区块天下 区块链新闻 除了IPFS,你对区块链存储还了解多少?

除了IPFS,你对区块链存储还了解多少?

自区块链成为创业新风口,以区块链去中心化存储为概念的项目,时不时就会吹起一阵阵旋风。

面对万亿数据存储市场的诱惑,瞄准这一商机的创业者不在少数。

据了解,当前市面上已经有 Storj、Sia、Factom、MaidSafe、Genero 等多个去中心化存储的区块链项目,其中,又以 IPFS 协议最为知名,虽然它的理论尚未完全落地,但已汇聚了不少拥趸。

王东临,是一名在存储行业深耕近 10 年的从业者,从去年 8 月开始,他成为了 YottaChain 的创始人。

他告诉 31QU,如果对存储证明机制、网络协议等专业术语感到困惑,那就拨开聚集在去中心化存储项目之上的浓云迷雾,“就存储本身而言,去中心化存储其实仍然是经典技术路线的延续。”

这意味着,如果对历史上经典的的数据存储做法进行梳理,自然能厘清去中心化存储方案能在哪些方面做出改进,也就能理解为何业界认为“区块链存储硬刚互联网巨头云存储”的时代来了。

文 / 31QU 灵芝

云存储的革命与被革命

没有存储就没有计算机。

存储设备的历史要追溯到第一台计算机的诞生,对公众的存储服务时代,最早可追溯至 2006 年电商巨头亚马逊发布 S3 对象存储服务。

由于操作简便,原本服务于亚马逊的云端服务器,开始被众多对数据有存储需求的企业所用,整个云存储行业逐渐发展起来。

经过十余年发展,云存储从微小的市场,演变成了空间巨大的市场。据 IDC 中国数据显示,2018 年中国云管理服务市场的规模达 3.07 亿美元,同比增长 131.4%;预测指出,2018~2023 年整体的市场复合增长率将达到 70.8%,到 2023 年,整个市场规模将跃升至 44.6 亿美元。

这还仅仅是中国市场,如果放眼全球,整个云存储市场规模高达百亿。这个赛道上,早已汇聚了亚马逊、微软、Google、阿里云、腾讯等科技/互联网巨头。如果再加入传统企业级存储的话,整个市场规模大约在 700 亿美元左右,包括 Dell/EMC、NetApp、IBM、HPE、HDS、华为等传统 IT 巨头。

但事实上是,云存储首先革了传统存储的命。

王东临告诉 31QU,曾有一位存储设备巨头的朋友对他说,“毛利率低于85%的生意不做”,“也就是说,100 元的销售收入里,只有 15 元的成本用于购买硬件。”相对传统存储,云存储服务的价格就亲民得多了。

不过,虽然云存储服务商利用雄厚的资金与资源背景,通过在全球搭建多个数据中心,为企业提供云存储服务,但由于种种原因,这样的方式已经出现诸多问题。

首当其冲的,就是技术问题。

这里我们需要理解两个概念:冗余和故障域隔离。中心化的数据存储方案,通过提高单一系统的可靠性实现数据可靠性,比如配备更多的存储硬盘,或自建更多的数据服务中心。

“提高单一系统的可靠性往往会遇到瓶颈,这时就需要做冗余和故障域隔离来进一步提高可靠性。”王东临解释,“冗余可以保证即使部分数据丢失也能完整读取数据,故障域隔离是将故障影响的范围限定在一个很小的区域内。”

例如硬盘年故障率基本能在 1% 左右(标称数据更低,但实测数据要略高一些),“但这个数据算是极限了,再低已经不太可能。”

传统企业级存储的解决办法是:“将数据分散存储在多块硬盘上,并且允许其中一块(RAID5)或两块(RAID6)硬盘出现故障,这样也不会丢数据。“

“延续这条路线继续发展的结果是用多台服务器组成位于同一地点的分布式存储系统,在存储服务器级别实现冗余和故障域隔离。云存储服务商甚至会将数据分散在不同机柜,实现机柜级别的冗余和故障域隔离。”王东临表示:但现在单一数据中心的可靠性也发展到了瓶颈,解决方案就是继续延续这个技术路线发展,在不同地点之间实现冗余和故障域隔离。”

实际上,这就已经是“去中心化存储”,如果我们在此基础上加上区块链激励,就能继续演变成“区块链存储”。

“存储行业早已存在分布式存储的概念。”王东临表示,随着去中心化与共享概念的兴起,类似 Airbnb、Uber 等新的商业模式流行开来,存储行业当然也可以采用这样的方式,将普通用户手上的存储资源,充分利用起来。

区块链的激励系统也能在其中起到很好的作用,可以激励矿工加入,迅速构建覆盖全球的庞大存储池;可以惩罚不提供承诺服务的存储节点,保证存储服务质量;还可以激励用户来使用,更大程度降低成本。

数据冗余、故障域隔离和监控

“对存储行业从业者来说,应该要有这样一个价值观,那就是数据本身是有生命的,必须对用户的数据负责,确保数据安全与可靠。”王东临表示,即便是去中心化存储方案,依然要遵循这样的原则。

他告诉 31QU,即便是对存储方案进行改进或者创新,也必须将可靠性、安全性、冗余率、成本、可用性、数据去重和 DDOS 这几大要点纳入考量。

其中,数据的可靠性、安全性和成本,又是重中之重。

“举一个简单的例子,如果把数据比作存款,某天用户急需用钱的时候,银行告知用户机器损坏,无法取用,这是可用性出现了问题;如果是用户的存款金额被人知晓,那是安全性出现了问题,但如果是钱都没了,那就是可靠性出现了问题。”

从存储的基本常识讲,为提高数据可靠性必须要做冗余,“现有云存储服务商为了确保数据可靠性,一般会将数据存三个副本,也就是说,数据冗余率是 300% 。”

除了冗余,还需要对数据进行故障隔离。

“原来的做法是故障隔离,保证即便一部分数据出现故障,也不会影响其他部分的数据,但无限制降低硬盘的故障率,已经不太现实。”王东临表示。

此外,还需要对数据进行监控,一旦出现问题,马上进行数据重建。

“数据冗余、故障域隔离、心跳监控和数据重建是专业存储人都会考虑的点,即便融合了区块链,这些要点依然不会改变。”王东临表示。

区块链存储的性价比

在技术之外,还需要考虑的是成本问题。

“之前,企业的数据都存储在硬盘中,人们会担心硬盘出现问题,等云存储发展起来后,大家开始把数据存储至服务器,也会担心整个服务器系统出现故障。但天灾等意外事件总是会发生的,因此,部分企业开始尝试将数据备份的放置地点,从单点扩大到了多个地点,目的之一就是避免数据全部遭殃的情况发生。”王东临告诉 31QU。

分散多地存储,在一定程度上确保了数据的安全,但这样的数据中心由谁出钱建设是个问题,“即便是全球第一大云服务上亚马逊,全球范围也不过几十个节点,对中心化机构来说,建设数据中心依然要面对巨大的资金压力。”

区块链激励系统出现后,这样的状态有望得到改变。

王东临告诉 31QU,将区块链应用至云存储领域,能有效降低参与数据存储的门槛问题,“在激励机制的作用下,更多的节点能参与进来,保证整个去中心化系统有效运转。”

区块链除了自身的激励体系是一种创新,还将给整个数据存储行业带来一个全新的去中心化体系。“之前,存储行业的分布式概念,只体现在屈指可数的几个地点,但区块链出现后,鼓励每个用户将自有的存储设备贡献出来,纳入整个去中心化云存储生态。”

而原来方案里的分布式存储概念,也逐渐被去中心化云存储替代,王东临认为,“无论存储行业发展到哪一个阶段,都是经典解决方案的一种自然延续。”

王东临说,YottaChain 的目标,是在实现数据去中心化存储的基础上,再进行数据加密、数据去重与计算,最终“颠覆整个数据存储市场的格局”。

落地挑战

据 31QU 不完全统计,目前以去中心化存储为核心概念的区块链项目就有近 10 个,其中,虽然部分项目尚未落地,但已经被炒得火热,甚至出现了矿机诈骗的现象。

王东临表示,项目方和矿机厂商的关系,有点类似谷歌搜索和网站,一方面,为了让自己网站的内容更易被搜索引擎收录,有人会对自己的网站进行 SEO 优化,另一方面,谷歌也希望能够给用户提供更准确、优质的内容,识别的信息也会告诉给用户。这本身是没有问题。”

“整体而言,专业矿机的出现,对整个去中心化存储项目生态,确实会产生积极作用。”至于生产出来的矿机,性能能否达到宣传时候的要求,只能说‘有待观察’。

他补充说,对 YottaChain 来说,官方不会参与矿机的研发、销售,但如果是技术方面的交流和学习,官方也会参与沟通,“类似微软官方,虽然不提供笔记本,但也会和 PC 厂商合作,告诉他们什么样的软件、硬件在微软系统里跑得更好。”

相对于原来的方案,去中心化存储方案优势确实明显,但作为一个专做2B企业级服务的区块链项目,落地会是一个巨大的挑战。

对于企业而言,他们最关心的依然是存储服务是否会便宜、支出会不会更少,还并没有完全意识到区块链存储的意义。

但我们已经在各种因“腾讯云或阿里云故障导致创业公司数据全部丢失”的新闻中,看到了区块链存储的必要性。

但无论项目把区块链吹得多么天花乱坠,能落地才是关键。

在很多宣传去中心化存储项目的文档里,会强调中心化系统的原罪、去中心化比中心化存储更安全的说法,王东临认为,这其实是错误的,“如果没有数据加密这一步,采用去中心的方案,用户的数据都暴露在外,数据反而更不安全。”

此外,行业内还有“加密、去重两者不可兼得”的难题。据王东临透露,这个难题,YottaChain 已经突破,“‘TruPrivacy’技术可以实现零知识加密和跨用户去重”。

“整个行业远没到激烈竞争的程度,希望更多的同类项目能和我们形成同盟,大家一起发展起来,最终能和亚马逊这样的中心化机构抗衡。”王东临信心十足地表示。

(本文不做任何投资建议)

返回顶部