IPFS入门指南:潮水之上,IPFS究竟将带来什么?

20世纪初的第二个十年,正是互联网风起云涌的十年,还是如火如荼的区块链黄金发展十年。错过了比特币、错过了以太坊,就是错过了一个时代!上一秒还在扼腕长叹的壮士这么说着,突然话锋一转,神神秘秘地问,你知道IPFS吗?

似乎一夜之间,街头巷尾的神秘圈内会都开始谈论IPFS,而只要一参与其中,再不利索的人都突然变得滔滔不绝口若悬河。这没头没脑毫无预兆出现的IPFS,简直跟深圳的天气一样炙手可热,可这股热风究竟是什么时候、怎么刮起来的呢?

舰娘本着兢兢业业的精神(好奇心太重)到处搜罗信息,面约了神秘圈内会的无数专业人士,终于整理了出来了一份IPFS项目指南——可能是全网最全的IPFS入门指南。看完这个你基本不再需要听街上业务员的诚恳忽悠了。

究竟什么是IPFS?

首先,IPFS全称是Inter Planetary File System,直译过来就是星际文件系统。可不要觉得这个名字是赶噱头,它可是一个刷新互联网感知、翻天覆地的分布式文件系统。融合了比特币的区块链协议及分布式网络的优势,IPFS已经站在巨人的肩膀,以IPFS协议来进行的存储数据、移除重复文件以及通过节点地址直接搜索获取文件的工作已成功运行了4年。

历经10年,比特币、以太坊和其他知名的区块链网络应用发展至今,证明了其作为去中心化交易账本的可能性—— 这些人人可查看的公共账本,早已交易过价值数百亿美金的加密资产;而作为衍生的数字加密货币,则为无中心管理机构的分布式网络节点提供了有效的支付方式。

但随着场景大量应用的可能,十年内参与人数与交易需求的不断增长,交易数据的实时存储、过时数据的删除恢复、时效的计算、运行处理速度等等切实的商业效率问题,也在同时出现。在十年前,你可能愿意为一笔100块钱的转账交易等待30分钟,但放在十年后支付宝、微信即时转账、交易效率高速的今天,随着区块的承载量越来越大,去中心化帐本的这个不良效率体验会越来越明显。这就是区块链应用迫在眉睫、急需解决的眼前问题,也是IPFS意图解决的问题。

针对有大量数据需要存储、有大量数据处理需求的用户来说,IPFS做到了解决效率的第一点——即内容寻址。

内容寻址

内容寻址的英文全称是Content Addressing,IPFS系统寻找源数据不再依靠HTTP协议(通过域名、IP及多中心服务器的中转,再进行上传下载),而是依靠其生成的一个唯一HASH密钥来进行数据寻找。

1.在不损害数据完整性的情况下,移动、复制和重新提供数据的能力。

2.无需复制(或引用)整个数据集,可以只选择其中一部分的能力。

3.为版本控制提供基础(内容寻址的),但又独立于版本控制元数据结构。

4.支持高效的动态聚合和来自多个位置的数据分析。

照此势头,依小编看, IPFS强大的数据寻找能力,必将颠覆传统的HTTP协议。

分布式P2P网络

IPFS另外一个重点在于其分布式P2P网络。

首先,大多数公司,尤其是在数据生成量达到PB级的行业(比如媒体或研究领域),总是把大型工作负载存储在 EMC Isilon 或 Netapp,这两者都有其本地局限性。而把大量的工作档案存储在 AMS (亚马逊旗下云计算服务平台)或 Azure(微软云计算服务平台),又存在成本控制、代码可靠、可扩展及中心化服务器的安全问题。

而且非常耗时的模拟也会产生大量(也许10TB)二进制文件,而保存这些文件又非常重要(一旦丢失文件,意味着得重新模拟,可能耗时长达几个月)。同时,把文件分享给同事也很重要——但不幸的是,这也很难在实际操作中实现。比如说,我去欧洲短期出差,就无法下载存储在清华数据库里10TB模拟数据集(要花很长时间)。

是的,这就是我们实际的现状——我们需要高容量且安全的存储空间,需要即时传输。这并不无厘头, IPFS已经做到了。

IPFS发行了一种名叫Filecoin的数字加密货币(关于Filecoin我们将在另一篇详细讲解)作为其核心激励机制,奖励为分布式网络做出贡献的节点。因此理论上,IPFS拥有无上限的数据存储空间,亦意味其拥有强大的商业数据存储应用能力。

而作为分布式网络,也意味着IPFS不再基于一个中央数据储存库,它足够近到你在地球的这一端,也能够进行最远的地球另一端文件分享。

当然,无论分布式网络或内容寻址模型,IPFS的一切,可以说都来源于已知的、成熟的技术支撑,但IPFS又高于一切已有的技术形态。技术不在新或旧、多与杂,实用性与解决问题就是所有的商业逻辑。