金色讲堂第16期:YottaChain如何打造区块链存储生态

9月24日,金色讲堂特邀YottaChain创始人王东临,通过线上微信群公开课的形式分享区块链存储的相关话题。

关于分享嘉宾:王东临,YottaChain区块链存储公链创始人、中国十大青年科学家、密码学分布式存储科学家、中国软件业十大杰出青年、OASIS国际工业标准组织UOML-X技术委员会主席;具有20年以上的密码学应用经验和10年的分布式存储经验,均达到世界顶级水平,先后发明十多项国际领先技术,创造多个中国IT业的里程碑,拥有200多项国内外专利。

k57tTGEZhj2fC7ojsd6ORnUDgLNyx6r849dQOxMs.jpeg

以下来自分享内容实录整理:

我今天分享的内容是YottaChain如何打造区块链存储生态。

首先介绍存储行业的背景情况。

众所周知,美国是IT技术执牛耳者,几乎垄断了IT业。近些年,中国在IT应用技术逐渐赶超美国,甚至在移动支付等个别领域已经反超美国。但是IT核心技术仍然被国际巨头把持,其中IT基础架构技术是最重要的IT核心技术。

IT基础架构技术为应用层提供存储能力和计算能力,包括存储、计算、网络三大件。存储技术是其中重要组成部分,甚至很多存储从业人士认为,存储比计算和网络更为重要。

不管这个观点是否得到认同,存储是IT核心技术的重要组成部分,这一点是无可置疑的。

存储产业是如此只重要,但长期以来一直被国际巨头所把持。在桌面级存储时代,中国是全军覆没。当年兴起的众多硬盘厂家,全部倒闭。FAT等流行的桌面文件系统,也全都是美国厂商的。在企业级存储时代,Dell/EMC、NetApp、IBM、HPE、HDS等美日巨头处于一流水平,把持着产业。

中国做的最好的是华为,华为存储几千人的团队奋斗十几年,已经达到世界二流水平,而且处于二流水平的前列,正在向世界一流水平发起冲击,但尚有一定距离。

在云存储时代,AWS、Azure和Google位于世界一流,阿里云在马云的强力推动下成功位居世界二流水平,但阿里云虽然借助各种因素成为中国市场的霸主,在全球市场依然难以突破。

最近,阿里云美国市场也不得不做出调整,从面向美国主流市场调整为面向做中国生意的美国企业。区块链存储时代虽然还在孕育中,但给中国人带来了新的机会。抓住一个产业新机会,跃居世界一流水平,成为所有中国存储人的期盼。

但在开始讲存储之前,我要先讲存储的职业道德问题。传说中很多武林宗师在收徒之前会要求弟子要学武艺就要先学武德。任何行业都有自己的职业道德,一个合格的前辈在带弟子学生时一定要先阐述这个行业的价值观和职业道德。

那存储行业的职业道德是什么呢?

在存储行业的从业人士看来,数据是有生命的,用户将数据托付给我们,我们就要对用户数据的生命负责。存储业务不赚钱可以不做,但只要做存储就要对数据可靠性负责。这就像航空公司必须将飞行安全置于最高优先级一样。哪怕是飞机晚点、空姐服务不好,也千万不能飞机掉下来。航空公司哪怕已经严重亏损,只要航班还在飞,该做的飞机养护就必须做,总之,飞行安全是最高优先级。

同样,存储产品、技术、服务的最高优先级就是数据可靠性,要对用户数据的生命负责。所以,要做能商用的存储产品,首先就必须对用户数据的生命负责。因此,在存储的各项技术指标中,数据可靠性是排在第一位的。

存储的基本技术指标都有哪些呢?如前所述,首先是数据可靠性,即数据不丢,一般用达到多少个9表示,每多1个9,可靠性增加10倍。然后是服务可用性:服务不宕机,专业术语是“在指定时间内返回操作结果”,也是用多少个9代表,4个9(99.99%)就是每年宕机不超过1小时。

数据安全性:即数据不被人偷,未经授权的人员拿不到数据,或者即使拿到也只能得到数据密文,无法破译出数据明文。

安全性和可靠性经常被弄混,可以举一个例子来说明其差异:陈冠希的艳照被人偷了,这是安全性出了问题,可靠性没有问题,而且由于其照片被复制了上百万份,其数据可靠性高的吓人。

一致性:为了保证数据可靠性,数据都要做冗余存储。数据一致性就是冗余的数据之间是一致的还是互相冲突的。典型场景就是在多副本冗余方案中,一个文件的多个副本是相同的还是不同的。数据一致性又可以进一步细分为强一致性、顺序一致性、弱一致性、最终一致性、会话一致性、单调读一致性、单调写一致性等。

延时:是指一次读写花费的时间,是一个重要的存储性能指标。如果将读写操作的性能比作北京到天津的运输性能,那延时就相当于从北京到天津运输所需要花费的时间,如果是高铁需要大约半小时,如果是高速公路大约是2小时。

吞吐量:是指平均每秒读写的数据量。在同样的延时指标下,增加并发可以提高吞吐量。

IOPS:IO Per Second的缩写,即每秒执行读写操作的数量,又可以进一步细分为顺序读IOPS,顺序写IOPS,随机读IOPS,随机写IOPS等指标。

去重:简称Dedup,又称重删(“重复数据删除”的简称),指重复数据占用相同存储空间,从而可以大大节约数据存储所需的物理空间。

去重率与用户数有直接的关系,一个中型的云盘系统的去重率大约在3倍左右,一个大型的云盘系统的去重率大约在5倍左右,一个典型的企业备份软件的去重率大约在4倍左右。

明文去重是很多高端存储都有的常规功能,但密文去重是只有YottaChain才有的专利技术。

并发能力:指可以同时响应多少个访问请求的能力。

分区可容忍性:就是存储系统因故障分成多个区后整个系统依然可用。

分布式存储存在一个经典的CAP理论,即数据一致性(Consistency)、服务可用性(Availability)和分区可容忍性(Partition tolerance)不可能同时满足。

CAP理论看似正确无比,但其实有一些隐含的假设,而YTFS(YottaChain的存储系统)用冗余编码的方式来保证数据一致性,而且节点之间的数据传输有较强抗分区风险,会在一定程度上改变传统的CAP理论。

容灾性:一旦出现地震、火灾等灾难性事件。整个地域的设备全部毁灭,还能不丢失数据,还能正常提供存储服务。

抗DDoS:难以通过DDoS(Distributed Denial of Service)分布式拒绝服务攻击将系统资源消耗光,从而保证系统在攻击时依然能保证稳定服务。

可扩展性:是指存储系统扩容是否容易,以及最多可以扩展到多大容量。可扩展性分为纵向可扩展性和横向可扩展性。

做存储系统,除了对可靠性要求非常低的桌面级存储可以听天由命(赌硬盘故障的AFR概率不会落到自己头上)以外,第一重要的是要设计一套数据可靠性保障机制,即使硬盘坏了也能保证数据不会丢。数据可靠性保障机制由数据冗余、心跳监测和数据重建三部分构成,企业级存储和云存储都有完备的数据可靠性保障机制。

在去中心化存储系统中,IPFS有非强制性的数据冗余机制(不是所有数据都做冗余,只有热数据有冗余),尚缺心跳监测和数据重建,YTFS则三者健全,构成完备的数据可靠性保障机制。对于去中心化存储系统来说,数据安全性也极为重要,不仅数据在公网上传输随时可能会被截获,而且存储节点都是不知道什么人所有,需要依靠基于密码学的数据安全措施。YTFS有内生的、完备的数据安全体系,但IPFS尚没有这样的设计。

下面介绍区块链存储

区块链存储是区块链驱动的去中心化存储的简称,A. 由去中心化存储系统(IPFS/YTFS)和区块链激励层(FileCoin/YTA)组成。区块链存储的数据不是保存在区块链上,而是存在去中心化存储系统中,区块链只是记账做激励,并不保存数据。去中心化存储系统由分布在全球的成千上万存储节点组成统一共享存储池,与区块链没有直接关系。用区块链的奖惩使得存储矿工积极将自己的存储空间共享给别人使用,遵守系统规则保证存储服务稳定性。

区块链存储本身就是存储技术发展的必然趋势。在桌面级存储时代,只有一块盘无冗余,数据可靠性只有2个9,不能满足企业用户的需求。

在企业级存储时代,采用多块盘有冗余方式存储数据,硬盘之间是故障域隔离的,坏一块盘不丢数据,数据可靠性4-7个9。在云存储时代,采用中心化的传统分布式存储技术,用冗余的多个通用存储服务器组成本地网络,服务器之间是故障域隔离的,坏一两台服务器不会丢数据,数据可靠性最高可达11个9。在区块链存储时代,则沿着相同的技术路线进一步发展,冗余的多个跨地域的存储节点组成广域网存储池,各地域之间是故障域隔离的,几个地域出故障不会丢数据,数据可靠性进一步提高到15个9以上。

可见,去中心化存储是存储技术发展的必然趋势,在大数据时代来临时可以满足人们对于数据存储容量和数据可靠性的更高要求。

衡量一条公链主要从四个维度来考虑:技术、商业模式、经济模型和治理结构。就存储公链来说,在以上列举的多项指标中,最核心的应该是数据可靠性、数据安全性、存储成本和吞吐量。

YottaChain的技术优势十分显著,在大家熟悉的几条存储公链中,唯一有数据可靠性保护机制、唯一保证数据安全、独家密文去重降低存储成本、理论上I/O性能最好。对我们来说,区块链存储的市场份额还是零,所有的存储公链都是同盟军,我们大家都是起义军,在挑战中心化村存储的霸权。但是很遗憾的是其他这些同盟军目前还处于大刀长矛的阶段,还无法去挑战这些巨头霸主,至少我们是专业的,我们能够把区块链存储应有的优势全部发挥出来。

YottaChain掌握了区块链存储的核心技术——加密去重技术,这能够完全改变产业格局,因为全球专利都在我们手里,只有我们能够实现。因此我们现在做的东西能够完全实现区块链存储支撑的价值,能够在可靠性、可用性这些方面比中心化存储做的好。

YottaChain的数据安全性可以做到工程意义或者商业意义上的绝对安全。科学意义上没有绝对的安全,但是商业意义上可以有绝对安全,也就是说可以保证你把你的身家性命赌上去都不会有问题。在全球最大黑客大会DefCon上,YottaChain经公开验证,敞开服务器任黑客出入,高额现金公开悬赏,无人攻破。这足以说明YottaChain技术的卓越。YottaChain在商业模式上可以无缝切入现有数百亿美元的存储市场,从技术接口到商业运作都可以无缝对接,可以从持久化存储和容灾备份市场先开始发展,这两个市场就有小几百亿美元市场了。

YottaChain的双层通证经济模型是和孟岩老师一起设计的,可以保证流动性和稳定性,用户能够以稳定价格购买存储服务,同时还不影响二级市场的投机,YTA价格还能保证长期增值(这是靠经济模型驱动的,而不是靠炒作的)。YottaChain的治理结构也是比较完备的,算是全球第一个初步完整的治理结构。以“去创始人化”为目标,将坚决地逐渐把项目发展决策权完全交给社区,为践行区块链精神做出贡献。

在治理结构方面,可以说有机融合了目前为止所有比较合理的元素。首先,YTA实行代议制,由全体持币者投票选举设立社区治理委员会,由社区治理委员会来制定YTA的规则。这就充分保证了人人和合。其次,YTA设立代码规格委员会、编码委员会、代码颁布委员会,各司其职,互相监督,制约均衡,保证治理委员会的决议都能准确地变成代码强制执行。通过这样的元规则设计,使得社区制定规则、规则执行和规则迭代都能得到有效的保证。

通过以上的制度化设计,不仅保证了 YTA项目可以不断发展完善,所有的权力都归于全体持币者,还可以高效专业地制定规则,所有的规则都能确保变成代码执行,任何人犯的错误都有对应的紧急纠正措施,实现多维度人机和合,从而充分释放出人、机器与代码的能量,体现出人、机器与代码应有的价值。

在路径上,也不是一步直接去中心化治理,而是从项目初创期创始团队中心化进化到了现在的半中心化治理,将来再逐渐过渡到去中心化治理,有明确的路线图,保证治理机制的发展变化平滑有序。在工程实现上,YTA也有很多比较周全的考虑。

我们有几个设计原则:

1、在满足商业目的前提下尽量降低工程难度,不去挑战学术难题

2、比AWS/Microsoft/Google/阿里云/腾讯云在核心技术指标上要有碾压优势

3、成本上要有明显优势

4、与现有中心化存储主要接口完全兼容,几百亿美元的应用可以无缝接入

在这几个原则指导下,我们采用了去中心化存储和半中心化的元数据相结合的模式。从而在满足商业目的的前提下将工程难度降低一个数量级。用纠删码保证数据一致性,再加上Hash校验,彻底解决脑裂问题;存储引擎等数据路径代码尽可能简单,降低出错概率,降低矿机配置要求从而降低系统总成本。这就是我们就分布式存储元数据、存储引擎、数据一致性协议等三大关键点的设计思路。具体可参考我们的黄皮书,所有设计细节都在其中。

总而言之,IPFS/FileCoin创造了风口,但是YottaChain是最专业的存储公链,在数据加密、确保数据不丢、加密去重、持久性存储、企业应用无缝对接、治理结构、拥抱监管等官方,皆实现了IPFS/FileCoin没有实现的关键特性。

时间过得真快,最后我介绍一下YottaChain的生态建设。YottaChain秉承“共识、共建、共治、共享”的生态建设理念,针对生态建设、用户规模、商业应用、生态投资四个方向推动全球区块链存储生态的建设。

目前我们已经有了126个超级节点,将近200万的社群用户,这都来源于大家对区块链存储前景的信念,对YottaChain强大专业能力的信任。前不久我们成立了首期规模为一亿人民币的Yotta生态基金投资生态项目,未来还将会有1500个生态节点陆续加入YottaChain社区。9月16日,YTA面向全球各大社区发起了《YTA生态社区蒲公英计划》。此次执行蒲公英A计划,招募首批为500席位的生态节点和一定数量的U粉,所有当选的生态节点和U粉都将获得丰厚权益。YTA将生态节点视为“全球第一区块链存储生态”的关键部分,所以YTA对生态节点的建设非常重视,对达到资质的生态节点提供了非常丰厚的回报。

YTA生态节点面向各存储矿机品牌厂商及营销渠道、社群运营机构、交易所、区块链行业媒体、区块链行业KOL、传统存储行业、互联网科技公司招募,首批A计划全球仅限500席位。一直以来,YTA始终贯彻“去中心化”的生态治理方针,为让更多的人快速进入协作状态,对生产关系进行改进调整,及时反馈利益刺激生态参与者,并坚决地逐渐将项目发展决策权完全交给社区。

YTA此次发布蒲公英计划,欲在更大程度上实现社区自治、共建、共享,和更多想为YTA生态建设贡献力量的个人和组织共同建设全球第一区块链存储生态,见证在中国市场跑出的世界一流区块链存储项目的成长历程。因此,蒲公英计划一经发布,就得到了社区用户的广泛响应和积极参与。

存储是一个有普遍需求的基础应用,我们希望将来能够打造上亿用户的存储生态,今天的数百万YTA生态社群就是我们打造全球第一存储生态的基础。

因此,我们为生态节点和U粉都提供了共同参与社区建设,共同享受社区发展成果的计划,欢迎大家一起共同参与,见证中国存储产业第一次实现进入世界一流水平,甚至做到世界第一的步伐。

mfPhrnL2nSIADRdhgM9mlBSaChKuyAtoYwXINayP.png

问答环节

主持人晓萌:1、通过分享的内容大家看得出来,YottaChain王总在技术方面的理解和成果非常深厚。您讲到去中心化存储是存储技术发展的必然趋势,那么这对现有的网络带宽有要求吗,大家知道现在5G概念非常火,未来会有结合吗?

王东临:这个问题很优质。YTA和5G是有天然的结合点的。一方面,区块链存储虽然在数据可靠性、可用性、容灾性、抗DDoS能力等方面都有了质的飞跃,但由于远程网络传输的延时会造成性能指标严重低于传统的集中式存储。而5G技术可以大大缩短网络传输延时,从而显著改善广域网存储的性能,大大增加了能够接受其性能指标的应用场景。

从目前发展趋势看,YTA由于每一个数据块都需要100多个边缘节点的网络数据传输,因此很有可能是最大的5G杀手级应用。另一方面,有了强大的YTA存储后,5G的用户可以将数据都不存在本地,而是存在更可靠、更廉价并具有无限容量的广域网存储中,利用5G网络的高性能直接将广域网存储当成本地存储使用,最多在本地做少量缓存,使得5G用户再也不用担心存储空间不够,不用担心数据会丢失,换机时也不再需倒要数据,数据的分享也更为便利。因此YTA和5G是相辅相成。

主持人晓萌:2、希望介绍一下YottaChain的产品目前在区块链存储领域所处的地位,YottaChain未来又有哪些重要的发展规划?

王东临:在存储公链范畴,YTA应该是最专业的,这些都可以一一比较刚才提到的技术指标,用数据来说话。

在整个存储行业,不管YTA还是IPFS都是新生力量,市场份额现在都是零,都是要颠覆旧世界的创新者。

主持人晓萌:3、YottaChain算是区块链的应用落地,适合应用它的用户类型是什么样的呢?

王东临:YTA目前处于公测阶段,所有人都可以去感知我们宣称比中心化存储更好更便宜而且可以无缝衔接,是不是真实的。我们未来计划是主链上线,明年做到小规模商用,后年做到一定规模的商用,5年左右达到大规模商用(即现在AWS的规模)。去中心化存储的规模要超过中心化存储才算是及格,所以要达到现在最大的中心化存储的规模才算是大规模商用。原则上YTA是面向应用层的基础架构,个人用户要通过一个应用来使用。例如可以通过个人云盘应用来使用。在YTA正式上线的时候,应该会同步有个人云盘应用上线,那时个人用户就可以使用了。

金色讲堂1期1家明星企业热点话题,助你把握市场脉搏、深度了解行业、捕获投资机遇!添加微信号harmonicaice进金色讲堂官方微信群,与大咖专家0距离,参与下一期金色讲堂直播。

金色讲堂
字号
收藏
分享