金色深核|对话PlatON曲俊杰:如何定义新的数据计算形式?

2021-04-05 505 其它文章

互联网苦数据隐私久矣。

漫长的数据泛滥时代,成就了很多以数据为核心要素挖掘价值的平台和企业。而当用户、监管者意识到数据价值应该归于用户时,却已感到无力实现。

因为这将是一次用户、平台、监管者三方长期聚焦才能改变的持久战,更何况在意识到其重要性与制定规则、研发技术、落地之间,还隔着诺大的空洞。

在这样的背景下,区块链项目却向数据隐私发起了集中式的挑战。

以同态加密、多方计算、可信执行环境、零知识证明等一系列技术为代表的区块链隐私计算项目,在尝试将数据保护起来,融合区块链的权益归属和激励方式,改变数据隐私现状。

《金色深核》栏目获悉,4月中旬,隐私计算网络PlatON将上线主网,在主网运行半年后,还会继续上线隐私计算层,将把隐私计算服务、数据发现等为数据搭建的服务流程上线。

PlatON团队集中了金融、密码学、数据服务、公链等多背景研究人才,以解决数据隐私为目标,已聚焦于将关于数据的协议根据法规细化,详细区分数据流通过程的所有权定义。

而为了将网络性能提升至为数据隐私所用,PlatON对网络的设计也极有特色,从PlatON的第一版白皮书中可以发现,整个网络结构分为了3层,包含区块链总帐本的layer1、隐私计算层layer2、跨链输出层layer3。主网上线的时间会成为整个架构启用的开始。

mFcsGN3AXfXFYopXJY5JJkwQspwIAsqqPrz2wHcK.png

PlatON主网结构里的layer1和layer2

此前,为了金融数据领域的尝试,在2020年8月,PlatON上线了先行测试网Alaya,该网络聚焦于金融数据层面的测试。而PlatON主网将代表着对更广泛数据服务的开始。

PlatON很早就进入了《金色深核》栏目的研究视野,在主网上线之前,为了更详实的了解PlatON的部署,《金色深核》栏目策划人王航与PlatON CTO曲俊杰进行了深度对话,对网络功能分配、网络设计、隐私计算面向数据的范式实现等进行了探讨。

在本文中,你将获取到以下关键信息:

1.Alaya先行网对金融领域的偏向性会更强。而PlatON主网对layer2隐私计算层偏向会更强;

2.PlatON的layer2不只是为了扩容;

3.主网上线半年左右,PlatON网络会推出隐私计算层。

4.PlatON在通过数据、算力的隐私保护模型去定义出一个“面向数据的计算方式”。

5.PlatON在安全计算硬件上已经有很大突破,对于现阶段的公开算法提高了100倍左右。

6.因为数据种类繁多,属性复杂,PlatON正在用复杂的协议去定义数据法规的细节。

U0YvwsUNHtveMkH9LuKXjEDB4tyjb15tAs1HWoeH.jpeg

PlatON CTO 曲俊杰

以下为对话实录,经《金色深核》栏目整理,力求还原对话过程中的精彩部分,以飨读者。

Alaya与PlatON

《金色深核》栏目策划人王航:

第一个问题关于Alaya与PlatON,PlatON主网即将上线,但此前已经先发布了Alaya先行网,为什么要分主网和先行网?

这样的安排,是否很像Kusama先行网和Polkadot主网的部署,两个网络的功能作用是如何分配的?

PlatON CTO 曲俊杰:

以Kusama和Polkadot做比喻,有类似的地方,也有完全不一样的地方。

类似的地方是,一个是先行测试网,一个是主网。不同的是,Alaya是侧重金融基础设施的沙盒,PlatON要做隐私计算网络和分布式经济基础设施,其核心是对数据做隐私计算处理,而数据是多种多样的,在数据类别里,金融数据是比较成熟完善的,所以对沙盒(Alaya)来讲是个很好的落地的实验对象。

所以,Alaya是一个聚焦金融的沙盒和先行示范区,会成为各种新功能和新实验的区域。

PlatON是我们的主目标,是未来的隐私计算网络和分布式经济基础设施,今年在主网推出之后,再过半年左右的时间,PlatON会再次推出一个隐私计算层,这个计算网络里会包含服务发现、数据发现、算力发现等等。

重新定义layer1、2、3

《金色深核》栏目策划人王航:

那Alaya对金融领域的偏向性会更强。PlatON对layer2隐私计算层偏向会更强。

PlatON CTO 曲俊杰:

可以这么说,不过关于layer2的定义,我也想跟你探讨一下。

的确我们现在有layer1、2甚至layer3的定义。但其实这些是上一代区块链生态的一种定义。

例如以太坊生态里的layer2主要为了扩容,我们已经在Layer1做到了,我们的layer2很明显并不是为了扩容。是着眼于数据,着眼于隐私分布式计算。

所以现在定义的分层是传统视角,在PlatON的世界里,我们希望重新定义layer1、2,甚至可以没有layer1、2,是一个整体的区块链基础设施,它包括了记账、共识治理等等,是经济和生态建立的基础。

另外,传统对于layer3也没有一个准确的定义,我认为我们的layer3,更准确的描述是把隐私的功能,通过类似跨链协议的方式,输出给其他的公链和生态。

以此去重新定义layer1、2、3。

《金色深核》栏目策划人王航:

此前在全面了解PlatON的时候,看到了咱们的文档叙述里面,有一个layer3的定义,但我发现layer3的这一层的特性,包含了子链模块和多链模块。

对比后发现,它似乎很像是一个偏向于为应用层提供的SaaS(主要提供隐私能力输出)。

而再看layer2,像您说的并没有完全用 layer 2扩容,layer2的特性是包含多方计算的隐私计算层和巨大的算力集成。

这个部分很像云计算架构里面的中间层部分。

最后layer1是一个区块链的总账本。

所以我认为用123这种传统分层的方式,确实不够清晰,可能会在功能上产生混淆。更好的理解应该是站在将它定义为一个面向服务的云架构,区块链层就是IaaS,layer2就是PaaS,上层就是SaaS,我认为值得用这样的方式对比理解。

PlatON CTO 曲俊杰:

layer分层概念是我们的第一版白皮书为主解析出来的。现在区块链行业迭代因为open source的特点发展非常快,我们也认为该进一步梳理类似像刚才提到云服务架构这些。

此外,平台还包含存储、算力等。

SaaS PaaS都是比较成熟的概念,我们可以把算力、存储通过新的模式最终抽象成为一个隐私数据的分布式计算平台。

如果对比传统云架构,PlatON也具备优势。

在云架构里,很难合理的去按照经济模型去分配各方的贡献。而PlatON是通过数据、算力的隐私保护模型定义出一个叫做面向数据的计算方式。

就像区块链和数据库的对比,

区块链的把这种分布式数据库和经济模型、治理模型结合在一起。而PlatON希望把现有的云服务架构的概念拆分之后,启用新的面向数据的计算形式。可能是通过一种新的协议、算法变成另外一种维度的重新组合。

PlatON 的数据隐私是如何塑造的?

《金色深核》栏目策划人王航:

明白。我有一个思考。这中隐私数据服务的范式。如果to c就是APP,to b的就是服务,在应用端,是不是会割裂的比较严重?最终发展博弈后,可能会比较偏向to b,或者形成企业Service平台?

PlatON CTO 曲俊杰:

你的这个问题问的很好。我们的思考是to c也罢,to b也罢,甚至还有to g。

从PlatON角度上分析,它的核心是数字时代数据该怎么办?在数据处理维度上的三者关系(数据提供方、平台、监管方)到底该如何去重新定义?如何变成一个更好的更健康的关系?

c端大众,是原数据的提供方。平台是把数据计算后挖掘出价值。而监管方可能会主导某些发展方向,因为某些数据里边会有公共数据。

而且将来数据产生不限于c端,未来各种机器,这些数据的所属权,他们和它们的利益,应该归属谁。

《金色深核》栏目策划人王航:

明白,那就是重新定义、制定数据所有权的具体规则。

相比其他项目,大多是实现数据做可用而不可见,这种对权益的拆分和数据本身的归属性拆分完成的并不详细。

这种范式和标准,我想到您原来说过一个词汇,叫多元异构数据流动的标准化,如果这种范式可以嵌入标准化的流程里,就像形成一个通用语言一样,可以部署到任何的位置,通过一个简易的SDK接入,就可以实现对这种范式的部署。

PlatON CTO 曲俊杰:

是的,我们的确希望通过实际商用落地逐渐把它定义清楚。

《金色深核》栏目策划人王航:

我还详细的问一下,像您刚才说的,如果一份数据,然后它是属于APP还是属于用户,还是属于平台?

这种定义有没有实现的demo,或者这种范式的基础标准。

PlatON CTO 曲俊杰:

协议的实现我们正在一步步推进。

原则上,首先要保证数据隐私,例如数据可用不可见。先把数据保护起来。另外是把权益和数据结合,我们已经尝试发布了一个隐私token协议。

因为数据种类繁多,属性复杂,需要用很复杂的协议去定义,需要不停的修订以保证保证数据权益最后落地,落地在不同的国家、政体,符合不同的法律法规。这个部分挑战很大。

例如欧洲 GDPR,其定义数据权益里有一条是可遗忘性,也就是说这个数据的所有方要求删除,你必须彻底干净的删除,不删除就涉及违法。

为了实现以上的需要,数据的定义协议需要有2个特点:

1.足够通用

2.具备灵活的可调整的空间

所以需要全面考虑协议框架怎么做。以身份举例,PlatON在参与 W3C国际标准的did身份制定,包含身份该怎么管理、怎么授权等。

最后,还要注意,在很多领域里,还会有一些特殊的部分。

例如金融是一个难真正落地的领域,第一与钱相关,任何创新都可能造成投资者损失。第二具有高度的法律法规保护。这些会造成有些创新难度,建议法律上开辟蹊径,例如沙盒,政府规定在沙盒里可以有相当程度的创新。

不过,我们坚信在金融领域里一定会有翻天覆地的好应用,把资金的流动、风险管控、投资者保护等这些传统金融费了很大的人力、财力、时间去做的东西,非常简洁的、可靠的做出来。

PlatON网络的并行能力

《金色深核》栏目策划人王航:

那PlatON的并行计算是如何体现的呢?现在计算能力,会局限于什么?

PlatON CTO 曲俊杰:

这块简单点讲是因为隐私计算有很多种。

一部分算法非常复杂,极度占用计算资源,另一部分其过程对数据的处理,需要反复多次传输、加密后再组合。

所以这几部分很适合做并行计算的处理,很早时。我们研发了一套语言,能够把安全多方计算的公式编译成门电路。

门电路的优势在于有前后逻辑关系就可以形成有向无环图DAG,实现之后,并行计算就不是问题了。

另外并行计算还体现在,为了快速验证所有默克尔树之间的逻辑关系,二叉树等结构可以拆分验证,并行计算完成后再根据密码学算法把最后两个节点合起来。但不是所有的都可以并行。

《金色深核》栏目策划人王航:

明白。我觉得可以理解为每一个计算电路,都是分片。

PlatON CTO 曲俊杰:

可以这么理解,只是分场景去实现。

《金色深核》栏目策划人王航:

您刚才说的门电路是跑在什么的设备里呢?硬件给予什么样的能力呢?

PlatON CTO 曲俊杰:

我们现在的硬件已经有很大的突破,比现在的市面上公开的算法提高了100倍左右,也优于微软。

这样的性能,的确是因为我们在硬件上做了一些尝试,但因为不同场景带来的密码学算法复杂度不同,其算法本身会有限制。

而数据计算时,除了GPU和带宽外,有些算法可能只适合100条数据和另一方1000条数据做协同计算。

一旦是2个G的数据和另一方10个G的数据协同计算,就完全不能商用了。

我们在做的是,最大程度的组合优化,根据不同的数据复杂度和算法复杂度、通讯复杂度,在不同的场景里不同的密码学算法接力计算,最后完成最优级的效果。

《金色深核》栏目策划人王航:

除了PlatON,我知道还有一个解决方案是PlatONE,两者在计算资源上有共享吗?

PlatON CTO 曲俊杰:

我们是以PlatON为主, PlatONE的是使用PlatON DNA的联盟链。

如果PlatONE有数据,有算力或者是有好的模型想共享开放出来,可以作为可以PlatON的子链,把它的能力发布到链上,供其他人发现使用。

所以资源共享,其实是一主一辅的关系,不是单纯的共享。

PlatON 架构设计的小故事

《金色深核》栏目策划人王航:

咱们刚才聊的整体看下来,我觉得是很符合工程化思维的,为了去实现数据隐私计算的工程目标,借鉴整合了多个部分,然后把它组合到一起。

例如在咱们整体的架构里面,可以看到云计算架构的设计,看到分层的设计,看到跨链,看到算力的管理和输出,那PlatON内部是怎么去推进开发过程的?从开发讨论到实施的推进流程什么样的?

PlatON CTO 曲俊杰:

这个行业是比较新的,经常有新的输入,通过内部的学习讨论,可能会此前的一些方案给颠覆掉。

我们内部例如肖总、孙总,他们在战略级别会有很多洞见。

我们非常坚定的大方向是数据隐私、分布式AI。

而一直持续的修订过程会来自于PlatON的各种专家团队、技术生态委员会、生态发展委员会等。

核心团队还会与外部专家有一些定期的沟通。包括美国、新加坡、香港,日本,中国的合规应用有什么动向?密码学研究有没有新的实现,如何优化?硬件是否能优化等等。

《金色深核》栏目策划人王航:

插问您一个小问题,PlatON什么时候开始确认整个架构设计的?

PlatON CTO 曲俊杰:

我们的整体架构在第一版白皮书就定义清楚了。

此前有过很深度的封闭讨论,被称作香山会议,讨论的内容例如包括要做计算的解耦,使用双层结构。

《金色深核》栏目策划人王航:

我知道PlatON 有非常庞大的密码学团队,关于密码学团队的工作状态是什么样的?

PlatON CTO 曲俊杰:

他们的自由度是非常高的,想研究什么都可以,只要出成果,只要能为整个社区做贡献就可以。

我们会从工程方面出命题,固定某个场景。有趣的是,有时候团队会告诉你这个做不了,但是过几天又告诉你,也许能做,可以这样做尝试。

对于某个单独的场景,一般会有多个研究方向,只要有一个方向突破了,就可以用了。

《金色深核》栏目策划人王航:

最后一个观点性的问题,外界对可编程电路的成本比较担心,那可编程电路的成本,目前来说是可控的吗?

PlatON CTO 曲俊杰:

我的观点是这样,如果是指 MPC相关的成本,假如在APP里实现,数据怎样进行隐私计算,电路的价值和使用频度相关。只要是使用频度高,有相当的价值体现点,成本就不是问题。

因为这些硬件还没有大规模商用,所以现在都是处于烧钱研究的状态。从我们基金会的角度来讲,暂时不考虑成本问题。

而对于商用来说,我们的确会考虑如何把这个问题做解耦,可能通过尽量做到模块化、通用化,可以实现固定成本,具体实现还有待研究。

当解耦和模块化的实现到达一定成熟程度,又有落地场景的价值覆盖成本,那个时候,成本问题只会是一时的。

币币情登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥5,078.28亿
2 欧易OKX欧易OKX ¥1,990.80亿
3 火币全球站火币全球站 ¥139.05亿
4 抹茶抹茶 ¥329.36亿
5 芝麻开门芝麻开门 ¥364.61亿
6 库币库币 ¥146.63亿
7 Coinbase ProCoinbase Pro ¥115.86亿
8 bitFlyerbitFlyer ¥5.58亿
9 BitMEXBitMEX ¥0
10 BitstampBitstamp ¥16.81亿