清华区块链公开课又开讲啦!这一讲的嘉宾是分布科技联合创始人、本体项目创始人李俊。大数据文摘为不能来到现场的同学们带来了讲座实录,请大家来先睹为快吧!
区块链系列公开课由清华x-lab及校研团委创新创业中心联合打造,面向清华大学全体学生、教师、校友。戳链接回顾之前课程内容:
区块链的几层含义
大家晚上好,非常高兴到清华来做汇报和分享。我是技术出身,也在金融行业工作多年,对区块链,特别是公有链方面的设计架构和技术有一些积累。
先谈一下对区块链理解的发展。
2008年比特币出现之后,才有了区块链,但是那篇论文中没有提到过区块链这个词,随后出现了对区块链的各个方面的解读。
《经济学人》总结区块链为:Trust。
的确,这个词是区块链的本质,是blockchain唯一的价值。离开trust,在其他环节,区块链和传统的IT系统,即中心化、分布式的系统相比优势并不突出,所以它的优点是建立信任。
现在很热的大数据,或者人工智能,用“增强”、“体验”、“提升”等词描述其特点。但对区块链的描述基本都是用“变革”、“新模式”、甚至于“新时代”,区块链是否真的有如此强影响?
首先要从技术的层面来讲,区块链跟原来的系统,即IT系统、互联网系统真正的区别在于结构、数据库包括应用模式等等方面的不同。
总结来说有四点,第一是网络结构。
这个网络结构和互联网很像,是权限对等的体系。但是互联网时代比以前任何时代都更加中心化,在国内我们做信息交互可能离不开微信,离不开腾讯,在国外离不开推特或者facebook。但在区块链里会发现,没有哪个节点比哪个节点更大,大家似乎是对等的,但是这个结构挺好,没有中心化来控制。
但是仔细想一想,这个体系下没有中心化的节点会出现很多问题,很多中心化的存在是有它自己独特意义的。比如说要交易股票,在上交所或者深圳所都能够完成,现在忽然需要个人之间单独进行交易,那么怎么证明股票的所有权?
在这个体系当中可能要用到大量的密码学,需要数据的防伪,数据的保护,数据的健全等等一系列机制,因为当体系中没有中心化的保证,没有上交所、深交所证明信息的真实性,只能相信技术。但是技术不是绝对完美的。但是它在一定程度上,在一些特定场景下可以证明资产权益、数据是真实的,这些真实性来自于技术。
上述问题解决之后,你会发现又有一个问题,个体之间达成合作是容易的。但是总有一些事情是需要集体决策的。例如组织决定哪些交易可以进行,哪些数据可以收录。
但是如果在这个体系下谁说都不合适,就需要机制来保证达成共识。共识机制是在没有中心节点的情况下,我们设计一套制度帮我们做决策,原来决策制定者是领导,但现在是制度做决策。这些共识机制里有很多名词,例如PoW、PoS、BFT等。其中PoW是工作量证明,通过付出的努力证明记账权的归属。
第四个问题,在网络结构、共识机制、数据结构之后,就形成人人为我,我为人人,便不存在中心的节点。没有中心节点的情况下我们依然能协作好,把这些事情都处理好,把要我们决定的事情都决策好,这个体系形成大家讲的分布式,或者大家听到的去中心化。
为什么大家觉得区块链比较重要,或者有革命性,是说这是我们第一次仅仅用技术带来的信任,能够走完一个完整的流程。原来各种各样的技术、信任其实是一个单点的流程,区块链是第一次用技术支撑完整的协作流程,所以大家觉得这个好像挺有革命性的。
区块链三个阶段
在《区块链新经济蓝图》中将区块链归结为三个阶段,但这三个阶段不是线性,很多时候三阶段是交杂融会的。某一个时间点三个阶段的场景都同时存在。
第一个阶段谈的是可编程金钱,例如比特币。
原来的信用货币发放机制,基本上都是有一个强中心,例如金本位也需要一个权威来保证这种挂钩机制。所以说信用当然是更需要,特别是政府,但不一定是政府,其实历史上有很多是银行发过这样的信用机制,但是这部分第一次把技术机制放到信用体系中,这就可编程的金钱。
金融行业跟技术发展的一些部分。通过上图可以看到整个金融行业技术发展的历史。大量新的经济模型从信用卡出现,ATM机、电子贸易、数字银行、移动银行等等这些部分,都伴随着技术的发展。
技术总会快半步,因为只有智能手机普及,或者移动网络普及才能看到移动银行的出现。在下一个潮流中,包括生物识别、云计算、认知计算、机器学习、预测分析等都有可能对金融行业的产业模式产生影响。
并不是所有去中心化的分布式账本一定有链式存储。例如DAG无像图,数据结构不一定是区块链,但是去中心化分布式账本理念是革命性的。
第二个阶段,也就是第二个层次,即可编程的经济。
所谓可编程的经济是从货币中扩展来的,但是却和货币不一样,货币相对的职能、性能是相对简单的,是价值中介,满足轻结算就可以。但是在这些体系当中你会发现,它在很多更复杂的条件、逻辑、合约在当中,不单单是一个数据,或者一种规则,甚至有些规则是动态的,需要参数变化的。所以像债券、股权、金融、合约、保险、权益的登记和转让,这些可能需要你用合约的形式在区块链中进行登记,进行部署,进行确权,进行交易。所以这把刚才纯粹的单一功能提升到了新的层次。
当前的智能合约,只是达到了自动合约的层次。因为其没有智能判断成分。而在可编程经济阶段,金融、共享经济、医疗、通讯等等这些部分能够进行协作。
保险、证券等虽然很复杂,归根到底是动态逻辑,动态规则。人类协作最复杂的是什么?是自己的组织协作,所有的问题还是组织协作问题,
所以第三阶段是可编程社会。当然可编程这个词用的不一定那么好,把区块链用到治理的领域,一系列人和人的协作,包括仲裁、调节,完全是人和人的组织关系的治理。在这一阶段中层次没有高低,只有协同,其实这三个层次大部分覆盖了我们的生活或者工作,以及商业、金融等等场景的体系,这是治理的部分。所谓治理的部分可以基于这个技术体系,我们自己可以协作起来。
信任机制
1、技术手段的信任
信任到底从哪来的?信任的来源是什么?有什么样的来源,什么样的技术手段?我认为有三个维度。
第一个维度是基于技术信任,这部分可能由来已久,例如虎符,古代两个将军一个虎符切开,贴到一起就可以调动军队。
这个依赖于某一个技术,只要这个技术验证就可以相信。这个场景应用到现代社会,CA认证、电子签名、电子存证包括生物识别等等,这些都是技术信任的。但是这些信任都是单点性的,解决了某一个单一场景下的某一个问题,为什么区块链出现是革命性的,因为它第一次让我们只在技术层面上完成了完整信任闭环,例如比特币货币交易,和其他智能体系交易,这个完整的闭环仅仅用技术性,没有依赖于其他第三方的信任源。
2、法律体系的信任机制
这是第一次仅仅依赖技术信任的完整闭环。但是再深想一下这是不是很完美,是不是就回到之前提到的问题,区块链这套机制是不是很好的机制,我们可以用它解决信用问题。回顾起来大家觉得区块链离你很远,虽然听这个词很多。但我们生活当中没什么东西用到区块链,我们和区块链的连接很弱,很弱的原因是什么,回顾生活当中的点点滴滴,包括学历、未来买的房子,这些是由谁证明的?由谁保护的。不是技术,来自各种各样的法制体系。
目前世界当中最大的信任源还是各种各样各个国家的法治体系,法制法规提供最大的信任保护,这是第二个维度。所以说当技术和法律结合会不会很完美?技术不完美,大部分事情都是靠法律帮支撑,不是光有技术就行了,现在这两个结合起来,大家觉得覆盖完全了吗?
3、社群信任机制
在我们的古代社会,那时即没有技术,也没有法制,但人已经协作起来了,这其实是我们人类的社群信任,人和人之间的信任。
大家讲的乡土中国,那个地方有王法,没人遵守王法,大家只讲礼,是礼数和礼仪,这个礼数和礼仪来自哪里?为什么会相互交易,相互借钱。
仅仅是因为彼此非常熟悉。在中国的民间借贷,不是国家保护,也不是技术,完全是人和人的信任,这种信任是很自然的,也是来源于很好的自发的来源。但这个信任有一个最大的问题是这种信用是没法进行规模化协作的,这种信任的成本是很高的。
但是大家用很多技术手段想扩展这种信用,不管是技术还是法制,依赖于某些中心化政府,规模协作是很痛苦的,没法跨国、跨领域。
所以大家用了很多技术手段,例如GooglePageRank,把群体性的信任机制传递到网页上去。例如PGP的网络不是中心化维护,通过分布式的信任体系互相做到。
例如ID2020,这个ID不是任何国家发的,全球共同对一个人,对一个物体进行认证形成一条证据链来证明这个人干过什么,发生过什么,拥有过什么,所以这个时候大家发现说完全把社群背书这件事情用技术化体系整合起来,所以这是一个很大的探索。
因为中心化不管再强的政府、银行,能给你背书的仅仅是你信息的一部分。
但是人的一生当中,有大量的点点滴滴,仅凭一部分信息很难对一个人产生信任。例如仅凭你是清华毕业生,且有5万块存款,不足以判断把100万借给你会更安全。但如果我从小和你长大的,工作、生活的经历都了解清楚,那么情况就不一样了。
信任的三个维度,技术、法制、社群。区块链技术在一定程度上覆盖这三个维度。信任其实是我们生活当中最大的一种成本,如果有一种技术能够让这些信任的体系增强,或者降低它的成本,那这个技术就有非常大的价值。
区块链是不是这样一个技术呢?因为还没有真正的规模性使用区块链,这个答案只能是一个设想跟判断。
信任机制的痛点
为什么存在技术、法制、社群,人和人之间的背书的情况下,为什么痛点还如此多?
仔细思考,其实证明“我是谁”这件事情还真是困难,你可以用身份证、护照证明你是中国公民,你可能偶尔还能用银行流水,工作证明,甚至用芝麻信用,但是这些只是证明了某些维度,而且很多人跟你在这些维度上是完全类似,你要在更精确一点的场景下证明自己,还真是很难。
在这个体系当中,如何把这些信任结合多样性和一体化,而且可以自动化、低成本的运行,这是挺难的。因为像大型机构有自己的系统,个人虽然散落很多数据,但却没有收集的工具。你掌控不了就不属于你。
现在公有链在这个体系当中,比较难和实体打得通,因为实体有很多场景是非常独特化的需求,这个需求可能在链上的应用层解决不了,很多可能需要一种非常的机制,在各种机制上做深度化定制,这种情况下单一的公有链体系比较难达到。
所以说可能在一个链网的体系当中可以做更多的定制化的服务,形成的部分可以做基础。在这上面只有公有链其实还远远不够,例如把这张桌子变成数字化,可以把桌子变成一个Token,你付给我。
之后碰到一个问题,当你拿这个Token来找我的时候,那个时候我说对不起,不给你。那个时候你怎么办?密码学机制、区块链共识等这些技术都帮不上忙,最后找的还是警察,依赖各种各样的法律机制,所以区块链要和线下不同的法律机制和体系打通,或者通过法律体系进行制约,要么通过社群,人和人之间的生命体系进行制约。
体系要打通,所以在公有链上面还需要多链式公有链和分布式信任生态。链网并不意味着不同的链可以进行横向的扩展,可以根据业务场景做深度的共识,例如以太坊有智能合约编程,可以在上面发布一些数字化的Token。
如果更复杂的场景,比如有自己独特的共识机制,独特的流程机制,在那个单一架构体系上比较难满足,但是自己独立做一条链公信力和共识的能力又不够,如果这些链串起来结合主链,独立的业务链也具备了公链的公信力,这能够在更好的信任点上开展工作。
分布式信任层如何和实体打通
当区块链和实体业务串联起来之后,会需要很多模块做支撑,首当是身份标识,个人身份和实体结合起来非常重要,因为这是保证交易顺利进行的前提。所以分布式身份标识是一个可信实现。
使用分布式ID协议,把各种各样能够证明自己的信任源串联起来,例如数字资产账号,银行账号,身份、CA证书,学历证明,甚至自己的一些背书,都可以统一在一个体系中进行管理。
个人信息无需在链上,区块链不是存储系统,另外区块链不是数据库,也不适合做数据库,区块链分布式存储机制不适合存储大量数据,数据储存的越少越好,它只是串联器和连接器,可以把自己各种各样的场景,自己各种各样的身份串联起来,而且你的数据该在哪还在哪,学历数据、教育数据、银行数据、各种身份数据都还原地,在银行,没有在链上,链上像一个大索引,一个大黄页。
通过这种体系,自己就能创造信任源,所谓可信声明就是把各种场景串联起来,学校、银行账户、数字资产账户,身份证、EID等等。
如何用技术化把社群信任组合起来,例如在村里很有信誉的人借钱只能在本村,去了别的地方,由于信息的不流通,借贷就会出现困难。因此社区信任技术化是能够打破信息流通的壁垒。
然而现实是社群信任技术化,技术化不够,重要规模协作化,现实挑战无法规模化。用区块链构造信任包能够很好的解决这个问题,链上的各种数据源能够全方位证明身份,无论在什么地方,无论什么时间,区块链体系下的信任包能够让证明成本大幅下降。
不仅是人,所有实体,所有存在所有权的物品,例如写的文章、拍的照片、画的画等,都可以确权。这些背后都是大量的数据,各种各样数据,每个数据都属于某一个实体,没有一个数据是无本之源,每一个数据必然跟某一个事情关联起来,实体到最后以大量的数据存在。
区块链解决大数据痛点
那么大数据和区块链结合,对大数据到底有没有帮助?在回答这个问题之前,先讨论大数据时代最大的两个痛点,每个人都认为数据是自己的私有资产,既不共享,也不协作,这是一个痛点;如何证明数据真与假,是另一个痛点。
首先区块链可以为数据打时间戳与水印,充分保护原数据,其次区块链密码学机制能够保证数据在时间和空间上的真实性。因此通过区块链,可以让原本沉默的数据成为有价值的数据资产。
当前最大的问题是数据的主体授权。隐私还是要便利似乎是不可调和的矛盾。但在某些程度上,是可以调和的:我们要的是什么,并不是数据的绝对保密,我们需要知情权和授权权。
数据主体授权是非常重要的体系。所以密码学在数据治理框架当中发挥着很重要的作用,这部分包括隐性地址,数据版权保护的体系。
之前当对多方数据汇集起来进行计算的时候,没有人知道数据来源是什么,只是知道数据存在,至于数据是真还是假,没法保证。后来有了区块链,有了分布式协作,有了去中心化体系之后,数据就掌握在自己的手中。
分布式声誉管理
区块链特别公有链,最大的生命线是什么?是开源,区块链开源是刚需。区块链有建立信用的功能,这是在开源的基础之上,因为只有开源才能获得信任。
分布式协作、分布式权益、分布式社群管理对每个加入社群的人都可以快速验证,说加入区块链技术群,杂七杂八的人都里,可以完全快速验证进群的是区块链技术人才。
这个里面还有一个很重要的体系,就是分布式的声誉管理,如果信任包数据足够广,未来应该有各种各样的芝麻信用、瓜子信用,基于不同的数据,每个人在证明自己这件事情上非常精准,所以分布式声誉管理很重要的。
在美国有实际应用分布式流程的场景:医生和药房完全分开,医生到另外一个小镇买药,买药的过程中需要做大量的验证,例如处方是不是真的,这个医生是不是有牌照等等一系列体系。
在美国有医疗垂直性,存在很多上述体系。这个场景其实在很多协作当中,大家发现现在都是积木式的技术,不像以前一个场景涵盖全部的服务,现在可能有一个流程、政府、公司甚至国外相互串联,分工协作。这个体系完全是分布式的,自动化流程支持即刻验证。
区块链一直是很幸运的行业,它幸运是幸运在哪里呢?不是它的融资情况,区块链技术层面虽然也挺复杂,但是做公链完全没有问题,完全能做出来。为什么区块链这些公司有生存空间?是因为一个模式的空间。
区块链里智能合约等等一系列自动化制度,其实比第三方的中介可以提供更好的场景。大家发现这两个场景都是对现在互联网巨头核心机制是有冲击的。
整个声誉体系评价是综合性的,就像手术刀一样精准,各类综合声誉评价,可以在不同的体系当中,多阶段、多主体参与。
区块链下的声誉评价体系能够让每个人知道如果做好事,讲诚信,做善,能得到好处;如果作恶能得到坏处,这起到了社会治理跟风向引导的作用。因为整个体系触发实际的经济利益,如果不诚信会寸步难行,这个时候每个人都会往好了做。
信任供应链从时间跟空间两个维度上形成了一张存证网,这两个维度同时做的成本非常高。供应链金融、版权保护,整个可以进行相应的存证。
自己拍的音频和视频自己可以确权了,即确定照片拍摄者,确定视频制造者,做房地产交易,或者抵押等等,需要到公证处执行,在区块链体系下,公证拍的视频和音频直接存在区块链上,然后就能确保防篡改。
金融的核心就是风险控制,运用区块链可以有更多手段证明自己,风控这件事情慢慢从金融机构转到自己手上。
如果再深入下去,如果有一天个人都可以做风控,何时何地都可以证明自己。所以说未来真正普惠金融是什么场景?每一个人都能自己做自己的风控,只要你是诚信的,每一个人都可以随时随地的进行借贷交易。
讲座之后,李俊还回答了清华同学的现场提问,以及大数据文摘的专访,我们也摘录其中的精华部分呈现:
Q:现在公有链性能是很差的,比如以太坊转账每秒钟20笔左右,咱们本体的网络理想很宏大的,要想实现这些宏大理想,会不会也受制于现在对公有链的性能?比如TDS太低会不会对本体应用造成一些影响? A:不同的共识机制是不一样的,PoW的共识机制不一样,而且这个世界没有说你能做到5000、7000。这部分得到一些肯定会失去一些,你去中心程度没有像比特网那么广,可能是选出来的集群做这个事情。在这个高性能上面找到一个平衡,多广的去中心化程度,多高的性能,这个平衡不是对与错的问题,而是价值观的问题,在这个体系当中。当然有一点是对的,系统做的更好,比如网络通讯层,并行处理、数据库如何做的更好,信用肯定会有提升的。
Q:比特黄金恶意攻击之后,区块链的安全不再是牢不可破,如何有效的保证区块链的安全?
A:在区块链中如果出现安全问题就会被放大,因为有很多放参与,必须对多方进行协调,哪一方出现问题都是比较严重的问题。而且在区块链下不可能采用停机修复的做法。
区块链最大的安全问题一个是节点保护,另一个是智能合约不能有漏洞。在本体中采取的做法是联合三家顶级的安全公司全面审计,并且内部加大投资来确保安全问题。在技术上,可以形成自己的安全知识库,从而举一反三;另一方面可以借助一些自动化工具包括攻防演练和形式验证。
Q:如何看待区块链代码开源?
A:区块链技术之所以被大家信任,很大的原因是区块链的底层技术架构的代码是开源的。然而,开源也会导致别人被抄袭。在接受大数据文摘采访的过程中,李俊表示:开源本身没有什么错,开源的本意是欢迎公众对代码进行检验与使用,但是,在使用开源代码的过程中,要遵守游戏规则,有开源协议的代码,在拷贝的时候要保留协议,这是最基本的原则。如果使用者在使用代码时声明开源的代码是其原创,并用于营销甚至盈利,这种行为就是盗窃。
这种行为,无论是国内还是国外都有发生。即使资料是开源的,但产权拥有者依然可以进行知识产权的保护,在法律层面上依然可以对盗版者进行追诉。也可以在开源社区公布盗版者的资料,让公众知道哪些人在违背游戏规则,在一定程度上道德方面谴责的效果比法律手段要好的多。所以开源环境需要大家维护,尊重开源规则,共同贡献资源,才能打造一个共赢的局面。
Q:区块链能否解决数据的良莠不齐
A:当前越来越多的数据上链,这些数据的质量参差不齐,区块链能否解决这些问题。李俊老师在接受大数据文摘采访的时候提到,区块链不能解决数据标准化的问题,区块链能为数据做的只有两个部分,其一是区块链不是存储器而是串联器,它可以把游离在各个地方的数据源串联起来,把各种各样的项目对接起来;另外一个方面区块链能在最大的程度上保证数据的真实性。数据标准化需要物联网本身自己去改进。虽然这方面的工作一直在推进,但是还没有形成国际化的标准。所以区块链是一个轻量的连接器。
【今日机器学习概念】 Have a Great Definition |