构建区块链专用的数据库管理系统

构建区块链专用的数据库管理系统
展开查看详情

1. ) TC BD ( 构建区块链专用的数据库管理系统 会 大 术 技 据 数 大 庞引明博士 国 中 18 20

2.庞引明 链极智能科技(上海)有限公司董事长兼总裁 ) TC BD ( 会 大 术 技 据 数 大 国 中 18 20

3.区块链基本概念介绍 ) TC BD 工信部指导发布的《中国区块链技术和应用发展白皮书2016》这样解释:广义来讲, ( 区块链技术是利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更 会 新数据、利用密码学的方式保证数据传输和访问的安全、利用由自动化脚本代码组成的智能 大 合约来编程和操作数据的一种全新的分布式基础架构与计算范式。 术 技  区块链是一个技术架构,所有的基础是存储。其存 据 储方式为1+N,本地存储和远层存储互相印证,解决 数 了底层数据的正确性 大  1为本地存储,哈希函数存在于底层,有一定的加密 国 中 作用 18  N为远程存储,保证了数据不可篡改 20

4. ) 什么是区块链数据? TC BD 从数据管理角度看,区块链的本质是一 ( 个构建在对等网络上、提供了可信数据 会 管理功能的数据库系统。 大 术 技 下面将从以下几个方面介绍链极科技在 据 这些方面的研究和进展。主要是数据管 数 理包含的数据储存、数据处理、数据溯 大 源和数据查询、数据监管。 国 中 18 20

5. ) 一、区块链的数据储存的可信性 TC BD 存储可信性解决区块的容错一致问 ( 题,其本质是分布式共识问题。 会 大 现在解决存储可信性的主流机制有: 术 1. 工作量证明机制(POW) 技 2. 据 实用拜占庭容错机制(PBFT) 数 3. 基于Raft的拜占庭容错机制 4. 大 其他共识机制,如Proof-of-Luck 国 中 (POL) 18 20

6. ) 1. 工作量证明机制(POW) TC BD POW(工作量机制) 是最早的存储可信性机制, ( 也是比特币采用的机制。虽然这个机制有各种问题,比 会 如低吞吐率和高延迟。但是这个机制支持高达数十万甚 大 术 至百万级别的参与者,这个数量远远高于其他现有的区 技 块链共识机制和金融信息系统。允许使用者参与和去中 据 数 心化是区块链最初的理念。 大 但是由于专用芯片硬件( ASICs )的出现,工 国 作量的算力飞快的集中在了大矿主手中,51%攻击或25% 中 18 自私挖矿攻击都是成为了可能。 20

7. ) 2. 实用拜占庭容错机制(PBFT) TC BD • PBFT 适用于节点数很少,主要开销在于网络消息 ( 传输带宽,吞吐率可达数千,并将延迟降到毫秒 会 大 级。此外,PBFT 可确保系统的最终一致性,由于 术 具有这些特性,PBFT 被应用于HyperLedger 技 Fabric(超级账本)。 据 数 • PBFT主要应用在私有链或联盟链中,节点就不再是 大 匿名的,节点规模远小于公有链,且可信程度也 国 中 远比在公有链中要高。 18 20

8. ) 3. 基于Raft的拜占庭容错机制 TC BD  PoW 和PBFT 考虑的都是拜占庭容错问题。在不用考虑参 ( 与者会攻击的情况下,有更高效的机制Raft。Raft最早 会 大 是用来处理分布式计算的共识问题,在分布式计算的过 术 程中,不同的参与者有可能会出现失败,错误或异常, 技 区块链的应用中如果是私有链,参与者不是匿名,而且 据 数 参与者恶意攻击可能性低,Raft就是很好的分布式共识 大 机制。 国  链极科技正在研究一个基于Raft的高效的拜占庭容错机 中 制,这个机制可以用在广泛的区块链的环境下。 18 20

9. 4. 其他共识机制 ) TC BD  现在区块链数据存储可信机制的研究方向是在增加效 ( 率和防范攻击方面达到平衡。 会  Proof-of-Luck(PoL) 是一个从可信计算环境- 大 Trusted Execution Environments (TEEs)的技术中 术 演化出的机制, PoL 扩展了TEEs 机制,使得运算平 技 据 均的分布在节点上,避免了专用芯片(ASICs)的出 数 现,同时大幅改进了运算的能耗和时间效率。 大  链极科技都已经在自己的产品上实现或验证了以上的 国 中 通用共识机制,并做了一些自己独有的改进。 18 20

10. ) 二、数据的处理(智能合约) TC BD 1. 最初比特币的区块链仅支持记账(挖矿)和转账,只能用于数字货币,功能有限。之后 ( 的区块链应用开始采用智能合约实现区块链中的数据处理,区块链的逻辑结构本身就和 会 日志具有相似之处。顺序连接的区块,类似按时间记录的日志。 大 2. 从数据管理角度看,智能合约与数据管理系统中的触发器和存储过程相似。不仅智能合 术 约所做的处理结果需要在区块链中保存,智能合约本身也需要被保存在区块链中,并在 技 据 系统的各个节点间同步,以确保不同节点和用户所看到的智能合约的一致性。 数 3. 现有的问题是智能服务接口通常是过程性的,需要用户撰写复杂的智能合约,与数据库系 大 统声明性的数据操纵相比,容易导致错误和漏洞产生。以太坊智能合约发生过多次攻击 国 事件。这是区块链应用中需要重点研究和解决的方面。 中 18 4. 链极科技在智能合约安全设定方面也做了很多工作。 20

11.三、数据溯源 ) TC 类似于数据库日志,区块链维护了区块链上所有操作和处理的记录。 BD 但区块链所提供的数据查询及分析处理功能较为简单。作为一种可信数 ( 据管理系统,对区块链上的数据进行溯源,是一个重要的问题。虽然理 数据 会 论上区块链平台上的每一笔交易都能够回溯,但是如何在引入复杂的特 溯源 大 性和应用后,在区块链平台所管理的数据随着应用增多、规模扩大以后 术 越来越多时,能高效处理数据溯源查询是区块链技术发展和应用中的重 技 据 要问题。 数 数据溯源方法可分成两大类,即基于批注和非批注的方法。对于 大 非批注的方法,在处理数据的过程中,不需要对源数据和目标数据(处 国 理的结果)附加额外的信息。但是,此时需要了解存储、维护数据进行 中 18 了何种处理。当处理是可逆的时候,通过目标数据,就能反推得到源数 20 据。但是很多数据库常用操作是不可逆向溯源的,比如聚集函数。

12.基于批注的数据溯源 ) 基于批注的方法通常将每个数据项变换为三元组 TC BD 标签,分别表示数据项源、目标数据(当前数据)和中间 数据结果,通过在数据处理过程中记录标签以支持数据溯 ( 会 源。关系数据库上实现的CuratedDB和Trio是两个重要的 大 数据溯源原型系统。 术 数据溯源的理论和技术与数据的结构化模式之间 技 据 关联紧密。虽然在当前的区块链应用中,数据并不一定是 数 结构化的,但是区块链数据管理中数据模式研究将成为一 大 个重要的问题,也将是现有数据溯源方法能否被成功应用 国 中 的关键问题。非结构化的数据很难记录标签和描述处理过 18 程,同样非结构化的数据溯源则是溯源问题的另一个方面。 20

13.四、可认证数据查询与处理 ) TC 在查询区块链中的数据时,确保每个区块中 BD 数据的正确性是确保最终结果可信的前提,该问 ( 题类似于数据库中的可认证查询处理与可认证查 会 大 询处理类似。区块链也常用基于Merkle-tree 的结 术 构来维护一个区块内的事务之间的关系。利用 技 据 Merkle-tree 保证查询数据的部分保密和完整性, 数 大 通常情况下出于安全和私密要求,不需要,也不 国 能向客户提供所有的相关数据,如何让用户相信 中 18 用户获得的部分数据是真实可靠的是可认证查询 20 的关键问题。

14. ) 可认证数据查询与处理 TC BD 随着区块链上查询需求的增长,在链 ( 式日志结构上的索引技术也正在成为重要的研 会 大 究问题,如使用次级索引,加速大规模的日志 术 技 的查询。包括: 据 1)一致性且可扩展的次级索引结构 数 大 2)一个高效的基于这个次级索引的加载数据 国 方法,能负载均衡的加载分布式的数据 中 18 20

15.五、区块链环境下数据管理中的监管 ) TC 区块链技术有很多具有吸引力的特性,如开放性、不容更改性、去中心化,它无 BD 法考虑到受监管的现实世界里的一些实际因素。现有的尝试有: ( 阿里巴巴申请一项区块链系统专利,允许第三方管理员执行“特殊处理”,例如 会 中止一个智能合约或是冻结与非法活动相关的账户。根据阿里提出的区块链系统,专 大 用的管理员账户能够给节点发送所谓的“特殊处理指令”,进而调动智能合约对特定 术 技 账户执行相应的操作。区块链的创建者可以为政府机构提供一个账户,允许该机构调 据 用智能合约,根据其法律或监管授权情况执行预先设定的干预措施。但是这样强大的 数 管理员账户会成为黑客的主要目标,为了适合监管的现实要求而不引入更多的风险, 大 国 还有很多研究要做。 中 现有的一种基于电脑资源硬件的安全性机制,管理员级别的节点可以和硬件绑定, 18 把这样的技术应用到监管者账号上,可以极大的减少被攻击的风险。 20

16.其他数据管理技术( BigChainDB ) ) TC 链极科技持续关注当前最新的区块链数据管理技术: BD BigChainDB 试图同时实现传统数据库管理系统的高 ( 性能和区块链系统的可伸缩性。它采用两层架构:底层 会 依赖于MongoDB,实现事务和故障恢复。高层利用基于 大 术 权威的区块链协议应对攻击情况下的容错,具有较高的 技 性能。BigChainDB 的目标应用为数字资产管理。 据 数 最新的BigchainDB 2.0希望解决的所有现有的问题, 大 并保留数据库和区块链的特性,并且解决拜占庭容错问 国 题。这些特性包括,去中心化,不可篡改,高事务处理 中 18 效率,低延迟,基于索引的结构化数据查询。 20

17.其他数据管理技术( Blockstack ) ) TC Blockstack 为普林斯顿大学研发的基于区块 BD 链的命名和存储服务。Blockstack 使用一种skip- ( 会 list技术 管理区块,以避免大规模地扫描区块链. 大 实验结果表明,它能极大地减少计算资源的消耗。 术 Blockstack的构架主要是 技 据 • 分离控制和内容数据 数 • 适用任意底层区块链 大 国 • 根据区块链构建状态机,不用修改区块链。 中 可以无缝的移植现有的区块链应用。 18 20

18. ) 链极智能科技(上海)有限公司是一家专业 TC 的区块链技术服务及业务服务商,已在全球范围 BD 内聚集了领域内的专家,在技术研发、行业应用、 ( 会 产业战略等方面均具备较强的技术储备。 大 http://linkeychain.com 术 技 据 数 大 国 中 THANKS 18 感谢聆听 20