分析Apache Spark中的Blockchain

Blockchain已经成为一个时髦词:人们对分布式分类账和密码货币感到兴奋,但是这些技术被神话和误解所笼罩。这篇演讲将通过使用Apache Spark来分析块链事务,从而对这种令人敬畏的技术在实践中是如何被实际使用的进行一些说明。我们将首先简要介绍块链,以及如何从公共二进制格式获取ETL事务图数据。然后,我们将研究如何在SARK中建模图形数据,简单地比较GrimeStand和Gracx。演示的大部分内容将是一个实时演示,运行在云中的Spark上,演示如何对数据运行de各种查询,解决诸如PageRank之类的图形算法,以识别重要的BTC地址,观察网络演进等等
展开查看详情

1.1

2. 2 Outline Blockchain 101 Blockchain to graph Graph data in Spark DEMO

3. 3 What is Blockchain Distributed ledger Linked list of blocks Trust stems from Merkle trees and proof of work (aka mining) Cryptography

4. 4 What is Block Set of transactions approved at once Metadata Hard limit 1 MB (*) header

5. 5 What is Transaction (INs, OUTs) sum of INs ≥ sum of OUTs confirming ~ including it to a new block and finding the "nonce" Alice Bob

6.6

7. 7 What is Transaction (more general case)

8. 8 Transaction to Graph M:N transactions produces a lot of edges Apache Parquet blockchain binary data -> parquet converter

9. 9 Transaction to Graph # of Satoshis sent on the edges of type [T→A] and [A→T] timestamp on the block nodes more suitable for querying the graph

10. 10 Graphs and Spark GraphX GraphFrames built-ins (label propagation, pagerank, triangles, bfs, etc.) motif ~ cypher Pregel

11. 11 Talk is Cheap Demo time

12. 12 Page Rank

13. 13 Takeways Blockchain is out there GraphFrames vs GraphX Reproducible experiments with notebooks and containers

14. 14 How to get started More projects, tutorials and examples can be found at radanalytics.io

15. 15 Thank You! This presentation http://bit.ly/sais18 Jiri-Kremser/bitcoin-insights @JirkaKremser