图数据库场景及展望

邵宗文老师对图数据库进行了市场分析,主要讲述了图数据库的市场趋势、热门产品,以及国内外的一些图数据库发展情况。接着进行了应用分析,比如使用图数据库的行业领域、相关领域的一些代表性公司以及应用情况等。最后通过其与关系型数据库的对比,让我们了解到两者的差异和优劣。

展开查看详情

1. 图数据库场景及展望 演讲人:腾讯云 邵宗文 全球敏捷运维峰会 广州站

2.目录 1. 市场分析 2. 应用分析 3. 优劣对比 全球敏捷运维峰会 广州站

3.1. 市场分析 全球敏捷运维峰会 广州站

4.急速增长中的图数据库 全球敏捷运维峰会 广州站

5.百花齐放的图数据库 Operational 图数据库 RDF图数据库 多模式图数据 分析及大图数据库 Neo4j AllegroGraph Azure Cosmos DB Apache Giraph Titan Blazegraph ArangoDB Turi JanusGraph Virtuoso Sqrrl TigerGraph OrientDB Stardog RedisGraph CayLey Dgraph 全球敏捷运维峰会 广州站

6.图数据库重点软件发展 图数据库的关注度越来越多,并且大部分都是有持续在更新 全球敏捷运维峰会 广州站

7. 人气王neo4j已收揽千万级的下载量 neo4j下载量 neo4j使用经验 图数据库 10M+ 工程师 50K+ 参会人数 50K+ 从下载数量来看还是前景很大 通过多年培训和逐步推广 图数据库相关技术会议 有7M是基于下的neo4j的docker版 目前大概有5万多名 GraphConnect大会已有上千人参会。 全球敏捷运维峰会 广州站

8.以neo4j为例的数据大盘展示 全球敏捷运维峰会 广州站

9.数据库巨头也在加大图数据库投入 1 国外的图数据库情况 2 国内图数据库情况 2017年11月底,亚马逊在 AWS 2017年10月,华为云推出了图引擎服务 2017全球峰会发布了全新的图数据库 产品:Neptune. 阿里云蚂蚁金服Geabase图数据库已 2017年7月,SQL Server 2017 rc1 开始在宣传,但还未在阿里云发布 发布,引入了图数据库的支持,2017 年10月正式发布。 2018年8月,百度推出了hugeGraph 2017年3月,Oracle 12.2开始支持属 性图和图分析 图数据库 全球敏捷运维峰会 广州站

10. 存量市场-大数据机遇 全球Hadoop和大数据市场规模 2017- 大数据业务市场增长最快的类别2015-2020 2022 120 $99.30 50.00% 38.60% 100 40.00% 30.00% 23.30% 80 $69.80 17.30% 16.60% 14.60% 20.00% 9.30% 60 $49.10 10.00% 0.00% $34.60 40 $24.30 $17.10 20 0 2017 2018 2019 2020 2021 2022 The Hadoop and Big Data Market are projected to grow from $17.1B in 2017 to $99.31B in 2022 attaining a 非关系数据存储,预计将成为大数据中增长最快的技术类别。 28.5% CAGR. 2015年至2020年的复合年增长率为38.6% 来源:StrategyMRC 全球敏捷运维峰会 广州站

11.存量市场-大数据国内增速远高于国外。 全球大数据市场增长2017-2019($ billion) 中国大数据市场增长2017-2019($ million) $2,392 $3,000.00 .60 $2,500.00 $30.00 $26.00 $1,460 $2,000.00 $25.00 $20.60 .60 $20.00 $1,500.00 $747.2 $15.50 $1,000.00 0 $15.00 127.20 $10.00 $500.00 $95.90 % 63.80% $5.00 $0.00 36.30% 32.40% 26.20% 2017 2018 2019 $0.00 2017 2018 2019 全球大数据市场增长趋势明显 国内大数据市场增速远高于USA\UK等国家 2017年增速达127.2%,2018年增速达95.5% 全球敏捷运维峰会 广州站

12.存量市场-在大数据领域,硬件和服务占了很大比重 全球大数据收入细分 2016-2027 (十亿美元计) 服务 硬件 软件 营收分块 Hardware Software Sevices $120 $100 $80 $46 $38 $42 $60 $31 $34 38.00% 28.60% $27 $24 $20 $22 $23 $24 $40 $17 $20 $14 $18 $19 $11 $16 $8 $12 $14 $15 33.30% $20 $10 $33 $9 $24 $26 $27 $29 $31 $32 $14 $16 $19 $21 $11 $0 2016 2017 2018 2019 2020 2021 2022 2023 2024 2025 2026 2027 2017-2022,硬件营收占比约为28.6%。2017年,近46.17亿美元;2022年,约198.62亿美元 全球敏捷运维峰会 广州站

13.增量市场-万物互联,数据爆发带来了图数据库的机会 市场规模 连接数量 《2018-2023 年中国物联网行业细分市场需求与投资 国内:据工信部数据,截至 2018H1,我国物联网终端 机会分析报告》数据显示,中国物联网行业到2018 年 用户数已达到 4.65 亿,是2017年同期的 2.5 倍 市场规模将突破2万亿元,到 2022年将接近7.2 万亿元。 全球: 2017年,全球物联网连接数达到 84 亿,首次超越人的连接 2018年,全球连接数将超过 90 亿,增长16.6% 2025年,将达到 251 亿,增长27.3% 全球敏捷运维峰会 广州站

14.2. 应用分析 全球敏捷运维峰会 广州站

15.兼具直观性的图数据库 一图胜过千言万语 比起传统的信息存储和组织模 式,图数据库能够很清晰揭示复 杂的模式,尤其在错综复杂的社交, 物流,金融风控行业效果更为明 显。 全球敏捷运维峰会 广州站

16.图数据库:特点 更好,更快速的查询和分析:图数据库为查询相关数据(无论大小)提供了卓越的性能。 图模 型提供了固有的索引数据结构,因此它不需要为给定条件的查询加载或接触不相关的数据。 这 使得它成为更好、更快的实时大数据分析查询的绝佳解决方案。 。 更简单和更自然的数据建模:使用关系型数据库建模的人都需要了解数据库的规范化和参照完整 性的严格规则。 一些NoSQL数据库则走向了另一个极端,将所有类型的数据放在一个大型表中。 另一方面,在图数据库中,可以定义任意类型的顶点类型来表示对象,并定义边类型来表示特定 的关系。 同时支持实时更新和查询:图数据库支持对大图形数据的实时更新,同时支持查询。 数据结构的灵活性:图数据库具有灵活的schema修改。 用户可以不断添加或删除新的顶点、边 和属性,扩展或缩小数据模型。 这对管理不断变化的对象类型特别方便。 大多数图数据库可以 在线修改schema,同时继续提供查询。 全球敏捷运维峰会 广州站

17.覆众多行业场景,尤其是在社交和金融风控领域 社交网络 金融风控 知识图谱 关系分析 车联网应用 网络&IT运 推荐引擎 维 社交网络 推荐引擎 网络&IT运维 金融风控 通过用户兴趣、好友和阅 基础设备规模庞大、结构 提供实时的用户行为检测 数十亿个关系查询延迟降低到 ,识别敏感用户,及时识 读历史记录等信息之间的 复杂,帮助深入了解设备 秒级,目前传统关系型数据库 别欺诈风险,错综复杂的 关系,向用户提供推荐。 状态、设备之间的关系, 基本无法实现超过3层好友关 实现全网络设备智能监控 人物关系分析,进行用户 系的查询。 电商,短视频,新零售等都 与管理 分群,识别异常群体 有强烈需求。 全球敏捷运维峰会 广州站

18.金融风控场景涉及维度多,传统数据库无法很好解决 银行风险压力 利用图谱网络开展风险管理 • 合规监管风险 员工管理 •员工与亲属、员工与外部企业 • 黑产欺诈风险 客户管理 • 内部员工风险 •财务状况、征信、行业、资金流动性、重大事件 关系管理 •亲属关系、股权关系、集团关系、业务关系、供应链、行业关系 业务管理 •业务流程、业务合规、业务资金、业务进展、业务数据 全球敏捷运维峰会 广州站

19.金融风控场景涉及维度多,传统数据库无法很好解决 全球敏捷运维峰会 广州站

20.发现隐藏股东和集团边界情况 全球敏捷运维峰会 广州站

21.发现风险预警 全球敏捷运维峰会 广州站

22.社交推荐案例-如何向用户推荐最符合需求和兴趣的聚会活动A 全球敏捷运维峰会 广州站

23.社交推荐案例-如何向用户推荐最符合需求和兴趣的聚会活动B 全球敏捷运维峰会 广州站

24.社交推荐案例-如何向用户推荐最符合需求和兴趣的聚会活动C 全球敏捷运维峰会 广州站

25.社交推荐案例-如何向用户推荐最符合需求和兴趣的聚会活动D 全球敏捷运维峰会 广州站

26.3. 优劣对比 全球敏捷运维峰会 广州站

27.图数据库目前优势明显,还需在性能和周边需要完善。 图数据库在处理关联关系上具有完全的优势,特别是在我们这个社交网络得到极大发展的互联网 时代。例如我们希望知道谁LIKES(喜欢)谁(喜欢可以是单向或双向),也想知道谁是谁的 FRIEND_OF(朋友),谁是所有人的LEADER_OF(领导)。除了在关联查询中尤为明显的优越性, 图数据库还有如下优势: a) 用户可以面向对象的思考,用户使用的每个查询都有显式语义; b) 用户可以实时更新和查询图数据库; c) 图数据库可以灵活应对海量的关系变化,如增加删除关系、实体等; d) 图数据库有利于实时的大数据挖掘结果可视化。 图数据库虽然弥补了很多关系型数据库的缺陷,但还有一些不足地方,如: a) 不适合记录大量基于事件的数据(例如日志条目); b) 二进制数据存储。 c) 并发性能要求高的项目。 d) 目前相关图查询语言比较多,尚未有很好统一。 e) 图数据库相关的一些书籍文档偏少。 f ) 相关生态还在不断完善。 全球敏捷运维峰会 广州站

28. Relational vs Graph的大比拼 https://neo4j.com/developer/guide-sql-to-cypher/ 全球敏捷运维峰会 广州站

29.在常规查询面前,基本没有特别大的差异 SELECT p.*FROM products as p; MATCH(p:Product)RETURNp; SELECT p.ProductName, p.UnitPriceFROM MATCH(p:Product) products as pORDER BY p.UnitPrice DESCLIMIT RETURNp.productName,p.unitPrice ORDERB 10; Yp.unitPrice DESC LIMIT10; SELECT p.ProductName, p.UnitPriceFROM MATCH(p:Product)WHEREp.productNameSTARTS products AS pWHERE p.ProductName LIKE 'C%' WITH"C"ANDp.unitPrice>100RETURNp.productN AND p.UnitPrice>100; ame,p.unitPrice; 全球敏捷运维峰会 广州站

数据连接未来!围绕Database、Bigdata、AiOps的企业级专业社群。行业大咖、技术干货,每天精品原创文章推送,每周线上技术分享,每月线下技术沙龙,受众20W+。