- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 文档嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
图数据库场景及展望
邵宗文老师对图数据库进行了市场分析,主要讲述了图数据库的市场趋势、热门产品,以及国内外的一些图数据库发展情况。接着进行了应用分析,比如使用图数据库的行业领域、相关领域的一些代表性公司以及应用情况等。最后通过其与关系型数据库的对比,让我们了解到两者的差异和优劣。
展开查看详情
1 . 图数据库场景及展望 演讲人:腾讯云 邵宗文 全球敏捷运维峰会 广州站
2 .目录 1. 市场分析 2. 应用分析 3. 优劣对比 全球敏捷运维峰会 广州站
3 .1. 市场分析 全球敏捷运维峰会 广州站
4 .急速增长中的图数据库 全球敏捷运维峰会 广州站
5 .百花齐放的图数据库 Operational 图数据库 RDF图数据库 多模式图数据 分析及大图数据库 Neo4j AllegroGraph Azure Cosmos DB Apache Giraph Titan Blazegraph ArangoDB Turi JanusGraph Virtuoso Sqrrl TigerGraph OrientDB Stardog RedisGraph CayLey Dgraph 全球敏捷运维峰会 广州站
6 .图数据库重点软件发展 图数据库的关注度越来越多,并且大部分都是有持续在更新 全球敏捷运维峰会 广州站
7 . 人气王neo4j已收揽千万级的下载量 neo4j下载量 neo4j使用经验 图数据库 10M+ 工程师 50K+ 参会人数 50K+ 从下载数量来看还是前景很大 通过多年培训和逐步推广 图数据库相关技术会议 有7M是基于下的neo4j的docker版 目前大概有5万多名 GraphConnect大会已有上千人参会。 全球敏捷运维峰会 广州站
8 .以neo4j为例的数据大盘展示 全球敏捷运维峰会 广州站
9 .数据库巨头也在加大图数据库投入 1 国外的图数据库情况 2 国内图数据库情况 2017年11月底,亚马逊在 AWS 2017年10月,华为云推出了图引擎服务 2017全球峰会发布了全新的图数据库 产品:Neptune. 阿里云蚂蚁金服Geabase图数据库已 2017年7月,SQL Server 2017 rc1 开始在宣传,但还未在阿里云发布 发布,引入了图数据库的支持,2017 年10月正式发布。 2018年8月,百度推出了hugeGraph 2017年3月,Oracle 12.2开始支持属 性图和图分析 图数据库 全球敏捷运维峰会 广州站
10 . 存量市场-大数据机遇 全球Hadoop和大数据市场规模 2017- 大数据业务市场增长最快的类别2015-2020 2022 120 $99.30 50.00% 38.60% 100 40.00% 30.00% 23.30% 80 $69.80 17.30% 16.60% 14.60% 20.00% 9.30% 60 $49.10 10.00% 0.00% $34.60 40 $24.30 $17.10 20 0 2017 2018 2019 2020 2021 2022 The Hadoop and Big Data Market are projected to grow from $17.1B in 2017 to $99.31B in 2022 attaining a 非关系数据存储,预计将成为大数据中增长最快的技术类别。 28.5% CAGR. 2015年至2020年的复合年增长率为38.6% 来源:StrategyMRC 全球敏捷运维峰会 广州站
11 .存量市场-大数据国内增速远高于国外。 全球大数据市场增长2017-2019($ billion) 中国大数据市场增长2017-2019($ million) $2,392 $3,000.00 .60 $2,500.00 $30.00 $26.00 $1,460 $2,000.00 $25.00 $20.60 .60 $20.00 $1,500.00 $747.2 $15.50 $1,000.00 0 $15.00 127.20 $10.00 $500.00 $95.90 % 63.80% $5.00 $0.00 36.30% 32.40% 26.20% 2017 2018 2019 $0.00 2017 2018 2019 全球大数据市场增长趋势明显 国内大数据市场增速远高于USA\UK等国家 2017年增速达127.2%,2018年增速达95.5% 全球敏捷运维峰会 广州站
12 .存量市场-在大数据领域,硬件和服务占了很大比重 全球大数据收入细分 2016-2027 (十亿美元计) 服务 硬件 软件 营收分块 Hardware Software Sevices $120 $100 $80 $46 $38 $42 $60 $31 $34 38.00% 28.60% $27 $24 $20 $22 $23 $24 $40 $17 $20 $14 $18 $19 $11 $16 $8 $12 $14 $15 33.30% $20 $10 $33 $9 $24 $26 $27 $29 $31 $32 $14 $16 $19 $21 $11 $0 2016 2017 2018 2019 2020 2021 2022 2023 2024 2025 2026 2027 2017-2022,硬件营收占比约为28.6%。2017年,近46.17亿美元;2022年,约198.62亿美元 全球敏捷运维峰会 广州站
13 .增量市场-万物互联,数据爆发带来了图数据库的机会 市场规模 连接数量 《2018-2023 年中国物联网行业细分市场需求与投资 国内:据工信部数据,截至 2018H1,我国物联网终端 机会分析报告》数据显示,中国物联网行业到2018 年 用户数已达到 4.65 亿,是2017年同期的 2.5 倍 市场规模将突破2万亿元,到 2022年将接近7.2 万亿元。 全球: 2017年,全球物联网连接数达到 84 亿,首次超越人的连接 2018年,全球连接数将超过 90 亿,增长16.6% 2025年,将达到 251 亿,增长27.3% 全球敏捷运维峰会 广州站
14 .2. 应用分析 全球敏捷运维峰会 广州站
15 .兼具直观性的图数据库 一图胜过千言万语 比起传统的信息存储和组织模 式,图数据库能够很清晰揭示复 杂的模式,尤其在错综复杂的社交, 物流,金融风控行业效果更为明 显。 全球敏捷运维峰会 广州站
16 .图数据库:特点 更好,更快速的查询和分析:图数据库为查询相关数据(无论大小)提供了卓越的性能。 图模 型提供了固有的索引数据结构,因此它不需要为给定条件的查询加载或接触不相关的数据。 这 使得它成为更好、更快的实时大数据分析查询的绝佳解决方案。 。 更简单和更自然的数据建模:使用关系型数据库建模的人都需要了解数据库的规范化和参照完整 性的严格规则。 一些NoSQL数据库则走向了另一个极端,将所有类型的数据放在一个大型表中。 另一方面,在图数据库中,可以定义任意类型的顶点类型来表示对象,并定义边类型来表示特定 的关系。 同时支持实时更新和查询:图数据库支持对大图形数据的实时更新,同时支持查询。 数据结构的灵活性:图数据库具有灵活的schema修改。 用户可以不断添加或删除新的顶点、边 和属性,扩展或缩小数据模型。 这对管理不断变化的对象类型特别方便。 大多数图数据库可以 在线修改schema,同时继续提供查询。 全球敏捷运维峰会 广州站
17 .覆众多行业场景,尤其是在社交和金融风控领域 社交网络 金融风控 知识图谱 关系分析 车联网应用 网络&IT运 推荐引擎 维 社交网络 推荐引擎 网络&IT运维 金融风控 通过用户兴趣、好友和阅 基础设备规模庞大、结构 提供实时的用户行为检测 数十亿个关系查询延迟降低到 ,识别敏感用户,及时识 读历史记录等信息之间的 复杂,帮助深入了解设备 秒级,目前传统关系型数据库 别欺诈风险,错综复杂的 关系,向用户提供推荐。 状态、设备之间的关系, 基本无法实现超过3层好友关 实现全网络设备智能监控 人物关系分析,进行用户 系的查询。 电商,短视频,新零售等都 与管理 分群,识别异常群体 有强烈需求。 全球敏捷运维峰会 广州站
18 .金融风控场景涉及维度多,传统数据库无法很好解决 银行风险压力 利用图谱网络开展风险管理 • 合规监管风险 员工管理 •员工与亲属、员工与外部企业 • 黑产欺诈风险 客户管理 • 内部员工风险 •财务状况、征信、行业、资金流动性、重大事件 关系管理 •亲属关系、股权关系、集团关系、业务关系、供应链、行业关系 业务管理 •业务流程、业务合规、业务资金、业务进展、业务数据 全球敏捷运维峰会 广州站
19 .金融风控场景涉及维度多,传统数据库无法很好解决 全球敏捷运维峰会 广州站
20 .发现隐藏股东和集团边界情况 全球敏捷运维峰会 广州站
21 .发现风险预警 全球敏捷运维峰会 广州站
22 .社交推荐案例-如何向用户推荐最符合需求和兴趣的聚会活动A 全球敏捷运维峰会 广州站
23 .社交推荐案例-如何向用户推荐最符合需求和兴趣的聚会活动B 全球敏捷运维峰会 广州站
24 .社交推荐案例-如何向用户推荐最符合需求和兴趣的聚会活动C 全球敏捷运维峰会 广州站
25 .社交推荐案例-如何向用户推荐最符合需求和兴趣的聚会活动D 全球敏捷运维峰会 广州站
26 .3. 优劣对比 全球敏捷运维峰会 广州站
27 .图数据库目前优势明显,还需在性能和周边需要完善。 图数据库在处理关联关系上具有完全的优势,特别是在我们这个社交网络得到极大发展的互联网 时代。例如我们希望知道谁LIKES(喜欢)谁(喜欢可以是单向或双向),也想知道谁是谁的 FRIEND_OF(朋友),谁是所有人的LEADER_OF(领导)。除了在关联查询中尤为明显的优越性, 图数据库还有如下优势: a) 用户可以面向对象的思考,用户使用的每个查询都有显式语义; b) 用户可以实时更新和查询图数据库; c) 图数据库可以灵活应对海量的关系变化,如增加删除关系、实体等; d) 图数据库有利于实时的大数据挖掘结果可视化。 图数据库虽然弥补了很多关系型数据库的缺陷,但还有一些不足地方,如: a) 不适合记录大量基于事件的数据(例如日志条目); b) 二进制数据存储。 c) 并发性能要求高的项目。 d) 目前相关图查询语言比较多,尚未有很好统一。 e) 图数据库相关的一些书籍文档偏少。 f ) 相关生态还在不断完善。 全球敏捷运维峰会 广州站
28 . Relational vs Graph的大比拼 https://neo4j.com/developer/guide-sql-to-cypher/ 全球敏捷运维峰会 广州站
29 .在常规查询面前,基本没有特别大的差异 SELECT p.*FROM products as p; MATCH(p:Product)RETURNp; SELECT p.ProductName, p.UnitPriceFROM MATCH(p:Product) products as pORDER BY p.UnitPrice DESCLIMIT RETURNp.productName,p.unitPrice ORDERB 10; Yp.unitPrice DESC LIMIT10; SELECT p.ProductName, p.UnitPriceFROM MATCH(p:Product)WHEREp.productNameSTARTS products AS pWHERE p.ProductName LIKE 'C%' WITH"C"ANDp.unitPrice>100RETURNp.productN AND p.UnitPrice>100; ame,p.unitPrice; 全球敏捷运维峰会 广州站