AliGraph:大规模图神经网络平台

AliGraph:大规模图神经网络平台
PAI机器学习平台介绍
深度神经网络面临的两个问题
常见的图计算
GNN的应用 – 分类
……

展开查看详情

1.AliGraph:大规模图神经网络平台 李永(九丰) 阿里巴巴资深技术专家 计算平台事业部

2.PAI机器学习平台介绍 https://data.aliyun.com/product/learn 简单易用 功能强大

3.PAI机器学习平台介绍

4.PAI机器学习平台特性 一站式 STOA 精心优化的 弹性 机器学习平台 机器学习算法 深度学习引擎 模型预测服务 数据处理,特征加工 经典机器学习 简化模型部署负担 阿里内部大规模任务打磨, 模型训练,在线预测 阿里自研算法 支持扩缩容,降低成本 PAI-Tensorflow引擎 兼顾离线&实时

5.深度神经网络面临的两个问题 模型可解释性 难以理解模型特征以及决策逻辑 缺少数学工具来评测网络的表达能力 因果关系推理 美国增加关税会影响中国GDP吗 博士毕业的薪水会比硕士要高吗?

6.图 G = (V, E) V = Vertex E = Edge 同构图 异构图 有向图 无向图

7.常见的图计算 图数据库 Neo4J,Titan 实时图分析查询 Aliyun GraphCompute, Amazon Neptune 离线图处理 Pregel, PowerGraph, Spark GraphX

8.图+深度学习 = 图神经网络 非规则化的数据 Graph Embedding

9.图神经网络的应用领域 社交领域 推荐领域 知识图谱 生命科学 反作弊 线上支付

10.GNN的应用 – 分类

11.GNN的应用 – 关系预测

12.GNN大规模应用的四大挑战 规模庞大 点边异构 属性丰富 动态变化 数百亿甚至数千亿点, 同构、异构、 点属性,边属性 节点、边的增删更新 数千亿甚至数万亿的 多边、多属性 边

13.AliGraph:大规模GNN平台 采样&建模&训练一体化 的GNN平台

14.AliGraph系统架构

15.AliGraph编程范式

16.AliGraph编程范式 sample aggregate combine

17.AliGraph五大特点 大规模 分布式 稀疏内 自创 线性 图存储 采样 核优化 SGCN 扩展

18.基于内存的图存储 • 分布式的图存储 • 支持百亿点的规模,可伸缩 • 基于Vertex Cut的分片 • Worker基于出入度的缓存优化

19.缓存效果 比随机方法快40%-50%, 缓存加速: 比LRU方法快50%-60% 缓存加速:比随机方法快40%-50%,比LRU方法快50%-60%

20.分布式采样 • 支持丰富的采样策略 • 支持多跳的采样功能 • 毫秒级的采样性能 • 模块化的采样设计 • 本地/全局的负采样

21.稀疏内核优化 加速原始版本GCN达 3x!

22.自创SGCN

23.分布式扩展 去中心化 Distribute Negative Sampling 多机异步训练

24.AliGraph API 以点为中心 边表混合 采样&建模&训练一体

25.如何使用

26. 扫码加入社群 与志同道合的码友一起 粘贴二维码 Code Up 阿里云开发者社区

27.谢谢!