- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 文档嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
陈才 - 数据资产管理在腾讯游戏的实践
腾讯游戏数据管理负责人陈才分享《数据资产管理在腾讯游戏的实践》
展开查看详情
1 .数据资产管理在腾讯游戏的实践 演讲人:陈才 2019 中国数据智能管理峰会
2 .个人简介 陈才 七年数据管理工作经验 90后 腾讯高级工程师 专注方向 数据资产管理、自动化运维、AIOps 2019 中国数据智能管理峰会
3 .腾讯游戏大数据运营概况 15w+表 离线计算量:220+万/天 4000亿+数据 端游 100+ 款 流式计算量:2000+万/秒 100P+ 4w+表 页游 90+ 款 600亿+数据 多维分析 Bitmap Index Data Mapper Generator Bitmap Filter Col-1 Col-1 Col… Builder 30w+表 Execute Engine Dynamic Bitmap Index Cache Aggregate TDW 手游 300+ 款 13000亿+数据 Merger 每日传输量:17000亿条,约260TB,总存储量为100PB+,公司占比为20% 2019 中国数据智能管理峰会
4 .问题与痛点 在游戏大数据管控中,面临着众多问题与痛点 01 数据多样化,缺少统一标准 02 计算逻辑理解一不致,导致统计结果有偏差 03 数据全链路质量问题,层次复杂、不能快速定位问题 04 数据质量偏低给数据应用带来的各种挑战 游戏数据管控的问题与难点 05 数据标准缺乏结构化管理,集成困难 06 数据分散,没有形成完整的成本管理 07 数据价值的评估较为困难 08 数据安全与合规保障的问题 …… 2019 中国数据智能管理峰会
5 .发展历程 构建游戏大数据资产管理体系-历经6年在各阶段解决的关键问题 数据集成 数据治理 • 数据孤岛形成 • 没有统一数据平台 资产运营 • 数据标准缺失 • 数据流转架构混乱 • 数据传输时延高 • 质量参差不齐 • 数据成本剧增 数据驱动 • 数据安全防护差 • 数据集成效率低 • 指标概念不一 • 数据血缘不完整 • 平台组件不够稳定 • 数据合规存在风险 • 数据价值难评估 • 数据获取效率低 • 数据生命周期不合理 • 运营效率有待提升 2013年 2014年 2016年 2018年 2019年 游戏大数据资产管理:通过组织、流程、制度、技术等组合手段,确保数据交付的 质量、效率、成本和安全,助力业务数据价值提升 2019 中国数据智能管理峰会
6 .能力模型——“三好” “用好”数据资产 “管好”数据资产 “看好”数据资产 产品PM 产品PM 数据管理人员 数据地图 平台指引 数据价值 成本结算 安全管理人员 数据助手 业务指标 资源视图 数据热点 数据审计 数据追溯 知识图谱 线下培训 数据应用 数据血缘 血缘跟踪 异常分析 产品开发 数据管理人员 产品开发 产品运维 业务管理 数据映射 产品运维 数据字典 数据源管理 配置管理 资源调度 产品PM 数据变更 数据质量 评估影响 数据质量 权限流程 安全规范 数据检索 数据接入 成本管理 元数据管理 安全策略 制度管理 通用模块 专属模块 2019 中国数据智能管理峰会
7 .体系架构 数据增值服务 可视化报表 效果分析 活动营销 消息推送 渠道管理 战绩查询 更多… 资产管理平台 资产总览 资产治理 资产服务 资产安全 价值评估 更多… 数据集成 数据治理 资产运营 数据驱动 数据采集 数据标准 成本优化 价值评估 数据清洗 流程制度 生命周期管理 热度分析 数据传输 数据质量 安全管理 广度分析 数据整合 数据共享 影响评估 收益度分析 数据存储 数据血缘 DevAIOps 数据开放 元数据管理 元数据标准 技术元数据 业务元数据 元数据存储 元数据检索 元数据开放 更多… 游戏大数据资产管理体系 2019 中国数据智能管理峰会
8 .元数据管理 元数据(Metadata)——描述数据的数据 按服务对象划分 业务元数据 技术元数据 2019 中国数据智能管理峰会
9 . 元数据管理 元数据应用 元数据检索 数据一体化 质量监控 资源管理 其他应用 更新管理 版本管理 用户管理 日志管理 可视化 ▫ 元数据能力特点 元数据管理 同步管理 其他管理 权限管理 备份恢复 接口管理 ➢ 异构适配,集中存储 ➢ 业务指标,开放共享 ➢ 描述数据,理解业务 技术元数据 其 元数据存储 元数据 DataMore iData 一体化 它 服务接口 ➢ 自动构建血缘关系链 业务元数据 实时规则 图灵 更多… ➢ 扩展能力,辅助运营 元数据采集转换层 模型桥接器 数据映射桥接器 异构数据源 DBMS NoSQL 日志文本 TDW 外部接口 业务系统 其它… 元数据管理体系技术架构 2019 中国数据智能管理峰会
10 .数据资产目录-某业务视图 2019 中国数据智能管理峰会
11 . 数据集成-数据采集架构 服务发现 Web管理端 Consul / L5 服务特性: TCP • 单机: UDP:5W qps; KV-JSON TGlog_Svr TGlog_Svr KCP: 9w; TCP:10w UDP 明文结构 游戏客户端 GW TGlog_Svr • 单机吞吐量:180Mbps 自定义 序列化 传 • 分布式高可用,双方扩容互 HTTP 不耦合 输 TGlog_Svr • 高可用,高可靠:扩容不丢 PB/TDR 体 TGlog_Svr 序列化 游戏服务端 LB RPC 失数据;WAL双备数据 系 TGlog_Svr RPC-Proto • 完整率: 99.99~99.9999% File I/O • 多协议支持;多数据格式支 DB-Binlog 持 TDBANK KCP • 专业数据管理、数据运维 AGENT 规范结构 • 周边系统完善支持 布道 LogX 元数据管理 专业运维管理 在线实时检索 2019 中国数据智能管理峰会
12 .数据治理-数据标准管理 统一日志规范 数据标准服务 数据项标准 指标项标准 业务属性 指标命名 技术属性 指标值域 管理属性 生成逻辑 数据标准管理 统一接入流程 组织职责 制度规范 流程管控 标准维护 2019 中国数据智能管理峰会
13 .数据治理-数据质量监控覆盖 数据 设备基础监控 集群计算监控 服务可用监控 应用 应用链路监控 计算延迟监控 任务状态监控 设备基础监控 集群存储监控 计算延迟监控 数据掉零监控 数据存储+计算 集群计算监控 来源变更监控 字典变动监控 资源容量监控 设备基础监控 传输流量监控 数据对账监控 数据掉零监控 数据传输 传输配置监控 来源变更监控 字典变动监控 服务心跳监控 设备基础监控 集群存储监控 数据对账监控 数据掉零监控 数据采集 采集配置监控 服务心跳监控 完整性 一致性 准确性 及时性 大数据质量监控多维覆盖 2019 中国数据智能管理峰会
14 . 数据治理-面临挑战 在线运营 (终点) 微服务 服务网关 服务治理 运营策略 数据服务运营质量面临三大挑战: ⚫ 全链路数据服务环节众多复杂,问题定 Tredis存储 Storm流式 Kafka消息 位困难 数据透传 ⚫ 业务服务故障,回溯数据问题非常困难 TGlog采集 数据传输 ⚫ 数据平台异常,如何快速评估影响面? 数据源 离线存储 离线计算 (起点) 基于数据流构建的微服务技术架构 解决方案:基于数据+业务血缘构建全链路质量保障体系 2019 中国数据智能管理峰会
15 . 数据治理-血缘构建 数据与业务血缘关系链构建过程 • 微服务调用跟踪链 dSaaS 营销活动 分析报表 精准推荐 安全打击 其他应用 • 接口使用指标关系 • 集群调度信息 • 接口部署信息 iPaaS 应用开发平台 • ….. 数 PaaS计算层 • 集群负载情况 据 实时计算 在线RMDB 任务调度 离线计算 MR • 数据消费关系 与 • 数据指标关系 流式计算 KV存储 调度引擎 HDFS Spark • 数据存储关系 业 • • 离线计算关系 ….. 务 PaaS数据层 MQ消息中间件 血 数据分发 • • 数据入库关系 离线导入关系 缘 业务数据 采集传输 • 数据透传关系 关 结构化 非结构化 SDK 采集集群 跨城传输 跨国传输 ….. 系 • IaaS • 基础指标信息 链 云服务器 IDC服务器 网络 • 项目与资源关系 云存储 云计算 IDC存储 IDC计算 私有网络 公有网络 • ….. 数据服务流转架构 2019 中国数据智能管理峰会
16 .数据治理-血缘应用效果 ⚫ 构建数据与业务血缘,保障数据全链路服务质量SLA达99.99+% ⚫ 1min内告警并评估影响面和问题快速定位 2019 中国数据智能管理峰会
17 .资产运营-成本管理 大数据成本管理架构 成本报告 同比环比 增长趋势 优化推荐 成本预警 业务成本 平均成本 成本优化 生命周期推荐 资源降配 资源调度优化 计算逻辑优化 数据服务成本 成本评测 成本对比 ROI评分 资源盘点 预算Review 存储成本 计算成本 成本组成 存储成本 计算成本 数据服务成本 成本对比 大数据引擎 存储引擎 计算引擎 数据服务引擎 2019 中国数据智能管理峰会
18 .资产运营-成本管理 某业务数据资产成本管理视图 2019 中国数据智能管理峰会
19 .资产运营-数据生命周期管理 ⚫ 数据生命周期管理面临问题 无数据生命周期管理会发生什么? 数据无序增长 成本快速上升 计算效率低下 数据维护困难 2019 中国数据智能管理峰会
20 .资产运营-数据生命周期管理 ■ 数据在线度与生命周期 数据在线度 ⚫ 数据在线度的评估 阈值1 随时间推移,数据使用价值不断衰减,数据在 归档阶段 线度就是反应数据的在线程度和使用衰减情况 在线阶段 近线阶段 阈值2 时间 影响数据在线度的因素:数据使用价值和数据 重要等级,而数据使用价值有跟数据访问热度 ■ 数据分类和重要等级 和应用广度有关,数据在线度的关联函数为 数据分类 说明 重要等级 𝒚(𝒕) = 𝒇(𝑽(𝒕), 𝑰) 收入类 充值、消费类,跟资金财产有关的数据 其中𝑽(𝒕)为数据使用价值, 𝑰为数据重要等级 在线类 用户注册、登录、登出等在线类数据 状态类 游戏用户属性、等级等状态类数据 数据生命周期管理策略随在线度的变化而变化 行为类 用户在游戏内的体验操作等行为日志 性能类 服务器性能、资源容量等数据 2019 中国数据智能管理峰会
21 .资产运营-数据安全管理 游戏数据资产安全管理“四大” 关键举措 合法合规 制度规范 国内和出海游戏数据按各国家 制定和完善《游戏用户核心数据 /组织相关法案及监督要求合 1 2 安全管理规范》 法合规采集、存储和使用 技术保障 安全管理平台 采用数据脱敏、加密技术、租 户隔离、角色授权等技术手段 3 4 通过敏感度分级、安全审计、 数据脱敏等手段,做到“事前 保障游戏数据安全传输、存储 可管 、事中可控 、事后可 和使用 查 ”,防止数据非法使用。 资产安全管理方法论:“制度先行、流程规范、技术保障、平台支撑” 2019 中国数据智能管理峰会
22 .资产运营-数据安全管理 数据使用方 游戏工作室 其他BG 业务安全 业务运维 游戏研发 更多… 资产安全管理 合法合规 制度规范 技术保障 资产安全管理平台 更多… 事前可管 事中可控 事后可查 敏感度分级 加密存储/传输 实时告警 安全审计 权限管理 敏感数据脱敏 事件处理 访问记录 离转岗人员 安全事件模拟 权限回收 下载记录 合法合规检查 风险评估 授权监控 安全报告 数据平台 TDW TGLog TSpider TRedis 更多… 游戏大数据安全管理体系 2019 中国数据智能管理峰会
23 .资产运营-数据安全管理 数据安全实时监控和操作审计架构 数据平台 Receiver 实时计算 告警 实时计算框架 消息队列 Tube 告警 Storm TRedis 规则 Receiver … 组织架构 权限管理 敏感度管理 Receiver 告警 异常权限检测 模块 采集访问/下载记录 管理 配置和管理 安全审计和监控视图 上报/审批/计算/视图/告警 告警 结果 运营报表 审计入口 统计监控页面 2019 中国数据智能管理峰会
24 .资产运营-数据安全管理效果 某业务资产安全管理视图总览 ⚫ 分钟级的数据安全实时监控 ⚫ 提供“事后”安全审计服务,回溯事件 ⚫ 数据安全事故0起发生 2019 中国数据智能管理峰会
25 .数据驱动-数据价值评估 ⚫ 实施数据价值评估的意义 • 衡量业务的投入产出比 数据 • 衡量数据发挥的作用 价值 • 为产品提供运营决策依据 • 衡量数据服务平台能力水平 ⚫ 数据价值评估的难点 价值 数据 • 行业内无统一标准和方法 • 公司内缺乏可量化的估值体系 • 数据价值存场景化差异性 如何做数据资产价值评估? 2019 中国数据智能管理峰会
26 .数据驱动-数据价值评估 数据价值评估“三度”模型 模型成熟度 成熟运营期 研究观察期 热度 广度 收益度 价值表现 热度评分与等级 应用广度评分 业务贡献评分 评估模型 热度评分模型 依赖计算模型 A/B Test计算模型 价值指标 数据访问热度 数据血缘关系 业务运营指标 数据应用 分析报表 营销活动 数据挖掘 精准推荐 业务安全 其他… 数据流 数据采集 数据传输 存储引擎 计算引擎 2019 中国数据智能管理峰会
27 .数据驱动-数据价值评估 ⚫ 数据热度评估模型 假设𝑃 𝐴 , 𝑃 𝐵 , … , 𝑃(G)分别是数据节点𝐴, 𝐵, … , 𝐹的被调用 次数。则每个节点的热度值通过下面公式得到: A 𝑽 𝒙 = 𝑷 𝒙 + 𝑽(𝒊) 𝒊∈𝑪(𝒊) 其中𝐶(𝑖)表示𝑖节点的所有子节点的集合,比如,数据节点 B C A的热度指数为 𝑽 𝑨 = 𝑷 𝑨 + (𝑽 𝑩 + 𝑽(𝑪)) D E F G 可以发现,上面的模型为典型是递归计算模型,其特点是 数据节点的依赖关系 𝑽 父节点 > 𝑽 子节点 冰 冷 温 热 0 (0,10] (10,200] >200 热度等级(天) 2019 中国数据智能管理峰会
28 . 数据驱动-数据价值评估 ⚫ 数据广度评估模型 通过数据源S的应用依赖关系发现,数据服务的种类越 多,应用广度就越大,应用广度可表示为 𝑾 S = 𝒏∗𝑴 数据源 S 其中𝒏为数据服务的种类数, 𝑴为正相关系数,表示同 一个数据服务有多个功能模块依赖数据源S,模块越多, 正相关系数𝑴越大。其中𝒈 𝑨𝒊 为数据服务𝑨𝒊 的模块个数 数据服务 A1 A2 A2 An … 𝒏 𝑴 = 𝒈 𝑨𝒊 𝒊=𝟏 功能模块 F1 F2 F1 F1 F2 F1 F2 最终应用广度模型为 𝒏 数据应用依赖关系 𝑾 S = 𝒏 ∗ 𝒈 𝑨𝒊 𝒊=𝟏 微 小 中 大 (0,10] (10,100] (100,500] >500 广度等级(天) 2019 中国数据智能管理峰会
29 .数据驱动-数据价值评估 ⚫ 数据收益度评估模型 时间周期 1 2 3 4 5 6 7 8 9 10 11 同等用户规模 用户子群A 47 53 58 52 56 64 61 58 63 67 84 随机抽样 用户子群B 49 55 56 58 61 63 59 62 65 59 59 数据应用干预A ⚫ A/B Test评估模型 上图是用户子群A和用户子群B的平均用户收入数据,同时数据干预在时 间周期11,作用于用户子群A,那么可以通过如下的A/B Test评估模型, 来计算数据干预的贡献收入值,活跃度\PV\UV等可采用同样思路 符合条件用户群 𝑭 𝑨/𝑩 = 𝑭 𝑨𝒕 − 𝑭 𝑩𝒕 − 𝑴 σ𝒕−𝟏 𝒊=𝟏(𝑭 𝑨𝒊 −𝑭 𝑩𝒊 ) 𝑴= 𝒕−𝟏 𝒕为数据干预时间周期,其中𝑴为A、B两个用户子群的历史平均差值 2019 中国数据智能管理峰会