数字营销领域的千人前面智能投放研究

数字营销领域的千人前面智能投放研究
展开查看详情

1. ) TC BD ( 数字营销领域的千人千面智能投放研究 会 大 术 技 朱亚东 Ramon 据 数 大 国 中 18 20

2. ) TC 旗下原生 广告平台 BD ( • 全球领先的移动营销平台 会 • 全球13个办公室, 大 程序化互动 术 广告平台 600+员工, 技 40%+技术研发团队 据 • 即将港股IPO 数 大 旗下移动游戏 国 数据分析平台 中 18 20

3.人工智能 = 数据 + 平台 + 算法 ) TC BD • 大量实时产生的数据为人工智能的应用奠定了基础 ( 数据 会 • 通过大量数据训练人工智能的算法模型 大 术 技 • 深度学习对并行计算及数据吞吐能力有更高的要求 人工智能 据 平台 • GPU发展及计算能力的提升使得云计算平台可以快速 数 计算处理大量数据 大 国 • 机器学习算法是实现人工智能落地的引擎 中 18 算法 • 机器学习尤其是深度学习及强化学习的发展与迭代 20 促成了人工智能与商业场景的结合

4.总体布局 ) TC BD 纵向延伸 计算平台引擎 ( 会 电子商务 大 术 技 定制化 据 金融科技 数 大 国 游戏 头部大媒体 中部程序化流量 长尾网盟流量 中 18 工具类 20 全媒体移动营销

5.计算平台架构 ) TC BD 离线:超大规模,高效计算 ( 会 数据仓库 DMP 在线:高性能,低延迟 大 术 数据流特征工程 算法组件 数据流通道 技 实时数据服务 在线评测 据 数 大 大数据计算 分布式机器学习 国 实时用户行为 分布式预估 中 18 集群调度 资源管控 20

6.一站式全链路机器学习平台—MindAlpha ) TC BD 自主研发,百亿特征,秒级更新 ( 会 完备的流程周期一体化 大 数据流接入、特征生成、模型训练、线上预估、 术 技 在线评测、在线学习的周期流程 据 数 完善的一站式服务框架 大 国 • 闭环高效的数据流平台 中 • 超大规模分布式的训练平台 18 • 高性能的在线预估平台 20

7.MindAlpha ) TC 模型实时存储服务 BD ( 分布式模型训练框架 分布式模型预测服务 会 Server Server Server Server M1 M2 大 Replica 1 Replica 2 Replica 1 术 Worker Worker Worker Shared 1 Shared 2 Shared 3 技 … … … FTRL / FM / DNN 算法组件 据 Shared n Shared n Shared n 数 大 实时特征工程 国 在线排序服务 中 离线特征 在线特征 18 实时特征回流 在线排序请求 20

8.千人千面的智能投放体系 ) TC BD 筛选适合广告的人 ( 年龄 Gender 职业 会 Occupation 大 性别 切合的需求 Gender 术 留存 技 安装 Retention 国籍 Install 据 Nationality 浏览 优选创意 数 History 大 爱好 国 时间 Hobby Time 作息 位置 Work & Rest 中 最佳投放 Location 18 20

9. ) 20+ 全球顶级Adx TC BD 题材 Theme FTRL ( 类型 风格 会 Type Style FFM GBDT 游戏行为 大 Game MODEL 术 Behavior 活跃特征 粘性特征 技 Active Sticky DRL XNN 据 Features 付费特征 Features …… 数 Paid Features 大 国 100亿+ 设备,9亿日活 500+开发者 中 全面立体的AI投放 18 700+标签类目体系 1,500+ 顶级App应用 20

10.业务场景 ) TC BD 广告类型:CPM,CPC,CPI,CPE ( ecpm: 𝑏𝑏𝑏𝑏𝑏𝑏𝑐𝑐𝑐𝑐𝑐𝑐 , 𝑐𝑐𝑐𝑐𝑐𝑐 ∗ 𝑏𝑏𝑏𝑏𝑏𝑏𝑐𝑐𝑐𝑐𝑐𝑐 , 𝑐𝑐𝑐𝑐𝑐𝑐 ∗ 𝑐𝑐𝑐𝑐𝑐𝑐 ∗ 𝑏𝑏𝑏𝑏𝑏𝑏𝑐𝑐𝑐𝑐𝑐𝑐/𝑐𝑐𝑐𝑐𝑐𝑐 会 大 术 双层排序空间 技 cpm Campaigns, creatives 据 cpc 数 cpi 大 cpe 机制设计 国 中 OCPI 展现占比 18 20

11.Algorithm Applications ) TC LR+GBDT BD ( FTRL ESMM 会 大 DF-ESMM 术 技 据 MindAlpha XNN DF-ESM-DNN 数 大 国 中 18 RL DRL 20

12.LR/FM/FFM ) TC Training IVR Model with LR and FM/FFM Directly BD ( 会 Output IVR 大 术 技 据 数 … 大 … … 国 Sparse Ffeature FM and LR .. .. .. . . . 中 … 18 20

13.CTR&CVR Co-Training ) TC Problems in CVR model training BD • Sample selection bias ( 会 • Data sparsity 大 • ESMM: Entire Space Multi-Task Model 术 技 ESMM with Logistic Regression 据 数 • L 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 , 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 = 𝑙𝑙 𝑦𝑦, 𝑓𝑓 𝑥𝑥; 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 + 𝑙𝑙 𝑧𝑧, 𝑓𝑓 𝑥𝑥; 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 × 𝑓𝑓 𝑥𝑥; 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 大 国 𝜕𝜕𝜕 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 𝑧𝑧−𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑣𝑣𝑟𝑟 • = 𝑓𝑓 𝑥𝑥; 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 − 𝑦𝑦 + (𝑓𝑓 𝑥𝑥; 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 − 1) 中 𝜕𝜕𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 1−𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑣𝑣𝑟𝑟 18 𝜕𝜕𝜕 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 𝑧𝑧−𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑣𝑣𝑟𝑟 • = (𝑓𝑓 𝑥𝑥; 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 − 1) 20 𝜕𝜕𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 1−𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑣𝑣𝑟𝑟

14.ESMM ) TC ESMM Loss BD Output IVR ( 会 大 术 技 据 … … 数 … … 大 .. .. .. … .. .. .. … . . . . . . 国 … … 中 18 CVR Model CTR Model 20

15. PS算法插件 20 18 中 国 大 数 据 技 术 大 会 ( BD TC )

16.样本延迟 ) TC 在效果展示广告中,用户的转化事件距离展现具有较长的时间窗口 BD 点击样本的抉择:负例 or 延迟正例? ( 3 a.m. 4 a.m. 5 a.m. 6 a.m. 7 a.m. 8 a.m. 会 在样本中加入delay time label 𝒆𝒆 大 click • 𝑥𝑥, 𝑦𝑦 → (𝑥𝑥, 𝑦𝑦, 𝑒𝑒) 术 技 • 𝑒𝑒 ∈ 1,2,3,4,5,6 ,join时间窗6小时 据 install e=1 e=2 e=3 e=4 e=5 e=6 Weibull分布建模安装延迟 数 大 k p d|x = k ∗ λ x (d ∗ λ x )𝑘𝑘−1 𝑒𝑒 −(d∗λ x ) 国 λ x = e𝑤𝑤∗𝑥𝑥 中 𝑘𝑘 18 p Y = 0 𝑋𝑋 = 𝑥𝑥, 𝐸𝐸 = 𝑒𝑒) = 1 − 𝑐𝑐𝑐𝑐𝑐𝑐 𝑥𝑥 + exp − 𝑒𝑒 ∗ 𝜆𝜆 𝑥𝑥 ∗ 𝑐𝑐𝑐𝑐𝑐𝑐(𝑥𝑥) 20 𝑘𝑘 𝑘𝑘 p Y = 1 𝑋𝑋 = 𝑥𝑥, 𝐸𝐸 = 𝑒𝑒) = [exp −( 𝑒𝑒 − 1 ∗ 𝜆𝜆 𝑥𝑥 ) − exp − 𝑒𝑒 ∗ 𝜆𝜆 𝑥𝑥 ] ∗ 𝑐𝑐𝑐𝑐𝑐𝑐(𝑥𝑥)

17.DF-ESMM ) TC Introduce delay feedback into co-training loss, and solve with MLE BD ( L 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑧𝑧−𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ∗𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 • = 𝑓𝑓 𝑥𝑥; 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 − 𝑦𝑦 + (𝑓𝑓 𝑥𝑥; 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 − 1) 𝜕𝜕𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 1−𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ∗𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 会 大 L 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑧𝑧−𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ∗𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 2.5 𝜆𝜆 = 1, 𝑘𝑘 = 0.5 • = (𝑓𝑓 𝑥𝑥; 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 − 1) 术 𝜆𝜆 = 1, 𝑘𝑘 = 1 𝜕𝜕𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 1−𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ∗𝑓𝑓 𝑥𝑥;𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝜆𝜆 = 1, 𝑘𝑘 = 1.5 2.0 技 𝜆𝜆 = 1, 𝑘𝑘 = 5 𝜕𝜕𝜕 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 ,𝜃𝜃𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑘𝑘∗((𝑒𝑒−1)∗𝜆𝜆 𝑥𝑥 )𝑘𝑘−1 exp −( 𝑒𝑒−1 ∗𝜆𝜆 𝑥𝑥 )𝑘𝑘 −𝑘𝑘∗(𝑒𝑒∗𝜆𝜆 𝑥𝑥 )𝑘𝑘−1 exp −(𝑒𝑒∗𝜆𝜆 𝑥𝑥 )𝑘𝑘 𝜕𝜕𝜕𝜕(𝑥𝑥) • 据 = ∑𝑖𝑖,𝑦𝑦𝑖𝑖=1 𝑘𝑘 + 1.5 𝜕𝜕𝜃𝜃𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 exp −( 𝑒𝑒−1 ∗𝜆𝜆 𝑥𝑥 )𝑘𝑘 −exp − 𝑒𝑒∗𝜆𝜆 𝑥𝑥 𝜕𝜕𝑤𝑤𝑑𝑑 数 𝑘𝑘−1 ∗exp(−(𝑒𝑒∗𝜆𝜆(𝑥𝑥))𝑘𝑘 ) 𝜕𝜕𝜕𝜕(𝑥𝑥) 𝑐𝑐𝑐𝑐𝑐𝑐 𝑥𝑥 ∗𝑐𝑐𝑐𝑐𝑐𝑐 𝑥𝑥 ∗𝑘𝑘∗𝑒𝑒∗ 𝑒𝑒∗𝜆𝜆 𝑥𝑥 ∑𝑖𝑖,𝑦𝑦𝑖𝑖=0 𝑘𝑘 1.0 ∗𝑐𝑐𝑐𝑐𝑐𝑐 𝑥𝑥 ∗𝑐𝑐𝑐𝑐𝑐𝑐(𝑥𝑥) 𝜕𝜕𝑤𝑤𝑑𝑑 大 1−𝑐𝑐𝑐𝑐𝑐𝑐 𝑥𝑥 ∗𝑐𝑐𝑐𝑐𝑐𝑐 𝑥𝑥 +exp − 𝑒𝑒∗𝜆𝜆 𝑥𝑥 0.5 国 𝑘𝑘 𝑘𝑘 [exp −( 𝑒𝑒 − 1 ∗ 𝜆𝜆 𝑥𝑥 ) − exp − 𝑒𝑒 ∗ 𝜆𝜆 𝑥𝑥 ] ∗ 𝑐𝑐𝑐𝑐𝑐𝑐(𝑥𝑥) 𝑖𝑖𝑖𝑖(𝑧𝑧 = 1) 中 • 𝑓𝑓 𝑥𝑥; 𝜃𝜃𝑐𝑐𝑐𝑐𝑐𝑐 , 𝜃𝜃𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 = � 𝑘𝑘 0.0 (1 − exp − 𝑒𝑒 ∗ 𝜆𝜆 𝑥𝑥 ) ∗ 𝑐𝑐𝑐𝑐𝑐𝑐 𝑥𝑥 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 0.5 1.0 1.5 2.0 2.5 18 20

18.DF-ESMM ) TC DF-ESMM Loss BD ( 会 Delay CVR Loss Output IVR 大 术 技 据 数 … … 大 … … … .. .. .. … .. .. .. … 国 . . . . . . … … 中 18 Generalized Linear Delay Model CVR Model CTR Model 20

19.DF-ESMM-DNN ) TC Delay Feedback ESMM Base on DNN BD ( DF-ESMM-DNN Loss 会 大 Delay CVR Loss Output IVR 术 技 CVR CTR 据 数 Expected Delay Full Connection Full Connection 大 国 Layers Layers 中 … 18 Concatenate 20 …… Embedding

20.丰富高效的 ) TC 广告形式 BD ( 支持banner、全屏、插屏、 会 大 贴片、原生信息流、 术 技 原生视频、激励视频、 据 数 原生应用墙、积分墙等 大 国 激励视频广告 10余种广告形式。 中 18 原生视频广告 20

21.Playable Ads ) TC BD 1.Reward Video ( 会 大 术 2.Playable 技 据 数 3.Download Page 大 国 中 18 20

22.多层次多粒度组合优化 ) TC BD ( 会 大 术 个性化模板 个性化素材 最佳呈现 技 据 数 • 不同类素材的拼接方式 • 动态文案生成 • 筛选最佳模板 • 素材呈现的顺序 大 • 动态元素拼接 • 筛选最佳素材 国 中 18 20

23.个性化模版生成&素材填充 ) TC BD 素材拼接 基于上下文的动态文案 ( • 确定多幅图片呈现的相对位置 • 时间、地点、设备信息 会 • 试玩demo、视频、图片、 大 文字的相对位置 术 技 据 呈现顺序 Display Order 数 大 • 视频呈现的先后顺序 国 动态元素拼接 • 视频与试玩demo等其他元素的 中 • 引人注目的元素动态拼接到 18 相对顺序 图片、视频 20

24.OCPI - Optimized Cost Per Install ) TC 动态出价 BD 采用Smart Bid的方式,在广告主设定的基础出价上, ( 根据预估出的pCVR、pCTR以及该单子的实际历史转化率和曝光量, 会 动态的调整出价,进而优化广告排序结果 大 术 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝐸𝐸[𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖] + 技 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑒𝑒𝑛𝑛𝑛𝑛𝑛𝑛 = ∗ 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑜𝑜𝑜𝑜𝑜𝑜 + ∗ 𝑐𝑐𝑐𝑐𝑐𝑐 𝐸𝐸[𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖] + 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝐸𝐸[𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖] + +𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 据 数 大 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑛𝑛𝑒𝑒𝑒𝑒 , 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 < 𝐸𝐸[𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝] 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 = 𝑓𝑓 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 = � 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑜𝑜𝑜𝑜𝑜𝑜 , 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 国 中 18 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 = 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 ∗ 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 ∗ 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 20

25.大媒体智能投放 ) TC FMP Adset 转化率预估 BD 希望借助于大数据+智能算法帮助优化师找到更优的投放设置,提升投放效果 ( 会 大 术 技 据 数 大 国 中 18 20

26. ) www.mobvista.com TC BD ( 会 THANK YOU 大 术 技 yadong.zhu@mobvista.com 据 数 大 国 中 18 © 2017 Mobvista —保留一切权利, 包括Mobvista的机密信息及享有所 有权的信息, 20 并且在得到 Mobvista的书面同意之前不得泄露或复制。