饿了么推荐算法演进及在线学习实践

01 推荐业务背景
• 产品形态
• 优化⽬标
02 算法演进路线
03 在线学习实践
• 基础⽅案
• ⼏点特⾊

展开查看详情

1.饿了了么推荐算法演进及在线学习实践 刘 ⾦金金 jin.liu04@ele.me

2.⽬目录 01 推荐业务背景 • 产品形态 • 优化⽬目标 02 算法演进路路线 03 在线学习实践 • 基础⽅方案 • ⼀一些特⾊色

3.⽬目录 01 推荐业务背景 • 产品形态 • 优化⽬目标 02 算法演进路路线 03 在线学习实践 • 基础⽅方案 • ⼀一些特⾊色

4.推荐产品形态 搜索词 类⽬目⼊入⼝口 品质推荐 营销推荐 ⾸首⻚页推荐

5.业务趋势 搜索推荐订单覆盖 全⽹网90%以上

6.算法优化⽬目标

7.⽬目录 01 推荐业务背景 • 产品形态 • 优化⽬目标 02 算法演进路路线 03 在线学习实践 • 基础⽅方案 • ⼏几点特⾊色

8.演进路路线 数据升级 特征升级 模型升级 业务理理解 时效性 ⽣生成⽅方式 复杂度 平台⽬目标 准确性 特征维度 时效性 流量量⽣生态 闭环 监控⽅方式 优化⽬目标 时效性

9.演进路路线 - 数据&特征 • 离线拼接 -> 在线⽣生成 • 数据采集:天级 -> 实时 • 模型⾃自动提取 • 多维度实时特征 ⽣生成 时效 • ⼤大规模稀疏特征 • 特征覆盖、波动实时监控 • 引⼊入向量量表达 规模 监控 • 异常值检测 (item/user/query) • 埋点问题检测

10.演进路路线 - 模型 复杂度:规则 -> 线性 -> ⾮非线性 -> 融合 时效性:天级 -> 时段级 -> ⼩小时级 -> 实时 深度学习与在 线学习 ⾮非线性模型 对象向量量化表达,⾼高维特征 线性模型 ⾃自动提取,特征与模型实时 树模型及多模型融合,引⼊入 在线更更新 通过线性模型⾃自动学习⼈人⼯工 更更多的上下⽂文特征,加⼊入⽤用 ⼈人⼯工规则 提取的特征权重,简单的⽤用 户实时⾏行行为反馈,千⼈人千⾯面 户特征,个性化推荐雏形 ⼈人⼯工经验提取规则,千⼈人⼀一 ⾯面,流量量效率低

11.演进路路线 - Wide&Deep

12.演进路路线 - DeepFM

13.推荐系统架构 搜索列列表 查询理理解 数据服务 ⾸首⻚页推荐 在线服务 产品/业务层 品类列列表 活动会场 场景判断 实时数据 Rank特征加载&模型排序 画像服务 点击率预估、转化率预估、客单价预估 算法/模型层 特征服务 GBDT GBDT+FTRL DeepFM WDL 特征层 商户特征 ⽤用户特征 上下⽂文特征 交叉组合特征 基础设施层 Spark Hadoop Flume Kafka Storm Redis 数据来源 业务⽇日志 服务端⽇日志 ⽤用户⾏行行为⽇日志

14.⽬目录 01 推荐业务背景 • 产品形态 • 优化⽬目标 02 算法演进路路线 03 在线学习实践 • 基础⽅方案 • ⼀一些特⾊色

15.在线学习(Online Learning) Online Learning vs Offline Learning ( Batch Learning ) 离线评测 在线效果 模型参数 Online Learning 特点: 1、动态持续学习 样本流 更更新 2、可以从新样本中学习新知识 3、以前已经处理理过的数据不不需要重复处理理 学习训练 4、样本⼀一旦学习完成后即被丢弃 5、逐条训练,每⼀一条样本都会更更新模型 6、可以处理理超⼤大数据集,节约存储 ……

16.在线学习 - 理理论基础 FTRL算法伪代码实现: 业界常⽤用算法:FTRL 特性: 1、可以产⽣生稀疏解 2、收敛速度很好 3、⽀支持并⾏行行化处理理,可以训练⼤大规模模型 4、⼯工程实现简单 参数迭代:

17.在线学习 - 技术栈 数据源: 数据采集: 消息管道: 数据处理理: 数据存储: ekv

18.在线学习 - 流程

19.在线学习 - 实时归属 Kafka Topic Storm ⽤用户⾏行行为 Parse 服务端⽇日志 Parse Join 基础效果数据 实时应⽤用 订单⽇日志 Parse 时间列列 维度列列 事实列列 多数据流实时join 实时产出多数据融合的细粒度事实数据

20.在线学习 - 模型结构

21.在线学习 - ⼩小技巧 样本不不均衡 • 正样本分权重分批投放 • 样本混合 采样策略略 输⼊入归⼀一化 • 位置截断 • 加快收敛 • 业务过滤 1 2 • 权重可⽐比较可解释 • 根据⽬目标设置样本权重 3 4 参数更更新 • 实时更更新 • 定期投放

22.⼩小特⾊色 - 可视化Debug

23.⼩小特⾊色 - 实时效果对⽐比 事实维度信息: 1、算法版本 2、⼊入⼝口 3、列列表位置 通过对维度和时间的聚合: 1、分算法版本实时效果 (实时A/B test) 2、分⼊入⼝口实时效果 3、分列列表位置实时效果 4、实时特征监控