- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 视频嵌入链接 文档嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
AICUG-肖强-个性化推荐技术在网易云音乐中的应用
云音乐凭借精细化产品,歌单、精准推荐等特色,成为了音乐爱好者的集聚地。云音乐推荐系统致力于通过个性化的智能推荐算法,实现用户千人千面的个性化音乐推荐,为用户带来不一样的听歌体验。本次分享主要介绍云音乐推荐系统中“人-歌-场”的数据建模思维,以及相关的推荐基础架构;并从精排算法模型演进、大规模稀疏特征建模、多阶段多链路目标建模等方面分享一些实践经验。
个人介绍
肖强,网易云音乐推荐算法组负责人。
2014年加入网易云音乐,音乐推荐算法组负责人,主要负责云音乐歌曲推荐系统以及相关的歌曲商业化变现相关工作,在机器学习和个性化推荐领域有丰富的经验。
展开查看详情
1 . . cn u g . aic 个性化推荐技术在网易云音乐中的应用 ww w 社 区 能 音乐推荐算法组负责人 肖强 智 工 : 网易云音乐-数据智能部 G人 IC U A
2 .目录 . cn u g Ø 1 背景介绍 . aic w Ø 2 音乐个性化推荐系统 w Ø 3 音乐推荐实践 w 社 区 智 能 人 工 U G A IC
3 .背景介绍 . cn u g ic 网易云音乐,2013年4月正式上线,依托歌单,社区、 . a 音乐人、个性化推荐算法,逐渐发展成为目前月活过亿 w 的音乐爱好聚集地。 w w 社 区 智 能 人 工 U G A IC
4 .背景介绍 . cn u g ic 探索用户口味的歌单推荐 . a ww w 区 列表式每日推荐 能 社 歌曲主题推荐 工 智 G人 IC U 侧重实时兴趣的, 触动用户心底的 A 流式推荐 心动模式
5 .目录 . cn u g Ø 1 背景介绍 . aic w Ø 2 音乐个性化推荐系统 w Ø 3 音乐推荐实践 w 社 区 智 能 人 工 U G A IC
6 .音乐个性化推荐系统 . cn u g . aic ww w 社 区 智 能 人 工 U G A IC
7 .音乐个性化推荐系统 . cn u g . aic 人 歌 场 w w w 人 场 社 区 歌 定义问题: 智 能 1)如何挖掘用户诉求? 工 2)如何圈定符合心智的歌曲? 3)如何理解场,并构建人-歌曲-场景的精准匹配机制? G人 ICU A
8 .音乐个性化推荐系统 . cn u g ﹦ ic 长期 推给 累积 + 短期 + 潜在 .a 谁 兴趣 兴趣 兴趣 w 用户画像引擎 用户意图引擎 千人千面引擎 CF推荐引擎 w 全面深挖用户兴趣 10亿用户每个用户的 分析用户最近的一系列行为, 用户群体兴趣识别 通过滤算法挖掘相似 w 语种、风格、艺人偏 精准定位用户实时兴趣、用 年龄、性别、地域、 用户兴趣 好等 于日推、fm、搜索等营销 客户端等 召回 投放 + 区 音乐个性化 海量 粗排 推荐 推什 么 ﹦ 曲库 + 最近 社 歌曲 热点 能 丰富物料画像 质量评估体系 主题推荐 智 分析歌曲的质量,转 新上映电影、剧集等 化率情况,受众群体, 主题歌曲,新发行的热 排序 工 提供丰富的物料 门歌曲 + 什么 合适 策略 人 ﹦ 消费 消费 时候 推/场 的场 景 + 周期 + 意愿 U G 精准定位用户不 情景推荐引擎 反向推荐引擎 实时付费意愿引擎 C 同兴趣发生的时 I 机 定位特定的位置/情 用户的复播率、复播 根据用户实时的行为, A 景,特定的query下的 周期等,分析用户不 分析用户在当前情景 转化情景 同的阶段,帮助决策 下对不同维度的消费 意愿
9 .音乐个性化推荐系统-基本系统架构 . cn u g 日志采集 . a 用户侧 ic w 点击日志 流式计算 Rerank w 精排Rank 曝光日志 实时画像计算 多样性 w 更复杂模型 负反馈 实时数据统计 召回引擎 时序模型 兴趣探索 区 用户群体 主动兴趣 社 目标平衡 HDFS itembased 能 画像计算 userbased Match 智 实时画像 粗排Sorting 长期兴趣 实时兴趣 偏好主题 实时召回 LR+GBDT 工 近期兴趣 模型召回 人 主动兴趣 实时负反馈 离线召回 大规模稀疏特征 G 歌曲画像 复杂模型 U 画像服务 IC 歌曲 歌单 艺人 语种 标签 专辑 兴趣识别 行为刻画 ctr预估 时长预估 A
10 .音乐个性化推荐系统-线上系统 . cn u g model train hbase . a ic w ETL Feature extraction first ranker redis 落 w configuration center w 区 校 验 盘 线 model 社 上 精 能 RT recall join recall feature ranker score 排 系 智 统 人 工 online collector 线上精排系统: G rec-item feature 1 各模块解耦,更有效的分析系统瓶颈,提升精排性 U 能,实现每天线上千亿级数据规模的⾳乐排序。 2 通过配置中⼼,提升算法迭代效率 IC 3 通过线上收集器,可以快速还原线上排序特征 A
11 .目录 . cn u g Ø 1 背景介绍 . aic w Ø 2 音乐个性化推荐系统 w Ø 3 音乐推荐实践 Ø 精排算法演进 w 区 Ø 大规模稀疏特征建模 社 Ø Field Group用户兴趣建模 Ø 多链路建模 智 能 人 工 U G A IC
12 . 精排算法演进 . cn u g ic 音乐推荐模型的演进之路 . a w 全部候 千万候选 w 选集 集 w 区 召回 几万候选集 能 社 第一轮粗排 几千候选集 智 第二轮粗排 几百候选集 人 工 精 排 几十个结果 U G A IC 粗排模型 精排模型 更精准
13 .精排算法演进 . cn u g ic 推荐场景 歌单推荐 . a w 精排模型层面 数据和特征层面 w 每日歌曲推荐 普通深度模型 w 实时化 深度兴趣模型 区 行为序列 私人FM 社 动态兴趣演化模型 Session分析 能 心动模式 深度会话兴趣演化网 大规模记忆特 智 络模型 征 工 首页 多路融合深度模型 G人 ICU 召回层面 A 行为模型召回 深度匹配模型召回
14 .大规模稀疏特征建模 . cn u g ic 使用更多的行为数据 . a w 统计类/泛化类特征很丰富, w 泛化能力比错 收藏歌单 遇到的问题: 收藏歌曲 1过拟合 w 播放歌单 2 数据量太大 3 特征时间穿越 播放歌曲 但是,云音乐有丰富的行为 区 数据,能否有办法更有效利 社 用基本行为数据,提升模型 的拟合能力? 百 百万 亿 能 级 级 级 智 推荐歌单 行为序列 歌单内歌曲-用户收藏 行为样本多,音乐资源多 工 歌单内歌曲-用户播放 歌单-推荐来源 人 歌单内歌曲艺人-用户 偏好 G 试验规模记忆类特征 U 更多的特征表达,更多的样本拟合 C 特征维度:几千个特征->1000w>1亿->10亿->100亿 A I
15 .大规模稀疏特征建模 . cn u g . aic ww w 社 区 智 能 人 工 G Wide特征来源 ICU A
16 .大规模稀疏特征建模 . cn u g . aic ww w 社 区 智 能 人 工 U G A IC
17 .大规模稀疏特征建模 . cn u g 离 . a ic w 线 训 练 w w 社 区 能 策略1 策略2 策略3 百亿 维度 K 工 V 智 训练特征 线上特征 训练特征 更新 特征 线上特征 人 K V bloom Filter 特征 G 特征hash 更新 特征hash …… 特征hash 特征hash 索引 U 函数 函数 函数 函数 更新 C K V I 一致性 一致性 A K V 特征index 特征index 特征index 特征index
18 . Filed Group用户兴趣建模 . cn u g ic 模型结构层面: Field Group - Interest Evolution Net . a 业内一般是把用户所有的行为作为一个大序列来表达用户兴趣. 而我们根据云音乐用户的多维度行为,分成不同的域组,每个域组表示不同的行 w 为意图,从而建立基于域组的兴趣演化网络 Item w w 区 field兴趣向量 总兴趣向量 Field Group1 用户完整播放序列 IEU 社 正向域 能 Field Group2 Interest Evolution Unit 用户收藏序列 IEU 兴趣抽取单元 负向域 Field Group3 工 用户跳过序列 智 IEU 人 Field Group4 用户trash序列 IEU 业务转 Field Group5 U G 用户收银台序列 IEU C 化域 A I Field Group - Interest Evolution Net 基于域组的兴趣演化网络
19 .多链路建模 . cn u g . aic ww w 社 区 智 能 人 工 U G A IC
20 .多链路建模 . cn u g ic 播放 播放页 收银台 购买 . a ww w 社 区 智 能 人 工 U G A IC
21 .多链路建模 . cn u g ic ESMM网络 . a ww w 社 区 智 能 人 工 U G A IC
22 .2.6多链路建模 . cn u g . aic ww w 社 区 智 能 人 工 U G A IC
23 .多链路建模 . cn u g TS歌曲多链路联合建模 . aic ww w 社 区 智 能 人 工 U G A IC 商业化变现业务中,推荐场景的会员转化率相对提升30%
24 .多链路建模 . cn u g ic 会员购买Label . a w 收银台曝光Label w 播放页曝光Label w 社 区 智 能 人 工 U G A IC 播放页曝光预估模型 收银台曝光预估模型 购买预估模型
25 . . cn u g . aic Thank you! ww w 社 区 智 能 人 工 U G A IC