机器学习与推荐系统实践

推荐系统概要,基本问题,算法实践,评估

展开查看详情

1.机器学习与推荐系统实践 刘志强 liuzhiqiangruc@126.com

2. 目录 Part One 01 推荐系统概要 Part Two 02 基本问题 Part Three 03 算法实践 Part Four 04 评估

3.01 Part One 推荐系统概要

4.推荐系统 一种数据驱动的用以满足用户个性化需求的产品实现方式, 具有极强的领域依赖性。

5.推荐系统三要素 多样且稳定 弱目的 反馈

6.推荐系统的三层境界 ③ 尊重用户 懂人 ② 理解用户 知人 HTML 识人 ① 了解用户

7.02 Part Two 基本问题

8.推荐系统基本问题 用户 资源 导流 进场 ① 用户冷启 ② 资源试投 冷启 试投 ③ 精准兴趣识别 ④ 惊喜多样性 ⑤ 热门霸屏 精准 加热 ⑥ 资源退场 惊喜 冷却 流失 离场

9.03 Part Three 算法实践

10.用户冷启 Item User

11.用户冷启 Item User New User

12.用户冷启 Out Domain Item User New User Current Domain

13.用户冷启 Out Domain Item User Joined Users New User Current Domain

14.用户冷启 Out Domain Item Mapping User Joined Users New User Current Domain

15.用户冷启 Out Domain Item Mapping User Joined Users New User Prediction Current Domain

16.用户冷启 w w w w U b b b b M N

17.用户冷启 θ 𝑃(𝑊|Θ) 𝑃(Θ|U) w w w w U b b b b M N

18.用户冷启 θ Ω 𝑃(𝑊|Θ) 𝑃(B|Ω) 𝑃(Θ|U) 𝑃(Ω|U) w w w w U b b b b M N

19.用户冷启 𝑃(Ω|Θ) θ Ω 𝑃(𝑊|Θ) 𝑃(B|Ω) 𝑃(Θ|U) 𝑃(Ω|U) w w w w U b b b b M N

20.用户冷启 𝑃(Ω|Θ) θ Ω 𝑃(𝑊|Θ) 𝑃(B|Ω) 𝑃(Θ|U) 𝑃(Ω|U) w w w w U b b b b M N

21.用户冷启 𝑃(Ω|Θ) θ Ω 𝑃(𝑊|Θ) 𝑃(B|Ω) 𝑃(Θ|U) w w w w U b b b b M N

22.用户冷启 𝑃(Ω|Θ) θ Ω 𝑃(𝑊|Θ) 𝑃(B|Ω) 𝑃(Θ|U) 𝑃(Ω|U) w w w w U b b b b M N

23.用户冷启 𝑃(Ω|Θ) θ Ω 𝑃(𝑊|Θ) 𝑃(B|Ω) 𝑃(Θ|U) 𝑃(Ω|U) w w w w U b b b b M N

24. 用户冷启 𝛼 ① 𝑝 𝑥𝑖 = 𝑡 𝑥¬𝑖 , 𝑦, 𝑤, 𝑏) = 𝑝 𝑥𝑖 = 𝑡 𝑥¬𝑖 , 𝑦, 𝑤𝑖 = 𝑣) 𝑣 𝑡 𝜃 𝑂𝑡,¬𝑖 + 𝛽𝑣 𝑂𝑢,¬𝑖 + 𝛼𝑡 ∝ V 𝑣 ⋅ 𝑇 𝑡 Σ𝑣=1 𝑂𝑡,¬𝑖 + 𝑉𝛽 Σ𝑡=1 𝑂𝑢,¬𝑖 + 𝑇𝛼 𝑦 ② 𝑝 𝑦𝑖 = 𝑡 𝑦¬𝑖 , 𝑥, 𝑧, 𝑤, 𝑏) = 𝑝 𝑦𝑖 = 𝑡 𝑦¬𝑖 , 𝑥, 𝑧𝑖 = 𝑙) 𝑥 𝑙 𝑂𝑡,¬𝑖 + 𝜂𝑙 𝑡 𝑂𝑢,¬𝑖 + 𝛼𝑡 ∝ ⋅ 𝑇 𝑧 𝜋 𝜂 L Σ𝑙=1 𝑙 𝑂𝑡,¬𝑖 + 𝐿𝜂 Σ𝑡=1 𝑡 𝑂𝑢,¬𝑖 + 𝑇𝛼 T 𝛽 𝜙 𝑤 T 𝜆 ③ 𝑝 𝑧𝑖 = 𝑙 𝑧¬𝑖 , 𝑥, 𝑦, 𝑤, 𝑏) = 𝑝 𝑧𝑖 = 𝑙 𝑧¬𝑖 , 𝑦𝑖 = 𝑡, 𝑏𝑖 = 𝑘) 𝑏 𝜓 M L 𝑘 𝑙 N 𝑂𝑙,¬𝑖 + 𝜆𝑘 𝑂𝑡,¬𝑖 + 𝜂𝑙 ∝ K k ⋅ 𝐿 𝑙 Σ𝑘=1 𝑂𝑙,¬𝑖 + 𝜆𝑘 Σ𝑙=1 𝑂𝑡,¬𝑖 + 𝜂𝑙 U

25. 用户冷启 From Online Behavior to Offline Retailer:

26. 用户冷启 From Online Behavior to Offline Retailer:

27.精准兴趣 真喜欢的 随意看的 看得到的

28.精准兴趣 𝛼 𝐾: number of topics U: number of users 𝜃 N: number of words of user u 𝜃: topic distribute of user u 𝜂: word distribute for topic k 𝛼: dirichlet prior for 𝜃 𝛽 z 𝛽1 : dirichlet prior for 𝜂 𝜂 𝑤 K N U

29.精准兴趣 𝛼 𝛾 𝐾: number of topics U: number of users 𝜃 𝜆 N: number of words of user u 𝜃: topic distribute of user u 𝜂: word distribute for topic k 𝛽2 𝛼: dirichlet prior for 𝜃 𝛽 z 𝑥 𝛽1: dirichlet prior for 𝜂 𝜆: binomial distribution for interest or not for user u 𝛾 : beta prior for 𝜆 𝜂 𝑤 𝜓 𝜓 : word distribution for global topic K 1 (system bias) N 𝛽2: dirichlet prior for 𝜓 U