达观数据个性化推荐引擎产品介绍

01个性化推荐的概念与功能
02推荐系统开发技术难点
03达观推荐系统解决⽅案
04成功案例展示
05专业周到的技术服务与交付

展开查看详情

1.达观数据 个性化推荐引擎建设⽅方案 中国领先的⽂文本搜索推荐技术服务商

2. ⽬目录 CONTENTS 01 02 03 04 05 06 专业的⼤大数据 个性化推荐的 推荐系统开发 达观推荐系统 成功案例例展示 专业周到的技 技术服务企业 概念与功能 技术难点 解决⽅方案 术服务与交付

3.1 THE FIRST 达观数据 专 业 的 ⼤大 数 据 技 术 服 务 企 业

4.达 观 数 据 : 中 国 领 先 的 ⼤大 数 据 技 术 服 务 企 业 • 专 注 于 ⽂文 本 挖 掘 和 搜 索 推 荐 技 术 服 务 的 ⾼高 科 技 企 业 , 总 部 位 于 上 海海 浦 东 软 件 园 , 在 北北 京 和 深 圳 设 有 办 事 处 • 上 海海 市 ⼤大 数 据 联 盟 理理 事 单 位 、 上 海海 市 计 算 机 学 会 成 员 、 复 旦 ⼤大 学 和 上 海海 交 通 ⼤大 学 科 研 合 作 单 位 和 校 外 研 究 ⽣生 培 养 基 地 • 先 后 获 软 银 赛 富 、 真 格 基 ⾦金金 、 ⽅方 ⼴广 资 本 等 国 际 ⼀一 流 机 构 共 同 投 资 • 多 次 获 得 国 际 竞 赛 冠 军 , 在 ⽂文 本 技 术 服 务 领 域 处 于 最 领 先 的 位 置 投资机构: 合作机构:

5.专业卓越的创始团队 业 务 扎 实 ⼯工 作 认 真 ⾏行行 业 内 享 有 优 良 ⼝口 碑碑 的 业 务 管 理理 团 队 CEO 陈运⽂文 博⼠士 • 中 国 计 算 机 学 会 ⾼高 级 会 员 , A C M 和 I E E E 学 会 会 员 , 复 旦 ⼤大 学 计 算 机 博 ⼠士 和 杰 出 毕 业 ⽣生 • 原 腾 讯 ⽂文 学 ⾼高 级 总 监 、 盛 ⼤大 ⽂文 学 ⾸首 席 数 据 官 、 百 度 核 ⼼心 技 术 ⼯工 程 师 • 三 ⼗十 项 国 家 技 术 发 明 专 利利 , ⼗十 五 篇 国 际 学 术 论 ⽂文 , 专 著 《 智 能 W e b 算 法 》 译 者 • C T O 纪 达 麒 : 原 腾 讯 和 盛 ⼤大 技 术 总 监 、 搜 狗 架 构 师 • ⾸首 席 技 术 专 家 ⻩黄 萱 菁 教 授 : 复 旦 ⼤大 学 计 算 机 系 教 授 、 博 导 , 中 国 著 名 ⽂文 本 挖 掘 专 家 • 技 术 副 总 裁 桂 洪 冠 : 原 新 浪 微 博 架 构 师 、 阿 ⾥里里 巴 巴 ⾼高 级 技 术 专 家 • 核 ⼼心 技 术 团 队 : 来 ⾃自 腾 讯 、 盛 ⼤大 、 阿 ⾥里里 巴 巴 、 百 度 、 新 浪 等 公 司 ⼤大 数 据 部 ⻔门 • 学 术 研 究 团 队 : 来 ⾃自 复 旦 ⼤大 学 计 算 机 学 院 ⽂文 本 挖 掘 和 信 息 检 索 重 点 实 验 室

6. 企 业 发 展 中 荣 获 众 多 重 量量 级 奖 项 累 积 获 得 ⼆二 ⼗十 余 次 全 国 奖 项 , 接 连 ⼊入 选 中 国 ⼤大 数 据 和 ⼈人 ⼯工 智 能 企 业 5 0 强 中国⻘青年年互联⽹网创业⼤大赛 全国总冠军 唯⼀一⻘青年年创业企业代表 ⼊入选创业⿊黑⻢马 企业服务专场冠军 第三届乌镇世界互 中国⼈人⼯工智能企业 和创新之星称号 联⽹网⼤大会发⾔言 50强 获选为京东云 荣获36氪 荣获《寻找独角兽》节目 独家搜索技术服务商 荣获中国电⼦子i+创新⼤大赛 中国最靠谱数据分 成功通过ISO9001认证 全国⼀一等奖 年年度银独⻆角兽⼤大奖 阿里、百度、UCloud、七牛 技术合作伙伴 析服务商

7. 技术团队屡获国际算法竞赛殊荣 ACM KDD-Cup 数据竞赛国际 亚军 ACM CIKM Competition竞赛国际 冠军 CIKM Cup竞赛的题⽬目是⾃自动识别⽤用户的 由国际计算机学会ACM主办的全球 查询意图,⼒力力克ebay等等国际强劲对⼿手夺 最⾼高级别的数据挖掘竞赛 冠,所提出的算法以F1值0.9296排名居于 经过2个⽉月激烈烈⻆角逐,陈运⽂文博⼠士 第⼀一。 率领的团队在全球1000多⽀支队伍中 荣获亚军,创⼤大陆企业15年年来的历 史最好成绩 EMI 国际⿊黑客⻢马拉松算法竞赛 冠军 国际著名⼤大数据专家, 全球知名唱⽚片公司百代EMI举办的国际推 美国科学院院⼠士Prof. Han 荐算法竞赛,达观CEO陈运⽂文带领的技术 为陈运⽂文团队颁奖 团队⼒力力压来⾃自剑桥、⽜牛津的众多知名专家 和团队,以优异的效果获得冠军

8.⾼高 度 重 视 核 ⼼心 技 术 研 发 取 得 累 累 硕 果 已申请有32项国家发明专利利 翻译出版著名⼈人⼯工智能著作 在国际学术期刊和技术社区 《智能Web算法》(第2版) CSDN QCon均发表了了技术论⽂文

9.众 多 客 户 选 择 了了 达 观 的 ⼤大 数 据 技 术 服 务 传统企业 视频、直播、教育 互联⽹网媒体、⽂文学 云服务、电商、⾦金金融等其他 中万年年历 中华万年年历 ⾼高清影视 万年年历 好食期 趣头条 韩剧tv 书⾹香云集 更更多客户未全展示

10.2 THE SECOND 个性化推荐的概念与功能

11.个性化推荐的概念和产品形态 ● 个性化推荐是各类内容平台、社交、电商⽹网站集客的重要⽅方式,通过为⽤用户快速准确地提供个性化的内容吸引其兴趣 ● 个性化推荐的对象类型各不不相同,与客户所在的⾏行行业密切相关,既有⽂文章、⾳音视频的推荐,也有社交对象、商品的推荐 电商个性化推荐 新闻媒体个性化推荐 ⾳音视频内容个性化推荐 企业⽂文书个性化推荐 ⽂文学⽹网站个性化推荐 问答结果个性化推荐 ⾦金金融财经个性化推荐 社交⽹网络个性化推荐

12.优秀的个性化推荐系统具备的效果 提供优秀的推荐结果 提⾼高⽤用户点击率 提升实际效果转化 通过对⽤用户初始信息和少量量点击⾏行行为 通过为⽤用户提供其感兴趣的内容,提 通过为⽤用户推荐有较⾼高吸引⼒力力的内容, 的分析理理解,以毫秒为单位迅速建⽴立 ⾼高⽤用户点击的频率,从⽽而提升⽤用户的 提⾼高⽤用户的注册和付费转化率,提升 和更更新⽤用户模型,完成精准有效个性 停留留时⻓长和⻓长尾物品的曝光率,并促 黏性,从⽽而促进⽤用户留留存,减少⽤用户 化推荐。 进⽤用户的⽇日活和⽉月活。 流失。

13.个 性 化 推 荐 应 ⽤用 的 三 类 常 ⻅见 形 式 ⾸首⻚页个性化推荐 内容⻚页相关推荐 其他⻚页热⻔门推荐 在APP的⾸首⻚页、频道⻚页、猜你喜欢⻚页、 在内容的详情⻚页、阅读⻚页、播放⻚页、 在排⾏行行⻚页⾯面、搜索⽆无结果⻚页、⽆无效跳 发现⻚页等、为每个⽤用户提供个性化的推 商品⻚页等⻚页⾯面的下部或右侧,呈现和 转⻚页、栏⽬目⻚页⾯面等,呈现各种统计结 荐结果,可以通过信息Feed流等⽅方式 相关的内容推荐。常⻅见形式为“看了了 果和热⻔门结果,并且达观的热⻔门推荐 呈现 ⼜又看”、“其他⽤用户还喜欢”等 能不不断更更新,确保新鲜感

14.通 过 使 ⽤用 个 性 化 推 荐 , ⼤大 幅 提 升 运 营 指 标 ● 提升推荐准确率,将最符合⽤用户⼝口味的产品推荐给他,让⽤用户的停留留时间和转化率⼤大幅度提升 提升点击率 提⾼高⼈人均PV 延⻓长⽤用户停留留时间 增加转化率

15.3 THE THIRD 开 发 推 荐 系 统 的 常 ⻅见 技 术 难 点

16. 技 术 难 点 1 : 如 何 精 准 把 握 ⽤用 户 的 兴 趣 点 ● ⽤用户兴趣不不仅存在多样性,⽽而且会随着时间的变化 ⽽而不不断有变化,如何对兴趣进⾏行行精准把握,并针对 性的调整推荐策略略是重⼤大难点 ● 对⽤用户兴趣的挖掘来⾃自于各种各样的数据,内容数 据、⾏行行为数据、关系数据,都对推荐结果有影响, 需要分别建⽴立算法模型来进⾏行行挖掘 ● 不不同算法模型对⽤用户兴趣的刻画结果不不同,如何综 合运⽤用不不同⽅方法的结果,进⾏行行有机的融合

17. 技术难点2:冷启动问题导致推荐满意度低 ● 对新⽤用户,由于缺少⽤用户⾏行行为数据,因此难以⽣生成优 质的推荐结果,导致新⽤用户体验差,流失率⾼高 ● 对新内容,在推荐时过度依赖内容类别标签,导致⽆无 法推荐给合适的⽤用户 ● 对新⽤用户和新内容的推荐质量量低,导致推荐集中于热 ⻔门结果,使得“⻢马太效应”愈发严重,⻓长尾内容得不不到 曝光,影响系统的⽣生态健康

18. ⾏行行 业 痛 点 3 : 推 荐 结 果 的 单 调 性 和 重 复 性 问 题 ● 推荐系统很容易易出现“回声效应”,即推荐的内容越来 越单调,只推荐⽤用户曾经看过的类似内容,导致推 荐的结果越来越单调乏味 ● 仅依赖内容分类和标签以及简单的推荐规则⽣生成的 推荐结果,实践证明会导致推荐结果质量量低下,⽤用 户点击意愿低 ● ⼤大量量优质内容⽆无法找到需要的⽤用户,成为沉没资源。 ⽽而往往低俗或猎奇内容会赢得⼤大量量推荐曝光,导致 ⽹网站调性低下 所有⽤用户的浏览内容相同 单调刻板,缺乏新颖性

19.4 THE FORTH 达 观 推 荐 系 统 解 决 ⽅方 案

20. 达 观 专 ⻓长 1 : 采 ⽤用 独 有 M E 算 法 提 升 推 荐 精 度 • 采⽤用独有的ME算法(Milti-Ensemble)来⾃自动组合多 个单层模型,获得精度远超任意传统单⼀一推荐模型的 推荐效果 • 将传统的协同过滤、矩阵分解、基于内容的推荐等基 础推荐算法能充分融合在⼀一起 • 提供外置接⼝口,客户的应⽤用逻辑、商业需求、⼆二次算 法修改等均可在推荐结果输出时进⾏行行最终修改

21. 达 观 专 ⻓长 2 : 快 速 建 模 解 决 冷 启 动 问 题 • 毫秒级快速⽣生成新⽤用户的⽤用户画 • 达观独特的CLUB(online • 通过⾃自然语⾔言处理理技术,深度挖掘 像,迅速缓解冷启动 clustering bandits)算法,⾃自适应 建⽴立新物品的画像 调整新⽤用户推荐结果

22. 达 观 专 ⻓长 3 : 充 分 考 虑 时 间 因 素 , 让 模 型 效 果 与 时 俱 进 • 将时间因⼦子(T)纳⼊入算法模型,根据⽤用户 ⽤用 ⾏行行为数据不不断调整⽤用户的兴趣画像模型 户 画 像 更更 • 将⽤用户兴趣拆分为⻓长期稳定的偏好,和短 新 期波动的偏好,分别针对性的进⾏行行挖掘 • 根据物品随时间因素变化的特性考虑进来, 不不断调整模型结果,确保效果始终如⼀一 时间

23.达 观 专 ⻓长 4 : “ 三 级 ⽕火 箭 ” 架 构 设 计 , 兼 顾 稳 定 性 和 灵 敏敏 性 • 达观系统架构分为三级⽕火箭:由Offline-Nearline- Online三级依次衔接构成,融合了了各类推荐算法和数 据 • Offline系统提供复杂离线运算,Online系统提供灵巧 的实时运算,Nearline衔接,整体兼顾了了稳定性和灵 敏敏性 • 系统运⽤用了了⼤大量量NoSQL,内存计算、Spark Stearming、Kafka等技术,确保了了在⾼高性能要求下系 统强⼤大的可靠性

24. 达 观 专 ⻓长 5 : 针 对 客 户 的 实 际 场 景 来 针 对 性 建 模 • 针对客户的应⽤用场景,定制特定的推荐模型,确保 因地制宜 • 设置⾃自学习循环体系,不不断根据客户数据来优化系 统,确保运⾏行行时间越久,服务越贴合客户需求 • 对历史⾏行行为库和画像库进⾏行行⻓长期深度挖掘,确保效 果持续提升

25.达 观 专 ⻓长 6 : 功 能 强 ⼤大 、 配 置 丰 富 的 管 理理 后 台 • 提供最为详尽的推荐数据统计分析后台,客户可以随时掌握推荐指标,对⽐比推荐效果数据 • 提供⾃自主化的管理理配置功能,让客户团队能随时调整推荐结果,管理理推荐策略略

26.5 THE FIFTH 成 功 案 例例 展 示

27. 达 观 为 酷 6 提 供 专 业 的 推 荐 系 统 解 决 ⽅方 案 项⽬目需求 达观解决⽅方案效果展示 ● 酷6⽹网是全球⾸首家在纳斯达克上市的视频 ⽹网站。2010年年,酷6⽹网成为世界杯独家视 频直播⽹网站。 ● 短视频⽤用户粘性低,停留留时间短,流失率 ⾼高,缺少个性化的视频推荐。 ● ⾃自主研发推荐系统成本⼤大,技术⻔门槛⾼高开 ⾸首 ⻚页 猜 你 喜 欢 详 情 ⻚页 发周期⻓长,急需专业的第三⽅方团队。 个性化推荐 相关推荐

28. 达观为酷6提供专业技术服务 显著提升推荐效果 实施效果 M站的相关推荐数 ● 达观为酷6⽹网完成推荐引擎开发,达观数据 为酷六视频提供了了⼀一站式视频推荐解决⽅方 案。 ● 针对酷6⽤用户⾏行行为建模,接⼊入后效果显著, ⽇日活量量提升40%左右,播放量量和观看时⻓长 提升50%左右。 ● 针对酷6的推荐引擎进⾏行行持续优化,定制算 法模型持续性地优化推荐结果,效果不不断 提升,总流量量呈现震荡上升趋势。

29. 达 观 为 ⾼高 清 视 频 提 供 专 业 的 推 荐 引 擎 解 决 ⽅方 案 项⽬目需求 达观解决⽅方案效果展示 • ⾼高 清 影 视 是 ⼀一 款 在 线 电 影 、 电 视 剧 点 播 A P P , 拥 有 千 万 级 的 ⽤用 户 群 体 , 应 ⽤用 商 店 视 频 类 排 名 前 2 5 。 • ⾼高 清 影 视 流 量量 巨 ⼤大 , 技 术 维 护 成 本 ⾼高 , 缺 少 有 经 验 的 专 业 技 术 ⼯工 程 师 进 ⾏行行 推 荐 引 擎 的 深 度 开 发 。 ⾸首 ⻚页 推 荐 模 块 内 ⻚页 推 荐 模 块 • ⾃自 研 后 效 果 不不 理理 想