阿里云数据智能-Elasticsearch分享

展开查看详情

1.阿里云Elasticsearch培训材料 面向合作伙伴 洪阳

2.行业背景 100,000 Meetup Members end to 2018.07 Elastic商业公司营收趋势 开源社区Elasticsearch下载量 数据引用自Elastic IPO Report

3.产品背景 Elasticsearch Logstash Kibana

4.市场分析 | 常见客户痛点 无灾备能力和容错机制 阿里云IaaS支持解决容灾 部署运维成本高 自动化部署,0成本运维 客 技术瓶颈解决不了线上问题 Elastic官方技术支持 产 户 品 痛 优 点 分析功能缺失 可视化分析功能 势 搜索结果无法优化 优化中文分词及搜索结果 性能瓶颈无法弹性扩容 扩容简单 无产品组合 云上产品组合使用

5.场景示例 | 日志分析 采集用户在网站/游戏/应用内的行为日志数据,分为离线和在线两个部分分别投递给Hadoop及Elasticsearch,以满足用户(离线部分)标签 、画像的加工,和(在线部分)用户行为实时统计和状态查询。 阿里云Elasticsearch能力 • 面向日志分析场景,提供聚合搜索、实时查询、 增量数据快速索引归档等分析必备能力。 • 除此之外,提供基于LBS的地理位置搜索、可视 化分析报表、数据可视化展现等高级分析能力。 适用场景:用户留存分析,浏览路径分析,基于地 理围栏的用户画像,用户标签体系等等场景。

6.Elasticsearch如何处理日志 • 集中收集与存储 Log Files • 日志搜索 常 日志搜索 见 Datastore • 分析聚合及可视化 问 • 安全,角色管理 题 Sensors 日志分析 • 可伸缩性 Web API

7.Elasticsearch如何处理日志 轻量级数据收集 • 集中收集与存储 • 对常见的日志数据采集 –日志文件,系统日志,网络拥堵 常 • 日志搜索 等其他常见的日志数据 见 • 收集汇拢数据 问 • 分析聚合及可视化 • 离线Hadoop数据的迁移 题 • 安全,角色管理 • 可伸缩性

8.Elasticsearch如何处理日志 • 集中收集与存储 • 全文检索 –日志文件,系统日志,网络拥堵 常 • 日志搜索 等其他常见的日志数据 见 • 元数据搜索 问 • 分析聚合及可视化 • 指标/标签搜索 • 地理位置搜索 题 • 安全,角色管理 • 可伸缩性

9.Elasticsearch如何处理日志 • 集中收集与存储 • 聚合分析 –Sum, average, min/max, etc 常 • 日志搜索 –Sub-aggregations 见 –机器学习 问 • 分析聚合及可视化 • 数据可视化 –Kibana在线数据可视化 题 • 安全,角色管理 • Query Language • 可伸缩性

10.Elasticsearch如何处理日志 • 集中收集与存储 • 安全 –RBAC的用户权限 常 • 日志搜索 –TLS/SSL交互式安全协议 见 • 告警 问 • 分析聚合及可视化 –实时监控,触发式告警 • 报表 题 • 安全,角色管理 –自动数据报表 –触发式报表 • 可伸缩性

11.Elasticsearch如何处理日志 • 集中收集与存储 •弹性扩容 –节点对等,快速拷贝,弹性扩容 常 • 日志搜索 见 问 • 分析聚合及可视化 题 • 安全,角色管理 • 可伸缩性

12.产品介绍 | 阿里云Elasticsearch产品定位 + Elastic Stack 阿里云 运维日志监控 业务分析 应用搜索 指标分析 安全分析 信息检索

13.阿里云Elasticsearch的产品生态架构 • 完全兼容开源大数据生态 • 用户放心 • 无缝对接阿里云产品生态 • 用户方便

14.阿里云Elasticsearch现状 服务1000企业 超过1500个 营收增长 云上集群 Top10

15.产品介绍 | 目标场景 指标分析 运维日志监控及分析 应用搜索 游戏/视频/多媒体 IT Operation 电商等 行为日志分 日志审计分析 信息检索 新零售场景 安全/金融 传统企业、内容聚合站点

16.产品介绍 | 产品价值 Eyou Elasticsearch 集群优化 基于机器学习的AIops Security 弹性伸缩 日志采集 机器学习预测 智能运维提示 Alerting Monitoring X-Pack ElasticFlow 集群分角色 默认集成Elastic Stack 阿里云自研Elasticsearch数据导入工具 全部扩展工具 Reporting MaxCompute Graph 自动快照 支持基于流式计算Blink的 数据加工能力 Kafka SLS RDS

17.产品介绍 | 竞品对比 Alibaba Cloud 腾讯 AWS Elasticsearch Elastic Cloud 华为 Elasticsearch Elasticsearch Elasticsearch Elasticsearch 多版本 多版本 多版本 多版本 多版本 差异化规格 有 有 有 有 有 监控报警 有 有 有 有 基础能力 高可用 有 有 弹性扩缩容 扩缩容 扩容 扩容 扩容 扩容 API开放 有 有 有 有 有 数据库对接工具 DTS、DataX等 lambda等 开源工具 开源工具 开源工具 搜索 分词插件 优化 默认 默认 优化 默认 相关功能 声纹搜索 有 数据集成工具 Blink、eflow等 lambda等 开源工具 开源工具 开源工具 可视化分析 有 有 有 有 分析 相关功能 企业级数据权限 有 有 simple auth simple auth simple auth 低成本存储 高效云盘、本地盘 高效云盘 智能运维 eyou 其他功能 节点角色 有 有 商业版本 X-Pack 有 有 功能

18.附件一 | 产品功能截图 数据探查和数据可视化 管理视角监控

19.

20.

21.

22.

23.“一图胜千言”图像搜索 – 销售一纸禅 为什么要卖图像搜索 行业竞对企业比较 厂商 价格策略 市场情况 优劣分析 国内垂直类电 客户需要更加 提升购买转化 互联网上各类 分为预付资源包,简单明了, 基于阿里巴巴电商拍立淘孵 低成本、轻交付、算法国际领 商和国外本土 便利、易用的 率,为客户创 型图片的数量 阿里云智能 提供免费试用 化出的搜索服务 先,售卖规格简单清晰 电商发展迅速 搜索方式 造直接效益 快速增加 导入和查询分开计费,容易混 免费测试期间 客户反馈算法准确度不如阿里, 百度 乱 积累部分用户 针对中大型客户而言价格偏高; 每月与最低消费,不适合量级 纺织布料行业为主,少量电 不能实时更新索引。API费用 码隆科技 目标客户与核心价值 较小的商家 商客户 过高;收费项多,计费复杂; 客户:技术精度不如我方; 目标客户 企业现状 核心需求 我们的价值 华为 按需计费和包月套餐相结合 产品上线晚,联合码隆输出 价格:中大型客户而言偏高 电商平台 技术能力储备无或 商品搜索/推荐 • 购买转化率提升 垂直/跨境/海外 不足 客户常见问题 图片Ip企业 • 提高搜索准确率 购物场景和使用体 相似图片推荐 是否需要单独购买ECS和GPU等基础资源? 是否存储客户的原始上传图片数据? 图库/论坛 验单一 • 优化购物体验 • 不需要。除了提供基本的AI能力外,也提供依赖的相关基础资源。 • 图像搜索产品需要客户自己在OSS中上传图库,并且不保存客户任何的 家居/装潢/制造业 无法给用户提供最 图片迅速查找 • 降低技术成本 是否一定需要单独购买OSS? 原始图片。 精准推荐 • 不是一定需要购买OSS。目前实例提供两种方式来导入数据,即实时导入 图片未存储在上海区域,是否影响使用图像搜索服务? 和离线导入。实时导入方式(调用API方式)适用于小规模、实时数据导 • 在导入阶段:实时导入时用户将图片post上传;离线导入时分增量和 典型 入。离线导入方式(OSS导入方式)适用于大规模、离线数据导入,需要 全量导入,都需要用户的OSS在上海区域;在查询阶段:当全部图片导 入到图像搜索服务,建立索引后,在任何区域都可以做检索查询。 应用 用户开通对象存储(OSS服务),并进行相应的授权。 电商/零售 工业用品 图库/影像 论坛 场景 项目联系 产品官网 官网地址: 电商软件 “一图胜千言”图像搜索销售弹药群 家居装潢 艺术/文物 纺织布料 其他 ai.aliyun.com/imagesearch 服务商 计费说明: 产品运营:安永 help.aliyun.com/document_detail/85153.html 产品经理:丹石

24.阿里机器翻译-销售一指禅 <联系我们> 运营讲解:宋蒙 产品讲解:董双 机器翻译的适用场景? 产品能力 在线文档协同处 跨境电商场景的 理平台、多语阅 智能硬件厂家、 卖家平台、跨境 读、在线外语教 手机厂家、视频 算法领先 海量数据 持续优化 电商ERP、跨境电 育、浏览器、社 字幕类厂家等。 商大卖家等。 交媒体类平台等 阿里翻译可根据用户情况 全球领先的人工智能技术 阿里多年电商数据驱动 提供持续定制的服务 丰富的产品特性 客户可能遇到的问题 1. 跨境电商多语言平台,如何低成本、高效率的解决? 电商翻译 11种语种 电商场景 跨境电商卖家在运营多语言市场、尤其是小语种市场的情况下,由于语言障碍最 全链路 支持 细化训练 终导致铺货效率低、沟通成本高、转化率低的问题,用户可利用阿里电商机器翻 电商场景 译根据电商的场景调用解决电商链路中的相关语言问题,成本低、效率高、有利 电商场景 通用领域 电商商品描述 买卖家沟通 各行业适配 于提高转化率。 搜索翻译 翻译 翻译 2. 非电商领域用户的多语言问题,该如何利用机器翻译解决? 非电商类用户可以调用阿里的通用场景机器翻译API,嵌入阿里翻译的服务到其相 神经网络 统计机器翻译 支持持续优化 语音翻译 …… 图片翻译 机器翻译 技术融合 定制化服务 智能同传翻译 OCR识别 应平台内,通多调用机器翻译解决平台内用户的多语言翻译问题。

25. <联系我们> 印刷文字识别OCR-销售一指禅 扫码加入钉钉交流群 运营讲解:苏睿 OCR:数据化、智能化的第一步 产品服务类型 注册登记审核 内容审核监管 文件存档录入 卡证类 汽车相关类 行业票据 资产证件类 识别 识别 识别 识别 • 许多APP或应用都需 • 自动识别图片、视频中 • 解决各种金融,医疗报 要通过证件审核,认 的文字内容,及时发敏 销等场景各种行业票剧 证来访用户的真实信 感,恶意广告等不合规 等识别 录入系统,方便, 息,从而提供更安全 内容,规避业务风险, 且节约人力成本 和高级的服务 大幅节约人工审核成本 行业文档 通用文字 视频、实体 识别 自定义模版 识别 识别 OCR产品优势 识别精度高 国内领先的人工智能技术, 售卖模式: 亿万级海量标注样本数据进行训练 公共云:预付费资源包,单价0.005元/次起;资源包有效期自购买之日起1年 稳定的服务 稳定的服务,高实时反馈 专有云:按licenses售卖,一次性收费,每年收取25%的服务费(需有GPU服务器) 丰富的使用 根据客户的使用场景,服务分为8大类, 场景 Demo 测试: 包含各种通用需求,以及定制化需求 https://data.aliyun.com/ai#/ocr-paper 一站式服务 提供公共云、专有云、端服务以及行业解决方案 http://duguang.aliyun.com/demo/general.htm?type=general

26.阿里云Elasticsearch– 销售一纸禅 一句话介绍Elasticsearch 竞品对比 Elasticsearch是阿里云上提供的云上全托管式的Elasticsearch服务,即开 厂商 数据可靠性 软硬件投入 系统托管 部署扩容 每年总费用 即用,稳定可靠,弹性伸缩,按需付费。 无软硬件投入, 阿里云 无软硬件投入,按 即时开通,快速部署, 99.9999% 按需无托管费 12790元/年 Elasticsearch 需付费 弹性扩容,按需开通 目标客户有哪些痛点 用付费 需自行保障, 无每台2U服务 自购服务器搭建 需硬件采购、机房托 自行搭建主从 服务器成本相对较 器每年超过 46900元/年 无灾备能力和容错机制 搜索结果无法优化 ES服务 复制,自建 高 5000元托管费 管、部署机器等工作, 周期较长。 RAID等 用 部署运维成本高 性能瓶颈无法弹性扩容 自购ECS搭建ES 需自行保障 无硬件投入 无硬件投入 无法弹性扩缩容 38623元/年 服务 技术瓶颈解决不了线上问题 无产品组合 购买方式 分析功能缺失 预付费: 后付费: 包年包月是预付费方式,在新建实例时 按时付费是后付费方式,按小时计费, 就需要支付费用。在长期使用的场景下 系统每小时生成1个收费订单并扣除相应 目标 包年包月具有更低的价格。 的账户余额。 场景 指标分析 游戏/视频/ 运维日志监控 应用搜索 电商 多媒体 及分析 产品官网 项目联系 官网地址: 如有需求,请联系我们或加群 传统企业、 data.aliyun.com/product/elasticsearch 行为日志分析 日志审计分析 信息检索 其他 产品经理:洪阳 新零售场景 安全/金融 内容聚合站点 计费说明: http://tb.cn/8uMzgGw 产品运营:小扑 文档地址: 中文技术社区:钉钉搜21737292 https://help.aliyun.com/document_detail/57876.html

27. 智能语音交互-销售一纸禅 <联系我们> 产品:宇舜,运营:安永 产品定位简述 目标场景 目标场景 阿里巴巴语音交互技术服务平台,提供语音识别、语音合成、语音自学习平台 等语音AI技术能力的开放平台,具备开放丰富的接入方式和稳定高性能的智能 智能客服 庭审速记 线路检修 外呼机器人 集成开发能力 行业经验 语音服务。 演讲 智能语音产品优势 语音质检 实时字幕 直播审核 线上教育 金融催收 产品化能力  算法的先进性 — BLSTM在工业界第一个大规模部署。DFSMN开源,语 音识别准确率纪录提升至96.04%(基于世界最大的免费语音识别数据库 LibriSpeech),被谷歌、微软论文引用。 售卖模式:  语音本地化部署方案的先进性:所有服务全部容器化、跨平台;兼顾安全  语音识别公共云:按时长售卖,按需付费。 性和灵活性的鉴权方案;鉴权服务、语音服务均支持负载均衡;接入体系  语音识别专有云:按路数售卖,永久有效。 完备:全平台SDK、文档、测试工具。  智能语音自学习平台:分为语音模型和声学模型两部分。  全球第一个地铁语音售票机方案 — 公众场所强噪声环境下免唤醒的多模 态AI交互。  语音自学习平台 — 突破性地提供一键式智能语音自助优化方案,将整个 TTS demo测试: 语音智能模型的数据输入、模型训练、模型测试和模型发布有机地融合在 https://ai.aliyun.com/nls/tts ASR demo测试: 一起并以非常简单的方式对外提供。 更多问题欢迎加入“智能语音弹药群”

28.阿里云智能机器学习PAI - 销售一指禅 为什么要卖PAI 产品能力 强烈的市场需求 强大的竞争优势 杰出的用户口碑 • 价格优势,高性能训练 • 开发者:对比本地,训 • 中国市场,GPU需求 量大于供给 GPU P100,全球最低 练提速100倍 notebook 在线预测 Studio • AI技术在企业应用越 价,竞品价格的1/3 • 技术优势,训练场景资 • 企业:对比云上自建服 GPU/CPU资源 P4集群/ECS集群 大规模解决方案 来越广泛 • AI人才和企业,规模 源复用,预测场景自动 务器,成本降至1/6 GPU P100 自动化扩缩 算法优化/框架优化 发展迅速 化弹性扩缩 CPU ECS/ODPS GPU降成本 自动弹性扩缩 解决复杂难题 目标客户与产品愿景 愿 景 • 以AI驱动自身业务发展的互联网企业 典型应用场景 人人都用得起的 • 以AI对外提供服务的AI创业公司 机器学习平台 • AI科研实验室 个性推荐 金融风控 图像质检 OCR 图像搜索 解决了什么问题 1、GPU价格高 自动驾驶 语音识别 图像识别 广告预测 人脸识别 …… 2、在线预测云上资源弹性扩缩 3、数据量大,模型复杂,本地计算不动 <联系我们> 运营讲解:黯灭 PD 讲解:傲海 扫码加入钉钉交流群

29.DataV 数据可视化(公共云)销售一指禅 产品能力一句话介绍 数据大屏常见场景 用数据展示企业特色 DataV是阿里自研的图形化数据可视化应用开发平台,有了DataV,人人都可 对外展示 即将上市的企业传播、媒体现场展示、大会展台、嘉宾访客接待 以轻松搭建实时数据驱动、效果炫酷的数据可视化页面,并通过大屏、电视机、 电脑、手机等媒体展现。 用数据驱动业务发展 驱动业务 实时查看业务概况、监控预警、驱动内部快速响应 为什么选择DataV? 价值发现 看到未被挖掘的数据价值 当多维数据实时呈现后,数据带来的视觉感受会帮助人发现新的因素  业内领头羊,图形化数据大屏开发平台开创者  天猫双11媒体大屏、杭州城市大脑、重庆城市大脑、云栖大会、香港国 目前线上售卖版本 际机场、平昌冬奥会等重大数据大屏的幕后英雄  提供丰富的可视化组件库,具备强大的地理信息展示能力 升级 免费 组件二次开发/ 基础版 企业版 开发者版 升级 公测期企业版用户免费体验  支持多种数据源,可进行数据交互分析  沉淀多种场景模板,手机端和PC端两者兼顾 个人使用 / 企业使用 /  网页形式发布,使用手段灵活 体验试用 / 功能齐全 / 性价比高 / 年付51 元 月付500/ 年付5100  提效利器,3人团队1个月的工作量,用DataV1人1天即可完成 本地 大屏本地部署/数据无需上云 <联系我们> 运营讲解:巢甜 产品讲解:央久 部署版 价格高/线下签约输出