店家的Apache Kylin 应用之旅

下载 6

Kyligence

发布于

6024

人观看

#信息技术

2018年10月Apache Kylin meetup@杭州站，店+大数据技术总监分享了从传统数据库，到使用Apache Kylin，以及升级到 Kyligence Enterprise 的历程。

展开查看详情

1 .店+ 的 Apache Kylin 应用之旅白英-刘涛日期 2018-10 https://www.dianjia.io/

2 .一公司、团队简介目录 CONTENTS 二数据发展史

3 . 一、公司、团队简介公司概况随着互联网时代的来临，越来越多的传统零售服装企业开始思考经营管理的转型和升级，店＋将互联网软硬件技术与先进的零售管理经验相结合，为企业提供一整套新零售解决方案。团队100+ 客户100+ 数据团队2 资深数据0 公司照片 https://www.dianjia.io/

4 . 二、数据发展史 2.1 历程小公司无法持续投入开发，遇到问题解决慢，未来转为商业版 Kylin ETL 结果明细数据汇总查询场景多，性能 2018.09 持续优化升级跟不上，考虑预计算开始利用 Hadoop 生态 HBase 存储结果、 2017.12 商业版 Kylin Phoenix 查询 MySQL 实时查询 2017.04 开源版 Kylin 2015.05 Hadoop应用数据部门组建 https://www.dianjia.io/

5 . 二、数据发展史 2.2 例子 select a.brand_id ,a.brand_spu_id , Cube 数:27 COALESCE(SUM(total_sale_money_kpi),0) as total_sale_money_kpi , 数据量：1TB COALESCE(SUM(total_sale_count_kpi),0) as total_sale_count_kpi , 最大 Cube：120G COALESCE(SUM(total_sale_money_suggest_kpi),0) as total_sale_money_suggest_kpi , COALESCE(SUM(short_sale_count),0) as short_sale_count , 最大 Cube 源数据行数：20亿 COALESCE(SUM(total_sale_money_refund),0) as total_sale_money_refund , COALESCE(SUM(total_sale_money),0) as total_sale_money , 例子：查询品牌某款商品 COALESCE(SUM(total_sale_count_kpi_offline),0) as total_sale_count_kpi_offline , COALESCE(SUM(total_sale_count),0) as total_sale_count , 一段时间内有销售或者库存 COALESCE(SUM(product_entry_stock_count),0) as product_entry_stock_count , 不为0的各种指标 COALESCE(SUM(distribution_entry_stock_count),0) as distribution_entry_stock_count , (CASE WHEN SUM(total_sale_money_suggest_kpi) = 0 THEN 0 ELSE (sum(total_sale_money_kpi)*1.0/SUM(total_sale_money_suggest_kpi)) END) 平均响应时长 as discount_rate MySQL -- from view_dm_storage_sku_sale_stock_dm_v0 a inner join dim_date d on a.start_day=d.date_id Phoenix 30-50s WHERE 1=1 and a.brand_id = 10170 and a.start_day >= '2018-10-20' and a.start_day <= '2018-10-21' Kylin 1s group by a.brand_id ,a.brand_spu_id having ( sum(total_sale_count_kpi) !=0 or sum(total_sale_money_kpi) !=0 or Kyligence 1s sum(TERMINAL_STOCK_COUNT)!=0 ) Enterprise order by total_sale_money_kpi DESC ,a.brand_spu_id desc LIMIT 10 offset 110 https://www.dianjia.io/

6 . 二、数据发展史 2.3 数据架构接口报表展示数据分析数据应用 Kylin HIVE HBASE Mysql Redis PolarDB 应用数据存储数据离线/实时计算离线数据流实时计算（storm） DataWorks 程业务数据存储 RDS PolarDB OSS MQ 会员支付商品订单库存其它业务数据采集 https://www.dianjia.io/

7 . 二、数据发展史 2.4 Phoenix 01 02 DWD 自建 Hadoop 集群，搭建 HBase，各搭建 CDH 集群，统一管理 Hadoop 生种配置混乱，无法统一管理，缺乏监态，配置、监控都方便了很多控常出问题，并发插入删除的问题、数据分布热点的问题，查询时计算较多，性能越来越差 https://www.dianjia.io/

8 . 二、数据发展史 2.5 开源版本 Kylin 1 团队转型线程无法释放，查询积压，最终无法 2 提供服务（应用层缓存，过一段时间重启，最终没有根本解决）缺乏监控（是否有 Cube 建的不合理 3 ？哪些查询慢需要优化？） https://www.dianjia.io/

9 . 二、数据发展史 2.6 商业版 : Kyligence Enterprise 系统建议抽取对于 Cube 的合理性给出建议故障解决 data对于出现的任何问题可以找人迅速响应解决业务问题层对于慢查询可以找人工分析自身发展更专注于业务的发展 https://www.dianjia.io/

10 . 二、数据发展史 2.7 未来实时场景历史数据的变更引入人才越来越多的准实时场景的需对于历史的错误数据的变更人才是最大的资本，我们尚求，如何更好的在业务场景如何做到更少的人为介入，处在远行的出发阶段，希望中实现实时与历史的结合更高效的变更历史数据有更多有能力又志同道合的同学加入 https://www.dianjia.io/

11 .让零售更智能服装零售用店+ https://www.dianjia.io/

15点赞

8收藏

6下载