Elasticsearch在金融大数据的应用

下载 21

da仔

发布于

9464

人观看

#信息技术

Elasticsearch在金融大数据的应用，从ES的总体架构介绍入手，分析ES集群优化的基本方法和实践，介绍ES应用在金融领域的应用案例，以及分析未来中国平安的ES规划。

展开查看详情

1 .Elasticsearch 在金融大数据的应用廖晓格 2019年4月

2 . 一．总体架构目录目录二．ES集群优化三．应用介绍四．未来规划 2

3 .总体架构基于Elasticsearch高效的搜索和强大的聚合特性，在大数据平台广泛应用，大量大数据服务基于 elasticsearch建设，总体容量近200TB，每天新增20TB 客户图谱决策引擎搜索服务日志平台可视化与数据应用 OLAP报表系统标签系统用户行为用户画像服务缓存 ES SQL Service Redis Cluster 层存储层 Elasticsearch cluster Elasticsearch cluster Elasticsearch cluster 传输层 ES Loader Job Message Consumer Service 数据层大数据平台(Hadoop) 消息中心（Kafka，RocketMQ…）

4 .ES Loader Job • 快速将hive表的数据导入到ES里面 • 根据hive字段创建es mapping，如果hive有map字段，则通过MapReduce创建mapping • 限流，防止ES集群压力过大 • 优化索引，切换alias 如有map字段，遍历map获取key， reduce创建mapping，如无，直接创建 map reduce ORC/HDFS split Map bulkload导入es split map ETL split flush merge optimize split switch alias

5 .Message Consumer Service • 通过简单的配置完成实时消息接入，并存到Elasticsearch • 支持ES故障无消息丢失，写降级临时将数据写到oracle • 支持字段类型转换 • 支持消息生命周期管理 • 支持mapping新增补全 Kafka MCS数据采集 ES Cluster RocketMQ 如果写es重试失败，消费降速，等ES恢复，再将Oracle数据同步到ES，消费速度恢复 …… Oracle

6 . ES SQL Service 将ES SQL插件独立出来，做成服务来调用ES集群，解决如下问题： • 避免更新插件时重启ES集群，迭代发布时只影响服务 • 方便加熔断机制 • 减小ES协调节点的压力，避免协调节点的内存使用过高 • 支持ES SQL查询（ES旧版本不支持SQL，采用https://github.com/NLPchina/elasticsearch-sql ，并增加复杂SQL功能） • 标准SQL支持 • 并发控制，OLAP分析的SQL进行并发控制 Rest API • 支持ES SQL权限认证 • 支持ES SQL阻断 • SQL成本预估并发控制权限管理元数据维护基数过大的聚合管理会造成单节点OOM SQL标准化 SQL成本预估 ES SQL Plugin

7 . ES SQL Service-plugin增加功能 • 语法和功能增强 • 使用场景：B+自助分析报表计算列 ES 6.3以前不支持SQL查询，项目从开源 (https://github.com/NLPchina/elasticsearch-sql )基础上增加功能： 1. 新增数值/日期/字符等SQL函数 2. SQL函数内嵌任意函数和case when 3. 支持过滤条件使用SQL函数 4. 支持按SQL聚合函数排序 5. 复杂case when语句：case when嵌套函数,函数嵌套case when等 6. 空值检查，修复表达式计算null pointer exception. 7. 解决大宽表字段别名查询造成过多脚本查询限制和性能问题 (原实现转换成脚本查询，新实现插件中做别名隐射 )

8 .ES SQL Service-慎用terms size ElasticSearch terms size聚合的时候，如果维度基数大于size，聚合结果求TopN可能是近似值 shard A shard B shard C shard A shard B shard C 求top3 A 30 B 12 E 15 A 30 B 12 E 15 B 25 C 10 B 10 C4 D8 D8 B 25 C 10 B 10 C4 D8 D8 结果 D3 E7 C6 B 47 和正确结果 B 47 对比 A 30 A 33 E2 A2 A1 D 16 E 24 正确结论：terms size & shard size 必须超过维度元素个数

9 .Elasticsearch监控报警 • Cluster status报警 • CPU usage & load average报警 • JVM GC报警 • Disk usage报警 • Query & indexing time报警 • Thread pool queued报警 ….. 告警 ES cluster ES exporter Prometheus Grafana 展示分析

10 . 一．总体架构目录二．ES集群优化目录三．应用介绍四．未来规划 10

11 .索引优化 • 合理设置字段索引参数 1. 不需要过滤时可以禁用索引 "index"：false 2. 不需要text字段的score，可以禁用 "norms"：false 3. 不需要短语查询可以不索引positions "index_options" : "freqs" 4. 禁用全文搜索功能 _all "enabled" : false • 采用多线程批量提交数据 1.使用 multiple workers/threads发送数据到ES 2. 每个bulk请求不宜过大，避免导致OOM 3. 遇到EsRejectedExecutionException则说明IO压力过大，需要调整线程或bulk size • 增加Refresh间隔，减少副本数量 1. 增加refresh时间间隔可以避免生成过多的segment，从而减少合并压力 2. 同步完成后再加副本可以避免主副分片同步带来的压力 • 硬件升级 1. 使用SSD硬盘，提高读写性能 2. 使用性能更好的CPU，高并发 3. 使用大内存，索引缓冲默认会占用JVM 10%的内存空间

12 .查询优化 • 尽量避免使用script 1. 尽量避免使用script，如要使用则可以选择painless & experssions引擎 2. 避免大量动态脚本产生，因为脚本需要编译才能执行。 • 避免大查询和大聚合 1. 大查询或者大聚合会导致ES响应慢，还会占用大量JVM内存，从而导致其他任务堆压 2. 建议在服务层通过程序来组装业务，并及时阻断查询size或者笛卡尔积过大的请求 • 避免深度分页 1. 深度分页导致大批数据返回到协调节点，协同节点一共会受到N * (From + Size) 条数据，然后进行排序 2. 使用 Elasticsearch scroll 高效滚动的方式来解决深度分页问题 • 使用routing 可直接根据 routing 信息定位到某个分配查询，避免查询所有的分片，以及在协调节点上无需排序 • 加大线程池阻塞队列长度修改thread_pool.bulk.queue_size，默认为500，可适度调整到1000-2000 • 设置Cache参数 1. QueryCache: 过滤查询过多则可以调大indices.queries.cache.size 2. FieldDataCache:聚类或排序场景较多则可以调大indices.fielddata.cache.size

13 .OS & JVM 优化 • 禁用swapping 内存交换到磁盘对服务器性能来说是致命的，通过设置swappiness = 0来禁用该功能 • 文件描述符和MMap Lucene使用了大量的文件，Elasticsearch 在节点和 HTTP 客户端之间进行通信也使用了大量的套接字，这需要足够的文件描述符, 设置sysctl -w vm.max_map_count=262144 • 单个节点内存不要超过32G 1. JVM 在内存小于 32 GB 的时候会采用一个内存对象指针压缩技术 2. 大指针在主内存和各级缓存之间移动会变得缓慢 3. 机器内存大，可以采用单机多节点部署 • 至少留一半内存给LUCENE Lucene可以利用操作系统底层来缓存数据结构，以便快速访问，这些内存并不属于JVM内存 • 单机多节点部署避免主副分片被分配到同一物理机设置cluster.routing.allocation.same_shard.host:true • 使用G1垃圾回收器 1. 存在单个索引数据非常大的集群，可以考虑使用G1替代CMS 2. 设置MaxGCPauseMillis参数减少GC停顿时间，但如果过小则会带来CPU消耗

14 .OS & JVM 优化 • 禁用numa模式，设置vm.zone_reclaim_mode=0 Elasticsearch集群中，经常偶节点出现sys cpu占用过高问题，出现问题期间，无法登录及操作,其它活跃进程占用 CPU都显示100%；压测集群过程中，出现了SYS 飙高问题，但是查看atop这个时间段的数据，也因为atop进程hang 住，导致了无法采集数据

15 . 一．总体架构二．ES集群优化目录目录三．应用介绍四．未来规划 15

16 .标签系统技术架构离线、实时、流式，是完整数据中心  离线：通过Hive计算，形成各个对象的超级款表，导入ES  实时流式日志数据：通过ES消息采集初步聚合汇入ES  应用系统状态：通过RocketMQ异步推送给指标资产交 …易超级宽表 .. ES Cluster 流式日志 ES消息采集 API Service 应用数据

17 .标签系统根据数据，生产标签，深入了解用户和产品精准营销千人千面信息推送智能产品客户分析广告系统口袋A 营销PUSH 推荐系统 APE 活动平台搜索产品货架客户画像标签系统

18 .标签系统 • 标签系统目前主要建立的是客户主题标签，目前分析预测类标签30余个，客户基本维度数据600多个，业务场景标签500多个（在线300个左右）。基础理财属性投资消费核心信用卡信息标签贷款行为兴趣信息偏好

19 .基于ES SQL的OLAP报表服务金融业务极其复杂，cube的维度繁多，维度基数不大，前期kylin对维度个数限制比较大，所以采用ES构建在线热点cube，提升拖拽体验应用层制式报表自助分析异动分析 API服务 AI报表 … query (API/SQL) SQL on Bigdata 平台层是否字段、DT 命中？ SQL on ES SQL on hadoop 在线Cube 离线Cube 200热点column 1000+ column ES ES Presto Spark SQL 一个粒度1个cube 新增热点字段 ES Loader Job 客户级公共表私钻主题综拓主题产品分类主题模型层 …… 产品级客户 X 产品级人员 X 产品级团队 X 产品级机构 X 产品级 …… 集市沉淀

20 .基于ES SQL的OLAP报表服务特点 自给自足业务人员无需IT技能，通过简单的托拉拽就能生成报表； 秒级计算基于强大的计算引擎 丰富模型 一键分享给用户提供极致的查预先准备数据模型，从业绩追踪、经营分可将自己的报表和分析成果一键批量询体验；析、客群分析等场景提供全面支持；分享给其他同事；

21 .业务日志归档平台传统银行业务日志归档基本上是存到Oracle库的，为了减轻数据库压力和方便业务系统将日志归档，所以基于Elasticsearch将日志归档，并能提供实时日志的查询功能日日志查询业务应用层业业务1 SDK 业务2 SDK 志务归登录权限 CATAgent CATAgent 档可视化与系 UI Filebeat 数据源配置其他系统高级应用 Filebeat 统发布消息应用层消息队列 Kafka A Kafka B RocketMQ 日志归档后台元数据数据管理数据查询创建日志契约消费消息索引构建 LogProcessor服务 LogProcessor服务查询服务 ES Query Service BigData Query Serive 数据服务在线数据在线存储(热点数据) Elasitcsearch A Elasitcsearch B 查询 (SQL) 归档(DSP调度) 离 Hive Spark Presto 数据存储线存 HDFS 储零售大数据平台

22 . 一．总体架构二．ES集群优化目录目录三．应用介绍四．未来规划 22

23 . 未来规划读写分离 MASTER节点 1. 集群分为read和write两个分区升级版本至7.X版本，不再接受查询/索引请求 2. index的数据放到write分区，同步完后将有很多新特性数据迁移到read分区 3. search请求read分区 1. 可以将master节点独立出来， 4. 读写分离可以避免同步数据以及段合并带 1. 稀疏性 Doc Values 的支持，可以避免稀疏字不再接受查询/索引请求，只来集群性能抖动段带来的性能和硬盘空间浪费负责管理集群元数据 2. 根据节点的负载高低来排序，负责高的节点接 2. CPU、内存和硬盘配置可以低收到的任务将减少一些，也可以采用虚拟机部署 3. 更快的查询和索引速度，故障分片恢复时间也变得更快了 4. 预排序，即在索引的时候将生成好排序信息，提升搜索或聚合的性能

24 . 金融大数据团队期待您的加入打造金融数据新生态助力平安零售强转型 181276056@qq.com 大数据团队目标是以最领先的大数据技术建设银行零售数据中心及AI智能服务平台，深入探索金融数据，为业务提供技术和数据支持，最大限度发挥银行数据的价值。

25 . 机密文件谢谢

0点赞

0收藏

21下载