GIAC架构大会-承载每天万级任务的调度系统架构是如何设计的

Easy Scheduler 设计特点: 一个分布式易扩展的可视化DAG工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。 其主要目标如下: 1. 以DAG图的方式将Task按照任务的依赖关系关联起来,可实时可视化监控任务的运行状态 2. 支持丰富的任务类型:Shell、MR、Spark、SQL(mysql、postgresql、hive、sparksql),Python,Sub_Process、Procedure等 3. 支持工作流定时调度、依赖调度、手动调度、手动暂停/停止/恢复,同时支持失败重试/告警、从指定节点恢复失败、Kill任务等操作 4. 支持工作流优先级、任务优先级及任务的故障转移及任务超时告警/失败 5. 支持工作流全局参数及节点自定义参数设置 6. 支持资源文件的在线上传/下载,管理等,支持在线文件创建、编辑 7. 支持任务日志在线查看及滚动、在线下载日志等 8. 实现集群HA,通过Zookeeper实现Master集群和Worker集群去中心化 9. 支持对Master/Worker cpu load,memory,cpu在线查看 10. 支持工作流运行历史树形/甘特图展示、支持任务状态统计、流程状态统计 11. 支持补数 12. 支持多租户 13. 支持国际化
展开查看详情

1.-

2. a l p ) o 9 9 + (

3.) (

4.• pHik A do a rv x un z un a fb L J a w r i l

5.

6./ 01 04 02 05 03

7.

8.• • • • • • • DAG

9.Ø 0 TS 1 l Ø / L Ø R i K1M G k K Ø R i 1 QDa Q D a Ø G M Ø e Ø a Lr p Ø h a s Ø e A

10.

11.

12.

13.

14.

15.

16. 2 • 2 2 2 • • • S • 2 • S 2 • 2 1 2 2

17.• B B A C A B A C • B C A A A A C

18. 5 • 1 T e • e c 1 5 3 4 4 d ) ( A 2 ba

19. CU ag • ( ( IF EW i T • LU S R •e eA d U A • Pb d U ag • • )

20. / • •

21.•

22.•

23. G D • GA , > G • G D

24.• M C M • • •

25.

26.• • • > 5

27.Ø

28.Ø Ø Ø Ø Ø

29. 1.0.1 1.0.2 1.0.3 2 1.0.1 1.0.2 1.0.3 2017.12 2019.02 2019.05 2018.05 2019.03 2019.07 1.1.0 3 30 – hadoop 1.0.0 Kerberos