破解云原生应用的可观测性 刘征 PHPCON2019

在云计算环境中,微服务和容器等技术已经将应用系统运行态的复杂度再次提高,可观测性逐渐成为软件工程师们不可回避 的问题。日志、指标和APM就是可观测性所谓的一体三面,需要先将以上三个方面都整合在统一的数据后台里,才可以进行 有效的搜索、关联、索引和分析,同时还需要运用机器学习的辅佐来降低人工系统排错分析的难度和成本。本演讲还将通过 Elastic Stack技术栈来展示对可观测性的应对之道和效果。

演讲大纲:

1、云技术对传统应用开发和运维管理的冲击
2、仅针对日志、指标或APM的分析和管理所存在的挑战
3、详解基于统一集中的数据后台做查询、聚合和分析的重要性和技术难点
4、分析和展示Elastic Stack是如何应对以上挑战和难点

展开查看详情

1.2019-8, , elastic, @martinliu

2.PHPCon PPT https://github.com/ThinkDevelopers/PHPConChina PPT PHPCon

3. elastic • DevOps • DevOps Handbook • The Reliability Workbook https://martinliu.cn 2

4. 1 2 3 4 5 Q&A 3

5.• • • DevOps • • Kubernetes • • • IaaS PaaS CaaS •

6. Monolith at scale • • • • • • • 5

7. Micro service at Scale Wheel of Doom This diagram, taken from late 2014, illustrates the interactions between services running on Hailo’s platform. 6

8. vs. / Docker 7

9.Rethink Service Monitoring

10. 1 2 3 4 5 Q&A 9

11.10

12.11

13.12

14. Baron SchSchwarz CTO of VividCortex 13

15. Alerting Overview Monitoring Ops Debugging Observability Dev Profilling dependency 14

16. Log Metric Tracing 15

17. 1 2 3 4 5 Q&A 16

18. 0 1 2 3 17

19. Level 0 : 18

20.Level 0 : • • ip/ • • • / etcd Zk • • • •

21. Level 0 20

22. Elastic Heartbeat Level 0 1 Heatbeat 2 3 4 21

23.Elastic Heartbeat Level 0 : • • • DDos

24. KPI Level 1 07/Jan/2019 16:10:00 all 2.58 0.00 0.70 1.12 0.05 95.55 server1 containerX regionA 07/Jan/2019 16:20:00 all 2.56 0.00 0.69 1.05 0.04 95.66 server2 containerY regionB 07/Jan/2019 16:30:00 all 2.64 0.00 0.65 1.15 0.05 95.50 server2 containerZ regionC 10 CPU load 23

25. / Level 1 1 2 3 • CPU • • • • • • • • 24

26. Level 1 / / /metrics Agent /Infra /metrics Agent /vm /metrics 25

27. Level 1 / / /metrics /Infra /metrics /vm /metrics 26

28. Level 1 CustomerID 27

29. Elastic Level 1 / Beat Logstash /Infra Beat Kibana /vm Beat Elasticsearch + Beat 28