运维自动化,互金灾备建设的助推器

好买财富系统运维部副总监岑崟分享《运维自动化,互金灾备建设的助推器》

展开查看详情

1.运维自动化,互金灾备建设的助推器 演讲人:岑崟 2019 中国数据智能管理峰会

2.自我介绍 岑崟 2015年加入好买财富(834418) 系统运维部副总监 负责应用运维与 运维平台研发及运营 从传统运维到DevOps 2019 中国数据智能管理峰会

3.理想很丰满,现实很骨感 网络互联 数据同步 2019 中国数据智能管理峰会

4. 业务持续性管理6R模型 响应Respond (几分钟到几小时) 重建Restore 返回Return (几星期至几个月) 恢复Recover 减少Reduce 重启Resume (零中断) (几小时至几天) 2019 中国数据智能管理峰会

5.灾备建设的思考逻辑 RTO RPO 时间 资源 2019 中国数据智能管理峰会

6.我是一个痛点:原样拷贝 2019 中国数据智能管理峰会

7.以本地应急资源建设为优先 核心网络冗余 应用高可用 数据库高可用 硬件冗余 2019 中国数据智能管理峰会

8.我们的经历:应对局部故障 多虚拟化池 去软件单点 多点接入 2019 中国数据智能管理峰会

9.我是一个痛点:备机房的可用性 你的主机房 你的灾备机房 2019 中国数据智能管理峰会

10.应用双活 业务双活太难 先来应用双活 10% 90% 混合云 读写 2019 中国数据智能管理峰会

11.我们的经历:内部灰度 办公流量劫持 真实流量 生产环境 灾备环境 ◼ 数据库 共享的基础服务 ◼ 中间件 ◼ 存储 2019 中国数据智能管理峰会

12.我是一个痛点:度量 随便报个数据,老板要,没啥用… ◼ 数据生产者不关心数据 的价值,也不关心数据 准确与否 没有数据,我咋知道能不能在切换成功 ◼ 数据生产者关心是否会 对自己带来惩罚或者受 益 写进KPI,演练后根据数据进行考核 2019 中国数据智能管理峰会

13.度量的意义 P D 改进 ◼ 现状如何 ◼ 与目标的GAP A C 2019 中国数据智能管理峰会

14.度量需要循序渐进 度量是有成本的 不要让度量成 保证有效和可靠 为团队的负担 手工 探针 KPI OKR 2019 中国数据智能管理峰会

15.我们的经历:目标为导向 每月Review,评估KR对目标的影响 2019 中国数据智能管理峰会

16.我是一个痛点:年年干 一年干一次 一次干一年 2019 中国数据智能管理峰会

17.灾备建设也可以慢慢演进 从数据和核心系统开始 2019 中国数据智能管理峰会

18.我们的经历:四年三代 交易核 主备机 灾备机房 心重建 房切换 承担流量 2016 2017 2019 制品库 配置版本化 资源数据闭环 发布工具化 部署工具化 发布流水化 2019 中国数据智能管理峰会

19.我们的经历:杜绝产线直接变更 产线变更零SSH 不可变基础设施 配置模板化 由Chad Fowler于2013年提出 基于虚拟化技术 2019 中国数据智能管理峰会

20.我们的思考和尝试:容器化 交易前中台所有测试项目 运维自研项目 测试环境 2019 中国数据智能管理峰会

21.未来的灾备建设:容器能带来什么? ◼ 更快速的环境重建 ◼ 更高效的资源使用 ◼ 更标准的环境管理 ◼ 更便捷的安装部署 2019 中国数据智能管理峰会

22. THANK YOU! 2019 中国数据智能管理峰会