IT数字化转型-打造可衡量的高可用及数字化运维

本次分享IT数字化转型-打造可衡量的高可用及数字化运维
展开查看详情

1.IT数字化转型 – 打造可衡量的高可用及数字化运维 杨跃山 阿里巴巴高级技术专家

2. 稳定的应用是IT的基本责任 明明很努力 为什么没有好的结果 根据墨菲定律:系统是一定 会出故障的 部署、兼容、升级、集群、高可用、热备、多活,都搞过没有?花了多少精力和成本?

3.而这是云的最基本要求,云产品,您搭配好了吗? 这么好,成本会不不会很⾼高?

4. 轻量级应用上云解决方案 普惠中⼩小企业,低成本上云⽅方案 ⽤用户 SLB 高可用、弹性伸缩 负载均衡 ARMS 应⽤用实时监控 EDAS EDAS 高可用、弹性伸缩 应⽤用服务器器 应⽤用服务器器 端到端的监控 RDS 高可用、主备自动切换 数据库

5. 轻量级应用上云解决方案(关键应用) ⽤用户 云盾 SLB 负载均衡 ARMS EDAS EDAS 应⽤用实时监控 AHAS 应⽤用服务器器 应⽤用服务器器 应⽤用⾼高可⽤用服务 Redis MQ 缓存 OSS 消息队列列 ⾮非结构数据存储 RDS 数据库

6. Aliware –企业级分布式应用服务EDAS Serveless版 简化用户流程,免运维IaaS,节省等待时间 节省资源闲置成本 使⽤用前的⽤用户使⽤用成本: 创建ECS 创建应⽤用(镜像、应⽤用) = EDAS平台服务费+购买的ECS费⽤用 安装Agent 2Core4G (其中购买的ECS存在闲置的可能性,但⽤用户需为此买单) 实例例数1-10 指定实例例规格及实例例数 伸缩规则 创建集群 范围 (ECS/K8S) 使⽤用后的⽤用户成本: 根据⽤用户的请 = 应⽤用实际消耗资源费⽤用 创建应⽤用 ⾃自动创建实例例并启动 求情况伸缩实 ( 价格低于ECS,真正赋能中⼩小企业) 例例数 配置弹性伸缩 启动 应⽤用服务器器,帮助客户应⽤用快速上云,⽆无需改造,直接部署。

7. Aliware –EDAS Serveless版价值 目前开放公测,预计2019-2商业化 ⽀支持开 ⾼高效 极致 精益 源微服 运维 性能 成本 务框架 ⽆无需关注集群与服务器器 ⾼高性能裸⾦金金属服务器器, 按需使⽤用,极速扩缩 ⽀支持Spring Cloud、Dubbo开发模式 计算性能⼤大幅提升 提升资源使⽤用率 以War、Jar包或镜像⽅方式部署应⽤用 无需客户改造应用,实现直接上云!支持原生SpringCloud和Dubbo!

8.Aliware –EDAS Serveless版演示

9.Aliware –EDAS Serveless版演示

10.Aliware –EDAS Serveless版演示

11.Aliware –EDAS Serveless版演示

12. Aliware –EDAS 开发者体验 C l o u d To o l k i t / 云 效 / I D E P l u g - i n 一 键 部 署 应 用 到 E D A S -  帮助开发者打通本 地环境和云VPC 环境 -  本地开发调试后, 快速部署应用到 EDAS

13. Aliware –EDAS 企业版 云原⽣生⽀支持 ⾃自动化、规模化部署 弹性伸缩 限流降级 ⽩白屏监控、⾃自动报警与⽇日志 应用拓扑 数 环境隔离 系 数据库诊断 应 服务地图 微 据 统 用 服 链路跟踪 应用开关 RPC 诊断 服务鉴权 化 高 诊 务 应用监控 运 限流降级 可 Java 运行时诊断 断 服务治理 基础监控 营 容量规划 用 容器诊断 开源关键支持 应用 PaaS 基础 优雅上下线 分批发布 日志管理 容器服务 权限服务 发布可视化 Beta 发布 报警通知 资源管理 应用管理 账号管理 应用发布 灰度发布 弹性伸缩 Docker 容器服务

14. Aliware –应用实时监控服务ARMS 数据端 场景 示例 页面数据上报 前端监控 页面一键埋点 •  实时感知用户实际访问网站的响应时间,页面异 常,和API错误率。 •  基于地区,运营商,浏览器等多维的用户体验分析 应用数据上报 应用监控 应用无侵入埋点 •  针对微服务的分布式链路分析。 •  基于应用本身的资源使用,堆栈分析,异常捕获,以 及内存快照监控和诊断。 •  针对第三方调用监控如DB, MQ, 缓存等的调用分析。 •  将业务日志和调用关联的全息排查。 日志抓取 业务日志 自定义监控 •  基于异构数据源抓取,实时计算和时序数据库的业 务大盘快速定制功能。 数据流对接 •  业务场景覆盖:零售,交通,物流等多个行业。 实时流/消息

15. Aliware –应用实时监控服务ARMS 阿里云官方 APM 产品,完整覆盖 应用服务端 和 浏览器终端 监控领域 0 100% 10% 零成本集成方式 支持百分百链路采样 价格为同类竞品1/10不到 •  基于Java字节码增强技术的应用监 •  应用和前端监控支持100%的链路调 •  支持按量付费,应用监控按 控监控方案,无需人工改造. 用采样,采样信息包括分布式链路, Agent*Hour收费,前端监控按数 •  基于静默上报技术的前端监控,最 本地调用堆栈和页面调用详情。 据上报收费,价格为业界均价 大限度降低人工改造. •  结合内置JVM和PaaS监控功能,故 1/10,显著降低TCO。 •  通过人工授权方式和阿里云 障根因一览无遗. •  可结合资源包,费用还可再节省高 PaaS(如EDAS)一键集成,集成 •  采样可根据应用性能动态调整,秒级 达60%。 方式简洁而安全。 生效。

16. Aliware –应用实时监控服务ARMS 慢会话追踪 终端分布 追踪到每⼀一个慢会话 地理分布 地理理维度展示性能分布 性能样本分布 地理理维度展示性能分布 从平均测速到⻓长尾慢速⽤用户 ⻚页⾯面加载瀑布图 追踪 关键性能指标 从技术的视⻆角出发,挖掘出 从业务视⻆角出发,统计对业 是哪个环节导致性能慢 务影响最⼤大的性能指标

17.Aliware –应用实时监控服务ARMS

18.Aliware –应用实时监控服务ARMS

19.三维⽴立体架构 颠覆传统监控的体验

20. 传统运维领域,我们最熟悉的界⾯面就是这三种 表格 表单 仪表盘dashboard 扁平,抽象 层级深,跳转多 信息有限

21.从系统架构的⽴立体性中,推导全新的监控展示⽅方式 服务 应⽤用 主机

22. 在⼀一个⽴立体空间中实现架构的真实展示与云上资产的可视化 服务 服务的调⽤用次数 错误率 调⽤用时⻓长 应⽤用 应⽤用间调⽤用关系 中间件调⽤用量量 主机 负载 健康状况 集群

23. 三维⽴立体架构 新功能发布 3D ARMS应⽤用全栈监控

24.

25.事件模式:监与控⼀一体化

26. Aliware –分布式消息 MQ 分布式消息 NOTIFY/METAQ APP 分布式最终⼀一致性 MQTT Client SMS 通信网络 手机 应⽤用解耦 Gateway 云 异步 负 MQTT Broker Internet 云 Gateway MQTT Client 载 并⾏行行 盾 Topic APNS iOS 终端 均 发布订阅 Gateway Internet 衡 数据 APP Internet HTTP Gateway Email 电子邮箱 METAQ每天投递2800亿+消息 Gateway Internet METAQ每天接收1000亿+消息 WEB NOTIFY每天投递200亿+消息 物联网云应用 阿里云云服务 NOTIFY每天接收70亿+消息

27.高级特性 – 消息轨迹

28. Aliware – 云测试服务PTS 为什么要做全链路压测 双11 所有系统都流量大,系统之间相互影响 单个系统没办法都一一准备到位(漏网之鱼) 部分问题只有在真正大流量下才会暴露(比如 网络带宽等等) 教训:单个系统ready不代表全局ready

29. Aliware – 性能测试服务PTS 需要做压测的场景 新系统上线,准确探知站点能力, 新系统上线 防止一上线就被用户流量打垮 类似阿里双11的峰值业务稳定 峰值业务稳定性 性考验,保障峰值业务不受损 成本优化,对多个关联应用进行精细化的容量 站点容量规划 规划 探测站点的性能瓶颈,提升站 性能瓶颈探测 点的整体服务能力和吞吐量