- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 文档嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
IT数字化转型-打造可衡量的高可用及数字化运维
展开查看详情
1 .IT数字化转型 – 打造可衡量的高可用及数字化运维 杨跃山 阿里巴巴高级技术专家
2 . 稳定的应用是IT的基本责任 明明很努力 为什么没有好的结果 根据墨菲定律:系统是一定 会出故障的 部署、兼容、升级、集群、高可用、热备、多活,都搞过没有?花了多少精力和成本?
3 .而这是云的最基本要求,云产品,您搭配好了吗? 这么好,成本会不不会很⾼高?
4 . 轻量级应用上云解决方案 普惠中⼩小企业,低成本上云⽅方案 ⽤用户 SLB 高可用、弹性伸缩 负载均衡 ARMS 应⽤用实时监控 EDAS EDAS 高可用、弹性伸缩 应⽤用服务器器 应⽤用服务器器 端到端的监控 RDS 高可用、主备自动切换 数据库
5 . 轻量级应用上云解决方案(关键应用) ⽤用户 云盾 SLB 负载均衡 ARMS EDAS EDAS 应⽤用实时监控 AHAS 应⽤用服务器器 应⽤用服务器器 应⽤用⾼高可⽤用服务 Redis MQ 缓存 OSS 消息队列列 ⾮非结构数据存储 RDS 数据库
6 . Aliware –企业级分布式应用服务EDAS Serveless版 简化用户流程,免运维IaaS,节省等待时间 节省资源闲置成本 使⽤用前的⽤用户使⽤用成本: 创建ECS 创建应⽤用(镜像、应⽤用) = EDAS平台服务费+购买的ECS费⽤用 安装Agent 2Core4G (其中购买的ECS存在闲置的可能性,但⽤用户需为此买单) 实例例数1-10 指定实例例规格及实例例数 伸缩规则 创建集群 范围 (ECS/K8S) 使⽤用后的⽤用户成本: 根据⽤用户的请 = 应⽤用实际消耗资源费⽤用 创建应⽤用 ⾃自动创建实例例并启动 求情况伸缩实 ( 价格低于ECS,真正赋能中⼩小企业) 例例数 配置弹性伸缩 启动 应⽤用服务器器,帮助客户应⽤用快速上云,⽆无需改造,直接部署。
7 . Aliware –EDAS Serveless版价值 目前开放公测,预计2019-2商业化 ⽀支持开 ⾼高效 极致 精益 源微服 运维 性能 成本 务框架 ⽆无需关注集群与服务器器 ⾼高性能裸⾦金金属服务器器, 按需使⽤用,极速扩缩 ⽀支持Spring Cloud、Dubbo开发模式 计算性能⼤大幅提升 提升资源使⽤用率 以War、Jar包或镜像⽅方式部署应⽤用 无需客户改造应用,实现直接上云!支持原生SpringCloud和Dubbo!
8 .Aliware –EDAS Serveless版演示
9 .Aliware –EDAS Serveless版演示
10 .Aliware –EDAS Serveless版演示
11 .Aliware –EDAS Serveless版演示
12 . Aliware –EDAS 开发者体验 C l o u d To o l k i t / 云 效 / I D E P l u g - i n 一 键 部 署 应 用 到 E D A S - 帮助开发者打通本 地环境和云VPC 环境 - 本地开发调试后, 快速部署应用到 EDAS
13 . Aliware –EDAS 企业版 云原⽣生⽀支持 ⾃自动化、规模化部署 弹性伸缩 限流降级 ⽩白屏监控、⾃自动报警与⽇日志 应用拓扑 数 环境隔离 系 数据库诊断 应 服务地图 微 据 统 用 服 链路跟踪 应用开关 RPC 诊断 服务鉴权 化 高 诊 务 应用监控 运 限流降级 可 Java 运行时诊断 断 服务治理 基础监控 营 容量规划 用 容器诊断 开源关键支持 应用 PaaS 基础 优雅上下线 分批发布 日志管理 容器服务 权限服务 发布可视化 Beta 发布 报警通知 资源管理 应用管理 账号管理 应用发布 灰度发布 弹性伸缩 Docker 容器服务
14 . Aliware –应用实时监控服务ARMS 数据端 场景 示例 页面数据上报 前端监控 页面一键埋点 • 实时感知用户实际访问网站的响应时间,页面异 常,和API错误率。 • 基于地区,运营商,浏览器等多维的用户体验分析 应用数据上报 应用监控 应用无侵入埋点 • 针对微服务的分布式链路分析。 • 基于应用本身的资源使用,堆栈分析,异常捕获,以 及内存快照监控和诊断。 • 针对第三方调用监控如DB, MQ, 缓存等的调用分析。 • 将业务日志和调用关联的全息排查。 日志抓取 业务日志 自定义监控 • 基于异构数据源抓取,实时计算和时序数据库的业 务大盘快速定制功能。 数据流对接 • 业务场景覆盖:零售,交通,物流等多个行业。 实时流/消息
15 . Aliware –应用实时监控服务ARMS 阿里云官方 APM 产品,完整覆盖 应用服务端 和 浏览器终端 监控领域 0 100% 10% 零成本集成方式 支持百分百链路采样 价格为同类竞品1/10不到 • 基于Java字节码增强技术的应用监 • 应用和前端监控支持100%的链路调 • 支持按量付费,应用监控按 控监控方案,无需人工改造. 用采样,采样信息包括分布式链路, Agent*Hour收费,前端监控按数 • 基于静默上报技术的前端监控,最 本地调用堆栈和页面调用详情。 据上报收费,价格为业界均价 大限度降低人工改造. • 结合内置JVM和PaaS监控功能,故 1/10,显著降低TCO。 • 通过人工授权方式和阿里云 障根因一览无遗. • 可结合资源包,费用还可再节省高 PaaS(如EDAS)一键集成,集成 • 采样可根据应用性能动态调整,秒级 达60%。 方式简洁而安全。 生效。
16 . Aliware –应用实时监控服务ARMS 慢会话追踪 终端分布 追踪到每⼀一个慢会话 地理分布 地理理维度展示性能分布 性能样本分布 地理理维度展示性能分布 从平均测速到⻓长尾慢速⽤用户 ⻚页⾯面加载瀑布图 追踪 关键性能指标 从技术的视⻆角出发,挖掘出 从业务视⻆角出发,统计对业 是哪个环节导致性能慢 务影响最⼤大的性能指标
17 .Aliware –应用实时监控服务ARMS
18 .Aliware –应用实时监控服务ARMS
19 .三维⽴立体架构 颠覆传统监控的体验
20 . 传统运维领域,我们最熟悉的界⾯面就是这三种 表格 表单 仪表盘dashboard 扁平,抽象 层级深,跳转多 信息有限
21 .从系统架构的⽴立体性中,推导全新的监控展示⽅方式 服务 应⽤用 主机
22 . 在⼀一个⽴立体空间中实现架构的真实展示与云上资产的可视化 服务 服务的调⽤用次数 错误率 调⽤用时⻓长 应⽤用 应⽤用间调⽤用关系 中间件调⽤用量量 主机 负载 健康状况 集群
23 . 三维⽴立体架构 新功能发布 3D ARMS应⽤用全栈监控
24 .
25 .事件模式:监与控⼀一体化
26 . Aliware –分布式消息 MQ 分布式消息 NOTIFY/METAQ APP 分布式最终⼀一致性 MQTT Client SMS 通信网络 手机 应⽤用解耦 Gateway 云 异步 负 MQTT Broker Internet 云 Gateway MQTT Client 载 并⾏行行 盾 Topic APNS iOS 终端 均 发布订阅 Gateway Internet 衡 数据 APP Internet HTTP Gateway Email 电子邮箱 METAQ每天投递2800亿+消息 Gateway Internet METAQ每天接收1000亿+消息 WEB NOTIFY每天投递200亿+消息 物联网云应用 阿里云云服务 NOTIFY每天接收70亿+消息
27 .高级特性 – 消息轨迹
28 . Aliware – 云测试服务PTS 为什么要做全链路压测 双11 所有系统都流量大,系统之间相互影响 单个系统没办法都一一准备到位(漏网之鱼) 部分问题只有在真正大流量下才会暴露(比如 网络带宽等等) 教训:单个系统ready不代表全局ready
29 . Aliware – 性能测试服务PTS 需要做压测的场景 新系统上线,准确探知站点能力, 新系统上线 防止一上线就被用户流量打垮 类似阿里双11的峰值业务稳定 峰值业务稳定性 性考验,保障峰值业务不受损 成本优化,对多个关联应用进行精细化的容量 站点容量规划 规划 探测站点的性能瓶颈,提升站 性能瓶颈探测 点的整体服务能力和吞吐量