腾讯 吴树生 - 《腾讯织云智能监控实践》_部分2

展开查看详情

1.智能监控案例

2.无阈值异常检测 阈值检测问题: 统计判别法 无监督算法 3sigma Isolation Forest 影响根源分析准确性 异 常 异 1.告警不准 常 故障自动发现率40% 漏告警或误告警 待定库 tsfresh 2. 维护困难 GBDT 业务和人员变更 告警配置未持续更新 人工判定 3. 告警量大 人均告警100条/天 样本库 个人最大告警量达1000条

3.ROOT-异常根源分析

4.异常根因分析 异常维 异常KPI 度组合 曲线 1.通用性,应用于成功率和累积量指标 2.准确率,增加总量权重和异常权重 3.性能,秒级在线分析