AIops相关算法
文章目录 根因分析 清华FOCUS:找影响系统性能瓶颈的原因 MSRA iDice:多维指标突变定位 清华Hotspot:多维根因定位 智能变更 清华FUNNEL:评估变更影响 异常检测 雅虎EGADS:KPI异常检测框架 清华Opprentice:KPI自动化异常检测 清华DeepLog: 日志异常检测 清华StepWise:指标模式漂移后的准确异常检测 故障预测 IBM: 磁盘故障预测 聚类 微软Yading:时序数据聚类算法 微软LogCluster:日志聚类 清华FT-Tree:提取日志模板 清华ROCKA:KPI聚类 最近要面阿里云的弹性计算部门,貌似会用到AIops,所以复习和学习一下之前实习公司的一些成果,本文基本都来自于公众号《智能运维前沿》,公众号由清华netman实验室和必示科技维护。 根因分析 清华FOCUS:找影响系统性能瓶颈的原因 focus 瓶颈:30%的用户的搜索响应时间大于1秒钟 单维分析的局限性:只简单的分析单维数据很难发现系统真正的性能瓶颈 多维分析:第二列表示该条件下的 高响应延迟(HSRT)占总的高响应延迟(HSRT)的比例,可以看出页面所含的图片数量是主要的性能瓶颈 FOCUS: 首先FOCUS使用系统每天产生的日志数据来训练决策树,从决策树中可以分析得到引发高搜索响应时间(HSRT)的条件,由于每天的数据会训练出一棵决策树