稳定性整理方法论总结

蹲街弑〆低调 提交于 2019-11-29 11:07:37

1,关键接口梳理

2,流量评估 (主要是大促活动期间比如双十一流量评估,如果只是日常发布,就评估日常流量以及高峰期峰值等)

3,数据量评估

4,上下游流量、数据信息同步(跨部门协同)

5,稳定性和整理降级预案

    a,  关键接口限流(防止DB压垮、以及下游被压垮)

    b,  关键接口SQL review,慢SQL治理(慢SQL特别容易造成雪崩,如果是特别核心的业务需要好好考虑降级预案 比如应急走缓存,至少业务不会跪,给线上排查问题留足时间)

    c, 日志检查降级(关键错误入参出参异常要详细、to C的接口以及一些流量大的接口一定不要乱打日志,这样磁盘很容易爆的)

    d, 监控告警配置(相关接口错误率监控、关键逻辑程序异常业务异常告警、接口各项指标大盘监控、DB监控 CPU、内存、SQL耗时、磁盘,系统服务器 内存、磁盘、CPU、网络等)

    e, 参考降级方向

            ① 系统降级

            ② 缓存降级

            ③ 业务降级

            ④ 分支业务降级

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!