Linux系统之运行状态分析及问题排查思路
〇、一件事儿 以下分析是站在Java工程师的角度来分析的。 <a name="anchor_cpu"></a> 一、CPU分析 分析CPU的繁忙程度,两个指标:系统负载和CPU利用率 1、系统负载分析 系统负载 :在Linux系统中表示,一段时间内 正在执行 进程数和CPU 运行队列中就绪等待 进程数,以及非常重要的 休眠但不可中断 的进程数的平均值(具体load值的计算方式,有兴趣可以自行深究,这里不深究)。<font style="color:red;">说白了就是,系统负载与R( Linux系统之进程状态 )和D( Linux系统之进程状态 )状态的进程有关,这两个状态的进程越多,负载越高。</font> 查看系统负载,见 top命令 :第1部分。 怎么看load average的值? 通常先看15分钟的load值,如果load很高,再看1分钟和5分钟的load值,查看是否有下降趋势。短时间内load值高,无须太担心;但是如果长时间内load值持续过高,那么就要赶紧看看发生了什么。 需要警惕的load average的值(以单核CPU为例): load值持续大于0.7 ,必须开始找问题出在哪里,防止情况恶化; load值持续大于1.0 ,解决问题已迫在眉睫; load值持续大升高达到5.0 ,表示各种请求几乎得不到响应,机器几近崩溃; <font style="color