Linux运维常见故障排查和处理的技巧汇总
作为Linux运维,工作中多多少少会遇见这样那样的问题或故障, 从中总结经验,查找问题,汇总并分析故障的原因,这是一个Linux运维工程师良好的习惯。 每一次技术的突破,都经历着苦闷,伴随着快乐,可我们还是执着的继续努力,从中也积累了更多的经验。 下面汇总了可能出现的故障及解决方法,看看你是否遇到过?并对你有帮助? 第一: 常见问题解决集锦 1.shell脚本不执行 问题: 某天研发同事找我说帮他看看他写的shell脚本,死活不执行,报错。我看了下,脚本很简单,也没有常规性的错误,报“:badinterpreter:Nosuchfileordirectory”错。 看这错,我就问他是不是在windows下编写的脚本,然后在上传到linux服务器的……果然。 原因: 在DOS/windows里,文本文件的换行符为rn,而在*nix系统里则为n,所以DOS/Windows里编辑过的文本文件到了*nix里,每一行都多了个^M。 解决: 1)重新在linux下编写脚本; 2)vi:%s/r//g:%s/^M//g(^M输入用Ctrl+v,Ctrl+m) 附:sh-x脚本文件名,可以单步执行并回显结果,有助于排查复杂脚本问题。 2.crontab输出结果控制 问题: /var/spool/clientmqueue目录占用空间超过100G 原因: cron中执行的程序有输出内容