linux运维故障案列,linux 运维故障排查思路

一、linux系统故障处理思路

1.重视报错信息,一般情况下此提示基本定位了问题的所在

2.查阅日志文件,系统日志和应用日志

3.分析、定位问题

4.动手解决

二、网络问题处理思路

1.网络硬件问题。网线、网卡、路由器、交换机等是否正常工作。

2.网卡驱动是否正常加载、网卡ip设置是否正确,系统路由是否正确。

3.检查局域网之间的通信是否正常。

4.检查dns是否设定正确。可从/etc/resolv.conf、/etc/host文件来确认。

5.服务是否打开。

6.访问权限是否打开。iptables、selinux

三、linux系统无响应

1.系统硬件问题

2.外围硬件问题,网络设备,网络参数方面查找解决。

3.软件问题,系统bug,软件bug,升级内核,修复程序bug,更新驱动等方面解决。

4.系统设置问题,参数设置不当。

四、Linux系统无法启动

常见系统故障,比如突然断电,配置更新,软件升级,内核升级等都有可能造成无法正常启动。常见的情况如:

1.文件系统破坏,一般是linux的根分区文件系统遭到破坏,一般由系统突然断点或者非法关机引起。

2.文件系统配置不当,比如/etc/fstab文件、/etc/inittab文件等配置文件错误或者丢失,一般是执行配置更新时人为导致的。

3.linux内核文件丢失或者崩溃。一般由内核升级错误或者内核存在bug引起。

4.系统引导程序问题。比如grub丢失或者损坏,一般由人为修改错误或者文件系统故障。

5.系统硬件故障。主板、电源、硬盘等出现问题。

你可能感兴趣的:(linux运维故障案列)