故障排查思路

1.重视报错提示信息 2.查阅日志文件 3.分析定位原因 4.解决问题

 、

 1.文件系统破坏:系统自动进入单用户模式,umount分区,fsck.ext3 -y /dev/sda4 无法恢复的文件放在lost+found文件里

  

 2./etc/fstab丢失无法启动:现象starting system logger然后停止,用系统光盘光驱启动,boot后输入linux rescue。修复模式会把所有分区挂在到/mnt/sysimage目录,选择continue读写方式进入,创建一个挂载点挂载根分区,创建fstab文件全部挂载

4.网络故障:硬件、联机、dns、服务开启、iptables、selinux

su不能切换 1.用户目录oracle权限2.su执行权限3.程序依赖共享库  4.selinux5.根分区问题(要有执行权限)

7.Read-only file system遇到严重错误会自动设置为只读,先umount,然后修复

5.空间不足,先检查tmp,然后根分区,然后一个个目录。    有可能是iNode不足

     inode:文件由数据块和元数据组成,数据块又连续扇区组成通常8个sector=一个块,元数据记录文件信息。操作系统把硬盘分为两个区。dumpe2fs -h /dev/sda   查看总数  

删除之后仍然满,需要在线清空 echo “ ”>/tmp/access_log

6.too many open file,设置/etc/security/limits.conf       ulimit -u  65535

 用户  soft/hard   nofile/cpu/stack  值

8.no space left on device:先查磁盘,然后查inode,再查信号量  ipcrm清除  apache用system v

(控制临界资源两种标准posix和system v),system v通过系统调用semget实现,ipcs可显示信号量及共享内存

posix用于线程和进程之间通信,分为有名和无名,有名保存在/dev/shm上可用于不相关的进程通信,无名只能用于线程和父子进程通信

9.apache20014错误:http.pid文件只有一行记录进程pid。启动时自动创建,关闭时自动删除,文件存在但是为空提示20014。    echo“28976” >>/usr/local/apache2/logs/httpd.pid  或者删除,再重启

10.could not bind to address:更改端口,因为普通用户无权绑定80端口,或者给httpd加suid


你可能感兴趣的:(故障排查思路)