Centos 7 更新后不能进入登陆界面的问题排查

周末随手 yum update 了一下, 结果就悲剧了。重启后, plymouth 结束后的屏幕上只留下灰灰的背景和光标。由于这次更新包含内核更新,我尝试在 grub 界面上选择更新之前的内核版本启动,结果仍然不起作用。难道只能重装系统了?有些不甘心,选择 centos 做桌面就是看中其稳定性(当然不足之处就是软件版本比较旧),何况电脑上装了双系统,还有 window 10, 万不得已不想走这条路。于是搜索加折腾弄了大半天,万幸问题解决了。排查过程颇具有典型意义,因此做个记录。
首先,用 centos 的安装盘做引导加载文件系统,以下命令等同于 system V init 下修改 init level:

systemctl set-default multi-user.target

该命令效果等价于:

rm /etc/systemd/system/default.target
ln -s /usr/lib/systemd/system/multi-user.target /etc/systemd/system/default.target

重启后正常登陆系统 bash shell。看来问题不大只是图形界面有问题。这时输入命令:

systemctl show --no-pager -p "Wants" graphical.target

可以获得 level5 启动依赖的 daemon, 并不是很多,在我的电脑上返回如下:

Wants=systemd-readahead-replay.service systemd-update-utmp-runlevel.service rtkit-daemon.service network.service systemd-readahead-collect.service jexec.service gdm.service accounts-daemon.service

逐个启动以上 daemon 排查,有时候问题就可以定位到某个 daemon 上。但是我的所有 daemon 都可以启动,切换到图形界面仍然没有登陆界面(可以使用 alt + ctrl + F1, alt + ctrl + F2 在图形界面与 terminal 之间切换)。这时就要查看日志了,在使用 systemd 的系统上可以使用 journalctl 命令,常用命令如下:

journalctl -k # 显示 kernel 信息,这个就等于 dmesg 了
journalctl -u NetworkManager.service # 显示该 unit 的相关信息
journalctl _PID=1 # 显示 pid 等于 1 的进程相关信息

journald 包含了系统从 boot 到现在涵盖 kernel 和 unit 的所有日志信息,可以说是集 dmesg 和 syslog 之大成。其中的 error 会被红色高亮显示,不过有些 error 并不影响系统使用,比如自带的开源驱动在 A 卡下总有这么两条错误。最终问题定位到 gnome-shell, gnome-shell 的 main.js 竟然抛出了异常导致其退出,而且似乎是语法上的错误, gnome 的开发者应该不会犯如此低级的错误。众所周知近年来 js 语法更新得很快,会不会是 gnome-shell 的版本与 js runtime 的版本不匹配呢?gnome 使用的 js runtime 对应 gjs 包,使用命令:

yum history list
yum history package-list gjs
yum history package-list gnome-shell

发现 gjs 在最近的一次更新中确实更新了,但 gnome-shell 没有!!!这是怎么回事呢?这时博主才想起更新的时候有依赖包冲突,当时根据提示跳过了部分包:

yum update --skip-broken

这样问题最终被定位:由于没有完整更新造成程序运行错误。找到问题就好办了,只要解决依赖包冲突然后完整更新就可以了。再敲一次 yum 更新命令显示冲突包是 epel 库中的 webkitGtk,base 库中自己就有 webkitGtk4 所以放心大胆删了。然后 yum update 重启,系统总算又回来了。

排查过程中在 level3 与 level5 之间切换了好几次,查到可以在 grub 界面中切换。当 grub 选择操作系统界面出现后,按 e 出现编辑界面,移动到 linux16 开始的一行在最后添加 3,按 ctrl + x 启动。这样也不用每次修改 default.target 了,比较方便。

你可能感兴趣的:(Centos 7 更新后不能进入登陆界面的问题排查)