前事不忘,后事之师,要多总结,多归纳,不要两次都摔倒在同一个坑内。51CTO将是我总结提高的助推器。

 

以下案例为我在刚完工的一个项目中遇到的问题,现在看起来挺容易,当时可是处理了不短时间。

 

现场环境:

VCS双机安装suse9sp3 32位系统,光纤卡为Emulex型号为lpe11002,通过双机多路径组网方式下挂HP EVA4400磁盘阵列。组网如下:

 

实录:安装HP多路径识别EVA4400阵列出错处理_第1张图片 

问题描述:

两台suse服务器连接光纤后都可正确识别到外挂存储,但使用fdisk -l 查看那可以看到有4条冗余路径。按照版本配套要求,需从HP网站下载相应多路径软件hp-lpfc-2008-12-09.tar进行驱动软件升级。多路径软件安装完成后重启操作系统报错,无法正常进入系统,报错如下:

No root device found:exiting to /bin/sh

Sh:can’t access tty; job control turned off

$ lpfcmpl:Dev:1:0:1 Path:1:0:1 Heart beat failure exceeded max retry :20

lpfcmpl:Dev:1:1:1 Path:1:1:1 Heart beat failure exceeded max retry :20

界面显示:

实录:安装HP多路径识别EVA4400阵列出错处理_第2张图片

问题处理:

1,  按照版本配套要求SLES9 SP3 32+ 8.06.40 _p2 版本Emulex驱动+HP EVA4400阵列如不符合则进行相关系统升级。检查当前系统,已升级为了 8.06.40 _p2 版本,并且使用hp_rescan –a 命令可以看到多路径也已经生效;

2,  因为安装多路径软件后修改了/etc/init.d/boot.local文件,怀疑是里面修改后有乱字符。将此备份文件恢复,恢复后同样无法进入系统;

3,但发现一个现象:只要将光纤拔掉,系统就可以正常启动。说明可能是外接存储的识别顺序优先于本地硬盘,导致本地硬盘变成非sda标识导致系统无法启动;

   但拔掉光纤重启后又无法重新识别外置存储,重新加载lpfc模块仍无法识别存储;

4, 检查多路径软件安装过程,发现多路径安装时对系统硬盘启动顺序进行了修改,该配置文件为/etc/sysconfig/kernel。
原来为"mptsas reiserfs lpfc",表示从本地硬盘启动。多路径安装后修改为了"lpfc reiserfs mptsas lpfc” 这样导致系统启动时默认以lpfc对应的HPEVA4400磁盘阵列为第一启动顺序,而阵列中并没有相应的操作系统导致启动失败。
5, 编辑配置文件/etc/sysconfig/kernel,将
原配置
INITRD_MODULES="lpfc reiserfs mptsas lpfc"
修改为:
INITRD_MODULES="mptsas reiserfs lpfc"
6,然后重新编译内核
Ls –l /boot
/sbin/mk_initrd –k -I
再次重启后系统可以正常登陆。
 

总结:

善于在对比中发现问题所在,善于在日志中寻找蛛丝马迹。此次就是在多路径安装日志中找到的问题。