redhat集群排错思路,转自chinaunix

a. 仔细调查/记录用作节点的服务器和用作集群存储的共享阵列的硬件型号,系统BIOS, HBA卡类型,HBA卡firmware版本, Linux的发行类型,版本,kernel的版本,kernel 的patch版本(errata或者service pack的版本). 磁盘阵列柜的类型,连接方式,上面的控制器的firmware版本,数量,冗余方式。 服务器和存储之间连接的类型,数量,通路上的额外冗余要求.

b. 按照从a得到的信息,到硬件厂商的站点上,核对和下载最新的BIOS, firmware, OS driver和Release Notes, 并且核对 厂商公布的支持的Linux的具体版本,kernel 版本等操作系统认证支持细则

c. 仔细阅读你要安装的集群软件的 Installation/Admin guide 和当前版本的Release Notes中关于 硬件/软件需求的章节, 建议仔细的阅读几遍,这里包含有事关你以后安装是否顺利和成功的关键信息.

d. 核对从c获得的信息和你的实际情况之间的差异,确认无误后往下走.

e. 仔细阅读installation/admin guide中的安装步骤,建议动手前至少阅读2边,了解清楚安装的几个大步骤.

f. 开始安装并注意保留屏幕上和系统日志中的出现的异常信息.

g.在提问的时候,把a和b步骤中了解的信息,清楚地贴在你的问题最前面. 然后把你在步骤f中保留得异常信息贴在其次, 最后清楚地简洁的描述你的问题.


http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=704325

你可能感兴趣的:(服务器,service,控制器,admin,firmware)