E87EF1BEThelargestdumpdeviceistoosmall
6D87B1C0Thedumpdevicecannotbeaccessed
为了增强故障分析能力,IBM的服务器增加了对设备故障当前环境的保存功能,就是保存一份设备故障时的内存、CPU寄存器、IO等设备的数据和状态信息,如果系统并没有停住,只是某个程序死掉,会产生COREDUMP,在当前目录下产生一个CORE文件。而如果操作系统死掉,则产生SystemDUMP或者SystemCrash,通常会引起系统停机。DUMP的记录如下图所示。
当系统进行DUMP时,DUMP管理设施自动将内核相关的数据(kernelsegment0及其他由内核或者内核扩展程序记录在主DUMP表中的内存块)复制到主DUMP设备。可以把DUMP理解为系统当时的一个快照,供以后分析
系统dump一般可以通过升级微码、提高系统补丁级别、升级驱动等方式解决。
参考http://www.myexception.cn/ai/439743.htmlAIX的Dump资料学习笔记(原创)
用sysdumpdev -l 查看一下系统dump的设置。AIX的dump一般会分为主dump设备和次dump设备,设备可自主定义到自建的LV,如果内存大于4GB,缺省的dump设备是/dev/lg_dumplv,该设备是专门为dump而设置的。
注:在AIX系统中的lg_dumplv逻辑卷是用于存放系统dump的区域。在安装系统时是否创建该逻辑卷与服务器的内存配置有关。若服务器的内存小于4GB时,那么在安装AIX5.2或5.3时,系统就不会自动创建它。而缺省将系统dump存放在hd6上。
当服务器的内存大于4GB时,在安装AIX时,就会为系统dump创建一专用区域,该逻辑卷名就是lg_dumplv.其缺省大小是按以下规则分配的:
.4GB<=服务器的内存〈12GBlg_dump的大小为1GB
.12GB<=服务器的内存〈24GBlg_dump的大小为2GB
.24GB<=服务器的内存〈48GBlg_dump的大小为3GB
.48GB<=服务器的内存lg_dump的大小为4GB
ERRPT:6D87B1C0Thedumpdevicecannotbeaccessed
#sysdumpdev-l
primary-
secondary/dev/sysdumpnull
copydirectory/var/adm/ras
forcedcopyflagTRUE
alwaysallowdumpTRUE
dumpcompressionON
typeofdumptraditional
可以看出是主转储设备未设置。解决方法:
1.smitlv:创建一个lg_dumplv,设备类型为sysdump,6个pps约3G
2.sysdumpdev-P-p/dev/lg_dumplv:设置主转储设备
3.#/usr/lib/ras/dumpcheck
4.#errpt,发现不再提示无法访问但提示太小。如下:
ERRPT:E87EF1BEThelargestdumpdeviceistoosmall
解决方法:
1.查看lg_dumplv大小的估计值
#sysdumpdev-e
0453-041Estimateddumpsizeinbytes:3687651328
即3.6G
2.现在lg_dumplv大小
#lslvlg_dumplv
其中PPSIZE:512megabyte(s)
PPs:6
经计算,现在容量为13G.需要扩容0.2G
3.查看lg_dumplv所在的vg的容量是否够用
#lsvgrootvg
其中PPSIZE:512megabyte(s)
TOTALPPs:1092(279552megabytes)
FREEPPs:413(211456megabytes)
经计算,vg剩余容量为206.5G,因为根盘做了镜像.故,可用剩余容量为103G左右.因ppsize为512m,故扩容2pps,即1G(其实扩1个pp也可以.2个放心点.)
4.扩容操作
extendlvlg_dumplv2
5.检查当前lg_dumplv的大小.
#lslvlg_dumplv
其中PPSIZE:512megabyte(s)
PPs:8
即,现在容量为4G.
6.使用dumpcheck命令查看,是否还出现errpt信息
#/usr/lib/ras/dumpcheck
#errpt
不出现,则为成功.
清空epprt信息命令为errclear0