1 IBM AIX系统管理日常工作
2 IBM AIX系统管理日常工作(检查篇)
2.1 1 常用的命令
|
CPU
|
Memory
|
Disk
|
Network
|
标准UNIX命令(包括HP、SUN等)
|
vmstat, sar, ps
|
vmstat, ps
|
iostat, sar, vmstat,
|
netstat, nfsstat
|
AIX
详细输出
|
tprof
|
svmon, rmss
|
filemon, fileplace
|
entstat
|
AIX
非常详细输出
|
syscalls, trace, emstat
|
trace
|
trace
|
trace, iptrace
|
分析工具
|
topas
|
topas
|
topas
|
topas
|
2
语法介绍
(1)vmstat:检查内存、CPU、进程状态等。
# vmstat 1 15
kthr memory page faults cpu
----- ----------- ------------------------ ------------ -----------
r b avm fre re pi po fr sr cy in sy cs us sy id wa
1 0 28132 81277 0 0 0 0 0 0 132 375 67 65 1 34 0
2 0 28132 81277 0 0 0 0 0 0 127 338 131 99 0 0 0
2 0 28132 81277 0 0 0 0 0 0 132 316 131 99 0 0 0
2 0 28132 81277 0 0 0 0 0 0 120 317 126 99 0 0 0
2 0 28132 81277 0 0 0 0 0 0 146 316 127 99 0 0 0
2 0 28132 81277 0 0 0 0 0 0 130 317 125 99 0 0 0
2 0 28132 81277 0 0 0 0 0 0 135 316 127 99 0 0 0
2 0 28132 81277 0 0 0 0 0 0 129 317 124 99 0 0 0
2 0 28132 81277 0 0 0 0 0 0 133 304 127 99 0 0 0
r
:正在运行的进程
b
:被阻挡的进程
avm
:活动的虚内存,单位4kb
fre
:自由列表,位4kb
po
:页换出
pi
:页换入
sy
:系统占用CPU
id
:空闲CPU
wa
:等待的CPU
(2)sar:检查CPU、IO
例如:
sar -u 1 30
sar -P ALL 1 10
语法:
sar -[abckmqruvwyA] inteval repetition
-b buffer
活动
-c
系统调用
-k
内核进程统计.
-m
消息及信号量活动
-q
正在运行的队列数及等待队列数
-r
页交换统计
-u CPU
利用
-P CPU
负载.
(3)PS:检查进程状态命令
ps
:
显示当前SHELL重所有进程
ps -ef
:
显示系统中所有进程,-f显示更详细信息
ps -u oracle
:
显示oracle用户进程
ps �CemoTHREAD
:
显示线程信息
ps au
;ps vg:
按使用时间显示进程(最近一次调用)
ps aux
:
按使用时间显示进程(进程启动)
(4)svmon:显示进程占用内存
svmon �CG
:
显示系统占用内存
svmon -C command_name
:
显示某个用户进程占用内存
svmon -P pid
显示某个进程占用内存
svmon �CS
:
显示段占用内存
(5)iostat:显示磁盘IO
tty: tin tout avg-cpu: % user % sys % idle % iowait
0.0 4.0 0.9 1.3 95.4 2.5
Disks: % tm_act Kbps tps Kb_read Kb_wrtn
hdisk0 58.4 218.3 41.2 172 920
hdisk1 16.8 85.6 21.4 428 0
hdisk2 50.6 223.9 55.6 1100 20
hdisk3 16.8 85.6 21.4 428 0
hdisk4 0.0 0.0 0.0 0 0
hdisk5 43.4 279.1 69.8 1396 0
hdisk6 0.0 0.0 0.0 0 0
hdisk7 16.4 27.2 20.2 0 136
hdisk8 0.0 0.0 0.0 0 0
hdisk9 9.4 156.0 11.4 0 780
hdisk10 16.4 27.2 20.2 0 136
cd0 0.0 0.0 0.0 0 0
(6)netstat, entstat:显示网卡信息
netstat en0
:
显示en0信息
netstat �Cs
:
显示网络信息
netstat -m
显示网络 buffers.
netstat -i
显示网卡状态
netstat -I en0 1
显示eno网卡塞(1秒间隔)
(6)no:显示tcpip参数设置
no �Ca
:
显示tcpip所有参数当前设置
no -o tcp_keepalivetime=7200000
设置tcp_keepalivetime等于3600000秒
no
-d 恢复默认值
注:该方法在重启后失效
(7)其它命令
检查文件系统
|
df -k
|
检查设备
|
lsdev -C
|
检查物理卷
|
lspv
|
检查交换区
|
lsps -a
|
检查配置
|
lscfg -vp
|
检查软件
|
lslpp -l
|
检查用户
|
who
|
3 IBM AIX系统管理日常工作(LV篇)
3.1 1 IBM AIX系统管理的日常工作
系统管理员对小型机系统的正确管理是系统稳定运行的保障,作为系统管理员应注意以下几个方面:
1. 开关机步骤
2. 用户组及用户管理
3. 文件系统维护
发现文件系统已满,应及时删除无用文件或扩大文件系统。
4. 系统日常管理
系统管理员最好用 smit来进行系 统管理。Smit是以菜单方式工作的工具包,它包括了日常管理工作的所有命令,操作简便。
5. 系统备份
备份是保护用户数据不丢失的重要手段。一般系统备份的要求如下:
A.
每一台机器的操作系统至少有一个全备份。
B.
每天备份用户数据。
C.
操作系统配置修改后重新备份操作系统。
6. 定时清洗磁带机
7. 定时检查设备指示灯状态
8. 简单故障的判断
9. 熟悉ibm aix操作系统
3.2 2 关于IBM AIX的逻辑卷管理
IBM AIX
存储管理的五个基本概念:
。物理卷Physical Volume,称为PV:指物理上硬盘,一个硬盘就是一个PV,名字为HDISK0、HDISK1。
。物理分区(Physical Partitions):物理卷被划分成大小一样的物理分区PPs
。逻辑卷组 Logical Volume Group,称为VG:一个VG包含整数个PV,可理解为一个大硬盘。
。逻辑卷 Logical Volume,称为LV:相当于对大硬盘进行逻辑分区, 一个VG里可有若干个LV,对用户讲,LV上的数据是连续的,但PV上的数据可能是分散的。
。逻辑分区(Logical Partitions):每个LV有若干逻辑分区(LPs)组成,每个逻辑分区至少有一个PV组成。
。文件系统 File System:在逻辑卷的基础上,可建立文件系统JFS,然后 MOUNT到一个目录下,这样就可以文件存取的方式来使用这块硬盘了。
当然,您也可以不建文件系统,而直接把LV当作裸设备,以TRUNK方式来存取数据,许多数据库都是用这种方式存取数据。
LVM
的关系如下图:
3.3 2.1 LVM命令
一般采用smit命令可对PV、VG、LV、JFS等进行图形化管理,命令如下:
smit lvm
屏幕显示如下:
Add a Logical Volume
Logical volume NAME [scratch]
* VOLUME GROUP name testvg
* Number of LOGICAL PARTITIONS [64] #
PHYSICAL VOLUME names [hdisk1 hdisk2 hdisk3] +
Logical volume TYPE [jfs]
POSITION on physical volume middle +
RANGE of physical volumes minimum +
MAXIMUM NUMBER of PHYSICAL VOLUMES [] #
to use for allocation
Number of COPIES of each logical 2 +
partition
Mirror Write Consistency? yes +
Allocate each logical partition copy yes +
on a SEPARATE physical volume?
RELOCATE the logical volume during yes +
reorganization?
Logical volume LABEL []
MAXIMUM NUMBER of LOGICAL PARTITIONS [512] #
Enable BAD BLOCK relocation? yes +
SCHEDULING POLICY for reading/writing parallel +
logical partition copies
Enable WRITE VERIFY? no +
File containing ALLOCATION MAP []
Stripe Size? [64K]
行命令:
.lsvg
:查看vg名字
查看vg详细信息: lsvg <vgname>
查看vg内的LVs: lsvg -l <vgname>
查看vg内的PV: lsvg -p <vgname>
查看激活的VG: lsvg �Co
.
lspv
:查看物理卷组pg名字
查看PV 详细信息: lspv hdiskN
查看PV内的LVs lspv -l hdiskN
查看PV内的PP : lspv -p hdiskN
.
lslv:
查看LV的信息
查看 LV 名字: lsvg -l <vgname>
查看LV 详细信息: lslv <lvname>
查看PV 内的LVs : lslv -l <lvname>
查看PV 内的 PP : lslv -p <pvname>
查看镜像的 LV: lslv -m <lvname>
4 IBM AIX(关键参数检查篇)
1.
AIO参数检查
# lsattr -El aio0
minservers X MINIMUM number of servers True
maxservers 80 MAXIMUM number of servers True
maxreqs 4096 Maximum number of REQUESTS True
kprocprio 39 Server PRIORITY True
autoconfig available STATE to be configured at system restart True
fastpath enable State of fast path True
- MaxServers = 10 * number of disks
- MinServers = MaxServers /2
其中MaxServers最大为80
可用命令#smitty aio
à
Change / Show Characteristics of Asynchronous I/O
修改相应的值。
2.
磁盘阵列queue_depth参数检查
假设DATAVG的RAID盘为hdisk2
# lsattr -El hdisk2
pvid 00019081a0dc91ea0000000000000000 Physical volume identifier Fal
queue_depth 8 Queue depth True
queue_depth值设置为7133硬盘个数
可用命令#chdev �Cl hdisk2 �Ca queue_depth=x修改,但VG必须为VARYOFF状态。
3.
用户参数检查
#smitty chlicense
修改Maximum number of FIXED licenses为10
#lsattr -El sys0|grep maxuproc
maxuproc
200
Maximum number of PROCESSES allowed per user True
用#smitty chgsys修改
利用lsattr -Elsys0 检查maxuproc, minpout, maxpout等参数的大小。maxuproc为每个用户的最大进程数,当应用涉及大量的顺序读写而影响前台程序响应时间时,可考虑将maxpout设为33, minpout设为16,利用smitty chgsys来设置。
4
.
激活
SSA Fast-Write Cache
利用smitty ssafastw来激活每一个逻辑盘hdiskn的Fast-Write Cache:选择硬盘后,把Enable Fast-Write一项改为Yes后回车即可。对于
OPS
必须关闭,对于
GAILOVER
或单机必须打开。
5
.IO参数设置
High water mark for pending write I/Os per file(maxpout) 和Low water mark for pending write I/Os per file
它们缺省值为0,在双机环境中一般应设High water mark为33,Low water mark为24,这两个参数可用smitty chgsys来设置。
6.
syncd daemon的数据刷新频率
1
该值表示刷新内存数据到硬盘的频率,缺省为60,一般可改为20,也可根据实际情况更改。该参数通过vi /sbin/rc.boot更改,其中一行如下:
nohup /usr/sbin/syncd 60 >/dev/null 2>&1 &
改为:
nohup /usr/sbin/syncd 20 >/dev/null 2>&1 &
7.
检查系统硬盘的镜像
#lsvg
�C
l rootvg
rootvg:
LV
NAME TYPE LPs
PPs PVs
LV STATE MOUNT POINT
hd5 boot 1 2 2 closed/syncd N/A
hd6 paging 48 96 2 open/syncd N/A
paging00 paging 32 64 2 open/syncd N/A
hd8 jfslog 1 2 2 open/syncd N/A
hd4 jfs 1 2 2 open/syncd /
hd2 jfs 32 64 2 open/syncd /usr
hd9var jfs 5 10 2 open/syncd /var
hd3 jfs 4 8 2 open/syncd /tmp
hd1 jfs 1 2 2 open/syncd /home
注意:PPs 为LPs的两倍,PVs为2
如果系统盘未镜像,而系统盘为18G盘,用命令镜像
# mirrorvg rootvg hdisk0 hdisk1
(对rootvg进行镜像)
# bosboot
�C
a
(在两块盘上重建bootimage)
# bootlist
�C
m normal hdisk0 hdisk1
(设置机器的启动顺序)
5IBM AIX性能分析
1
性能瓶颈定义
项目 检查命令 判断标准
CPU vmstat %user + %sys greater
大于 75%
Disk I/O vmstat %iowait
大于 30% (AIX 4.3.3 or later)
应用程序磁盘 %tm_act 大于 60%
交换区 lsps -a 大于60%
页交换数量 iostat vmsta 大于10×CPU数量
2
性能范围
好 坏 极差
CPU 60% 75% 90%+
Disk <30% <40% <50%+
Memory 0 10 pages/
秒CPU >50
6 IBM AIX系统管理日常工作(SHUTDOWN篇)
6.1 1 概念
IBM AIX
的启动分为多用户(normal)和单用户(service)模式,在正常情况下,一般选择多用户模式。
6.2 2 关机命令
快速关机,不警告用户
|
shutdown -F
;halt
|
快速关机并重启
|
shutdown
�C
Fr
;reboot
|
警告一分钟后关机并重启
|
shutdown -r
|
发送关机命令,但不关机
|
shutdown -k
|
关机并警告用户推出
|
Shutdown now
|
关机到单用户模式
|
Shutdown
-m;init s;telinit s
|
7IBM AIX备份与恢复
1
用SMIT备份
#smitty mksysb进行系统备份
当COMMAND STATUS页面中Command: OK出现后,表示备份成功。
取出制作完毕的磁带,在磁带上的标签上注明备份机器的名称和序列号
2
手工备份
#
mksysb /dev/rmt0