介绍一些常用工具和命令,可以用来诊断、查看和管理RAC和Exadata数据库一体机的RAC相关组件。(不管是否是Extradata环境同样适用)
用crsctl query命令查询Exadata上的Clusterware集群软件信息的命令。
crsctl query命令:
crsctl query crs activeversion
crsctl query crs releaseversion
crsctl query crs softwareversion
crsctl query crs softwareversion
crsctl query crs softwareversion -all
crsctl query css votedisk
crsctl query crs administrator
crsctl check命令,用来检查Exadata上的集群组件状态:
crsctl check has
crsctl check crs
crsctl status和crsctl get命令,用来显示Exadata上集群相关组件的状态信息。
crsctl status serverpool -p
crsctl status serverpool ora.dbm -p
crsctl get cluster mode status
crsctl get node role config
用srvctl config命令展示了Exadata上集群相关的配置信息。
srvctl config database -d dbm
srvctl config nodeapps -n oe01db01
srvctl config listener -l LISTENER -a
用srvctl status命令展示了Exadata上集群管理资源的状态信息。
srvctl status server -n oe01db01,oe01db02,oe01db03,oe01db04
srvctl status database -d dbm
srvctl status instance -d dbm -i dbm1
stvctl status nodeapps
srvctl status nodeapps -n oe01db01
srvctl status asm
srvctl status diskgroup -g DATA01
srvctl status listener
srvctl status listener -n oe01db01
srvctl status scan
srvctl status scan_listener
srvctl status scan_listener -i 1
srvctl status vip -n oe01db01
srvctl status vip -i oe0101-vip-vip
列出的是Exadata里与RAC组件相关的一些命令。
各种RAC组件信息
ocrconfig -showbackup
olsnodes -s
olsnodes -n
ocrcheck
ocrcheck -local
可使用三个A开头的性能优化和问题诊断工具来解决性能相关的问题或其他通用问题:
集群私有网络是集中式的骨干网络,承担所有节点之间的缓存融合。虽然在Exadata中比较罕见(由于使用了超快的InfiniBand网络交换机),但集群互联很可能是潜在的问题点。
AC管理工具,比如数据库配置助手(DBCA)、数据库升级助手(DBUA)、集群验证工具(CLVU)、服务器控制工具(SRVCTL)等,是基于Java开发的,所以可以启用跟踪功能。这些工具的跟踪日志可以在它们各自的目录中找到(例如,$ORACLE_HOME/cfgtoollogs/dbca),如果遇到相关故障,应该去检查这些日志。
集群健康状态监视器(Cluster Health Monitor,CHM)也是一个Exadata、RAC故障问题发生时非常有用的工具。CHM搜集的信息,放在Grid Infrastructure的管理信息库,可以用于RAC集群的故障排除。CHM搜集数据可以通过运行$GRIDHOME/bin目录下的diagcollection.pl脚本获得。不过,相对TFA来说,diagcollection.pl有些过时了。
OEM 12c是一个标准框架,可以作为RAC、Exadata故障诊断和性能调优时的一种选择参考。下面列出OEM 12c上的一些工具、程序、报告、页面,这在识别、跟踪诊断和处理RAC或Exadata的一些问题情景时是非常有用的:
还有一些工具和命令脚本,对于诊断和解决RAC问题也是比较有用的: