AIX 6.1新功能 之RAS,虚拟化,存储及文件系统,网络增强,参数调整 (转帖)

AIX 6.1新功能 之RAS

AIX 6.1在高可用性等方面添加了如下特性:

  1、RAS组件框架

  •RTEC(Run-Time Error Checking)  可以对系统硬、软件故障进行检测
  •CT (Component Tracing)    用于在系统跟踪时额外的更细致的过滤
  •CD (Component Dump)      对Dump进行增强,可细化控制Dump信息的详细程度

  2、Dump功能的增强

  AIX 6.1引入了几种新的dump手段:
方式         AIX 版本         说明
传统 dump         所有         原始方式,随着 CPU 数量的增加,物理内存的加大,dump 需要的时间也越来越长。
Minidump         V5.3 TL3         数据不是像传统的 dump 方式那样保存到磁盘上,而是保存到 NVRAM 中,系统下次启动时,再写入到 error log 中。因此 Minidump 的容量非常小,只保存了关键的信息,同时转储所需要的时间也很短。
Parallel dump         V5.3 TL5         Dump 数据存储的格式发生改变,数据块以无序方式存储,使得多处理器的系统可以按照每个处理器同时转储一块区域的方式将内存数据写入到 dump 设备。此改进使得大型系统(多 CPU,大内存)的 dump 速度得到大大提升,仅仅受限于 I/O 速度。
Component Dump         V6         前面已经提到,Component Dump 使得管理员可以对 dump 的详细程度和各组件的 dump 属性进行更加精确的控制。
Live Dump         V6         Live Dump 方式基于新的 Component Dump 框架。执行时,只有那些注册到 CD 框架并且声明为支持 Live Dump 特性的组件才会有数据转储。Live Dump 还有另外一项非常重要的特性,就如其名称表明的一样,在 dump 时不需要重新启动系统。因此 Live Dump 方式减少了需要转储的数据并显著的降低了 dump 所需要的停机时间。
Firmware-Assisted Dump         V6         传统的 dump 方式实际上是由已经发生故障的 AIX 内核进行的,这样存在两个问题:
•如何保证由已经故障的内核所写入的数据的正确性
•故障严重到内核已经无法进行 dump 时,即无法收集任何 dump 信息
在 POWER 6 平台上,系统微码引入了对 AIX dump 的支持。AIX 6 可以在发生崩溃时立即重启,系统微码会保护崩溃时的内存区域的内容不受影响。在 AIX 6 系统启动过程中,内核会将由微码保护起来的内存区域转储并释放。使用此方式,dump 的可靠性得到了大幅提升。

  3、Storage Protection keys

  Storage protection keys是POWER 6处理器新增的功能,系统内存可以按照区域分配不同的 key,通过硬件提供支持来保证只有持有正确的key的代码可以修改其内容。该技术可以应用在 AIX内核或者用户应用程序代码中,防止由于代码的错误行为(无论是有意还是无意)而可以任意破坏其它内存区域,因此可以进一步提高系统的稳定性。AIX 5.3 TL6中加入了Storage protection keys的API,应用程序可以使用此功能,但是内核并不支持使用key来保护。而AIX 6中,内核代码和用户应用代码都可以使用Storage protection keys功能。


  4、内核故障恢复


  内核出现错误,往往造成整个系统崩溃。AIX 6内核包括了自动故障恢复功能(Kernel error recovery),当错误出现时,可以自动采取动作,避免造成崩溃。


  AIX 6 内核中增加了一个称为恢复管理器(Recovery Manager)的组件,所有需要提供故障自动恢复的内核组件或者扩展模块都会向Recovery Manager注册其特定的恢复例程(Recovery Routine)。当某个组件发生错误时,它会产生一个异常,将执行转交给Recovery Manager,由其执行该组件的恢复例程。当恢复例程执行结束后,Recovery Manager会将执行交还该组件,使其继续运行下去。


  恢复例程内通常会执行以下操作,使得出错的组件可以恢复到正常的执行状态:


  •收集故障数据

  •检查并恢复数据结构

  • 对组件出错时持有的资源进行相应的处理或者释放

  • 决定修复故障而应采取的措施


  恢复例程通常在尝试进行任何恢复动作前会先触发一个Live Dump,并在AIX error log中记录一次内核故障恢复事件(Lable为RECOVERY、RECOVERY_NOTIF或RECOVERY_TIME)。

  内核故障恢复功能的开启可以通过raso命令来进行控制,包括受限参数recovery_action、recovery_average_threshold、recovery_debugger和recovery_framework。也可以通过SMIT菜单来访问,快捷路径为krecovery。


  5、在线内核升级(Concurrent Update)


  在 AIX 6 之前的版本中,任何对AIX内核进行更新的操作之后都必须要执行bosboot命令更新Boot LV然后重新引导系统才会生效,在补丁升级任务结束后经常会看到这样的提示信息,

   * * * A T T E N T I O N * * *

   System boot image has been updated. You should reboot the

   system as soon as possible to properly integrate the changes

  and to avoid disruption of current functionality.

  就是因为这个原因。当IBM发布一个关键的内核补丁时,用户通常会面临一个两难的局面:如果升级补丁,必须要重新启动,会带来宕机时间;而如果不更新补丁,又会面临潜在的问题。

  AIX 6通过引入在线内核升级(Concurrent update)功能改善了这个问题,该功能的特点在于:

  •安装后不需重启,即时生效。补丁可以设置为在重启后持续生效,或者仅对本次有效。

  •以临时补丁(Interim Fix)的形式提供,使用emgr命令来安装和管理。emgr命令新增加-i参数来安装concurrent update,具体的信息可以参考man emgr。

  •如果补丁被安装为应用(Applied)状态,而没有被提交(Commit),那么移除该补丁同样不需要重新启动系统。

  •由于对运行中的内核代码进行动态的修改和替换是一个复杂的过程(AIX 6 的内核专门为此引入了相应的机制和系统调用),因此并不是所有的内核补丁都能够以在线方式升级。对内核的重大改变或者关键部分的升级还是需要计划相应的宕机时间。

  6、换页空间校验

  AIX 6增加了对Paging space数据的正确性校验,通过记录被换页的内存数据的校验和(checksum),AIX 6确保内存数据在写入到磁盘时和从磁盘读入时一致。如果校验数据表明 Paging space中的数据不正确,AIX会记录一个错误日志,并根据错误的内存数据属于哪个区域而采取相应的行为:如果属于内核使用的系统内存,那么停机;如果属于应用程序使用的部分,则给相应的进程发送异常信号。

  Paging space的中的数据以4KB为单位计算校验和,校验和长度(checksum size)可以在 8 / 16 / 32 bit中进行选择,如果checksum size设置为 0,则关闭了该功能。当打开校验功能时,每个Paging space设备会对应一段大小为256MB的专用内存区域,用来记录存储到该设备上的每个内存页的校验和。Paging space的校验和长度设置记录在 /etc/swapspaces 文件中,可以在创建时使用mkps –c参数来指定,也可以在创建好之后使用chps –c参数来修改。


AIX 6.1新功能 之虚拟化


1、工作负载分区(Workload Partitions)

  AIX 6.1在虚拟化方面的最大变化就是引入了WPAR。WPAR是纯软件的虚拟化解决方案,他与IBM POWER平台上传统的LPAR(逻辑分区)方案有着本质上的不同,下表给出了LPAR和WAPR的简单比较。

        LPAR         WPAR
实现技术         硬件支持,POWER 处理器加 Hypervisor(微码内置功能)         软件功能,由 AIX 内核实现
管理方法         HMC 或 IVM         AIX 系统命令,WPAR Manager
特点         一个服务器,多个物理或虚拟设备,多个 OS         一个 OS,一套物理或虚拟设备,多个应用环境
操作系统         AIX 或者 Linux         仅 AIX 6.1
成本         需要购买 APV        随 AIX 6 附带,无额外费用。
WPAR Manager 需额外许可。
承载WPAR的AIX系统在WPAR的术语中称之为全局环境(Global Environment),它既可以运行在一个物理机器上,也可以是一个LPAR。WPAR相比LPAR是更轻量级的虚拟化解决方案,它与全局 AIX 环境共享处理器、内存、网络和文件系统资源,创建和初始化操作简单快捷。

  WPAR又分为系统WPAR(System WAPR)和应用WPAR(Application WPAR)两类。系统 WPAR 是一个完整的AIX环境,拥有独立的资源,如独立的 init 进程树提供网络服务,独立的文件系统,用户帐户等。创建系统 WPAR 的过程实际上包括了 AIX 软件包安装的过程。对于用户来讲,访问 WPAR 与其他独立的 AIX 系统差异不大,既可以登录到终端,可以使用 telnet 连接。而应用WPAR是一个更精简的环境,只包含应用程序特定的进程和相应的内核支撑环境,不包含自己独立的资源,只能共享使用全局环境的资源。当应用WPAR中包含的应用程序启动时,它也就启动,当应用停止时应用WPAR也就被删除了,因此从用户的角度来看它更加接近于传统的 chroot。

  WPAR 为用户带来了以下好处:

  •进一步降低虚拟化成本。

  •优化系统资源使用率:一个系统中可以有多个 WPAR 运行,在隔离的同时也使得系统的计算资源得以更加充分的利用。

  •更细粒度的对计算资源进行分配:管理员可以对WPAR的资源(处理器、内存等)占用进行控制,保证应用可以合作性的共享系统资源。

  •对应用环境的隔离进一步提高了安全性和稳定性:每个WPAR都是独立的环境,有自己的安全上下文和用户帐号等,一个WPAR内的安全问题不会对其他WPAR和全局环境产生影响。

  •提高应用可用性:管理员可以对某个WPAR的状态生成快照(checkpointing)并稍后恢复运行(resuming)。此功能可以提高应用的可用性:当系统故障发生时,暂停应用,移动到另外的平台上恢复运行,同时对故障系统进行维修。

  要注意的是,LPAR和WPAR两者之间并不冲突,完全可以互补。

  2、WPAR动态应用迁移,使用IBM Workload Partition Manager

         Live Application Mobility是AIX 6 WPAR提供的一项高级特性,允许WPAR动态的移动到另一个系统上,而不影响其中应用的持续运行。该功能的关键特点在于:

  •WPAR在迁移时处于活动状态,无需停止应用或整个WPAR。对用户来讲,迁移时的影响只是WPAR中的应用响应速度有短暂的降低。

  •迁移可以在逻辑分区和物理机器之间进行,即WPAR可以从同一个物理机器上一个逻辑分区迁移到另一个,也可以完全迁移到另外一个物理机器。当然,在不同的物理平台之间迁移时,必须要保证平台硬件的兼容性,例如处理器类型。

  •需要迁移的WPAR其文件系统必须放在NFS上,以保证在源和目的全局环境中都能够访问该WPAR的数据。迁移过程由IBM Workload Partition Manager软件进行控制。

  Workload Partition Manager 是 IBM 单独销售的专用于WPAR管理的软件平台。它除了为 Live Application Mobility提供支持外,还可对WPAR进行创建、修改、删除、监控等管理操作,并支持对多台服务器实行集中式图形化管理。如果不使用WPAR Manger,就只能用基本命令行工具或SMIT来管理WPAR,因此即使不需要Live Application Mobility功能,也推荐使用WPAR Manager来降低WPAR管理的复杂度。

  Live Application Mobility可以被用来进一步提高灵活性和可用性。当平台需要进行升级,或者由于故障需要停机维护时,通过此功能可以将工作负载动态的切换到其他硬件上,在不影响应用的同时即可完成维护任务。

  3、Live Partition Mobility 支持

  Live Partition Mobility是POWER 6平台提供的新一代虚拟化高级特性,它使得逻辑分区可以在物理系统之间动态迁移。与WPAR的Live Application Mobility类似,它也可以帮助提高应用的灵活性和可用性。

  Live Partition Mobility 需要POWER 6硬件平台支持,被迁移的LPAR内运行的操作系统也必须要支持此特性。IBM在AIX 6.1和5.3 TL7中增加了对Live Partition Mobility的支持。

  4、支持多个共享处理器池(Multiple Shared Processor Pools)

  多个共享处理器池是POWER 6平台引入的虚拟化新特性。在POWRE 5平台上,所有的共享处理器(Shared Processor)逻辑分区(LPAR)都使用一个统一的、系统全局的处理器池(Processor Pool),并从中取得自己的处理器资源。POWER 6对这一特性做了增强:一个物理系统中可以有多个处理器池,每个池可供一个或多个(即一组)LPAR使用,并且处理器池中的处理器数量和 LPAR数量都动态可调,这样可以按组来控制LPAR的处理器资源分配。AIX 6.1和AIX 5.3 TL7系统的对这一特性提供了支持,并升级了性能工具以支持获取系统处理器池的信息。




AIX 6.1新功能 之存储及文件系统

AIX 6操作系统增加了不少新功能。涉及可管理的物理资源、参数设置、系统安全、性能调整,国际化支持等诸多方面。这里分几篇文章进行介绍:

  1、LVM配置和跟踪日志

  1)lvmcfg日志:在alog中新增了记录系统中所执行的LVM管理命令、参数、时间、进程ID和返回值等信息的lvmcfg类型。可以使用alog –t lvmcfg –o进行查看。

  # alog -t lvmcfg -o
  Starting Log
  [S 188534 172238 01/14/09-17:05:40:353 extendlv.sh 794] extendlv hd2 5
  [E 188534 0:837 extendlv.sh 33] extendlv: exited with rc=0
  [S 176336 196720 01/14/09-17:17:58:485 mklv.sh 617] mklv -y fwdump -t jfs2 rootvg 272969b
  ... ...

  2)LVM tracing日志:通过设置环境变量 LVMT_VERBOSE 或者配置文件 /etc/lvmtlog.cfg,可以设置 LVM 操作的跟踪日志级别,总共0-9 级日志,可记录大量的信息供管理员或 IBM 支持工程师分析。LVM tracing 日志位于 /tmp/lvmt.log 文件中,通过 alog –t lvmt –o 命令查看。

  3)gsclvmd 日志增强:gsclvmd 是 HACMP 所需要的,支持并发卷组(Concurrent VG)的服务进程。在之前的 AIX 中,它的日志记录到 /tmp 下面的多个文本文件中,并且默认是关闭的。AIX 6.1 中对其做了增强,统一到 alog 框架下,并且与 LVM tracing 日志类似,可以设置日志级别。其日志内容通过 alog –t lvmgs –o 来查看。

  2、gsclvmd故障管理增强

  该进程可以对故障进行分类记录,同时可以采取相应的动作来处理问题。

  3、jfs2无日志模式

  AIX 6.1 中的 JFS2 文件系统支持以无日志的模式来 mount,以提高 I/O 性能,但在出现故障时就无法通过日志记录来恢复文件系统错误。仅适用于数据完整性不太重要,或者数据能够很容易的重新恢复的情况。

  要使用无日志模式,可以在 mount 文件系统时使用 -o log=NULL 参数,或者编辑 /etc/filesystems 文件,修改该文件系统节中对应的 log 属性。

  4、jfs2内联快照

  从 AIX 5.2 开始,JFS2 文件系统支持创建快照 (Snapshot)。一个文件系统可以有多个快照,快照可以直接备份,或者供原文件系统作为回滚点。在 AIX 6.1 以前,JFS2 文件系统的快照必须保存在一个单独的逻辑卷(LV)上,从 AIX 6.1 开始新引入的内联快照(Inline Snapshot)允许快照内容保存在原文件系统上,访问和管理更加方便快捷。

  内联快照保存在该文件系统的 /mount_point/.snapshot/snapshot_name 目录下,可以直接进入该目录查看和访问内容。SMIT 菜单也做了相应增强,与外部快照一样,可以对文件系统创建内联快照并直接进行备份。

  5、加密文件系统

  AIX 6.1 中新增加的 EFS ( 加密文件系统 ) 提供了细粒度的文件加密支持,用户可以选择对某个文件或者目录进行透明加密,文件在写入磁盘时自动加密,从磁盘读入到内存时自动解密。只有持有密钥的用户,才被允许访问加密后的数据。在需要对敏感数据进行保护的环境中,EFS 可以提供很好的保护。

  要使用 EFS,必须安装 AIX 6.1 Expansion Pack 光盘上的 Crypto Library 软件包(clic.rte 文件集),并开启 RBAC 支持(默认即处于开启状态)。

  需要注意的是:

  •/、/usr、/var、/opt 不能够开启 EFS 支持。

  •现有的 JFS2 文件系统可以通过 chfs 来开启 EFS 支持,但无法进行反向转换。

  •开启 EFS 支持的文件系统不支持通过 NFS 输出。

  •备份软件需要更新以支持对加密信息的正常备份。AIX 内置命令如 tar、backup、cpio 已经支持 EFS,但需要注意,包含有加密信息的备份(如 tar 包)必须要在 AIX 6.1 上才能解开还原。

  •加密会对文件 I/O 性能造成一定影响,在性能敏感的应用环境中需要充分考虑 EFS 带来的影响。

  • 经过加密后的文件并不会占用额外的磁盘空间,但是由于加密信息使用 EA2(Extended Attributes 2)格式存储,每个文件需要额外的 4KB 空间,对于包含大量小文件的文件系统,可能会比较明显。

  6、iSCSI 增强

  支持 iSCSI 软件 target 模式,可以将一个磁盘或者 LV(逻辑卷)通过以太网 TCP/IP 方式输出给其他 iSCSI initiator 使用。

  iSCSI 启动支持,通过软件 Initiator 或者硬件 iSCSI TOE 卡,从 iSCSI 存储设备上启动操作系统。AIX 6.1 在进行安装时,提供了一个 iSCSI 设置菜单来进行相关的配置。

  iSNS 协议支持。iSNS(Internet Storage Name Service)协议帮助 iSCSI Initiator 和 Target 注册到网络上的一个中心数据库,查询和发现其他设备,简化 iSCSI 磁盘设备的配置。AIX 6.1 包含了对 iSNS 协议的支持,除了传统的文本文件方式配置 iSCSI target 的方式,还可以设置成通过 iSNS 协议来发现 iSCSI 存储。

  7、AIO 动态调整

  在 AIX 5L 中,AIO 的管理接口以 aio0 和 posix_aio0 两个设备的形式出现,AIO 子系统默认不会加载,如要启动 AIO 支持,需要将 aio 设备启用,重新启动系统后才能生效。对 AIO(minservers/maxservers/maxreqs)参数的调整,需要使用 chdev 命令修改 aio0 或者 posix_aio0 设备的属性,然后重启。从 AIX 5.3 TL5 开始,引入了 aioo 命令,使得对 minservers/maxservers/maxreqs 参数的调整可以动态进行,不需要重新启动系统。

  AIX 6.1 中,AIO 的支持更加动态。



AIX 6.1新功能 之网络增强

  1、IPv6的增强

  支持新的 RFC 标准:RFC4007(IPv6 Scoped Address Architecture)和 RFC4443(Internet Control Message Protocol ICMPv6),与标准技术保持一致。
  支持校验卸载(Checksum Offload)和大包收发卸载(Largesend Offload/Largereceive Offload),在受支持的以太网卡上可以将 IPv6 数据包的校验、大包收发的重组工作交由网卡芯片硬件来完成,从而降低 CPU 的负担并提高吞吐量。
  这些更新使得 AIX 6 对 IPv6 的支持更加完善,性能更优,能更好的应用于 IPv6 网络。

  2、支持IGMPv3协议

  v3版本可以针对来源地址对数据包进行过滤。

  3、NFS增强

  EIM(Enterprise Identity Mapping)支持多服务器冗余保护,可以在主 EIM 服务器出现故障时切换到辅 EIM 服务器。EIM 服务是在 AIX 中用于 NFS 服务器和客户端之间的用户帐号(ID)信息转换映射的数据库。在 AIX 6.1 中,使用 chnfsim命令或 SMIT 菜单配置EIM服务器信息时,可以指定一个主服务器和最多 11 个辅助服务器,当主服务出现故障时,辅助服务器可以保证 ID 映射服务不发生中断,从而不影响 NFS 服务的正常运行。
  NFS 代理服务现在在安全性、协议包容性和性能上都得到了增强。NFS 代理位于 NFS 客户端和真正的 NFS 服务器之间,它能缓存和复制 NFS 服务器上的数据,从而使得客户端能更快的访问数据,并且减少到 NFS 服务器的网络流量。在 AIX 6.1 中,NFS 代理在以下方面得到增强:
  客户端和代理之间、代理和服务器之间都支持 RPCSEC_GSS Kerberos 方式的安全认证。这需要安装 Expansion Pack 光盘上的 krb5 和 clic 软件包。
  客户端可以使用 NFS v3 协议访问 NFS 代理,而不论 NFS 代理和 NFS 服务器之间使用的是 v3 还是 v4 协议。这使得更多旧的客户端可以利用 AIX NFS 代理。
  NFS 代理下层所使用的 CacheFS 得到了增强,性能、可缓存的最大文件数、最大文件大小和总 Cache 大小都得到了提高。
  以上的增强使得 AIX 在大型企业级的 NFS 文件服务中的性能,安全性和健壮性都有了较大的提高。

  4、内置FTP服务支持SSL

  AIX 6.1 开始,FTP 服务支持 TLS(Transport Layer Security)协议,可以对 FTP 的数据和命令通道进行传输加密。要使用此功能需要安装 Expansion Pack 光盘上的 openssl 软件包并配置 /etc/ftpd.conf 文件。具体的配置信息请使用 man ftpd 命令查看手册。

  通过 TLS 加密方式使用 FTP 使得用户认证信息不再以明文方式在网络上传输,因此能大大提高 FTP 服务的安全性,但由于数据加密需要消耗处理器资源,因此和会对性能造成影响。在需要大吞吐量的 FTP 服务时,要仔细评估加密所带来的影响。

  注意:AIX 默认开启有 telnet 服务。由于 telnet 服务也采用明文方式传输用户帐号和密码信息。因此如果需要保证远程访问的安全性,仅仅将 FTP 服务使用 SSL 保护是不够的。建议将 telnet 服务关闭,使用ssh方式提供远程登录服务。AIX在Expansion Pack光盘上提供了openssh 软件包,提供了ssh客户端和服务器端程序,安装后即可使用。

  5、名字解析缓冲

  IBM 在 AIX 6.1 中引入了一个称之为 netcd 的系统服务,负责缓存本地应用程序对以下记录的查询请求:

  本地文件内的记录:/etc/hosts、/etc/services、/etc/protocol等
  DNS 服务器上的记录,如主机名和 IP 地址间的正、反向解析等。
  NIS 和 NIS+ 服务器上的记录,如用户帐号、hosts、services、protocol、netgroup等。
  Yellow page服务和AIX ULM(User Loadable Module)上的用户帐号等信息
  当应用程序进行查询时,netcd 进程会将查询记录缓存下来并设置一个超时时间(TTL),在到期前,任何对同一个记录的查询直接从 netcd 的本地缓存返回。对于有大量查询请求的应用程序,可以大大改善查询性能。

  与netcd服务同时提供的还有netcdctrl命令,可以用于查看和刷新netcd的缓存状态,或者设置日志级别。

  6、集成 NDAF

  NDAF(Network Data Administration Facility)提供了基于 NFS4 协议的网络文件服务的中心管理和数据复制和同步环境。使用 NDAF,管理员可以通过多台 AIX 服务器提供一个单一的 NFS v4 文件服务,并由一个单一控制点在这些服务器上创建和同步数据。NFS客户端可以使用一个统一的名字空间(也就是NFS服务器上输出的路径)来访问数据,即使数据实际位于不同服务器上。AIX 5.3 TL5 中引入了该功能,包括在 Expansion Pack 光盘中,而从 AIX 6.1 开始它被集成进了安装 CD 成为基本系统的一部分。



AIX 6.1新功能 之参数调整

 1、默认安装后性能参数已经经过调整

  在AIX系统上安装应用程序时(尤其是大型应用软件,如数据库、中间件等)经常会需要按照其要求配置AIX系统,如VMM参数、配置AIO/CIO等。AIX 6.1的系统配置和参数据此做了相应调整,以提高系统默认配置下的性能,减少额外工作。

  改变了的配置主要包括:

  •vmo 参数中 minperm%、maxperm%、maxclient%、lru_file_repage和page_steal_method 参数。paging space只有在AVM(活动虚拟内存)大小达到物理内存大小的 97% 以上时才会被使用。同时,系统允许 90% 的内存可以被用来做文件缓存,而在发生页交换时,系统将会优先将文件缓存页换出内存,尽量将应用程序所使用的页面保留在物理内存中。此项改变使得 AIX 6.1 对系统物理内存的利用率更高,并且对于有大量内存用来作为文件缓存的应用环境,也不再会出现文件缓存将应用内存“挤出”到 paging space 的情况出现。

  •磁盘 I/O 速率控制。当系统中有某个进程进行持续的大数据量的磁盘写入时,它将会占用整个系统的 I/O 带宽,使得其他进程的 I/O 请求无法及时得到响应,只能处于等待状态,看起来就好像系统已经几乎失去响应。IBM 在 AIX 5L 中提供了两个参数 minpout 和 maxpout,可以控制 I/O 的上下阀值,将进程的 I/O 队列限制在一个合适的范围内,从而为其他进程留下一定的余地。但该设置在 AIX 5L 中默认为关闭。由于现在 POWER 5、POWER 6 处理器性能强劲,数据产生(被处理)的速度经常会大大超过存储系统的带宽,因此必须打开此项设置以保证系统在持续大 I/O 负载下的响应性。可以通过设置 sys0 设备的 minpout 和 maxpout 属性来配置全局值,也可通过文件系统的 mount 选项为某个文件系统单独设置。

  •         AIO 调整。现在 AIO 子系统无需手动启用,只要有应用程序发起 AIO 请求,就会有对应的内核 AIO 服务程序自动启动处理请求。AIO 服务程序的数量会随需要动态增加(minservers、maxservers和maxreqs 等上限值比起 AIX 5L 也有增加),在 AIO 请求处理完毕后,在指定的时间内(aio_server_inactivity)如果没有更多的请求,AIO 服务程序会自动结束。所有这些设置都由 ioo 命令进行设置,并且动态生效。

  •         NFS 调整。nfso 命令支持的 nfs_max_read_size,nfs_max_write_size,nfs_rfc1323 三个参数改变:读写块大小被提高到64KB,对RFC1323(TCP Extensions for High Performance)的支持也默认打开,这些都可以提高 NFS 的网络 I/O 性能。

  2、受限制的调整参数(Restricted tunables)

  AIX 6.1中对系统参数调整命令(vmo、ioo、schedo、no、nfso、raso(管理RAS参数))做了更新,增加了一类称之为 “受限” 的参数。此类参数能对更多系统内部行为进行调整,但同时也可能由于不适当的修改导致影响系统稳定性和数据完整性。除非有IBM开发人员的参与和指导,普通用户和系统管理员不应改变这些参数。

  受限参数默认在使用 vmo / ioo / schedo / no / nfso / raso 命令查看参数列表时(-a,-L,-x 参数)不会显示。如要查看,必须要同时使用 -F 参数。例如下列 raso 命令的输出结果:

  # raso –a -F

   kern_heap_noexec = 0

   kernel_noexec = 1

   mbuf_heap_noexec = 0

   mtrc_commonbufsize = 3799

   mtrc_enabled = 1

   mtrc_rarebufsize = 199

   tprof_cyc_mult = 1

   tprof_evt_mult = 1

   tprof_inst_threshold = 1000

  ##Restricted tunables

   recovery_action = 1

   recovery_average_threshold = 5

  recovery_debugger = 0

  recovery_framework = 0 

  其中加粗标出的部分就是 “受限参数” 。修改这些参数时,会有警告提示,如要做永久修改,必须要经过确认才会生效,并且在系统启动时会记录一条errlog。

  再次提醒:修改受限参数可能造成系统不稳定或者数据丢失,IBM不为此问题负责。应在修改受限参数前做好数据备份。

  3、性能监控工具更新

  由于 AIX 6.1 支持新的硬件和提供了新的特性,性能监控的工具也进行了相应的更新以反映新的数据。更新主要包括:

  • topas/vmstat/iostat/netstat/nfsstat/filemon/svmon/netpmon/proctree/trace/curt/tprof/pprof 等命令更新,增加命令选项以支持从全局环境收集某个或所有 WPAR(工作负载分区)的性能状态数据,或者在 WPAR 内运行收集该 WPAR 的数据。

  •iostat 命令支持获取磁带设备的 I/O 状态信息。

  •topas 和 lparstat 命令升级支持获取 POWER 6 新的多个共享处理器池信息。

你可能感兴趣的:(应用服务器,网络应用,网络协议,配置管理,AIX)