[ 前言 ]在高清播放机的硬盘分区中,除了根分区等分区外,大都会创建一个交换分区,及Swap分区。那么这个Swap分区
           的作用是什么呢?它能实现对系统性能的提升吗?本文简要介绍Swap分区的功能及对系统性能的影响。

一. 什么是Swap分区,Swap分区的作用是什么?
Swap分区,顾名思义,即交换区。Swap空间的作用可简单描述为:
当系统的物理内存不够用的时候,就需要将物理内存中的一部分空间释放出来,以供当前运行的程序使用。那些被释放的空间可能来自一些很长时间没有什么操作的程序,这些被释放的空间被临时保存到Swap空间中,等到那些程序要运行时,再从Swap中恢复保存的数据到内存中。也就是说,系统总是在物理内存不够时,才进行Swap交换。
其实,Swap的调整对Linux服务器,特别是Web服务器的性能至关重要。通过调整Swap,有时可以越过系统性能瓶颈,节省系统升级费用。   
众所周知,现代操作系统都实现了"虚拟内存"这一技术,不但在功能上突破了物理内存的限制,使程序可以操纵大于实际物理内存的空间,更重要的是,"虚拟内存"是隔离每个进程的安全保护网,使每个进程都不受其它程序的干扰。   
计算机用户会经常遇这种现象。例如,在使用Windows系统时,可以同时运行多个程序,当你切换到一个很长时间没有理会的程序时,会听到硬盘"哗哗"直响。这是因为这个程序的内存被那些频繁运行的程序给"偷走"了,放到了Swap区中。因此,一旦此程序被放置到前端,它就会从Swap区取回自己的数据,将其放进内存,然后接着运行。   
需要说明一点,并不是所有从物理内存中交换出来的数据都会被放到Swap中(如果这样的话,Swap就会不堪重负),有相当一部分数据被直接交换到文件系统。例如,有的程序会打开一些文件,对文件进行读写(其实每个程序都至少要打开一个文件,那就是运行程序本身),当需要将这些程序的内存空间交换出去时,就没有必要将文件部分的数据放到Swap空间中了,而可以直接将其放到文件里去。如果是读文件操作,那么内存数据被直接释放,不需要交换出来,因为下次需要时,可直接从文件系统恢复;如果是写文件,只需要将变化的数据保存到文件中,以便恢复。但是那些用malloc和new函数生成的对象的数据则不同,它们需要Swap空间,因为它们在文件系统中没有相应的"储备"文件,因此被称作"匿名"(Anonymous)内存数据。这类数据还包括堆栈中的一些状态和变量数据等。所以说,Swap空间是"匿名"数据的交换空间。

二. Swap分区的大小限制
经常看到有些Linux(国内汉化版)安装手册上有这样的说明:Swap空间不能超过128M。为什么会有这种说法?在说明"128M"这个数字的来历之前,先给问题一个回答:现在根本不存在128M的限制!现在的限制是2G!   
Swap空间是分页的,每一页的大小和内存页的大小一样,方便Swap空间和内存之间的数据交换。
旧版本的Linux实现Swap空间时,用Swap空间的第一页作为所有Swap空间页的一个"位映射"(Bit map)。这就是说第一页的每一位,都对应着一页Swap空间。如果这一位是1,表示此页Swap可用;如果是0,表示此页是坏块,不能使用。这么说来,第一个Swap映射位应该是0,因为,第一页Swap是映射页。另外,最后10个映射位也被占用,用来表示Swap的版本(原来的版本是Swap_space ,现在的版本是swapspace2)。
那么,如果说一页的大小为s,这种Swap的实现方法共能管理"8 * ( s - 10 ) - 1"个Swap页。对于i386系统来说s=4096,则空间大小共为133890048,如果认为1 MB=2^20 Byte的话,大小正好为128M。之所以这样来实现Swap空间的管理,是要防止Swap空间中有坏块。如果系统检查到Swap中有坏块,则在相应的位映射上标记上0,表示此页不可用。这样在使用Swap时,不至于用到坏块,而使系统产生错误。   
现在的系统设计者认为:   
 1.现在硬盘质量很好,坏块很少。   
 2.就算有,也不多,只需要将坏块罗列出来,而不需要为每一页建立映射。   
 3.如果有很多坏块,就不应该将此硬盘作为Swap空间使用。   
于是,现在的Linux取消了位映射的方法,也就取消了128M的限制。直接用地址访问,限制为2G。

三. Swap配置对系统性能的影响
分配太多的Swap空间会浪费磁盘空间,而Swap空间太少,则系统会发生错误。   
如果系统的物理内存用光了,系统就会跑得很慢,但仍能运行;如果Swap空间用光了,那么系统就会发生错误。例如,Web服务器能根据不同的请求数量衍生出多个服务进程(或线程),如果Swap空间用完,则服务进程无法启动,通常会出现"application is out of memory"的错误,严重时会造成服务进程的死锁。因此Swap空间的分配是很重要的。   
通常情况下,Swap空间应大于或等于物理内存的大小,最小不应小于64M,通常Swap空间的大小应是物理内存的2-2.5倍。但根据不同的应用,应有不同的配置:如果是小的桌面系统,则只需要较小的Swap空间,而大的服务器系统则视情况不同需要不同大小的Swap空间。特别是数据库服务器和Web服务器,随着访问量的增加,对Swap空间的要求也会增加,具体配置参见各服务器产品的说明。   
另外,Swap分区的数量对性能也有很大的影响。因为Swap交换的操作是磁盘IO的操作,如果有多个Swap交换区,Swap空间的分配会以轮流的方式操作于所有的Swap,这样会大大均衡IO的负载,加快Swap交换的速度。如果只有一个交换区,所有的交换操作会使交换区变得很忙,使系统大多数时间处于等待状态,效率很低。用性能监视工具就会发现,此时的CPU并不很忙,而系统却慢。这说明,瓶颈在IO上,依靠提高CPU的速度是解决不了问题的。

四. 通过观察Swap进程实现对系统性能的监视
Swap空间的分配固然很重要,而系统运行时的性能监控却更加有价值。通过性能监视工具,可以检查系统的各项性能指标,找到系统性能的瓶颈。本文只介绍一下在Solaris下和Swap相关的一些命令和用途。   
最常用的是Vmstat命令(在大多数Unix平台下都有这样一些命令),此命令可以查看大多数性能指标。 例如:
# vmstat 3   
procs memory swap io system cpu   
r  b  w  swpd free buff cache si so bi bo in  cs us sy  id
0  0  0   0  93880 3304 19372 0  0  10 2  131 10  0  0  99   
0  0  0   0  93880 3304 19372 0  0   0  0  109  8   0  0 100   
0  0  0   0  93880 3304 19372 0  0   0  0  112  6   0  0 100   
............
命令说明:   
vmstat 后面的参数指定了性能指标捕获的时间间隔。3表示每三秒钟捕获一次。第一行数据不用看,没有价值,它仅反映开机以来的平均性能。从第二行开始,反映每三秒钟之内的系统性能指标。
这些性能指标中和Swap有关的包括以下几项:   
procs下的w
表示当前(三秒钟之内)需要释放内存、交换出去的进程数量。   
memory下的swpd 表示使用的Swap空间的大小。   
Swap下的si,so   si表示当前(三秒钟之内)每秒交换回内存(Swap in)的总量,单位为kbytes;so表示当前(三秒钟之内)每秒交换出内存(Swap out)的总量,单位为kbytes。   
以上的指标数量越大,表示系统越忙。这些指标所表现的系统繁忙程度,与系统具体的配置有关。系统管理员应该在平时系统正常运行时,记下这些指标的数值,在系统发生问题的时候,再进行比较,就会很快发现问题,并制定本系统正常运行的标准指标值,以供性能监控使用。   
另外,使用Swapon-s也能简单地查看当前Swap资源的使用情况。例如:   
   # swapon -s   
   Filename Type Size Used Priority   
   /dev/hda9 partition 361420 0 3   
能够方便地看出Swap空间的已用和未用资源的大小。通常应该使Swap负载保持在30%以下,这样才能保证系统的良好性能。
增加Swap空间的步骤:   
 1) 成为超级用户   
    $su - root   
 2) 创建Swap文件   
    # dd if=/dev/zero of=swapfile bs=1024 count=65536   创建一个有连续空间的交换文件。   
 3) 激活Swap文件   
    #/usr/sbin/swapon swapfile   swapfile指的是上一步创建的交换文件。
 4) 现在新加的Swap文件已经起作用了,但系统重新启动以后,并不会记住前几步的操作。因此要在/etc/fstab文件中记录
     文件的名字,和Swap类型,如:   
    /path/swapfile none Swap sw,pri=3 0 0   
 5) 检验Swap文件是否加上   
    /usr/sbin/swapon -s   
删除多余的Swap空间的步骤:   
 1) 成为超级用户   
 2) 使用Swapoff命令收回Swap空间。   
    #/usr/sbin/swapoff swapfile   
 3) 编辑/etc/fstab文件,去掉此Swap文件的实体。   
 4) 从文件系统中回收此文件。   
    #rm swapfile   
 5) 当然,如果此Swap空间不是一个文件,而是一个分区,则需创建一个新的文件系统,再挂接到原来的文件系统上。

五. 合理配置系统的Swap分区:
目前推荐交换分区的大小应当与系统物理内存的大小保持线性比例关系。不过在小于2GB物理内存的系统中,交换分区大小应该设置为内存大小的两倍,如果内存大小多于2GB,交换分区大小应该是物理内存大小加上2GB。其原因在于,系统中的物理内存越大, 对于内存的负荷也会越大。

但是,如果物理内存大小扩展到数百GB,这样做就没什么意义了。

实际上,系统中交换分区的大小并不取决于物理内存的量,而是取决于系统中内存的负荷。Red Hat Enterprise Linux 5可以在这样的情况下工作:完全没有交换分区,而且系统中匿名内存页和共享内存页小于3/4的物理内存量。在这种情况下,系统会将匿名内存页和共享内存页锁定在物理内存中,而使用剩余的物理内存来缓冲文件系统数据(pagecache),当内存耗尽时, 系统内核只会回收利用这些pagecache内存。

考虑到以下情况:
 1)安装系统时难以确定内存的负荷,如何设置交换分区大小
 2)系统中物理内存越大,所需交换分区就会越少
以下是设置合适的交换分区大小的规则:
小于等于4G物理内存的系统,至少设置2GB的交换分区
4G~16G物理内存的系统,至少设置4GB的交换分区
16G~64G物理内存的系统,至少设置8GB的交换分区
64G~256G物理内存的系统,至少设置16GB的交换分区

六、线上增加swap分区

当前swap 2G

[root @CentOS5 ~]# free
total       used       free     shared    buffers     cached
Mem:       2058776 2014824 43952 0 51176 267420
-/+ buffers/cache:     1696228 362548
Swap:       2096472 63096 2033376

查看磁盘分区,选择足够空间大小的分区,创建swap文件,如果物理磁盘速度不同,尽量选择速度快的磁盘创建swap文件

在/data目录下创建2G文件newswap
[root @CentOS5 ~]# time dd if =/dev/zero of=/data/newswap  bs=1M count= 2048
2048 + 0 records in
2048 + 0 records out
2147483648 bytes ( 2.1 GB) copied, 64.7137 seconds, 33.2 MB/s
real 1m5.144s
user 0m0.014s
sys  0m5.685s
可将newswap文件转为Linux的交换区
[root @CentOS5 ~]# mkswap /data/newswap
Setting up swapspace version 1 , size = 2147479 kB
查看当前swap挂载点
[root @CentOS5 ~]# swapon -s
Filename                      Type              Size    Used    Priority
/dev/sda2                               partition       2096472 63096 - 1
添加swap空间
[root @CentOS5 ~]# swapon /data/newswap
查看添加后swap挂载点
[root @CentOS5 ~]# swapon -s
Filename                      Type              Size    Used    Priority
/dev/sda2                               partition       2096472 63096 - 1
/data/newswap                           file             2097144 0 - 2
查看添加后swap大小
[root @CentOS5 ~]# free
total       used       free     shared    buffers     cached
Mem:       2058776 2047024 11752 0 3136 384072
-/+ buffers/cache:     1659816 398960
Swap:       4193616 63096 4130520

dd:用指定大小的块拷贝一个文件,并在拷贝的同时进行指定的转换

注意:指定数字的地方若以下列字符结尾则乘以相应的数字:b=512;c=1;k=1024;w=2

参数:

  1. if=文件名:输入文件名,缺省为标准输入。即指定源文件。< if=input file >

  2. of=文件名:输出文件名,缺省为标准输出。即指定目的文件。< of=output file >

  3. ibs=bytes:一次读入bytes个字节,即指定一个块大小为bytes个字节

  • obs=bytes:一次输出bytes个字节,即指定一个块大小为bytes个字节

bs=bytes:同时设置读入/输出的块大小为bytes个字节

  1. cbs=bytes:一次转换bytes个字节,即指定转换缓冲区大小

  2. skip=blocks:从输入文件开头跳过blocks个块后再开始复制

  3. seek=blocks:从输出文件开头跳过blocks个块后再开始复制

  4. 注意:通常只用当输出文件是磁盘或磁带时才有效,即备份到磁盘或磁带时才有效

  5. count=blocks:仅拷贝blocks个块,块大小等于ibs指定的字节数

  6. conv=conversion:用指定的参数转换文件

ascii:转换ebcdic为ascii

ebcdic:转换ascii为ebcdic

ibm:转换ascii为alternate ebcdic

block:把每一行转换为长度为cbs,不足部分有空格填充

unbock:使每一行的长度都为cbs,不足部分用空格填充

lcase:把大写字符转换为小写字符

ucase:把小写字符转换为大写字符

wab:交换输入的每对字节

oerror:出错时不停止

  • otrunc:不截短输出文件

ync:将每个输入块填充到ibs个字节,不足部分用空(NUL)字符补齐

七,清理swap分区

使用到的命令:swapoff -a 再swapon -a

执行过程很慢,可以用top命令查看swap使用率在降低