博主前一段时间买了1G的阿里云服务器,然后各种折腾下,Hadoop相关生态圈基本给搭建完毕,但用到Spark时候却遇到了重大问题,进程启动一切正常,但进入spark shell客户端时候一直报OOM,到这怎么办?难道升级阿里云服务器的内存,但看了看价格,还是算了。。。
办法还是人想出来的,终于经过一番艰难的寻找,终于找到了让我给找到了,下面就是今天准备给大家介绍的主人公:
Memory指机器物理内存,读写速度低于CPU一个量级,但是高于磁盘不止一个量级。所以,程序和数据如果在内存的话,会有非常快的读写速度。但是,内存的造价是要高于磁盘的,且内存的断电丢失数据也是不能把所有数据和程序都保存在内存中的原因。
既然不能全部使用内存,那数据还有程序不可能一直霸占在内存中。当内存没有可用的,就必须要把内存中不经常运行的程序踢出去。但是踢到哪里去,这时候swap就出现了。
Swap全称为swap place,即交换分区。当内存不够的时候,被踢出的进程被暂时存储到交换区。当需要这条被踢出的进程时,就从交换区重新加载到内存,否则它不会主动交换到真实内存中。
在详细介绍swap之前,需要知道的是计算机内存分为物理内存与虚拟内存(注意虚拟内存和虚拟地址空间的区别)。
物理内存是计算机的实际内存大小,由RAM芯片组成。虚拟内存则是虚拟出来的、使用磁盘代替内存。虚拟内存的出现,让机器内存不够的情况得到部分解决。当程序运行起来由操作系统做具体虚拟内存到物理内存的替换和加载(相应的页与段的虚拟内存管理)。这里的虚拟内存即所谓的swap。
当用户提交程序,然后产生进程在机器上运行。机器会判断当前物理内存是否还有空闲允许进程调入内存运行,如果有则直接调入内存进行;如果没有,则会根据优先级选择一个进程挂起,把该进程交换到swap中等待,然后把新的进程调入到内存中运行。根据这种换入和换出,实现了内存的循环利用,让用户感觉不到内存的限制。从这也可以看出swap扮演了一个非常重要的角色,就是暂存被换出的进程。
内存与swap之间是按照内存页为单位来交换数据的,一般Linux中页的大小设置为4Kb。而内存与磁盘则是按照块来交换数据的。
从上可以看出,当物理内存使用完或者达到一定比例之后,我们可以使用swap做临时的内存使用。当物理内存和swap都被使用完那么就会出错,如:out of memory。
对于使用多大比例内存之后开始使用swap,在系统配置文件中可以通过调整参数进行修改。
1 [root@localhost ~]# cat /proc/sys/vm/swappiness 2 60
该参数范围为0-100。0就是最大限度使用内存,尽量不使用swap;100是积极使用swap。
物理内存无法更改,所以swap大小的设置将会影响应用能否正常运行。swap大小的确定,根据Centos官网介绍可以得出如下公式:
1 M = Amount of RAM in GB, and S = Amount of swap in GB, then If M < 2, S = M *2 Else S = M + 2
注意:最小不应小于32M。
Swap分区的数量对性能也有很大的影响。因为swap毕竟还是以磁盘来伪装成内存,交换的操作是磁盘IO的操作而不是内存的ioad与store操作。如果有多个swap交换区,每个swap会有一定的优先级,该优先级也可以调整。swap空间的分配会以轮流的方式操作于所有的swap,这样会大大均衡IO的负载,加快swap交换的速度。
1、可以先使用 swapon -s 来查看当前swap的使用情况和使用free -h来查看内存情况。
2、swappiness 参数调整:可以使用下述方法临时修改此参数,这里配置为 0%:
echo 0 >/proc/sys/vm/swappiness
3、Swap 默认一般是0, 所以需要创建Swap memory,这里设置了5G的Swap
dd if=/dev/zero of=/swapfile bs=1024 count=5120k #about 5G
mkswap /swapfile
swapon /swapfile
4、再利用swapon -s 和free -h来查看会出现5G Swap
5、持久化swap memory
vim /etc/fstab
/swapfile swap swap defaults 0 0 # for centos 6
修改swap文件权限
chmod 600 /swapfile
6、关闭Swap,如果大家不想使用了,可以使用命令swapoff 关闭 SWAP
swapoff /swapfile
修改 /etc/fstab 文件,删除或注释相关配置,取消 SWAP 的自动挂载。
6、通过 free -m 确认 SWAP 已经关闭。
到sbin的目录下启动Spark进程,再到bin下启动spark shell,发现一切OK,结束!
关于swap和memory参考文章:https://www.cnblogs.com/004x/p/6651600.html