RabbitMQ及Erlang内存使用分析

一、RabbitMQ内存占用排查

1.定位 linux 系统内存占用最高进程

(1)输入 top 指令

nqs@nqs-yq-haitao-order-1488355883912:~$ top

然后输入大写的 M(Shift+m),基于内存占用倒序,找到占用最大内存的进程,如果内存占用最大的为 beam.smp 则为 RabbitMQ 进程占用。

2.定位 RabbitMQ 内部组建内存占用情况

(1)进入 RabbitMQ 指令目录

nqs@nqs-yq-haitao-order-1488355883912:~$ cd ~/rabbitmq_server-3.6.6/sbin/

(2) 查看 RabbitMQ 内存占用情况

nqs@nqs-yq-haitao-order-1488355883912:~/rabbitmq_server-3.6.6/sbin$ ./rabbitmqctl status

内存参数详解:

(1)内存占用总数

参数:

total

描述:

RabbitMQ 进程内存总占用量,单位 B(字节)

(2)RabbitMQ 连接

参数:

connection_readers

connection_writers

connection_channels

connection_other

描述:

​ 这部分主要包含了连接和通道(channel)所消耗的内存,也包含了SSL系统所使用的内存。

(3)队列

参数:

queue_procs

queue_slave_procs

描述:

​ 队列占用的内存指的是队列进程消耗的,并不包含消息体(在二进制中)。当内存不足时,这部分的内存将交换到磁盘上。

(4)插件

参数:

plugins

描述:

插件使用的内存不包含连接rabbit服务器的Erlang客户端和数据库所占用的部分,通常包含像一些协议插件如STOMP和MQTT。

注:有出现过队列数量配置过多 RabbitMQ_Manager插件内存占用过高的情况。

(5)其它进程内存

参数:

other_proc

描述:

​ 除了上面所提到的以外的进程所消耗的部分,这里的进程是erlang虚拟机中的概念,最近被GC回收的内存会展现在这里。

(6)Mnesia

参数:

mnesia

描述:

​ Mnesia保存了一份磁盘上的数据拷贝到内存,意味着当有大量队列、交换机、绑定、用户信息或虚拟主机时会消耗大量的内存。

(7)管理数据库

参数:

mgmt_db

描述:

​ 前提是启用了管理插件,在集群中它只会出现在一个节点中。

(8)message store索引

参数:

msg_index

描述:

​ 保存了所有消息的索引,包括那些被交换到磁盘上的消息。

(9)其它ETS表

参数:

other_ets

描述:

除了上面三个集合以外的内存表。

(10)二进制

参数:

binary

描述:

erlang虚拟机所使用的共享二进制数据,消息体的内存消耗包含在这部分。

(11)代码

参数:

code

描述:

代码所消耗的内存,一般为常量。

(12)Atoms

参数:

atom

描述:

atoms消耗的内存,一般为常量。

(13)其它系统内存

参数:

other_system

描述:

Erlang所消耗的其他内存,比如可用文件描述符的统计。

3.RabbitMQ Erlang 进程资源占用详情

nqs@nqs-eightcore16g-ha-1505907720958:~/rabbitmq_server-3.1.5/sbin$ ./rabbitmqctl eval '[{Mem, Pid, process_info(Pid)} || {Mem, Pid} <- lists:sublist(lists:reverse(lists:sort([{process_info(Pid, memory), Pid} || Pid <- processes()])), 1)].'

参数名称 描述
registerd_name 注册的名字
current_function 当前进程执行的函数,{M, F, A}
initial_call 进程初始入口函数,如spawn时的入口函数,{M, F, A}
status 进程状态
message_queue_len 进程邮箱中的待处理消息个数
messages 返回进程邮箱中的所有消息,该调用之前务必通过message_queue_len确认消息条数,否则消息过多时,调用非常危险
links 所有链接进程
dictionary 进程字典中所有的数据项
trap_exit 是否捕获exit信号
error_handler 异常处理函数
priority 进程优先级
group_leader erlang的io控制台的输出到那个进程
total_heap_size 总堆内存占用
heap_size 堆内存占用
stack_size 栈长度
reductions 进程规约数
garbage_collection GC 详情

4.RabbitMQ 流控阀值设置

​ 目前官方默认内存流控阀值设置为0.4,即RabbitMQ 进程内存占用到系统总内存的百分之四十生产者会发生流控。

​ RabbitMQ 流控机制主要是一个自身保护机制,由于 RabbitMQ 是基于Erlang 开发,RabbitMQ 将每个队列设计为一个 Erlang 进程,Erlang 进程GC也是采用分代策略,当新老生代一起参与Major GC时,Erlang虚拟机会新开内存,根据root set将存活的对象拷贝至新空间,这个过程会造成新老内存空间同时存在,极端情况下,一个队列可能短期内需要两倍的内存占用量,所以内存流控阀值设置为0.4相对是一个比较安全的值,设置太高,有可能系统内存被全部占用导致系统进程 kill RabbitMQ进程,设置过低导致内存使用率不高。

二、Erlang 进程内存占用排查

1.进入 Erlang 终端

nqs@nqs-yq-haitao-order-1488355883912:~$ erl

2.查看内存占用

1> erlang:memory(). 

3.查看进程数量

​ 如果内存占用情况主要为Erlang进程,查询下 Erlang 进程数,确定是否由于过多进程造成。

2> erlang:system_info(process_count).

4.查看进程占用内存信息

​ 基于内存占用降序获取前20条进程记录信息

3> spawn(fun()->etop:start([{output,text},{interval,5},{lines,20},{sort,memory}])end).

注:

output:指定输出方式

interval:内存信息刷新间隔时间

lines:显示内存记录行数

sort:排序规则(上文指令基于内存用量倒排)

5.查看指定进程详情

1> erlang:process_info(pid(0,26,0)).

注:0,26,0 为上图中进程 id,不过由于”.”是指令结束字符所以”.”替换为”,”

参数名称 描述
dictionary 进程字典中所有的数据项
registerd_name 注册的名字
status 进程状态
links 所有链接进程
monitored_by 所有监控当前进程的进程
monitors 所有被当前进程监控的进程
trap_exit 是否捕获exit信号
current_function 当前进程执行的函数,{M, F, A}
current_location 进程在模块中的位置,{M, F, A, [{file, FileName}, {line, Num}]}
current_stacktrace 以current_location的格式列出堆栈跟踪信息
initial_call 进程初始入口函数,如spawn时的入口函数,{M, F, A}
memory 进程占用的内存大小(包含所有堆,栈等),以bytes为单位
message_queue_len 进程邮箱中的待处理消息个数
messages 返回进程邮箱中的所有消息,该调用之前务必通过message_queue_len确认消息条数,否则消息过多时,调用非常危险
reductions 进程规约数

你可能感兴趣的:(消息队列)