干货分享-Rabbitmq 引发的内存溢出及排查思路

背景

某一天,和我们配合的中台组给我们部门发了一组新的MQ配置,用于支付回调消息的接收,原来我们的某个项目已经有一个MQ,所以项目需要适配两个MQ(该项目都是作为消费者的角色)。

spring rabbitmq使用的版本是


    org.springframework.boot
    spring-boot-starter-amqp
    2.1.5.RELEASE


兼容多MQ的代码

import lombok.extern.slf4j.Slf4j;
import org.springframework.amqp.core.Queue;
import org.springframework.amqp.rabbit.config.SimpleRabbitListenerContainerFactory;
import org.springframework.amqp.rabbit.connection.CachingConnectionFactory;
import org.springframework.amqp.rabbit.connection.ConnectionFactory;
import org.springframework.amqp.rabbit.core.RabbitTemplate;
import org.springframework.beans.factory.annotation.Qualifier;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.boot.autoconfigure.amqp.SimpleRabbitListenerContainerFactoryConfigurer;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.context.annotation.Primary;

@Slf4j
@Configuration
public class RabbitConfig1 {
    @Bean(name = "connectionFactory1")
    @Primary
    public ConnectionFactory connectionFactory1 (
            @Value("${spring.rabbitmq.host}") String host,
            @Value("${spring.rabbitmq.port}") int port,
            @Value("${spring.rabbitmq.username}") String username,
            @Value("${spring.rabbitmq.password}") String password
    ) {
        CachingConnectionFactory connectionFactory = new CachingConnectionFactory(host, port);
        connectionFactory.setUsername(username);
        connectionFactory.setPassword(password);
        return connectionFactory;
    }
    @Bean(name = "rabbitTemplate1")
    @Primary
    public RabbitTemplate rabbitTemplate1 (
            @Qualifier("connectionFactory1") ConnectionFactory connectionFactory
    ) {
        RabbitTemplate rabbitTemplate = new RabbitTemplate(connectionFactory);
        return rabbitTemplate;
    }
    @Bean(name = "listenerContainerFactory1")
    public SimpleRabbitListenerContainerFactory listenerContainerFactory1 (
            SimpleRabbitListenerContainerFactoryConfigurer configurer,
            @Qualifier("connectionFactory1") ConnectionFactory connectionFactory
    ) {
        SimpleRabbitListenerContainerFactory factory = new SimpleRabbitListenerContainerFactory();
        configurer.configure(factory, connectionFactory);
        return factory;
    }
}

import lombok.extern.slf4j.Slf4j;
import org.springframework.amqp.core.AcknowledgeMode;
import org.springframework.amqp.rabbit.config.SimpleRabbitListenerContainerFactory;
import org.springframework.amqp.rabbit.connection.CachingConnectionFactory;
import org.springframework.amqp.rabbit.connection.ConnectionFactory;
import org.springframework.amqp.support.converter.Jackson2JsonMessageConverter;
import org.springframework.beans.factory.annotation.Qualifier;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.boot.autoconfigure.amqp.SimpleRabbitListenerContainerFactoryConfigurer;
import org.springframework.boot.autoconfigure.condition.ConditionalOnProperty;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Slf4j
@Configuration
@ConditionalOnProperty(name = "pay.callback.message.config.enable", havingValue = "true")
public class RabbitConfig2 {
    @Bean(name = "connectionFactory2")
    public ConnectionFactory connectionFactory2(
            @Value("${pay.callback.rabbitmq.host}") String host,
            @Value("${pay.callback.rabbitmq.port}") int port,
            @Value("${pay.callback.rabbitmq.userName}") String userName,
            @Value("${pay.callback.rabbitmq.password}") String password
    ) {
        CachingConnectionFactory connectionFactory = new CachingConnectionFactory(host, port);
        connectionFactory.setUsername(userName);
        connectionFactory.setPassword(password);
        connectionFactory.setVirtualHost("/");
        return connectionFactory;
    }
    @Bean(name = "listenerContainerFactory2")
    public SimpleRabbitListenerContainerFactory listenerContainerFactory2 (
            SimpleRabbitListenerContainerFactoryConfigurer configurer,
            @Qualifier("connectionFactory2") ConnectionFactory connectionFactory
    ) {
        SimpleRabbitListenerContainerFactory factory = new SimpleRabbitListenerContainerFactory();
        configurer.configure(factory, connectionFactory);
        factory.setMessageConverter(new Jackson2JsonMessageConverter());
        factory.setAcknowledgeMode(AcknowledgeMode.AUTO);
        factory.setDefaultRequeueRejected(false);
        return factory;
    }
}

测试

开发环境验证通过,发布到测试环境时,出现了以下异常

image

一下子就精神了,这就是臭名昭著的内存溢出
回顾以往出现内存溢出,往往有以下几种

内存溢出

堆空间溢出

java.lang.OutOfMemoryError: Java heap space

出现的原因一般是

  • 数据突增。比如突然创建了大对象,超出了最大堆空间内存,可能还来不及回收,也可能根本就无法满足。
  • 对象堆积。一般是程序编码有问题,导致创建的对象一直堆积在堆内存,无法被GC探测回收。

永久代溢出

java.lang.OutOfMemoryError: PermGen space

元空间溢出

java.lang.OutOfMemoryError: Metaspace

元空间的概念是在jdk1.8提出来的,用来取代以前的永久代。永久代

遇到这种问题,冷静,接着一步步校验

查看jvm启动参数

java -server -Xmx512M -Xms512M -Denv=FAT -XX:+UseCodeCacheFlushing -XX:+HeapDumpOnOutOfMemoryError -Xloggc:gc.log -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:-OmitStackTraceInFastThrow -jar /usr/local/application/**.jar

可以看出,启动参数限制了最大堆内存是515M,因为是测试环境,部署了很多个项目,保险起见设置的,平时也都正常。

那就是说调大最大堆内存就可以,接下来试一下把最大堆内存调整为1G。

image.png

更改启动参数,本地运行后,仍然会报错


image

呃。。。。

查看VisualVm

这时候打开VisualVm看看,可以看到设置的最大堆大小在1000MB,而已使用的堆内存大小才100多MB,此时能够笃定是创建了大对象而导致的内存溢出。

image.png

断点调试

这一步开始来断点,排查大对象从哪里来,此时查看报错的源码,发现确实是因为大对象的创建导致
代码在com.rabbitmq.client.impl.Frame 类中,Frame是指AMQP协议层面的通信帧。

对于Frame的理解,可以查看其它博客:https://blog.csdn.net/usagoole/article/details/83048009

image

从上图可以看到,输入流读取的字节数为1345270062,这时候即创建了一个大小为1345270062(1.2G)的字节数组,于是乎出现内存溢出。

至于为什么会突然读取到这么大的字节数,重新调试,我把断点打在com.rabbitmq.client.impl.SocketFrameHandler

image.png

系统有两个MQ,原有的MQ一切正常,从支付回调MQ开始,就开始报错了,所以初步怀疑是这个MQ账号的问题,或许是账号不对?没有远程登录的权限?

理解源码

Rabbitmq是基于socket连接读取的输入流,再将它转成字节数组。
先熟悉一下com.rabbitmq.client.impl.Frame
帧(Frame),AMQP协议层面的通信帧

image

上图从左到右依次为帧类型、通道编号、帧大小、内容、结束标记组成一个帧

从上面调试的代码可以看出,我们是打算取出payload这一段内容时,超出了长度。

再看看以下代码,
readInt()的作用是,读取四个输入字节,并做了位移运算,返回一个整型值。
一个int存储的是32位的整型数据,32bit = 4 * 1byte,即表明每次从输入流里读取4个字节的数据;

int payloadSize = is.readInt();

public final int readInt() throws IOException {
    int ch1 = in.read();
    int ch2 = in.read();
    int ch3 = in.read();
    int ch4 = in.read();
    if ((ch1 | ch2 | ch3 | ch4) < 0)
        throw new EOFException();
    return ((ch1 << 24) + (ch2 << 16) + (ch3 << 8) + (ch4 << 0));
}

image.png

断点可以看出,返回的整型值,也就是payload的长度,达到了1345270062,这样下一步创建byte对象的时候,就出现内存溢出的事故。

但是为什么会出现这个大对象,回过头去分析readInt()in.read()将16进制的网络字节码 转为10进制的数组,正
是因为读取的数据有问题,才导致位移运算后得到一个比较大的整型值。

抓包

围绕着上面这个问题,此时需要抓个包看看,采取的是边断点边抓包的方式。

  • 打开抓包工具,过滤器设置指定ip为MQ的host

  • 先断点到111行,接着启动程序

    image.png
  • 当打到该断点的时候,看到帧大小比较大的时候,进入readInt()

    image.png
可以看到此时读取的4个数值分别是80、47、49、46,由于是网络字节码转过来的,故转为16进制后,对应为

```
DEC:80  47  49  46
HEX:50  2F  31  2E    

```
  • 查看抓包
image.png

从抓包可以看到,字节码对上了,而且看到响应码为400,Bad Request!!!

这也验证了一开始提到的猜测:MQ账号有问题,于是咨询了中台组,最终发现,是因为1.0部门给的端口有问题,导致socket无法连接!

分析的过程非常有趣,虽然结果很狗血。。

image

你可能感兴趣的:(干货分享-Rabbitmq 引发的内存溢出及排查思路)