Elasticsearch7.6解决报错Connection reset by peer【刨根问底完美解决】

一、前言

小编最近在生产上遇到一个问题,解决完后立马总结一下分享给大家,希望可以帮助到大家哈!

事情是这样的,奇怪的现象,公司搭建的ElasticSearch,本来是用来提高检索效率的,最近出现报错了!

版本配置什么都没变,奇怪的很!

问题:
每隔几个小时就会查询不到,与ElasticSearch连接不上,刷新后查询正常
报错为:java.io.IOException: Connection reset by peer

拿着条件去kibana是可以查询到的;

核心原因:

这是客户端是长链接,服务端过期后自动关闭链接,客户端继续用原来的链接导致错误的!

二、前因后果

小编ElasticSearch版本为7.6
下面我们来详细说一下报错原因和解决方案哈:

1. 报错信息

java.io.IOException: Connection reset by peer
	at org.elasticsearch.client.RestClient.extractAndWrapCause(RestClient.java:828)
	at org.elasticsearch.client.RestClient.performRequest(RestClient.java:248)
	at org.elasticsearch.client.RestClient.performRequest(RestClient.java:235)
	at org.elasticsearch.client.RestHighLevelClient.internalPerformRequest(RestHighLevelClient.java:1514)
	at org.elasticsearch.client.RestHighLevelClient.performRequest(RestHighLevelClient.java:1484)
	at org.elasticsearch.client.RestHighLevelClient.performRequestAndParseEntity(RestHighLevelClient.java:1454)
	at org.elasticsearch.client.RestHighLevelClient.search(RestHighLevelClient.java:970)

2. 原因与解决方案

上面也是说了原因,但是不太详细,下面详细说一下原因哈!

ES会设置一个策略来进行链接时间的控制,设置此连接的空闲持续时间

我们可以看一下这个策略:

这是我们不配置会走这个策略,默认-1为长链接,可循环重复使用;

我们只需要把这个策略换成我们的即可

@Contract(threading = ThreadingBehavior.IMMUTABLE)
public class DefaultConnectionKeepAliveStrategy implements ConnectionKeepAliveStrategy {

    public static final DefaultConnectionKeepAliveStrategy INSTANCE = new DefaultConnectionKeepAliveStrategy();

    @Override
    public long getKeepAliveDuration(final HttpResponse response, final HttpContext context) {
        Args.notNull(response, "HTTP response");
        final HeaderElementIterator it = new BasicHeaderElementIterator(
                response.headerIterator(HTTP.CONN_KEEP_ALIVE));
        while (it.hasNext()) {
            final HeaderElement he = it.nextElement();
            final String param = he.getName();
            final String value = he.getValue();
            if (value != null && param.equalsIgnoreCase("timeout")) {
                try {
                    return Long.parseLong(value) * 1000;
                } catch(final NumberFormatException ignore) {
                }
            }
        }
        return -1;
    }

}

服务器的TCP时间,我们可以查看一下:

cat /proc/sys/net/ipv4/tcp_keepalive_time

在这里插入图片描述

这里就是12分钟,我们需要让客户端的链接时间小于服务器的keepalive时间

这样客户端超过时间后就会重新获取新链接,确保不会报错哈!!

三、具体方案

编写ElasticsearchProperties ,获取nacos上的信息,方便修改!

@Data
@Component
@ConfigurationProperties(prefix = "spring.elasticsearch.rest")
public class ElasticsearchProperties {

    private String uris;

    private String username;

    private String password;

}

编写RestHighLevelClient配置类,使用我们的策略,看到其他教学还是使用以前的连接方式,现在RestClientBuilder 里的RestClientBuilder是自动构建连接的!

这里我们把RestClientBuilder 注入,继续放里面放新策略即可!

由于我们重写RestHighLevelClient,它又依赖RestClientBuilder ,原来RestClientBuilder 会自动获取用户名密码、连接地址,现在我们需要把用户名密码重新赋值一下哈!
这样就可以少一步输入地址的哈!

这里设置10分钟,没有超过12分钟!

@Configuration
public class ElasticsearchConfig {

    @Autowired
    private ElasticsearchProperties elasticsearchProperties;

    @Autowired
    private RestClientBuilder restClientBuilder;

    @Bean
    public RestHighLevelClient restHighLevelClient(){

        CredentialsProvider credentialsProvider = new BasicCredentialsProvider();
        credentialsProvider.setCredentials(AuthScope.ANY, new UsernamePasswordCredentials(elasticsearchProperties.getUsername(), elasticsearchProperties.getPassword()));
        return new RestHighLevelClient(restClientBuilder.setHttpClientConfigCallback(requestConfig ->{
            requestConfig.setKeepAliveStrategy((response, context) -> TimeUnit.MINUTES.toMillis(10));
            requestConfig.setDefaultCredentialsProvider(credentialsProvider);
            return requestConfig;
        }));
    }

}

看一下配置文件:

Elasticsearch7.6解决报错Connection reset by peer【刨根问底完美解决】_第1张图片

方案二:

如果不介意的话可以把错误捕获起来,重新调用一下,第二次就会重新建立连接,这样就不会有问题了,不过这种不太建议!!

四、总结

这样就完美解决了,生产回复正常哈!

写作不易,大家给点支持,你的支持是我写作的动力哈!

对你有帮助,还请不要吝啬你的发财小手点点关注哈!

关注小编的微信公众号,一起交流学习!文章首发看哦!

你可能感兴趣的:(修复bug合集和小技巧,elasticsearch,spring,boot)