项目中有时候一次性将大批量数据都查出来到内存中导致内存占用过多很可能会导致内存溢出
在JVM内存结构中分为以下几个模块
程序中的实例对象包括从数据库读取的数据是存在堆内存中的。
所以这里的OutOfMemoryError
是因为数据量过大超过了堆内存中设置的最大内存,一次性读取的数据太多导致内存容纳不下,抛出了内存异常
如果堆的内存大小超过 -Xmx
设定的最大内存, 就会抛出 OutOfMemoryError
异常,先准备好数据在启动项目时把堆内存的最大值设置小一点就可以进行模拟内存溢出的异常
搭建一个本地项目。需求描述:查询表call_task中待拨打的数据进行拨打,call_task中一次可能会有大批量数据需要处理。本次准备了1万条数据
/**
* 查询数据执行拨打
**/
@Override
public void waitingCall() {
List<CallTask> waitingTaskList = list(Wrappers.<CallTask>lambdaQuery()
.eq(CallTask::getCallStatus, "WAITING")
.le(CallTask::getReqTime, new Date())
);
if (CollUtil.isEmpty(waitingTaskList)) {
return;
}
call(waitingTaskList);
}
/**
* 模拟执行具体拨打数据
**/
private void call(List<CallTask> waitingTaskList) {
try {
TimeUnit.SECONDS.sleep(5);
} catch (InterruptedException e) {
throw new RuntimeException(e);
}
}
启动项目时将JVM堆内存的大小调整到合适数值(可以造成内存溢出的情况)。
本次最大设置的20m,最小设置的10m
idea设置方式, 选择 run/debug configurations
设置 VM options
启动程序执行方法,程序出现错误 java.lang.OutOfMemoryError: Java heap space
既然是数据量过大导致的问题,我们可以减少每次查询的数据来解决这个问题
使用分页查询,避免一次性查询所有的数据,分批次处理
public void methodOne() {
long page = 1;
long limit = 500;
long total;
do {
Page<CallTask> taskPage = new Page<>(page, limit);
Page<CallTask> pagResult = page(taskPage,
Wrappers.<CallTask>lambdaQuery()
.eq(CallTask::getCallStatus, "WAITING")
.le(CallTask::getReqTime, new Date()));
total = pagResult.getTotal();
List<CallTask> records = pagResult.getRecords();
if (CollUtil.isEmpty(records)) {
break;
}
call(records);
page++;
} while (page * limit < total);
}
使用流式查询
public void methodTwo() {
Date reqDate = new Date();
LambdaQueryWrapper<CallTask> wrapper = Wrappers.<CallTask>lambdaQuery()
.eq(CallTask::getCallStatus, "WAITING")
.le(CallTask::getReqTime, reqDate);
int batchSize = 1000;
int offset = 0;
while (true) {
List<CallTask> taskList = list(wrapper.last("limit " + offset + "," + batchSize));
if (CollUtil.isEmpty(taskList)) {
break;
}
offset += batchSize;
call(taskList);
}
}
分页查询通常用于展示数据,如在网页上显示数据列表,需要分页展示。而流式查询通常用于数据处理,如在数据清洗、数据分析等场景中
减少查询字段,避免 select *