【生产】数据排查系统自重启

为了考虑到多重可能性问题,功能上添加了一个日志记录,正常有问题查询*.log文件(包含error和info文件),有时候需要具体痕迹日志,mysql设计一个debug_log表进行数据数据记录。

-- 查询日志,指定时间,看看内容 debug_info  error_info,导出表格 
select * from debug_logger where 1=1 AND DATE_FORMAT(create_time,'%Y%m%d') = '20231231'

前情

定时task服务,隔离在0点10分、0点20分、0点30分

  • 查询数据库数据量正常
  • 查询服务日志信息未记录0-1点时段信息
  • 查询后台记录日志显示为空,
  • 往常正常,这两天出现问题,服务为动过
  • 查询数据量逐日10万量递增趋势(考虑到处理量问题)

生产排查,开发,维护是协助处理,所以写排查步骤、排查脚本、沟通等待一系列处理

怀疑

今天0点-1点是否存在人工或者系统重启

  • 1、人工重启
  • 2、系统自重启

掘金者说:系统自重启情况,系统内存使用量过载超过内存承受范围被系统重新启动(Docker)

承受不了再次重启,业务服务可以,定时任务就导致数据丢失了。

内存使用达到85%以上,重启次数达到6次

最终

继续优化代码处理数据逻辑

你可能感兴趣的:(通用表单,java,mysql)