Java线上问题排查汇总:cpu飙高、内存飙高、程序未知异常、远程调试、程序运行缓慢、链路追踪、APM

这部分内容涉及的知识点比较多,我没能一次性把它们全部写完,但是会尽快更新完善。

一、cpu和内存飙高。

1)内存飙高问题可以使用MAT查看原因,CPU飙高可以使用jstack查看原因,我把具体的方法单独写到了我的这篇博客里:https://blog.csdn.net/dap769815768/article/details/104942720

2)在关于MAT的博客里也说过,jmap不是很适合线上环境,那么就需要找替代品,适合线上使用的工具。Oracle官网推荐的一个工具是:JMC/飞行记录器。这个工具的具体使用方式可以参考我的另外一篇博客:https://blog.csdn.net/dap769815768/article/details/105426993

二、开启远程调试。

很多问题我们都是采用打印日志的方式,但是日志毕竟不是很完善的,很多细节看不到,这个时候如果开启远程调试,效率会高很多。使用idea开启java的远程调试并不难,这里我使用springboot+docker+linux,演示一下如何开启java的远程调试。

1)使用idea创建一个SpringBoot程序,名字叫做debug,创建一个TestController,代码如下:

@RestController
public class TestController {
    @PutMapping(value = "test")
    public boolean Update()
    {
        return  true;
    }
    @GetMapping(value = "test")
    public String Get() {
        return new Date().toString();
    }
}

2)点击Edit Configurations,点击+,选择remote:

Java线上问题排查汇总:cpu飙高、内存飙高、程序未知异常、远程调试、程序运行缓慢、链路追踪、APM_第1张图片     Java线上问题排查汇总:cpu飙高、内存飙高、程序未知异常、远程调试、程序运行缓慢、链路追踪、APM_第2张图片

3)填写服务器地址和端口号,这里我的Linux服务器的地址是192.168.31.195。然后把黄色框里面的内容复制下来:

Java线上问题排查汇总:cpu飙高、内存飙高、程序未知异常、远程调试、程序运行缓慢、链路追踪、APM_第3张图片

4)打包我们的springboot程序为jar包,把它部署到docker容器里面,这里如何部署到docker容器,我在我之前的一篇博客里有写过,不会的话可以看我的这篇博客:https://blog.csdn.net/dap769815768/article/details/86561566。但是这里的Dockerfile内容要加上上一步我们复制的东西,完整的Dockerfile如下:

FROM java:8
ADD debug.jar debug.jar
ENTRYPOINT ["java","-jar","-agentlib:jdwp=transport=dt_socket,server=y,suspend=n,address=5005","-Dspring.profiles.active=sit","debug.jar"]

5)启动容器的时候把5005和8089端口映射出来,5005端口是用于远程调试的端口,8089端口,是我的Springboot程序要用的端口。

6)程序部署好之后,在idea里面,将配置选项设置为我们配置的那个远程配置,然后点击调试:

如果连接成功了,那么idea控制台会输出如下内容:

这个时候调用一下我们写好的接口:192.168.31.195:8089/test。你会发现,虽然我们调用的是服务器的服务,但是代码会进到你本地的idea里面:

Java线上问题排查汇总:cpu飙高、内存飙高、程序未知异常、远程调试、程序运行缓慢、链路追踪、APM_第4张图片

不妨多想一下,在这种远程调试的情况下,如果代码打了断点,那么会导致应用程序暂停吗?

答案是会。所以远程调试可能会导致线上程序暂停,对于高并发的互联网场景下,使用的时候要注意。

另外说一点,远程调试分称两种,一种是主动连接,一种是被动连接。

a)attach to remote jvm 主动连接就是程序已经启动起来了,使用ide去远程连接要调试的程序,也就是本例中的这种情况

b)listent to remote jvm 被动连接是先把ide的远程调试启动起来,等待程序启动然后连接,这种一般用于程序启动不起来,需要远程调试查找原因的情况。

具体的设置方法也还是在Edit Configuration里面设置:

Java线上问题排查汇总:cpu飙高、内存飙高、程序未知异常、远程调试、程序运行缓慢、链路追踪、APM_第5张图片

java的远程调试原理并不难,使用的是Java的调试体系,调戏体系的原理是对JVM Tools Interface的上层封装。基于JVMTI,可以实现很多黑科技,比如链路追踪,Cloud Debugger,各种性能监控技术,热加载技术,Java代码加密等等技术,都是用这些实现的。这块儿的内容比较多而且涉及到C++的知识,我后续会开一篇博客单独讲这部分内容。

三、sql异常。

sql异常指sql执行结果和预期不符,或者运行缓慢。一个java方法经过一系列的操作之后,最终都是要落库的,所以程序执行结果是否符合预期,sql的执行结果至关重要。sql问题排查可以采用临时开启普通日志的方式,sql执行耗时长,可以采用慢查询日志的方式来查找原因,等等。具体如何进行sql问题的排查,可以参考我的另外一篇博客:https://blog.csdn.net/dap769815768/article/details/105792481。

四、程序运行缓慢。(尽快补充)

五、链路追踪和APM。(尽快补充)

你可能感兴趣的:(Java线上问题排查汇总:cpu飙高、内存飙高、程序未知异常、远程调试、程序运行缓慢、链路追踪、APM)