Linux性能分析工具汇总

       Linux针对性能调优设计了许多分析工具,这些工具对于分析整个系统性能可提供巨大的帮助。影响性能的因素有cache、I/O,系统调用,系统内核、CPU性能等等。比如某些程序无法充分利用 cache,从而导致性能下降。比如不必要地调用过多的系统调用,造成频繁的内核 / 用户切换等。 

      主要的分析工具有:CPU性能工具、内存性能工具、磁盘I/O性能工具、网络性能工具和基准测试工具。

                                                                           图1  Liunx性能分析工具

1、Linux常见分析工具

1.1、cpu性能工具

       首先,从 CPU 的角度来说,主要的性能指标就是 CPU 的使用率、上下文切换以及 CPU Cache 的命中率等。下面这张图就列出了常见的 CPU 性能指标。

Linux性能分析工具汇总_第1张图片

       

Linux性能分析工具汇总_第2张图片

1.2、内存性能工具

       接着我们来看内存方面。从内存的角度来说,主要的性能指标,就是系统内存的分配和使用、进程内存的分配和使用以及 SWAP 的用量。下面这张图列出了常见的内存性能指标。

Linux性能分析工具汇总_第3张图片

     

Linux性能分析工具汇总_第4张图片

1.3、磁盘I/O性能工具

       接下来,从文件系统和磁盘 I/O 的角度来说,主要性能指标,就是文件系统的使用、缓存和缓冲区的使用,以及磁盘 I/O 的使用率、吞吐量和延迟等。下面这张图列出了常见的 I/O 性能指标。

Linux性能分析工具汇总_第5张图片

Linux性能分析工具汇总_第6张图片

1.4、网络性能工具

       最后,从网络的角度来说,主要性能指标就是吞吐量、响应时间、连接数、丢包数等。根据 TCP/IP 网络协议栈的原理,我们可以把这些性能指标,进一步细化为每层协议的具体指标。这里我同样用一张图,分别从链路层、网络层、传输层和应用层,列出了各层的主要指标。

Linux性能分析工具汇总_第7张图片

Linux性能分析工具汇总_第8张图片

1.5、基准测试工具

除了性能分析外,很多时候,我们还需要对系统性能进行基准测试。比如,

  • 在文件系统和磁盘 I/O 模块中,我们使用 fio 工具,测试了磁盘 I/O 的性能。
  • 在网络模块中,我们使用 iperf、pktgen 等,测试了网络的性能。
  • 而在很多基于 Nginx 的案例中,我们则使用 ab、wrk 等,测试 Nginx 应用的性能。

除了专栏里介绍过的这些工具外,对于 Linux 的各个子系统来说,还有很多其他的基准测试工具可能会用到。下面这张图,是 Brendan Gregg 整理的 Linux 基准测试工具图谱,你可以保存下来,在需要时参考。

Linux性能分析工具汇总_第9张图片

总结

当分析性能问题时,大的来说,主要有这么两个步骤:

  • 第一步,从性能瓶颈出发,根据系统和应用程序的运行原理,确认待分析的性能指标。
  • 第二步,根据这些图表,选出最合适的性能工具,然后了解并使用工具,从而更快观测到需要的性能数据。

虽然 Linux 的性能指标和性能工具都比较多,但熟悉了各指标含义后,你自然就会发现这些工具同性能指标间的关联。顺着这个思路往下走,掌握这些工具的选用其实并不难。

当然,正如咱们专栏一直强调的,不要把性能工具当成性能分析和优化的全部。

  • 一方面,性能分析和优化的核心,是对系统和应用程序运行原理的掌握,而性能工具只是辅助你更快完成这个过程的帮手。
  • 另一方面,完善的监控系统,可以提供绝大部分性能分析所需的基准数据。从这些数据中,你很可能就能大致定位出性能瓶颈,也就不用再去手动执行各类工具了。
     

 
 

你可能感兴趣的:(Linux笔记)