Linux 性能分析利器 -火焰图 flame graph

简述

Perf 命令(performance的简写)是 Linux 系统原生提供的性能分析工具,返回 CPU 正在执行的函数名以及调用栈(stack)。

通常,它的执行频率是 99Hz(每秒99次),如果99次都返回同一个函数名,那就说明 CPU 这一秒钟都在执行同一个函数,可能存在性能问题。

$ sudo perf record -F 99 -p 13204 -g -- sleep 30

注:perf record表示记录,-F 99表示每秒99次,-p 13204是进程号,即对哪个进程进行分析,-g表示记录调用栈,sleep 30则是持续30秒。

执行之后会产生一个文本文件(perf.data)。为了便于阅读,使用 perf record 命令可以统计每个调用栈出现的百分比,然后从高到低排列。

$ sudo perf report -n --stdio

火焰图

火焰图是基于 perf 结果产生的 SVG 图片,用来展示 CPU 的调用栈。

  1. y 轴表示调用栈,每一层都是一个函数。调用栈越深,火焰就越高,顶部就是正在执行的函数,下方都是它的父函数。
  2. x 轴表示抽样数,如果一个函数在 x 轴占据的宽度越宽,就表示它被抽到的次数多,即执行的时间长。
  3. 注意,x 轴不代表时间,而是所有的调用栈合并后,按字母顺序排列的。

火焰图就是看顶层的哪个函数占据的宽度最大。只要有"平顶"(plateaus),就表示该函数可能存在性能问题。

颜色没有特殊含义,因为火焰图表示的是 CPU 的繁忙程度,所以一般选择暖色调。

互动性

火焰图是 SVG 图片,可以与用户互动。

鼠标悬浮显示

火焰的每一层都会标注函数名,鼠标悬浮时会显示完整的函数名、抽样抽中的次数、占据总抽样次数的百分比。

下面是一个例子。

mysqld'JOIN::exec (272,959 samples, 78.34 percent)

点击查看详细

在某一层点击,火焰图会水平放大,该层会占据所有宽度,显示详细信息。

查看详细信息

左上角会同时显示**"Reset Zoom"**,点击该链接,图片就会恢复原样。

搜索

按下 Ctrl + F 会显示一个搜索框,用户可以输入关键词或正则表达式,所有符合条件的函数名会高亮显示。

局限

在这两种情况下,无法画出火焰图,需要修正系统行为。

  1. 调用栈不完整

当调用栈过深时,某些系统只返回前面的一部分(比如前10层)。

  1. 函数名缺失

有些函数没有名字,编译器只用内存地址来表示(比如匿名函数)。

参考资料

  1. 如何读懂火焰图?
  2. 火焰图介绍论文
  3. 火焰图官方文档
  4. 火焰图生成工具

转载于:https://my.oschina.net/u/1033181/blog/3062986

你可能感兴趣的:(操作系统)