profile在计算机领域,我们可以将其理解为当前应用程序运行状态的画像。当程序性能不佳时,我们希望知道应用在 什么地方耗费了多少 CPU、memory等资源,golang是非常注重性能的语言,其内置的pprof就是为了分析调优程序运行性能而生。
pprof主要模块介绍:
pprof引入代码有两种方式,一种是项目中导入runtime/pprof
,主要用来产生dump文件,然后再使用 Go Tool PProf 来分析这运行日志,此种方式在普通的单机程序未使用http网络服务上使用。另一种方式是项目中导入net/http/pprof
,net/http/pprof是对runtime/pprof的封装,如果当前程序已启用http服务,使用此种方式非常方便,以做到直接在web上看到当前 web 服务的状态,包括 CPU 占用情况和内存使用情况等,由于我当前参与的项目都会开启http,因此本文主要介绍第二种方式。
使用import "net/http/pprof"
也可以很方面的集成到我们代码中,其方式如下:
//再main包中加入
import _ "net/http/pprof"
其调用pprof的init函数如下:
//pprof.go
func init() {
http.HandleFunc("/debug/pprof/", Index)
http.HandleFunc("/debug/pprof/cmdline", Cmdline)
http.HandleFunc("/debug/pprof/profile", Profile)
http.HandleFunc("/debug/pprof/symbol", Symbol)
http.HandleFunc("/debug/pprof/trace", Trace)
}
可以看到其把相关的路由加到DefaultServeMux路由器中了,如果我们程序开启了http服务,并使用HTTP默认路由分发器DefaultServeMux,则只需要再main包中导入import _ "net/http/pprof"
,即可通过"http://ip:port/debug/pprof"进行pprof接口访问,如果程序未开启使用默认路由器的http服务,可再main函数中开启一个httpserver即可,如下例子:
package main
import (
"log"
"net/http"
_ "net/http/pprof"
)
func main() {
go func() {
http.ListenAndServe("0.0.0.0:9009", nil)//开启一个http服务,nil表示绑定默认路由器DefaultServeMux
}()
// ... rest of the program ...
}
如果程序开启了http服务器,并自定义了路由器ServeMux,则只需要把pprof相关的路径加入到自定义的ServeMux中即可,不需要单独开启http服务:
r := http.NewServeMux()
r.HandleFunc("/debug/pprof/", pprof.Index)
r.HandleFunc("/debug/pprof/cmdline", pprof.Cmdline)
r.HandleFunc("/debug/pprof/profile", pprof.Profile)
r.HandleFunc("/debug/pprof/symbol", pprof.Symbol)
r.HandleFunc("/debug/pprof/trace", pprof.Trace)
http.ListenAndServe("0.0.0.0:9009", r)//程序业务的httpserver,自定义了mux,需要把pprof的路径加进去ike
以上三种方式都可开启pprof,最好的方式还是把pprof集成到当前已开启的httpserver中去,如果http的server采用默认的servermux,则只需要在main中导入
import _ "net/http/pprof"
即可通过http://ip:port/debug/pprof
来访问。
假设本机启动,http端口为9009,启动程序后访问:http://127.0.0.1:9009/debug/pprof
,即可看到pprof>监控界面:
还可直接访问如下几个路径:
可通过网页进行分析,通过http://127.0.0.1:9009/debug/pprof
打开pprof网页,点击各个分类可直接进入日志文件,页面各个分类解释如下:
通过网页方式分析,可看整体情况,比如gotouine持续增多,说明有go程未被正确释放,但是器可读性不高,一般可以通过go tool方式进行分析。
分析代码中内存占用较大的地方,分析潜在的内存泄漏,优化内存分配,示例代码如下:
package main
import (
"fmt"
"net/http"
_ "net/http/pprof"
"time"
)
func main() {
fmt.Println("hello world")
go func() {
http.ListenAndServe("0.0.0.0:9009", nil)
}()
go gotest()
done := make(chan any)
<-done
}
func gotest() {
a := make([]int, 0)
for {
fmt.Println("go test")
a = append(a, []int{9: 10}...)
fmt.Println("go test,len(a):", len(a))
time.Sleep(time.Duration(5) * time.Second)
}
}
运行后在终端执行命令:go tool pprof -inuse_space http://127.0.0.1:9009/debug/pprof/heap
参数说明:
下载后得到可交互的命令行,然后输入top10,来查看正在使用的对象较多的10个函数入口。通常用来检测有没有不符合预期的内存对象引用。
参数解释:
上图中可以根据list [函数名] 查看main函数详细内存分配情况:
list main
可查看main函数查看具体函数占用情况
通过执行如下命令:go tool pprof -alloc_objects http://127.0.0.1:9009/debug/pprof/heap
看下临时内存分配情况,步骤同上(top10->list main)
list main命令之后,可以看到具体再append函数,内存一直增长,应该对代码进行优化。
top -cum命令:-cum表示将函数调用关系中的数据进行累积,比如A函数调用的B函数,则B函数中的内存分配量也会累积到A上面,这样能够明确定位到那个函数内存出现问题。
执行: go tool pprof http://127.0.0.1:9009/debug/pprof/profile
会搜集30s对cpu采样,对cpu性能进行分析,可查看正在使用的一些CPU相关信息
从上图可以看出gotest函数占用过多cpu,list gotest 可以看到里面有一个死循环。
执行命令:go tool pprof http://127.0.0.1:9009/debug/pprof/goroutine
可以查看当前goroutine的信息
输入:trace
可以打出各个goroutine的调用栈
从图中可以看出main启动的gotest较多,阻塞再runtime/gopark,又读取chan引起的,也可以通过’traces runtime.gopark’ 查看那些方法最终阻塞
锁的问题可能导致程序运行缓慢,pprof mutex 相关的需要设置采样率,再main函数中加入runtime.SetMutexProfileFraction(1)
执行命令:go tool pprof http://127.0.0.1:9009/debug/pprof/mutex
通过top->traces [函数] ->list [函数]
最终可以可以检查出那个锁耗时较大
同样需要设置采样率:runtime.SetBlockProfileRate(1)
执行命令:go tool pprof http://127.0.0.1:9009/debug/pprof/block
主要是记录goroutine阻塞等待同步的位置,通过top->traces [函数] ->list [函数],查看等待位置
从图中可以看到最终阻塞的地方