GO 记一次TcpServer性能优化

库存文章发布

写了一个TcpServer,主要功能是做终端的保活信息,保活信息中包含一些额外数据。并转发来自后端的命令至终端。
历经数日,各项基础功能完备,准备做一些压力测试。

服务器配置:

cpu family  : 6
model       : 63
model name  : Intel(R) Xeon(R) CPU E5-2620 v3 @ 2.40GHz
stepping    : 2
microcode   : 0x38
cpu MHz     : 1523.625
cache size  : 15360 KB

内存:16G

当然,了为压力测试,独立写了客户端测试程序,客户端也简单,实现连接和心跳(10秒一次)。

第一次测试,客户端数据过千就出错了,很明显,limit需要配置一下喽。 limit这个配置,说难不难,但每次记不住。

好文不敢独享, Linux TCP/IP 协议栈调优

第二次测试,客户端20k,貌似没问题,只是CPU使用率达到200%多,领导不同意,性能堪忧,并对go产生质疑,如此性能,怎么称霸宇宙!! 改去吧。

开始一次性能优化之旅:
1,首先,我们看到了性能问题,但我们不知道哪里有问题。于是需要工具帮我们调查,哪里慢了。这里pprof 工具出场性能试工具
虽然我的程序并不提供http服务,但我依然选择了http的方式,输出debug,因为我觉得这样方便

main.go
import (
    _ "net/http/pprof"
    "net/http"
)
....
    go func() {
        if pprofPort := utils.GetConfig("pprofPort").(string); pprofPort != "" {
            log.Warningf("pprof at http, %s", pprofPort)
            http.ListenAndServe(pprofPort, nil)
        }
    }()
....

使用 go tool pprof http://192.168.1.8:2205/debug/pprof/profile开始收集,大概30秒左右,出现命令提示符:

go tool pprof  http://192.168.1.8:2205/debug/pprof/profile

Fetching profile over HTTP from http://192.168.1.8:2205/debug/pprof/profile
.....30s

主要介绍两个命令:
一个叫top,显示耗时最长的代码。默认10个。可以使用 top5,top20随意查找。
一个叫list,根据top的结果,使用list+代码名称,产出结果如下,非常明确

(pprof) list _/Users/apple/GoglandProjects/MessageServer/server
Total: 13.36s
ROUTINE ======================== _/Users/apple/GoglandProjects/MessageServer/server.Depack in /Users/apple/GoglandProjects/MessageServer/server/receiveHandler.go
      20ms      180ms (flat, cum)  1.35% of Total
         .          .     68:// 如果有,返回一个完整的命令及余下的内容
         .          .     69:// 如果没有,新旧数据拼接返回。命令为空
         .          .     70:// buffer 表示旧的数据
         .          .     71:// newData 表示刚收到的数据
         .          .     72:func Depack(buffer, read []byte) (r, data []byte) {
         .       30ms     73:   if index := bytes.Index(read, []byte{13, 10}); index > -1 {
         .          .     74:       if (len(buffer) > 0) {
      20ms       40ms     75:           data = append(buffer, read[:index]...)
         .          .     76:       } else {
         .          .     77:           data = read[:index]
         .          .     78:       }
         .          .     79:
         .          .     80:       // 余下的内容,继续粘包
         .          .     81:       buffer = read[index+1:]
         .          .     82:       // 清理空白字符
         .      110ms     83:       data = bytes.TrimFunc(data, unicode.IsSpace)
         .          .     84:   } else {
         .          .     85:       // 如果没有,直接将新旧数据相连
         .          .     86:       buffer = append(buffer, read[:]...)
         .          .     87:   }
         .          .     88:   return data, buffer

接下来就是使用这两个命令,找到最消耗时间的代码块,然后优化。


最后完成版

你可能感兴趣的:(GO 记一次TcpServer性能优化)