前言
按照strace官方的描述,strace是一个可用于诊断、调试和教学的Linux用户空间跟踪器。我们用它来监控用户空间进程和内核的交互,比如系统调用、信号传递,进程状态变更等,下面对strace命令进行讲解。
strace常用选项
-tt 在每行输出的前面,显示毫秒级别的时间
-T 显示每次系统调用所花费的时间
-v 对于某些相关调用,把完整的环境变量,文件stat结构等打出来。
-f 跟踪目标进程,以及目标进程创建的所有子进程
-e 控制要跟踪的事件和跟踪行为,比如指定要跟踪的系统调用名称
-o 把strace的输出单独写到指定的文件
-p 指定要跟踪的进程pid, 要同时跟踪多个pid, 重复多次-p选项即可。
追踪系统调用
现在我们做一个很简单的程序来演示strace的基本用法。这个程序的TCP server 代码如下:
#include
#include
#include
#include
#include
#include
#include
#include
#define MAX 80
#define PORT 8080
#define SA struct sockaddr
void func(int sockfd) {
char buff[MAX];
int n;
// infinite loop for chat
for (;;) {
bzero(buff, MAX);
//读取客户端发送的消息
read(sockfd, buff, sizeof(buff));
// print buffer which contains the client contents
printf("From client: %s\t To client : ", buff);
bzero(buff, MAX);
n = 0;
//将读取内容原封不动地发送回去
while ((buff[n++] = getchar()) != '\n')
;
write(sockfd, buff, sizeof(buff));
if (strncmp("exit", buff, 4) == 0) {
printf("Server Exit...\n");
break;
}
}
}
int main(int argc, char const *argv[]){
int sockfd, connfd, len;
struct sockaddr_in servaddr, cli;
sockfd = socket(AF_INET, SOCK_STREAM, 0);
if (sockfd == -1) {
printf("socket creation failed...\n");
exit(0);
}
else
printf("Socket successfully created..\n");
//初始化服务端socket信息
bzero(&servaddr, sizeof(servaddr));
//使用默认的ip和port
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
servaddr.sin_port = htons(PORT);
//绑定指定ip和端口
if ((bind(sockfd, (SA*)&servaddr, sizeof(servaddr))) != 0) {
printf("socket bind failed...\n");
exit(0);
}
else
printf("Socket successfully binded..\n");
// 现在服务器已经准备好监听
if ((listen(sockfd, 5)) != 0) {
printf("Listen failed...\n");
exit(0);
}
else
printf("Server listening..\n");
len = sizeof(cli);
//处理来自客户端的连接
connfd = accept(sockfd, (SA*)&cli, &len);
if (connfd < 0) {
printf("server acccept failed...\n");
exit(0);
}
else
printf("server acccept the client...\n");
func(connfd);
// 关闭套接字
close(sockfd);
}
然后我们用gcc server.c -o server 编译一下,得到一个可执行的文件server。然后用strace调用执行,查看输出参数含义:
从上面的信息来看,每一行都是一条系统调用,等号左边是系统调用的函数名及其参数,右边是该调用的返回值。
strace 显示这些调用的参数并返回符号形式的值。strace 从内核接收信息,而且不需要以任何特殊的方式来构建内核。
系统调用统计
还是上面那个例子,运行的server服务,然后打开另外一个终端窗口,输入如下的命令,查看pid
运行的server服务:
查看pid:
得到其pid 3371然后就可以用strace跟踪其执行:
完成跟踪时,按ctrl + C 结束strace即可。
跟踪服务程序
跟踪3371进程的所有系统调用(-e trace=all),并统计系统调用的花费时间,以及开始时间(并以可视化的时分秒格式显示)。
strace可以使用参数-T将每个系统调用所花费的时间打印出来。-tt 输出结果精确到微妙。
最后将记录结果存在output.txt文件里面。
总结
当发现进程或服务异常时,我们可以通过strace来跟踪其系统调用。如果不知道系统调用,可以看这篇Linux 系统调用和库函数的区别,熟悉常用系统调用,能够更好地理解和使用strace。
参考:https://www.linuxidc.com/Linux/2018-01/150654.htm