简介:
strace - trace system calls and signals
在Linux中,进程不能直接访问硬件设备,当进程需要访问硬件设备(比如读取磁盘文件,接收网络数据等等)时,必须由用户态模式切换至内核态模式,通过系统调用访问硬件设备。strace可以跟踪到一个进程产生的系统调用,包括参数,返回值,执行消耗的时间。我们可以使用strace对应用的系统调用和信号传递的跟踪结果来对应用进行分析,以达到解决问题或者是了解应用工作过程的目的
用法:
strace的最简单的用法就是执行一个指定的命令,如:$ strace cat /dev/null 在命令结束之后它也就退出了。在命令执行的过程中,strace会记录和解析命令进程的所有系统调用以及这个进程所接收到的所有的信号值。
- ubuntu@ubuntu-s3:~$ strace cat /dev/null
- execve("/bin/cat", ["cat", "/dev/null"], [/* 19 vars */]) = 0
- brk(0) = 0x1679000
- access("/etc/ld.so.nohwcap", F_OK) = -1 ENOENT (No such file or directory)
- mmap(NULL, 8192, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f547f508000
- access("/etc/ld.so.preload", R_OK) = -1 ENOENT (No such file or directory)
- open("/etc/ld.so.cache", O_RDONLY|O_CLOEXEC) = 3
- fstat(3, {st_mode=S_IFREG|0644, st_size=16028, ...}) = 0
- mmap(NULL, 16028, PROT_READ, MAP_PRIVATE, 3, 0) = 0x7f547f504000
- close(3) = 0
- access("/etc/ld.so.nohwcap", F_OK) = -1 ENOENT (No such file or directory)
- open("/lib/x86_64-linux-gnu/libc.so.6", O_RDONLY|O_CLOEXEC) = 3
- read(3, "\177ELF\2\1\1\0\0\0\0\0\0\0\0\0\3\0>\0\1\0\0\0\200\30\2\0\0\0\0\0"..., 832) = 832
- fstat(3, {st_mode=S_IFREG|0755, st_size=1802936, ...}) = 0
- mmap(NULL, 3917016, PROT_READ|PROT_EXEC, MAP_PRIVATE|MAP_DENYWRITE, 3, 0) = 0x7f547ef2b000
- mprotect(0x7f547f0de000, 2093056, PROT_NONE) = 0
- mmap(0x7f547f2dd000, 24576, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED|MAP_DENYWRITE, 3, 0x1b2000) = 0x7f547f2dd000
- mmap(0x7f547f2e3000, 17624, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED|MAP_ANONYMOUS, -1, 0) = 0x7f547f2e3000
- close(3) = 0
- mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f547f503000
- mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f547f502000
- mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f547f501000
- arch_prctl(ARCH_SET_FS, 0x7f547f502700) = 0
- mprotect(0x7f547f2dd000, 16384, PROT_READ) = 0
- mprotect(0x60a000, 4096, PROT_READ) = 0
- mprotect(0x7f547f50a000, 4096, PROT_READ) = 0
- munmap(0x7f547f504000, 16028) = 0
- brk(0) = 0x1679000
- brk(0x169a000) = 0x169a000
- open("/usr/lib/locale/locale-archive", O_RDONLY|O_CLOEXEC) = 3
- fstat(3, {st_mode=S_IFREG|0644, st_size=2919792, ...}) = 0
- mmap(NULL, 2919792, PROT_READ, MAP_PRIVATE, 3, 0) = 0x7f547ec62000
- close(3) = 0
- fstat(1, {st_mode=S_IFCHR|0620, st_rdev=makedev(136, 1), ...}) = 0
- open("/dev/null", O_RDONLY) = 3
- fstat(3, {st_mode=S_IFCHR|0666, st_rdev=makedev(1, 3), ...}) = 0
- fadvise64(3, 0, 0, POSIX_FADV_SEQUENTIAL) = 0
- read(3, "", 32768) = 0
- close(3) = 0
- close(1) = 0
- close(2) = 0
- exit_group(0) = ?
每一行都是一条系统调用,等号左边是系统调用的函数名及其参数,右边是该调用的返回值,strace 显示这些调用的参数并返回符号形式的值。
strace [ -CdffhiqrtttTvxx ] [ -acolumn ] [ -eexpr ] ... [ -ofile ] [ -ppid ] ... [ -sstrsize ] [ -uusername ] [ -Evar=val ] ... [ -Evar ] ... [ command [ arg ... ] ]
strace -c [ -eexpr ] ... [ -Ooverhead ] [ -Ssortby ] [ command [ arg ... ] ]
选项:
-c #统计每一系统调用的所执行的时间,次数和出错的次数等.
-C #Like -c but also print regular output while processes are running
-d #输出strace自身的关于标准错误的调试信息.
-f #跟踪由fork调用所产生的子进程.
-ff #如果提供-o filename,则所有进程的跟踪结果输出到相应的filename.pid中,pid是各进程的进程号. 此与-c不兼容
-h #输出简要的帮助信息.
-i #打印系统调用时候的入口指针.
-q #禁止输出关于脱离的消息.
-r #进入每一个系统调用时打印一个相对时间戳,一个系统调用的开始和下一个系统调用接替时,两者之间的时间.
-t #在输出中的每一行前加上时间信息.
-tt #时间信息精确到微妙
-ttt #时间信息精确到微妙,而且时间表示为unix时间戳
-T #显示每一调用所耗的时间.
-v #Print unabbreviated versions of environment, stat, termios, etc. calls
-V #输出strace的版本信息.
-x #打印所有非ascii字符串以十六进制字符串格式显示。
-xx #所有字符串以十六进制形式输出.
-a column #设置返回值的输出位置.默认 为40.
-e expr #指定一个表达式,用来控制如何跟踪.格式如下:
[qualifier=][!]value1[,value2]...
qualifier只能是 trace,abbrev,verbose,raw,signal,read,write其中之一.value是用来限定的符号或数字.默认的 qualifier是 trace.感叹号是否定符号.例如: -eopen等价于 -e trace=open,表示只跟踪open调用.而-etrace!=open表示跟踪除了open以外的其他调用.有两个特殊的符号 all 和 none. 注意有些shell使用!来执行历史记录里的命令,所以要使用反斜杠
-e trace=set #只跟踪指定的系统调用.例如:-e trace=open,close,rean,write表示只跟踪这四个系统调用.默认的为set=all.
-e trace=file #只跟踪有关文件操作的系统调用.
-e trace=process #只跟踪有关进程控制的系统调用.
-e trace=network #跟踪与网络有关的所有系统调用.
-e strace=signal #跟踪所有与系统信号有关的 系统调用
-e trace=ipc #跟踪所有与进程通讯有关的系统调用
-e abbrev=set #设定 strace输出的系统调用的结果集.-v等与abbrev=none.默认为abbrev=all.
-e raw=set #将指 定的系统调用的参数以十六进制显示.
-e signal=set #指定跟踪的系统信号.默认为all.如 signal=!SIGIO(或者signal=!io),表示不跟踪SIGIO信号.
-e read=set #输出从指定文件中读出的数据.例如: -e read=3,5
-e write=set #输出写入到指定文件中的数据.
-o filename #将strace的输出写入文件filename
-O overhead #设置追踪系统的总开销(microseconds)
-p pid #跟踪指定的进程pid.
-s strsize #指定输出的字符串的最大长度.默认为32.文件名一直全部输出.
-S sortby #-c选项的输出以规定的标准显示为直方图
-u username #以username 的UID和GID执行被跟踪的命令
示例:
$ strace -o output.txt -T -tt -e trace=all -p PID
更多详情参考手册页