二进制工具:nm_列出目标文件中的符号表]

一.nm介绍

nm用来列出目标文件的符号清单.这里的目标文件,一般是指.a扩展名的静态连接库文件和编译过的目标文件.
linux下的有两种库文件,一种是动态连接库(.so),一种是静态连接库(.a).
nm就是可以用来显示一个静态连接库中符号列表的工具.

二.nm基本用法

下面以一个例子介绍nm的使用方法.

1.编写源文件

分别建立2个文件,bill.c和fred.c.

//bill.c
#include <stdio.h>
void bill(char *arg)
{
  printf("bill: you passed %s\n",arg);
}
// fred.c
#include <stdio.h>
void fred(int arg)
{
  printf("fred: you passwd %d\n",arg);
}

2.编译为目标文件

# gcc -c bill.c fred.c
# nm bill.o
0000000000000000 T bill
                 U printf

3.制作成静态库

# ar crv libfoo.a bill.o fred.o
# nm libfoo.a
bill.o:
0000000000000000 T bill
                 U printf

fred.o:
0000000000000000 T fred
                 U printf

三.nm命令的格式

nm [-a|--debug-syms] [-g|--extern-only] [-B][-C|--demangle] [-D|--dynamic] [-s|--print-armap]
[-o|--print-file-name] [-n|--numeric-sort][-p|--no-sort] [-r|--reverse-sort] [--size-sort]
[-u|--undefined-only] [-l|--line-numbers] [--help][--version] [-t radix|--radix=radix]
[-P|--portability] [-f format|--format=format][--target=bfdname] [objfile...]

  如果没有为nm命令指出目标文件,则nm假定目标文件是a.out.下面列出该命令的任选项,大部分支持"-"开头的短格式和"—"开头的长格式.

-A、-o或--print-file-name:在找到的各个符号的名字前加上文件名,而不是在此文件的所有符号前只出现文件名一次.

-a或--debug-syms:显示调试符号.
-B:等同于--format=bsd,用来兼容MIPS的nm.
-C或--demangle:将低级符号名解码(demangle)成用户级名字.这样可以使得C++函数名具有可读性.
-D或--dynamic:显示动态符号.该任选项仅对于动态目标(例如特定类型的共享库)有意义.
-f format:使用format格式输出.format可以选取bsd、sysv或posix,该选项在GNU的nm中有用.默认为bsd.
-g或--extern-only:仅显示外部符号.
-n、-v或--numeric-sort:按符号对应地址的顺序排序,而非按符号名的字符顺序.
-p或--no-sort:按目标文件中遇到的符号顺序显示,不排序.
-P或--portability:使用POSIX.2标准输出格式代替默认的输出格式.等同于使用任选项-f posix.
-s或--print-armap:当列出库中成员的符号时,包含索引.索引的内容包含:哪些模块包含哪些名字的映射.
-r或--reverse-sort:反转排序的顺序(例如,升序变为降序).
--size-sort:按大小排列符号顺序.该大小是按照一个符号的值与它下一个符号的值进行计算的.
-t radix或--radix=radix:使用radix进制显示符号值.radix只能为"d"表示十进制、"o"表示八进制或"x"表示十六进制.
--target=bfdname:指定一个目标代码的格式,而非使用系统的默认格式.
-u或--undefined-only:仅显示没有定义的符号(那些外部符号).
-l或--line-numbers:对每个符号,使用调试信息来试图找到文件名和行号.对于已定义的符号,查找符号地址的行号.对于未定义符号,查找指向符号重定位入口的行号.如果可以找到行号信息,显示在符号信息之后.
-V或--version:显示nm的版本号.
--help:显示nm的任选项. 

   对于每一个符号,nm列出其值(the symbol value),类型(the symbol type)和其名字(the symbol name)。

符号
类型
说明
A
该符号的值是绝对的,在以后的链接过程中,不允许进行改变。这样的符号值,常常出现在中断向量表中,例如用符号来表示各个中断向量函数在中断向量表中的位置。
B
该符号的值出现在非初始化数据段 (bss) 中。例如,在一个文件中定义全局 static int test 。则该符号 test 的类型为 b ,位于 bss section 中。其值表示该符号在 bss 段中的偏移。一般而言, bss 段分配于 RAM
C
该符号为 common common symbol 是未初始话数据段。该符号没有包含于一个普通 section 中。只有在链接过程中才进行分配。符号的值表示该符号需要的字节数。例如在一个 c 文件中,定义 int test ,并且该符号在别的地方会被引用,则该符号类型即为 C 。否则其类型为 B
D
该符号位于初始话数据段中。一般来说,分配到 data section 中。例如定义全局 int baud_table[5] = {9600, 19200, 38400, 57600, 115200} ,则会分配于初始化数据段中
G
该符号也位于初始化数据段中。主要用于 small object 提高访问 small data object 的一种方式。
I
该符号是对另一个符号的间接引用。
N
该符号是一个 debugging 符号。
R
该符号位于只读数据区。例如定义全局 const int test[] = {123, 123}; test 就是一个只读数据区的符号。注意在 cygwin 下如果使用 gcc 直接编译成 MZ 格式时,源文件中的 test 对应 _test ,并且其符号类型为 D ,即初始化数据段中。但是如果使用 m6812-elf-gcc 这样的交叉编译工具,源文件中的 test 对应目标文件的 test, 即没有添加下划线,并且其符号类型为 R 。一般而言,位于 rodata section 。值得注意的是,如果在一个函数中定义 const char *test = “abc”, const char test_int = 3 。使用 nm 都不会得到符号信息,但是字符串“ abc ”分配于只读存储器中, test rodata section 中,大小为 4
S
符号位于非初始化数据区,用于 small object
T
该符号位于代码区 text section
U
该符号在当前文件中是未定义的,即该符号的定义在别的文件中。例如,当前文件调用另一个文件中定义的函数,在这个被调用的函数在当前就是未定义的;但是在定义它的文件中类型是 T 。但是对于全局变量来说,在定义它的文件中,其符号类型为 C ,在使用它的文件中,其类型为 U
V
该符号是一个 weak object
W
The symbol is a weak symbol that has not been specifically tagged as a weak object symbol.
-
该符号是 a.out 格式文件中的 stabs symbol
?
该符号类型没有定义

你可能感兴趣的:(linux,object,gcc,table,工具,debugging)