在 Linux中,一切皆文件。 Linux 编程实际上是编写处理各种文件的代码。系统由许多类型的文件组成,但目标文件具有一种特殊的设计,提供了灵活和多样的用途。
目标文件是包含带有附加地址和值的助记符号的路线图。这些符号可以用来对各种代码段和数据段进行命名,包括经过初始化的和未初始化的。它们也可以用来定位嵌入的调试信息,就像语义 Web,非常适合由程序进行阅读。
objdump命令是Linux下的反汇编目标文件或者可执行文件的命令,它以一种可阅读的格式让你更多地了解二进制文件可能带有的附加信息。
另外需要讲一下符号表,后面会用到。我们平时无论是在Linux上还是windows上用到的可执行程序。可执行程序的生成并不是一蹴而就而是代码经过预处理,编译,汇编和链接而成。编译只是将我们自己写的代码变成了二进制形式,它还需要和系统组件(比如标准库、动态链接库等)结合起来,这些组件都是程序运行所必须的。链接(Link)其实就是一个“打包”的过程,它将所有二进制形式的目标文件和系统组件组合成一个可执行文件。完成链接的过程也需要一个特殊的软件,叫做链接器(Linker)。经过编译链接后,代码中的各种符号都被分配了地址,并将各种信息记录在符号表中。
符号表用来体现作用域与可见性信息,符号表中语言符号可分为关键字符号,操作符符号及标识符符号。
符号表的作用:
符号表中的标识符一般设置的属性项目有:
选项 | 详细选项 | 描述 |
-a | --archive-headers | 显示档案库的成员信息,类似 ls -l 将 lib*.a 的信息列出。 |
-b bfdname | --target=bfdname | 指定目标码格式。这不是必须的,objdump 能自动识别许多格式,比如: objdump -b oasys -m vax -h fu.o 显示 fu.o 的头部摘要信息,明确指出该文件是 Vax 系统下用 Oasys 编译器生成的目标文件。objdump -i 将给出这里可以指定的目标码格式列表。 |
-C | --demangle | 将底层的符号名解码成用户级名字,除了去掉所开头的下划线之外,还使得C++函数名以可理解的方式显示出来。 |
-g | --debugging | 显示调试信息。企图解析保存在文件中的调试信息并以 C 语言的语法显示出来。仅仅支持某些类型的调试信息。有些其他的格式被 readelf -w 支持。 |
-e | --debugging-tags | 类似 -g 选项,但是生成的信息是和 ctags 工具相兼容的格式。 |
-d | --disassemble | 从 objfile 中反汇编那些特定指令机器码的 section。 |
-D | --disassemble-all | 与 -d 类似,但反汇编所有 section. |
--prefix-addresses | 反汇编的时候,显示每一行的完整地址。这是一种比较老的反汇编格式。 | |
-EB | ||
-EL | --endian={big|little} | 指定目标文件的小端。这个项将影响反汇编出来的指令。在反汇编的文件没描述小端信息的时候用。例如 S-records. |
-f | --file-headers | 显示 objfile 中每个文件的整体头部摘要信息。 |
-h | --section-headers --headers | 显示目标文件各个section的头部摘要信息。 |
-H | --help | 简短的帮助信息。 |
-i | --info | 显示对于 -b 或者 -m 选项可用的架构和目标格式列表。 |
-j name | --section=name | 仅仅显示指定名称为 name 的 section 的信息 |
-l | --line-numbers | 用文件名和行号标注相应的目标代码,仅仅和 -d、-D 或者 -r 一起使用使用 -ld 和使用 -d 的区别不是很大,在源码级调试的时候有用,要求编译时使用了 -g 之类的调试编译选项。 |
-m machine | --architecture=machine | 指定反汇编目标文件时使用的架构,当待反汇编文件本身没描述架构信息的时候(比如 S-records),这个选项很有用。可以用 -i 选项列出这里能够指定的架构. |
-r | --reloc | 显示文件的重定位入口。如果和 -d 或者 -D 一起使用,重定位部分以反汇编后的格式显示出来。 |
-R | --dynamic-reloc | 显示文件的动态重定位入口,仅仅对于动态目标文件意义,比如某些共享库。 |
-s | --full-contents | 显示指定 section 的完整内容。默认所有的非空 section 都会被显示。 |
-S | --source | 尽可能反汇编出源代码,尤其当编译的时候指定了 -g 这种调试参数时,效果比较明显。隐含了 -d 参数。 |
--show-raw-insn | 反汇编的时候,显示每条汇编指令对应的机器码,如不指定 --prefix-addresses,这将是缺省选项。 | |
--no-show-raw-insn | 反汇编时,不显示汇编指令的机器码,如不指定 --prefix-addresses,这将是缺省选项。 | |
--start-address=address | 从指定地址开始显示数据,该选项影响 -d、-r 和 -s 选项的输出。 | |
--stop-address=address | 显示数据直到指定地址为止,该项影响 -d、-r 和 -s 选项的输出。 | |
-t | --syms | 显示文件的符号表入口。类似于 nm -s 提供的信息 |
-T | --dynamic-syms | 显示文件的动态符号表入口,仅仅对动态目标文件意义,比如某些共享库。它显示的信息类似于 nm -D | --dynamic 显示的信息。 |
-V | --version | 版本信息 |
--all-headers | -x | 显示所可用的头信息,包括符号表、重定位入口。-x 等价于 -a -f -h -r -t 同时指定。 |
-z | --disassemble-zeroes | 一般反汇编输出将省略大块的零,该选项使得这些零块也被反汇编。 |
@file | 可以将选项集中到一个文件中,然后使用这个 @file 选项载入 |
创建一个test.c并生成可执行文件test
gcc -g test.c -o test
- #include
-
- int add(int a, int b)
- {
- return a+b;
- }
- int sub(int a, int b)
- {
- return a-b;
- }
-
- int main()
- {
- int a = 88;
- int b = 66;
-
- int sum = add(a, b);
- printf("a=%d, b=%d, a+b=%d\n", a, b, sum);
-
- int dif = sub(a, b);
- printf("a=%d, b=%d, a-b=%d\n", a, b, dif);
- }
- objdump -D test | less
- objdump -S test | less
objdump -D命令来查看test的汇编代码。
objdump -S命令来以汇编和源代码的形式查看test的代码。
可以使用以下命令来查看可执行文件中的函数调用地址:
objdump -d -j .plt test
可以使用以下命令来查看共享库中函数的地址:
objdump -T /lib/libc.so.6
上述命令将显示共享库libc.so.6中所有函数的地址。
可以使用以下命令来查看可执行文件中的符号表:
objdump -t test
可以在符号表中找到sub,add的地址
- [root@localhost testEg]# objdump -t test
-
- test: file format elf64-x86-64
-
- SYMBOL TABLE:
- 0000000000400238 l d .interp 0000000000000000 .interp
- 0000000000400254 l d .note.ABI-tag 0000000000000000 .note.ABI-tag
- 0000000000400274 l d .note.gnu.build-id 0000000000000000 .note.gnu.build-id
- 0000000000400298 l d .gnu.hash 0000000000000000 .gnu.hash
- 00000000004002b8 l d .dynsym 0000000000000000 .dynsym
- 0000000000400318 l d .dynstr 0000000000000000 .dynstr
- 0000000000400358 l d .gnu.version 0000000000000000 .gnu.version
- 0000000000400360 l d .gnu.version_r 0000000000000000 .gnu.version_r
- 0000000000400380 l d .rela.dyn 0000000000000000 .rela.dyn
- 0000000000400398 l d .rela.plt 0000000000000000 .rela.plt
- 00000000004003c8 l d .init 0000000000000000 .init
- 00000000004003f0 l d .plt 0000000000000000 .plt
- 0000000000400420 l d .plt.got 0000000000000000 .plt.got
- 0000000000400430 l d .text 0000000000000000 .text
- 0000000000400634 l d .fini 0000000000000000 .fini
- 0000000000400640 l d .rodata 0000000000000000 .rodata
- 0000000000400678 l d .eh_frame_hdr 0000000000000000 .eh_frame_hdr
- 00000000004006c0 l d .eh_frame 0000000000000000 .eh_frame
- 0000000000600e10 l d .init_array 0000000000000000 .init_array
- 0000000000600e18 l d .fini_array 0000000000000000 .fini_array
- 0000000000600e20 l d .jcr 0000000000000000 .jcr
- 0000000000600e28 l d .dynamic 0000000000000000 .dynamic
- 0000000000600ff8 l d .got 0000000000000000 .got
- 0000000000601000 l d .got.plt 0000000000000000 .got.plt
- 0000000000601028 l d .data 0000000000000000 .data
- 000000000060102c l d .bss 0000000000000000 .bss
- 0000000000000000 l d .comment 0000000000000000 .comment
- 0000000000000000 l df *ABS* 0000000000000000 crtstuff.c
- 0000000000600e20 l O .jcr 0000000000000000 __JCR_LIST__
- 0000000000400460 l F .text 0000000000000000 deregister_tm_clones
- 0000000000400490 l F .text 0000000000000000 register_tm_clones
- 00000000004004d0 l F .text 0000000000000000 __do_global_dtors_aux
- 000000000060102c l O .bss 0000000000000001 completed.6355
- 0000000000600e18 l O .fini_array 0000000000000000 __do_global_dtors_aux_fini_array_entry
- 00000000004004f0 l F .text 0000000000000000 frame_dummy
- 0000000000600e10 l O .init_array 0000000000000000 __frame_dummy_init_array_entry
- 0000000000000000 l df *ABS* 0000000000000000 test.c
- 0000000000000000 l df *ABS* 0000000000000000 crtstuff.c
- 00000000004007f0 l O .eh_frame 0000000000000000 __FRAME_END__
- 0000000000600e20 l O .jcr 0000000000000000 __JCR_END__
- 0000000000000000 l df *ABS* 0000000000000000
- 0000000000600e18 l .init_array 0000000000000000 __init_array_end
- 0000000000600e28 l O .dynamic 0000000000000000 _DYNAMIC
- 0000000000600e10 l .init_array 0000000000000000 __init_array_start
- 0000000000400678 l .eh_frame_hdr 0000000000000000 __GNU_EH_FRAME_HDR
- 0000000000601000 l O .got.plt 0000000000000000 _GLOBAL_OFFSET_TABLE_
- 0000000000400630 g F .text 0000000000000002 __libc_csu_fini
- 0000000000601028 w .data 0000000000000000 data_start
- 000000000040051d g F .text 0000000000000014 add
- 000000000060102c g .data 0000000000000000 _edata
- 0000000000400634 g F .fini 0000000000000000 _fini
- 0000000000000000 F *UND* 0000000000000000 printf@@GLIBC_2.2.5
- 0000000000000000 F *UND* 0000000000000000 __libc_start_main@@GLIBC_2.2.5
- 0000000000601028 g .data 0000000000000000 __data_start
- 0000000000000000 w *UND* 0000000000000000 __gmon_start__
- 0000000000400648 g O .rodata 0000000000000000 .hidden __dso_handle
- 0000000000400640 g O .rodata 0000000000000004 _IO_stdin_used
- 00000000004005c0 g F .text 0000000000000065 __libc_csu_init
- 0000000000601030 g .bss 0000000000000000 _end
- 0000000000400430 g F .text 0000000000000000 _start
- 000000000060102c g .bss 0000000000000000 __bss_start
- 0000000000400547 g F .text 0000000000000070 main
- 0000000000601030 g O .data 0000000000000000 .hidden __TMC_END__
- 0000000000400531 g F .text 0000000000000016 sub
- 00000000004003c8 g F .init 0000000000000000 _init
objdump -h test.o
紧接着可以用nm查看函数和全局变量,静态变量
- [root@localhost testEg]# nm test.o
- 0000000000000000 T add
- 000000000000002a T main
- U printf
- 0000000000000014 T sub
局部变量不会生成符号,最终是分配在栈内存中,不会在函数外部被引用