#include <stdio.h>
int main() {
printf("Hello, World!\n");
return 0;
}
上面这段代码,通过 gcc main.c 编译 ,会生成a.out 文件。然后通过 ./a.out 执行。会发现控制台有Hello World 打印出来。
事实上,上面的过程可以分解为4个步骤
预编译(Prepressing)->编译(Compilation)->汇编(Assembly)->链接(Linking)
预编译 命令: gcc -E main.c -o main.i
编译过程就是把预处理完的文件进行一系列的词法分析,语法分享,语义分析和优化后生成相应的汇编代码文件,这个过程往往是我们所说的整个程序构建的核心部分,也是最复杂的部分之一。
编译命令:gcc -S main.c -o main.s
执行完后得到汇编代码的输出文件main.s.
汇编器是将汇编代码转变成机器可以执行的指令,每一个汇编语句几乎都对应一条机器指令。所以汇编器的汇编过程相对于编译器来说比较简单那,他没有复杂的语法,也没有语义,也不需要作指令优化。只是根据汇编指令和机器指令的对照表一一翻译就行了。
汇编命令 as main.s -o main.o 或者 gcc -c main.s -o main.o
gcc -c main.c -o hello.o
链接通常是一个让人费解的过程,为什么汇编器不直接输出可执行文件而是输出一个目标文件。
很久之前,人们开发代码都是在一个文件里面,然后那个文件里面的代码随着功能的增多会变得异常臃肿,导致维护很困难。于是后面的模块化编程方式就出现了。若干个变量和函数组成一个模块,存放在一个".c"的源代码文件里,然后这些源代码文件按照目录结构来组织。在一个软件程序被分割成很多个模块后,就需要解决模块之间如何通信的问题,一种是模块见得函数调用,另一种是模块间的变量访问。函数访问需要知道目标函数的地址,变量访问也需要知道目标变量的地址,所以两种方式可以归结为一种方式,那就是模块间符号的应用。这个模块间的拼接过程就是链接
链接过程主要包括了地址和空间分配,符号决议和重定位这些步骤。
比如我们再main.c 模块中调用了另一个模块的foo()方法,由于每个c文件是单独编译的,所以我们并不知道foo的地址是什么。于是在链接的时候,链接器就会帮我们把main.c 的foo 方法的地址填充好。地址的分配和填充由链接器完成,这大大的提高了程序员的效率,如果要手动填写地址无法想象是多么庞大的工作量。