目录
C语言的程序到底是怎样生成的呢?又怎样去执行呢?我们来探索。本篇是讲解编译环境。
在ANSI C(标准C语言)的任何一种实现中,存在两个不同的环境。第一种是翻译环境,在这个环境中源代码.c被转换为可执行的机器指令.exe,第二种是执行环境,它用于实际执行代码。
test.c----->test.i------->test.s----->test.obj----->test.exe
程序的翻译环境同时又分为两个阶段 编译 和 链接
- 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。
- 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
- 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。
- 在windows环境下,生成相应的目标文件test.obj
- 在Linux环境下,生成的目标文件是test.o
- test.c源文件---------->test.obj目标文件+链接库------------>test.exe可执行程序
理解图:
以我们的VS编译器为例子。编译和链接依赖的是什么工具呢?
- #include
- int main()
- {
- printf("hehe\n");
- return 0;
- }
其实编译本身也分为几个阶段:预编译(预处理) 编译 汇编 这三个阶段。我们接下来分别探索一下这三个阶段分别干了什么事情。我们整个过程都在 : Linux环境下,使用gcc编译器去验证整个过程。test.c------->test.i--------->test.s----->test.o(test.obj)
具体要用到的指令:
我们想要展示一个预处理的效果,那我们希望预处理之后这个代码就不会往后继续执行了。这里我们要用到一个gcc的指令: -E test.c / test.c -E(预处理之后test.c代码不会往后继续执行)
在我们VS验证之后我们发现我们预处理的文件名为test.i 所以这里在Linux环境下,我们使用gcc指令:-o test.i (把test.c预处理完之后的文件命名为test.i,如果没有指定就直接打印在屏幕上了)
在观察了test.c和test.i两个文件差异我们发现预处理对源代码做了一些文本操作处理的。
在我们的下篇博客我们也会详细去讲到预处理这个阶段的知识点。
注释的删除
头文件的包含
来到我们的编译阶段,我们想要展示一个编译的效果,那我们希望编译之后这个代码就不会往后继续执行了。这里我们要用到一个gcc的指令: -S test.i / test.i -S(编译之后test.i代码不会往后继续执行)
同时我们也可以使用gcc指令:-o test.s (把test.i编译完之后的文件命名为test.s,如果没有指定也会生成test.s)
我们发现test.s里面放置的都是汇编代码。 其实编译的过程就是:把C语言代码翻译成了汇编代码。这个过程是非常非常复杂的。简单来说,编译这个过程包含:
到这里,汇编语言依旧不能被我们计算机读懂,汇编语言必须经过汇编器转化成二进制指令,才能被计算机读懂。
我们想要展示一个汇编的效果,那我们希望汇编之后这个代码就不会往后继续执行了。这里我们要用到一个gcc的指令: -c test.s / test.s -c(汇编之后test.s代码不会往后执行)
同时我们也可以使用gcc指令:-o test.o(test.obj) (把test.s汇编完之后的文件命名为test.o,如果没有指定也会生成test.o)
我们发现test.o里面放置的都是二进制信息代码。 其实汇编的过程就是:把汇编代码翻译成二进制指令(目标文件)。到此为止,计算机看得懂了。
现在我们的目标文件test.obj 在gcc指令下:gcc test.o(test.obj) -o test.c(test.exe) (把test.o链接完之后的文件命名为test.c,如果没有指定也会生成test.c(其实就是test.exe可执行程序)
上面在学习编译/汇编/链接这几个阶段,我们发现他们有一个公共的点。
这些功能的实现应用在多文件的工程的项目里。
那编译器是如何处理这种多文件的定义和声明的呢?下面我们来深入学习一下。
当每个源文件经过编译器都会发生符号汇总。一般都是全局变量汇总,局部变量一般不会汇总。
为什么只有全局变量才会汇总,因为只有全局变量才会跨文件使用。所以一般只会汇总全局变量
在符号表汇总的时候,编译器会为每个文件的全局变量分配地址。
此刻这个阶段每个.o目标文件都有自己的符号表。
像上面的test.o和add.o文件都有自己的符号表。我们需要知道的是:
接下来,把相同段的目标文件的数据进行锁定和合并成二进制的可执行文件。
合并完段表,我们就要进行符号表的合并和重新定位。
当编译器在编译阶段想要去查找的时候,都是去符号表里面根据地址查找。
当我们在执行程序的时候,经常发生这样的错误。❌❌
【推荐书籍】《程序员的自我修养》
【VIM学习资料】
【给程序员的VIM速查卡】
https://coolshell.cn/articles/5479.html
✔✔✔✔✔最后,感谢大家的阅读,若有错误和不足,欢迎指正!我想说:最近有很多小伙伴和我交流说学不懂,告诉大家,一定要有耐性哦,乖乖敲代码,留给自己足够的时间与耐性。慢慢悟,学着学着自然就会了
希望大家都有好好学习,好好敲代码。好好生活哦
代码------→【gitee:唐棣棣 (TSQXG) - Gitee.com】
联系------→【邮箱:2784139418@qq.com】