• 程序执行的四个阶段


    程序执行的四个阶段

    对于一段helloc.c的程序

    #include 
    
    int main()
    {
        printf("hello, world\n");
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    为了在系统上运行程序,每条C语句都必须被其他程序转化为一系列的低级机器语言指令。然后这些指令按照一种称为可执行目标程序的格式打好包,并以二进制磁盘文件的形式存放起来。目标程序也称为可执行目标文件。

    Unix系统上,从源文件到目标文件的转化是由编译器驱动程序完成的:

    linux> gcc -o hello hello.c

    在这里,GCC编译器驱动程序读取源程序文件hello.c,并把它翻译成一个可执行目标文件 hello。这个翻译过程可分为四个阶段完成,如图所示。执行这四个阶段的程序(预处理器、编译器、汇编器和链接器)一起构成了编译系统(compilation system)。
    在这里插入图片描述

    • 预处理阶段:预处理器(cpp)根据以字符#开头的命令,修改原始的C程序。比如hello.c中第1行的#include 命令告诉预处理器读取系统头文件stdio.h的内容,并把它直接插入程序文本中。结果就得到了另一个C程序,通常是以.i作为文件扩展名。

    • 编译阶段:编译器(cc1)将文本文件hello.i翻译成文本文件hello.s,它包含一个汇编语言程序。该程序包含函数main的定义,如下所示:

    main:
    .LFB0:
            .cfi_startproc
            pushq   %rbp
            .cfi_def_cfa_offset 16
            .cfi_offset 6, -16
            movq    %rsp, %rbp
            .cfi_def_cfa_register 6
            movl    $.LC0, %edi
            call    puts
            movl    $0, %eax
            popq    %rbp
            .cfi_def_cfa 7, 8
            ret
            .cfi_endproc
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    定义中每条语句都以一种文本格式描述了一条低级机器语言指令。汇编语言是非常有用的,因为它为不同高级语言的不同编译器提供了通用的输出语言。例如,C编译器和Fortran编译器产生的输出文件用的都是一样的汇编语言。

    • 汇编阶段:接下来,汇编器(as)将hello.s翻译成机器语言指令,把这些指令打包成一种叫做可重定位目标程序(relocatable object program)的格式,并将结果保存在目标文件hello.o中。hello.o文件是一个二进制文件,它包含的17个字节是函数main的指令编码。如果我们在文本编辑器中打开hello.o文件,将看到一堆乱码。

    • 链接阶段:请注意,hello程序调用了printf函数,它是每个C编译器都提供的标准C库中的一个函数。printf函数存在于一个名为printf.o的单独的预编译好了的目标文件中,而这个文件必须以某种方式合并到我们的he11o.o程序中。链接器(ld)就负责处理这种合并。结果就得到hel1o文件,它是一个可执行目标文件(或者简称为可执行文件),可以被加载到内存中,由系统执行。

    如果需要查看程序的各个阶段生成的内容, 可以查看gcc的man帮助

     gcc --help
     // 常用的编译选项,其它内容自行查看
      -E                       Preprocess only; do not compile, assemble or link.
      -S                       Compile only; do not assemble or link.
      -c                       Compile and assemble, but do not link.
      -o <file>                Place the output into <file>.
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    说明:本系列博文主要参考内容《深入理解计算机系统》经典永远值得仔细阅读!同时也会参考其它书籍及互联网内容。后续本系列更新内容不在赘述。喜欢操作系统系列的可以点赞收藏关注。后续会一直更新!

  • 相关阅读:
    FASTAPI的简单理解
    Linux上文本处理三剑客之grep
    【java】五道经典算法题
    [论文阅读] (23)恶意代码作者溯源(去匿名化)经典论文阅读:二进制和源代码对比
    发送短信验证码的倒计时一直停留在60秒,没有开始倒计时
    微信小程序软件著作权申请成功!
    C++——数据类型笔记
    分享几个Google Chrome谷歌浏览器历史版本下载网站
    【Linux】shell命令与用户/文件权限
    【Python学习】字典(dict )的几种遍历方式
  • 原文地址:https://blog.csdn.net/weixin_48617416/article/details/132793274