• <Linux> 编译器与调试器—gcc/g++/gdb 的使用


    < Linux > 编译器与调试器—gcc/g++/gdb 的使用

    在这里插入图片描述

    一、Linux编译器 - gcc/g++ 使用

    1. 编译程序的四个过程

    背景知识

    我们知道程序最终需要转化为机器语言(二进制),因为计算机只认识二进制。在程序转化为二进制(编译)的过程中需要经过如下四个过程:

    1. 预处理(进行宏替换)
    2. 编译(生成汇编)
    3. 汇编(生成机器可识别代码)
    4. 连接(生成可执行文件或库文件)

    这方面的内容我们在【C】程序环境和预处理已经初步了解过了,但是并没有具体分析过程,接下来我们来演示一下各个过程。

    预处理

    gcc -E test.c -o test.i
    
    • 1
    • 所有的#define删除,并展开所有的宏定义

    • 处理所有的预编译指令,例如:#if,#elif,#else,#endif等。

    • 处理#include预编译指令,将被包含的文件插入到预编译指令的位置。

    • 添加行号信息、文件名标识,便于调试。

    • 删除所有的注释

    • 保留所有的#pragma编译指令,因为在编写程序的时候,我们经常要用到#pargma指令来设定编译的状态或者是指示编译器完成一些特定的动作。

    • 生成.i文件(包括去注释、宏替换、头文件展开、条件编译),编译生成的.i文件不包含任何宏定义,因为宏已经被展开,并且包含的文件已经被插入到.i文件中。

    • -E:从现在开始给我进行程序的翻译,当gcc在预处理完成,就停下来

    • -o:把预处理后的结果写到临时文件test.i里头。“.i”文件为已经过预处理的C原始程序

    代码演示

    image-20221110172225627

    编译

    gcc -S test.i -o test.s
    
    • 1
    • 扫描、语法分析、语义分析、源代码分析、目标代码生成、目标代码优化。

    • 生成汇编代码。

    • 汇总符号。

    • 生成.s文件。

    • -S:从现在开始进行程序的翻译,当我们编译完成之后,就停下来
    • -o:把编译后的文件写到临时文件test.s里头。

    image-20221110172815404

    汇编

    gcc -c test.s -o test.o
    
    • 1
    • 根据汇编指令和特定平台,把汇编指令翻译成二进制形式

    • 合并各个section,合并符号表

    • 将汇编语言翻译成为可重定位二进制文件(.o / obj)
    • -c:从现在开始进行程序的翻译,当我们汇编结束之后,就停下来

    image-20221110173227881

    我们可以使用 od test.o 指令,将test.o转化为二进制数字。

    image-20221110173353192

    汇编语言并不能被计算机直接执行,注意这里虽然是二进制文件了,但是仍然不是可执行程序,因为还少了最后一步的链接。

    链接

    gcc test.o -o mytest
    
    • 1
    • 合并各个.obj文件的section,合并符号表,进行符号解析。

    • 符号地址重定位。

    • 生成可执行文件。

    • 这一步就是链接我们自己的程序和库,形成可执行程序!

    • gcc后面不带E/S/c这三个指令,默认就是直接生成可执行程序,省略前三个步骤。

    image-20221110174050602

    2. 链接方式与函数库

    2.1 动态链接与静态链接

    为了帮助大家理解,这里我们将一个故事:

    image-20221111173628448

    假设你上高中了,现在有一个事情你爸给你说一下,就你去学校的时候千万不要去受你那些不好的学长影响,好好学习。你说,好的,满口答应,但是你都不听你爸爸的话。假如这是你们的学校,比如说叫做某某一中,这是学校里面的有一栋宿舍楼,你们的宿舍在501,那么在你进入高校之前,进入,进入这个中学之前你就知道,这个学校管理的非常严格,这个学校它是一个封闭式管理的学校,就是我一到学校里面就出不去了,但是星期天还可以出学校,关键是这个学校禁止你个人携带任何电子设备,这难不倒你,为什么?我们学校附近有一所网吧,叫红树林网吧。你星期天列了一个计划,然后执行。看了一会语文,然后又看了一会英语,然后又看了一会数学,然后去了网吧,愉快的在这上网,那么上网期间,你很愉快的度过了你上网的一个到两个小时,之后就直接回到学校,然后继续做我的计划,然后继续向后再进行执行。你列的这一张清单,那么这个清单就是你写的这个计划,你列的你要做什么,那么这就是你的程序,程序从上到下,全部依次去执行,其中这个程序当中,你要在做的事情,有一部分是靠你自己一个人就可以做的,比如说你想看什么语文英语数学,但是上网的话,你没有上网的工具所以在这里,在你只能跑到到外部去上网,那么其中这个小蚂蚁网吧就叫做库,那么所以当你的程序执行到一定的位置,他会发现,这个方法我这里没有。我要执行函数功能,函数没有,怎么办?我跑到库里面去执行,然后完成之后再把我们的结果再返回,返回之后,然后此时再继续执行我后续的程序。那么这个格式,我们就叫做库函数跳转,也就是我们之间跳转到库的中去执行我们的库函数,那么你怎么知道程序?那么其实说白了,程序背后就是人。那么程序背后怎么知道库在哪里?当年你打电话给你的学长,问他哪里能上网,那么,其中你和你的学长电话的这个过程就叫做,和库建立连接好,那么你的学长在这里他相当于什么?你的学长就相当于一个编译器内部的一个编译器内部的一个链接器,他告诉你的库在哪里,你将来想去调用库方法,那你就去什么地方调就可以了。

    image-20221111174240149

    但是最近发生一些变故,因为这个网吧的存在,你们附近的学校的学生经常去上网,极大的影响了你们这些学校的成绩,所以你们这几所学校的校长,一起联合举报了这所网吧,说它天天毒害我们学校的青少年,所以警察同志以非法经营的接口把这所网吧给封了。你父母听说了你学校附近的网吧被封了,他们不担心你上网,就是担心你不能上网。于是你爸大手一挥,把网吧的电脑买下来了,并且和学校商量一下,允许你在周末的时候使用电脑,于是在你的宿舍装了一台电脑。这时候你就可以直接在宿舍上网了。这就不用在路上来回跑。

    1、什么是静态链接?

    静态链接(Static Linking)是由链接器在链接时将库的内容加入到可执行程序中的做法。链接器是一个独立程序,将一个或多个库或目标文件(先前由编译器或汇编器生成)链接到一块生成可执行程序。这里的库指的是静态链接库,Windows下以.lib为后缀,Linux下以.a为后缀。

    2、什么是动态链接?

    动态链接(Dynamic Linking),把链接这个过程推迟到了运行时再进行,在可执行文件装载时或运行时,由操作系统的装载程序加载库。这里的库指的是动态链接库,Windows下以.dll为后缀,Linux下以.so为后缀。值得一提的是,在Windows下的动态链接也可以用到.lib为后缀的文件,但这里的.lib文件叫做导入库,是由.dll文件生成的。

    转载自: 静态链接与动态链接的区别

    2.2.函数库

    我们的C程序中,并没有定义“printf”的函数实现,且在预编译中包含的“stdio.h”中也只有该函数的声明,而没有定义函数的实现,那么,是在哪里实“printf”函数的呢?

    最后的答案是:系统把这些函数实现都被做到名为 libc.so.6 的库文件中去了,在没有特别指定时,gcc 会到系统默认的搜索路径“/usr/lib”下进行查找,也就是链接到 libc.so.6 库函数中去,这样就能实现函数“printf”了,而这也就是链接的作用

    函数库一般分为静态库和动态库两种,下面展开讨论:

    2.3.动态库与静态库

    • 头文件:给我们提供了使用的方法,所有的开发环境,具有语法提示,本质是通过头文件帮我们搜索的。(.h)
    • 库文件:给我们提供了可以使用的方法的实现,以供链接,形成我们自己的可执行程序。(.c、.cpp)

    静态库:

    • 后缀名Linux(.a),windows(.lib)
    • 静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不再需要库文件了。静态链接拷贝的并不是.so内部的代码。而是系统必须存在.so结尾的库文件。

    动态库:

    • 后缀名Linux(.so),windows(.dll)
    • 动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时链接文件加载库,这样可以节省系统的开销。动态库一般后缀名为“.so”,如前面所述的 libc.so.6 就是动态库。gcc 在编译时默认使用动态库。完成了链接之后,gcc 就可以生成可执行文件,如下所示。 gcchello.o –o hello

    静态库和动态库的名称是去掉前缀和后缀剩下的内容。

    接下来对比下动静态库的优缺点:

    动态链接静态链接
    优点大家共享一个库,可以节省资源不依赖任何库,程序可以独立执行
    缺点一旦库缺失,会导致几乎所有的程序失效!浪费资源

    gcc默认生成的二进制程序是动态链接的,可以通过file命令验证:

    image-20221111191813577

    如果你想强制改成静态链接,只需要在后面加个-static即可,如下:

    image-20221111192834203

    如果执行不了静态链接,则说明没有链接到静态库,需要手动执行下面的命令:

    gcc(C语言)sudo yum install -y glibc-static
    g++(C++)sudo yum install -y libstdc++-static
    
    • 1
    • 2

    3. gcc/g++ 的使用

    常用选项如下:

    1. -E 只激活预处理,这个不生成文件,你需要把它重定向到一个输出文件里面
    2. -S 编译到汇编语言不进行汇编和链接
    3. -c 编译到目标代码
    4. -o 文件输出到文件
    5. -static 此选项对生成的文件采用静态链接
    6. -g 生成调试信息。GNU 调试器可利用该信息。
    7. -shared 此选项将尽量使用动态库,所以生成文件比较小,但是需要系统由动态库.
    8. -O0 / -O1 / -O2 / -O3 编译器的优化选项的4个级别,-O0表示没有优化,-O1为缺省值,-O3优化级别最高
    9. -w 不生成任何警告信息。
    10. -Wall 生成所有警告信息。

    二、Linux调试器 - gdb 使用

    1. debug 和 release

    Debug:Debug 通常称为调试版本,通过一系列编译选项的配合,编译的结果通常包含调试信息,而且不做任何优化,以为开发人员提供 强大的应用程序调试能力。

    Release:Release通常称为 发布版本,是为用户使用的,一般客户不允许在发布版本上进行调试。所以不保存调试信息,同时,它往往进行了各种优化,以期达到代码最小和速度最优。为用户的使用提供便利。

    2. gdb 的使用

    • gdb的安装

    在Linux下,安装gdb的命令为:

    sudo yum install -y gdb
    
    • 1

    image-20221111214205425

    程序的发布方式有两种,debug模式和release模式

    Linux gcc/g++出来的二进制程序,默认是release模式

    image-20221111213052149

    • 要使用gdb调试,必须在源代码生成二进制程序的时候, 加上 -g 选项
    gcc mytest.c -o mytest_g -g
    
    • 1

    image-20221111213020386

    并且这里很明显能看出debug版本的大小是比release版本的大的,而大出来的部分就是增加的调试信息。可以通过readelf -S这条指令看出来:

    image-20221111212941026

    下面就开始讲解调试的选项指令:

    gdb命令汇总

    • gdb binFile :开始调试

    • list (l)行号:显示binFile源代码,接着上次的位置往下列,每次列10行。

    • list 函数名:列出某个函数的源代码。

    • run(r):运行程序(逐语句)。

    • next(n):单条执行(逐过程)。

    • step(s):进入函数调用

    • break(b) 行号:在某一行设置断点

    • break 函数名:在某个函数开头设置断点

    • info b :查看断点信息。

    • finish(fin):执行到当前函数返回,然后挺下来等待命令

    • print(p):打印表达式的值,通过表达式可以修改变量的值或者调用函数

    • p 变量:打印变量值。

    • set var:修改变量的值

    • continue(c):从当前位置开始连续而非单步执行程序

    • run(r):从开始连续而非单步执行程序

    • d :删除所有断点

    • d 行号:删除序号为n的断点

    • disable 编号:禁用断点

    • enable 编号:启用断点

    • info(i) breakpoints:查看当前设置了哪些断点

    • display 变量名:跟踪查看一个变量,每次停下来都显示它的值

    • undisplay:取消对先前设置的那些变量的跟踪

    • until X行号:跳至X行

    • breaktrace(bt):查看各级函数调用及参数

    • info(i)locals:查看当前栈帧局部变量的值

    • quit(q):退出gdb(ctrl + d )

    接下来,我们演示一些常用的指令:

    显示代码:l 行数

    image-20221112192551409

    b 行数(打断点):

    image-20221112192608271

    info b(查看断点):

    image-20221112192638501

    d + 断点编号(取消断点):

    image-20221112192656979

    r (调试运行,在断点处停下):

    image-20221112193156335

    n(逐语句):

    image-20221112192723371

    s(逐过程):

    image-20221112192735035

    c(运行至下一个断点):

    image-20221112193142565

    fin(直接运行到函数跑完):

    image-20221112192815621

    bt(函数调用堆栈):

    image-20221112192753675

    display/undisplay(常显示变量,类似于监视):

    image-20221112193751269

    until(调整指定行):

    image-20221112193046638

    p 变量(打印变量值)set var(修改变量的值):

    image-20221112192959081

    info local(查看当前栈帧局部变量的值):

    image-20221112192859170

    disable breakpoints(禁用断点):

    image-20221112193346188

    剩下还有一些指令就留给大家去练习一下了,上面的指令平时用的比较多,希望大家多加练习,能够掌握gdb基本的使用。

  • 相关阅读:
    SaaS企业如何降低客户流失率?
    【黑马-SpringCloud技术栈】【05】Nacos配置中心_搭建Nacos集群
    java基于springboot_vue的校园闲置物品交易系统-计算机毕业设计
    最新CLion + STM32 + CubeMX 开发环境搭建
    vue-创建项目
    让.NET 8 支持 Windows Vista RTM
    SQL注入绕过safedog原理分析(二)
    具有自适应边界与最优引导的莱维飞行蚁狮优化算法-附代码
    innovus: clock cell spacing如何设置?
    【全志T113-S3_100ask】13-1 Linux c语言ioctl驱动oled(iic、ssd1306)屏幕
  • 原文地址:https://blog.csdn.net/m0_64224788/article/details/127824458