• 【Linux进阶之路】动静态库


    回顾

      前面在gcc与g++的使用中,我们简单的介绍了动态库与静态库的各自的优点与区别:

    1. 动态链接库,也就是所有的程序公用一份代码,虽然方便省空间,但是一旦链接库被删,那么所有的程序将无法运行!
    2. 静态链接库,就是所有程序都拷贝一份代码自己用,这样虽然库删除之后会正常运行,但是会使代码的空间异常的大,通常在几十倍到几百倍左右。

     那么今天就让我们通过动静态库的制作过程与基本原理,进而更深一步了解动静态库吧!

    一. 静态库

    1.代码传递的方式

    • 我们要想让别人使用我们写的代码,有两种方式:
    1. 将源文件与头文件直接发给别人。
    2. 将源文件打包成的库与头文件发给别人。

    区别:

    1. 第一种相当于把实现方法直接发给别人,别人可以进行抄袭与学习以及使用,几乎是把自己的劳动成果(实现方法)拱手让人。
    2. 第二种相当于只把说明书(头文件)发送给了别人,由于打包成了库,因此实现方式别人看不到,只能进行使用。
    • 总结:类比商品,假如你买了个电脑,第一种是只附带有说明书,外加实现的具体方法。第二种是只附带了说明书。因此买的电脑如果是第一种,电脑用坏了,可以自己修,甚至可以自己再造出一台电脑。如果是第二种,用坏了,自己还得去找人家花钱修。
    • 重点:不管哪种方式,头文件必不可少!因为头文件是一份使用说明书,一些具体的使用细节都在头文件中。而且在代码中包含头文件才能用里面的接口。如果不这样使用方式及其麻烦。

    2.简易制作

    • 源文件
    #include"mymath.h"
    int myerrno = 0;
    int add(int x,int y)
    {
      return x + y;
    }
    int sub(int x,int y)
    {
      return x - y;
    }
    int product(int x,int y)
    {
      return x * y;
    }
    int div(int x,int y)
    {
      if(y == 0)
      {
        myerrno = 1;
        return -1;
      }
      return x / y;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 头文件
    //存放的是函数与变量的声明
    extern int myerrno;
    int add(int x,int y);
    int sub(int x,int y);
    int product(int x,int y);
    int div(int x,int y);
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    说明:静态库的名称格式为——libXXX.a

    生成静态库的指令:

    argc -rc [静态库的名称] [要生成静态库的目标文件]
    
    • 1
    • Makefile
    #定义静态库变量的名称
    lib=libmymath.a
    #目标文件生成静态库, $(lib)为变量
    $(lib):mymath.o
    	ar -rc $@ $^
    #生成目标文件	
    mymath.o:mymath.c
    	gcc -c $^
    #清理文件
    .PHONY:clean
    clean:
    	rm -rf *.a *.o mylib
    #将生成的静态库进行打包
    .PHONY:output
    output:
    	mkdir -p mylib/include
    	mkdir -p mylib/mymathlib
    	cp *.a mylib/mymathlib
    	cp *.h mylib/include
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    1. make 生成 静态库与.o文件

    在这里插入图片描述
    2. make output将静态库与头文件进行拷贝打包

    在这里插入图片描述
    3. make clean 将多余的文件进行清理

    在这里插入图片描述

    此时我们的静态库就打包好了,下面我们另起文件进行使用。


    与mylib同目录下编写test.c

    #include"mymath.h"
    #include
    int main()
    {
      printf("myerrno:%d 1 + 0 = %d\n",myerrno,add(1,0));
      printf("myerrno:%d 1 - 0 = %d\n",myerrno,sub(1,0));
      printf("myerrno:%d 1 * 0 = %d\n",myerrno,product(1,0));
      printf("myerrno:%d 1 / 0 = %d\n",myerrno,div(1,0));
      return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    我们编译一下:
    在这里插入图片描述

    • 可见我们所包含的头文件不在当前目录与默认路径(usr/include),因此找不到。

    因此我们需要告诉编译器,去哪找。

    gcc test.c -I ./mylib/include
    
    • 1

    因为头文件已包含文件名,因此不用再说明。

    在这里插入图片描述

    • 可见我们函数定义还没有包含,因此找不到定义

    因此我们需要告诉编译器,去哪找库。

    gcc test.c -I ./mylib/include -L ./mylib/mymathlib/
    
    • 1

    在这里插入图片描述

    • 可见因为库名字未知且一个目录下可能有多个库,因此我们还找不到定义。

    因此我们需要告诉编译器,库名字(库真实的名字为去掉后缀.a 与前缀 lib)。

     gcc test.c -I ./mylib/include -L ./mylib/mymathlib/ -l mymath
    
    • 1

    在这里插入图片描述

    • 总结
    1. -I(大写 i) 指定头文件的路径
    2. -L指定库所在路径
    3. -l(小写 L) 指定库的名称。且库的名称是去掉 lib 与 .a后缀。

    3.原理

    1. 时间:在预处理,编译,反汇编,生成.o(可重定向目标二进制文件)之后。
    2. 动作:将静态库里面的内容,拷贝, 与.o文件一起链接生成的.exe文件。
    • 说明:链接进行段表的合并,符号表的重新定位,其中段表的合并是把有效信息筛选无效信息删除,符号表的重新定位指的时检查代码是否正确,比如函数与某些全局变量的地址是否是有效的。

    二. 动态库

    1.简易制作

    我们还是用之前的代码(将myerrno删了)。

    两个关键动作:

    1. 生成.o文件并生成位置无关码
    	gcc -FPIC -c mymath.o
    
    • 1
    1. 生成动态库
    	gcc -shared -o libmymath.so mymath.o
    
    • 1
    • Makefile
    lib=libmymath.so
    
    $(lib):mymath.o
    	gcc -shared -o $@ $^
    	
    mymath.o:mymath.c
    	gcc -FPIC -c $^ 
    
    .PHONY:clean
    
    clean:
    	rm -rf *.a *.so *.o 
    
    .PHONY:output
    
    output:
    	mkdir -p lib/include
    	mkdir -p lib/mymathlib
    	cp *.so lib/mymathlib
    	cp *.h lib/include
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    1. make生成动态库与.o文件
      在这里插入图片描述

    2. make output 动态库与.h文件进行打包
      在这里插入图片描述

    3. make clean 删除冗余的动态库文件与.o文件
      在这里插入图片描述


    同理,我们使用一下库,验证一下。

    • test.c
    #include"mymath.h"
    #include
    
    int main()
    {
      printf("1 + 1 == %d\n",add(1,1));
      printf("1 - 1 == %d\n",sub(1,1));
      printf("1 * 1 == %d\n",product(1,1));
      printf("1 / 1 == %d\n",div(1,1));
      return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    同理我们直接使用之前静态库的结论进行编译链接。

    gcc -o test test.c -I lib/include/ -L /lib/mymathlib/ -l mymath
    
    • 1

    在这里插入图片描述

    补充: ldd 【可执行文件】 #显示与可执行文件链接的
    
    • 1
    • 可见在生成可执行程序是没问题的,但是显示无法打开这个共享文件对象,这是问什么呢?

    解释:

    1. 在动态链接时,我们是在可执行程序变成进程运行的同时,链接到对应库当中,其中库是文件,需要打开才能被链接。
    2. 因此需要让加载器去指定的路径下打开文件,才能使用动态库。
    • 注意:前面的gcc 只是让编译器解决了如何找的问题,如何让加载器打开还没有解决。其次静态链接因为是直接拷贝,因此无需关心打开的问题。

    因此:我们需要将让编译器想办法在默认路径下打开库文件。


    1. 直接拷贝到默认路径(最常用)
      在这里插入图片描述
    • 可见是链接成功的,可执行程序也能正常的执行,不过因为要拷贝到系统的路径下,所以我们需要sudo 进行提权。
    1. 在默认路径下建立对应静态库的软链接
      在这里插入图片描述
    • 与第一种方式同理,唯一需要说明的是对不在同一目录下建立软链接,需要使用绝对路径,而不是相对路径。
    1. 修改环境变量LD_LIBRARY_PATH(可能会没有)
      在这里插入图片描述
    • 说明:只需要后跟:与动态库所在的路径即可。至于名称我们在链接形成可执行程序时,已经知道了。
    • 注意:这里环境变量在重启时,就没有了,这是比较恶心的一点。
    1. 添加配置文件
    1. su / su - 切换到root用户
    2. 进入 /etc/ld.so.conf.d/
    3. 添加一个.conf结尾的任意名称的文件
    4. vim 此文件,切换到 Insert模式,添加动态库的路径,保存并退出。
    5. 使用 ldconfig更新此配置文件。
    • 图解:在这里插入图片描述
    • 验证:在这里插入图片描述

    2.基本原理

     先来铺垫一下,我们编译器与链接器处理代码的过程:

    1. 预处理,完成头文件的替换,条件编译中代码的裁剪,宏的替换等。
    2. 预编译,完成对语义分析,词法分析,语法分析,符号汇总等,检查语法错误,最终转换为汇编代码。
    3. 汇编,完成符号表与段表的生成,并将代码转换为二进制代码。
    4. 链接,完成符号表的重定位,与段表的合并,并生成可执行程序。

    那可执行程序里面存放的是什么呢?

    我们反汇编一下:

    objdump -S [可执行程序]
    
    • 1

    在这里插入图片描述

    • 可见是一些指令级别的东西,这里我们或许还能勉强看懂一些汇编,里面还存放着地址。
    • 因此我们可以从中得知,可执行程序在还没有被加载时就已经存在地址了。

    那么问题来了,这里的地址是物理地址还是虚拟地址?

    • 肯定是虚拟地址,是要给进程地址空间使用的,物理地址是操作系统在程序加载之后申请的。

    这是编译的结论,接下来我们的程序是如何加载到内存当中的呢?

     我们先就可执行程序来进行讨论,我们编译好的可执行程序是在磁盘当中的,在加载时必然要被加载到内存当中。

     对于操作系统来说可执行程序在加载时必然要变为进程,之前我们已经了解过进程是 PCB数据结构, 以及代码和数据。 其中PCB在Linux中为stuct tasks_struct 包含着 页表, 进程地址空间(struct mm_struct) 管理文件的(struct files_struct)等对象。

     那在程序加载时,必然要先形成进程,代码和数据可以后面用时再加载。那进程的地址空间首先要先加载,才能保证后续的正常运行。

    至于进程的地址空间的加载,我们用图辅助理解:
    在这里插入图片描述

    • 代码在进行加载时,通过页表其指令在进程地址空间中是虚拟地址,也就是编译生成的地址,而实际执行指令的物理地址在加载时就通过页表进行填充。这样进程便可通过指令的虚拟地址通过页表获取到指令的物理地址,进而执行指令。
    • 除此之外,加载时,要想找到可执行程序,还得进程的exe,即可执行程序的路径。这种信息在进程加载时即可进行获取。

     代码现在成功加载到内存中了,那指令是如何运行的呢?

    首先万事开头难,如何读取到程序的第一行指令很关键,因此会设置程序入口地址以便接下来的执行

    其次CPU首先通过指令寄存器拿到指令的虚拟地址,然后通过页表进行映射,成物理地址,然后根据指令的具体信息,进行执行,然后接着执行下一句代码,如此循环往复。

    • 说明:在加载中,程序指令原本的虚拟地址在内存中变为了物理地址,而原来的虚拟地址则给了进程地址空间,这样才讲的通。

    其次数据我们可以在需要时加载,在加载时,触发缺页中断,让操作系统将页表进行填充即可。


    代码与数据如何加载我们已经讲的差不多了,那动态库是如何加载的呢?

    • 在这之前我们已经达成了共识,动态库是共享库,即多个进程都可以使用。

    那么便可大致画出:
    在这里插入图片描述

    • 可见动态库是在加载过程中与进程产生链接的。

    那链接到进程地址空间的什么位置呢?

    • 进程地址空间的共享区,这个共享区很大,足够跟多个动态库进行链接。

    既然在可能有多个共享库进行链接,那么如何进行链接,才能保证能找到指定的共享库呢?

    1. 我们可以采用起始地址 + 偏移量的方式,从而使函数在在找库时,只需知道偏移量即可。
    2. 偏移量的设定与动态库生成中的位置无关码有关。
    • 拓展:在进行链接时,动态库也可能会产生缺页中断的现象,即用时再进行加载。

    补充:

    1. 第三方库,即自己写的库,在进行链接时,必须要指定库名字!
    2. 如果一个库的方法实现有动态库,也有静态库,那么默认优先加载动态库。

    • 总结
    1. 静态库的原理与简易制作。
    2. 动态库的原理与简易制作。
    3. 动态库加载的原理,进程地址空间程序的加载。

    尾序

     如果有所帮助的话,不妨点个赞鼓励一下吧!

  • 相关阅读:
    糖友吃什么有助于控制血糖
    身份证实名认证接口的三种方式、C#实名认证接口
    新手零基础自学Python,安装并配置环境+教程
    SPEL表达式注入分析
    性能测试 —— 生成html测试报告、参数化、jvm监控
    redis学习笔记
    26. 通过 cilium pwru了解网络包的来龙去脉
    《Go 语言第一课》课程学习笔记(十五)
    Allegro调丝印规范操作指导
    一文学会html(详细)
  • 原文地址:https://blog.csdn.net/Shun_Hua/article/details/134459228