• C++ :Symbol:符号


    1:符号的概念

    符号(symbol)是在 ELF格式中会遇到的概念,也就是在写汇编代码时候会遇到的,而在更高级语言(C或者C++)中不会直接遇到这个概念,我们把讨论的范围限制在 Linux上的ELF格式。

    符号的绑定(Symbol Binding)符号和符号之间是不一样的,首先我们明确,链接器的任务是把很多个.o文件(object file)组合到一起,因为一个符号可能在某一个 object file中定义了,而在另一个object file 中使用了,链接器的任务就是把这些 reference都分析清楚。

    常见的符号有三种类型:

    1. Local Symbol : 只有当前object file 文件才能看见,其他别的 object file看不到
    2. Global Symbol : 所有 object file 里都能看见,全局只能有一个
    3. Weak Symbol : 所有Object file 里都能看见,全局可以有很多,但最后只保留一个,如果有同名Global Symbal,就只留下 Global Symbol

    看下面一个例子:

    1. // 我们在 symbol.cpp 源文件中定义一个函数 func
    2. symbol.cpp
    3. int func() {
    4. return 1;
    5. }

     经过 gcc -c -S main.cpp -o maini.o 命令编译后生成 main.o文件  //  然后 cat main.o 得到上面汇编代码

    可以看到 函数名称 func就是一个符号,如果想要调用这个函数,就可以利用这个函数的符号

    有人说,汇编后的代码没有看到 func 符号,其实这是C++s实现了函数的重载

    2:符号的链接

     下面在介绍下,在链接中可能会出现问题。看下面的代码

    1. // a.h
    2. #pragma once
    3. int func(){
    4. return 0;
    5. }
    6. // A.cpp
    7. #include"a.h"
    8. void printl_Fun() {
    9. func();
    10. }
    11. // main.cpp
    12. #include"a.h"
    13. int main() {
    14. func();
    15. return 0;
    16. }

    很显然:如果你编译两个.cpp文件,那么就是在编译 A.cpp和main.cpp的时候分别生成 Global Symbol  (func) ,这样在链接的时候就会报错: func 重定义

    2.1:编译A.cpp

     2.2 编译main.cpp

     2.3 将A.o 和 main.o 编译后的产物链接起来

     显然报错了:multipe definition of 'func()' 重复定义函数 func()

    3: 解决multipe definition问题

    3.1  只在一个翻译单元中给出函数的定义,这样的话就只有一个 Global Symbol生成,就不会有问题

    1. // A.h
    2. #pragma once
    3. int func();
    4. // A.cpp
    5. #include"a.h"
    6. int func()
    7. {
    8. return 0;
    9. }
    10. // main.cpp
    11. #include
    12. #include"a.h"
    13. int main() {
    14. int ret = func();
    15. std::cout << ret << std::endl;
    16. return 0;
    17. }

    看下预编译和编译成汇编的结果:在main.o中是看不到 全局符号(global symbol) func的

     在看下 A.o的汇编结果: 很显然是存储 全局符号(Global Symbol)func 

    所以这就很清晰了,符号 func 在全局符号表中只有一个,链接的时候,自然就不会后什么问题。 

    3.2 变成两个 Local Symbol

    这样做最后的二进制文件会变大一些. 具体在 C++ 中有两种做法, 拿我们的 func 函数示例. 可以加上 static 这个在C++层面称之为: Internal Linkage

    1. // a.h
    2. #pragma once
    3. //static int func() {
    4. // // static修饰的 函数,会生成local symbol
    5. // return 1;
    6. //};
    7. // 方式二 : 匿名的 namespace里面都是 Local Symbal符号
    8. namespace {
    9. int func() {
    10. return 1;
    11. }
    12. }
    13. A.cpp
    14. #include
    15. #include"a.h"
    16. void printf_fun()
    17. {
    18. std::cout << func() << std::endl;
    19. }
    20. // main.cpp
    21. #include
    22. #include"a.h"
    23. int main() {
    24. int ret = func();
    25. std::cout << ret << std::endl;
    26. return 0;
    27. }

    先看下A.cpp 编译后的产物

     在看下main.cpp 编译后产物

     很显然我们在main.o 和A.o中并没有看到 globl symbol符号,那么当然也不会出现 multipe definition定义,自然就会正常输出 .

    3.3 变成两个 Weak Symbol 这个可以直接用编译器拓展 __attribute__((weak))

    • 但是更加常见的操作是: 使用 inline 修饰一个函数
    • 对于这个函数, 编译器会考虑是否内联它. 如果编译器决定不内联, 就会生成一个 Weak Symbol.如果编译器决定内联, 这样即使是在多个翻译单元都定义了, 也不会有重定义的错误.
    • 链接器则会从不同 object file 中随机选择一份 func 的副本. (具体选哪个要看链接器的实现了, 你要做的是确保每个副本是一样的)
    1. // a.h
    2. #pragma once
    3. // 方式一:只声明
    4. // int func();
    5. // 方式二 : 添加static 变成 local symbol符号
    6. //static int func() {
    7. // // static修饰的 函数,会生成local symbol
    8. // return 1;
    9. //};
    10. // 方式二 : 匿名的 namespace里面都是 Local Symbal符号
    11. //namespace {
    12. // int func() {
    13. // return 1;
    14. // }
    15. //}
    16. // 方式三 :添加 inline 修饰符,变成 Weak Symbol
    17. inline int function() {
    18. return 2;
    19. }
    20. // A.cpp
    21. #include
    22. #include"a.h"
    23. void printf_fun()
    24. {
    25. std::cout << function() << std::endl;
    26. }
    27. // main.cpp
    28. #include
    29. #include"a.h"
    30. int main() {
    31. int ret = function();
    32. std::cout << ret << std::endl;
    33. return 0;
    34. }

     4: 总结:

    这三种处理方案, 一般使用 1, 3 是比较常见的. 第 2 种的话, 每一个翻译单元都有一份副本, 会增加最终生成二进制的体积和符号个数.

    5:扩展

    如果你在 struct/class/union 中给出了函数的完整定义, 那么它也是隐式 inline 的. 比如

    1. struct A {
    2. int func() { return 0; } // 隐式 inline, 所以不会有重定义的错误
    3. };
    1. 现在的 inline 语义大概就是: 允许同一个定义在不同的翻译单元出现, 但你需要确保不同翻译单元给出的定义是一致的. 可以看出, 最自然的实现方案就是使用 ELF 格式中的 Weak Symbol. 
    2. 在 C++ 之中, 除了 inline 会生成 Weak Symbol, 模板生成的内容也会 Weak Symbol. 所以模板可以放在头文件中, 而不用有担心重定义的错误. 事实上, 模板的定义也需要放在头文件中, 不然无法实例化. (除了显式实例化等情况)
    3. 参考文献 ELF 格式的 Symbol 及 C++ 的 inline 关键字 - 知乎
  • 相关阅读:
    vite源码分析之dev
    软件测试,作为职场新鸟?我该怎么办?看看资深5年测试的见解......
    Java之Gradle【IDEA版】入门到精通(上)(一篇文章精通系列)【安装+基本使用+项目创建+项目部署+文件操作+依赖管理+插件使用】
    css,sass,scss和less的区别
    【BOOST C++ 5 】通信(05 windows相关的对象 )
    Python---练习:for循环 求1-100的和/所有偶数的和
    66、Spring Data JPA 的基本功能--CRUD 和 分页
    ClickHouse教程 — 第一章 ClickHouse单机版安装
    Python基础学习笔记1(AI Studio)
    细粒度图像分类论文研读-2014
  • 原文地址:https://blog.csdn.net/u013620306/article/details/127928153