浅析C++内存布局

浅析C++内存布局
C++程序在内存中的布局是怎样的？总结下C++内存布局的相关知识。

概述

简单总结下C++变量在内存中的布局和可执行文件相关的知识。暂未涉及虚函数，虚函数表，类的继承和多态等C++对象的内存模型。对象的内存模型推荐经典书籍《 深度探索C++对象模型》，豆瓣评分9.1。

开篇先回顾下Linux运行时存储器映像：

以下示例可以调试观测内存地址：
```
#include <iostream>
  
int  gdata1 = 1;
int  gdata2 = 0;
int  gdata3;
  
static int  gdata4 = 4;
static int  gdata5 = 0;
static int  gdata6;
  
int main() {
  int  a = 11;
  int  b = 0;
  int c;
  
  static int d = 12;
  static int e = 0;
  static int f;
  
  const char *p = "hello world";
  
  return 0;
  
 }
```
使用size命令和objdump来查看目标文件的结构和内容：

使用 objdump -s -d 查看更详细的内容：

使用 nm （names）查看符号表：

若是在linux下，上述指令都有效。还可使用readelf 可显示一个或者多个elf格式的目标文件的信息。

readelf是Linux下的分析ELF文件的命令，这个命令在分析ELF文件格式时非常有用。常见的文件如在Linux上的可执行文件，动态库(*.so)或者静态库(*.a) 等包含ELF格式的文件。

什么是ELF文件？

ELF(Executable and Linkable Format)是Unix及类Unix系统下可执行文件、共享库等二进制文件标准格式。

系统里的目标文件是按照特定的目标文件格式来组织的，各个系统的目标文件格式都不相同。

从贝尔实验室诞生的第一个Unix系统使用的是a.out格式（直到今天，直到文件仍然称为a.out文件）。Windows使用可移植植入（PortableExecutable，PE）格式。MacOS- X使用Mach-O格式。现代x86-64Linux和Unix系统使用可调可链接格式（ELF）。

ELF格式的文件在Linux系统下有.axf，.bin，.elf，.o，.prx，.puff，.ko，.mod和.so等等。

.text（代码段）

.text段存放程序代码，运行前就已经确定（编译时确定），通常为只读。

在window平台上，可执行程序为xxx.exe。它产生两种东西：指令和数据。.exe程序存放在磁盘中，执行时被加载到内存中，不是物理内存，而是虚拟内存空间，.text中存放指令。

.rodata(只读数据段)

rodata段存储常量数据，比如程序中定义为const的全局变量，#define定义的常量，以及诸如“Hello World”的字符串常量。(注意有些立即数与指令编译在一起，是放在text段中的)。

const修饰的全局变量在常量区。const修饰的局部变量只是为了防止修改，没有放入常量区。

编译器会去掉重复的字符串常量，程序的每个字符串常量只有一份。

有些系统中rodata段是多个进程共享的，目的是为了提高空间利用率。

如在main中的 const char *p = "hello world"; 即存放在.rodata中。在vs2017中，并不能将常量字符串定义为char *p类型，否则会编译失败；

.data

data存储已经初始化的全局变量，属于静态内存分配。（注意：初始化为0的全局变量还是被保存在BSS段），static声明的变量也存储在数据段。

.bss

bss段存储没有初值的全局变量或默认为0的全局变量，属于静态内存分配。 bss段内容会被全部设为0。

stack

stack段存储参数变量和局部变量，由系统进行申请和释放，属于静态内存分配。

stack的特点是先进先出，可用于保存/恢复调用现场。

heap

heap段是程序运行过程中被动态分配的内存段，由用户申请和释放（例如malloc和free）。

申请时至少分配虚存，当真正存储数据时才分配物理内存；释放时也不是立即释放物理内存，而是可能被重复利用。

总结

1、执行文件中包含了text、rodata、data段的内容，不包含bss段内容（一堆0放入执行文件没有意义）

2、堆和栈的内存增长方向是相反的：栈是从高地址向低地址生长，堆是从低地址向高地址生长。

3、局部变量存储在stack中，编写函数时要注意如果该函数被递归调用很多次，可能会引起stack overflow的问题。

C++程序的内存格局通常分为四大区：全局数据区(静态区，常量区)，代码区(code area)，栈区(stack area)，堆区(heap area)(即自由存储区)。全局数据区存放全局变量，静态数据和常量。所有类和函数代码存放在代码区。为运行函数而分配的局部变量、函数参数、返回数据、返回地址等存放在栈区。余下的空间被称为堆区（在栈与堆之间有部分动态分配的姑且称之为共享区，叫法可能不一样）。

推荐书籍《程序员的自我修养》

该书主要介绍系统软件的运行机制和原理，涉及在Windows和Linux两个系统平台上，一个应用程序在编译、链接和运行时刻所发生的各种事项。

包括：代码指令是如何保存的，库文件如何与应用程序代码静态链接，应用程序如何被装载到内存中并开始运行，动态链接如何实现，C/C++运行库的工作原理，以及操作系统提供的系统服务是如何被调用的。

类对象所占的内存空间

一个类的实例化对象所占空间的大小？注意不要说类的大小,是类的对象的大小。首先，类的大小是什么？确切的说，类只是一个类型的定义，它是没有大小可言的，用sizeof运算符对一个类型名操作，得到的是具有该类型实体的大小：
```
#include <iostream>
 
class Test
{
};
 
int main()
{
  Test test;
  std::cout << sizeof(test) << std::endl; //1
 
  return 0;
}
```
- 打开VS2019开发者命令行工具（每个版本都有）
- 切换到源文件所在路径
- cl /dl reportSingleClassLayout类名 "源文件名.cpp"
可以看到一个空类对象的大小1。

一个空类对象的大小是1，为什么不是0？

类A明明是空类，它的大小应该为0，为什么编译器输出的结果为1呢？这就是实例化的原因（空类同样被实例化），每个实例在内存中都有一个独一无二的地址，为了达到这个目的，编译器往往会给一个空类隐含的加一个字节，这样空类在实例化后在内存中得到了独一无二的地址，所以obj的大小是1。

添加虚函数之后，类的变化

当类中添加了虚函数时，类的大小变为4，同时编译器给类中添加了虚函数表指针vfptr 这个指针指向了vftable，vftable 这张表里面存放的本类所有的虚函数入口地址。

结论

1.当类中添加了虚函数时，类的大小变为4，同时编译器给类中添加了虚函数表指针vfptr 这个指针指向了vftable，vftable 这张表里面存放的本类所有的虚函数入口地址。
2.当发生继承时，子类会将父类的虚函数表指针继承下来，指向父类的的虚函数表，在子类调用构造函数后，编译器会将该指针指向自己的虚函数表。
3.当子类重写了父类的虚函数时，在虚函数表中会用子类的函数地址去覆盖父类对应的虚函数地址。
4.程序运行时，通过父类指针或者引用调用函数时，编译器会先找到该对象中的虚函数指针，根据指针找到虚函数表，在虚函数表中找到对应的函数入口地址进行调用。

二进制可执行文件的执行流程

可执行文件生成过程
1. 预处理：进行头文件和宏定义的替换
2. 编译：由编译器把高级语言代码编译为汇编代码
3. 汇编：由汇编器把汇编代码翻译成二进制代码，也即是.o文件
4. 连接：由连接器把多个.o文件连接成可执行文件；可分为编译时链接，加载时链接（程序被加载到内存中执行时），运行时链接（由应用程序来执行时）。
加载可执行目标文件

ELF头标书文件的整体格式还包含程序的入口点（程序需要运行时执行的第一条指令的地址）。可执行文件的连续片（chunk）被映射到连续的内存段。

当在shell中输入./programName时，shell解析到/判断不是内置命令（如果是内置命令时会搜索/usr /usr/lib ...）而是一个可执行文件，调用常驻内存的加载器（通过execve调用加载器）的操作系统代码来调用他。将可执行程序的代码和数据从磁盘复制到内存，在程序头部表的引导下加载器将可执行文件的片（chunk）复制到代码段和数据段，跳转到程序的第一条指令或入口点来运行。

linux的每个程序都运行在一个进程的上下文中，有自己的虚拟地址空间。当一个shell运行时，父进程shell生成一个子进程，他是父进程的一个复制。子进程通过execve系统调用调用加载器，加载器删除现有的虚拟内存段，创建新的代码段数据段堆栈，新堆栈被初始化为0，通过将虚拟地址空间的页映射到可执行文件的页面大小chunk，新的代码段和数据段被初始化为可执行文件的内容，最后跳转到_start，最终调用程序的main函数，除了头部的一些信息，加载过程没有任何数据从磁盘复制到内存，知道CPU引用的第一个虚拟页时才被复制。利用页面调度算法将他从磁盘复制到内存。

linux系统从开机到启动，执行流程从代码层面看大致经历：

设备上电后执行一段bootloader的汇编阶段。汇编第一阶段的代码主要可以分为以下部分：

设置异常向量表

设置特权管理模式

初始化PLL、DDR、MUX…

关MMU，关CACHE

判断代码在RAM还是FLASH，将FLASH代码复制至RAM中

设置堆栈、清空bss段

跳转至C语言处进入第二阶段，第二段也属于bootloader的功能，完成一些硬件资源初始化。最后才是操作系统内核的引导启动。

处理器流水线概述

1.经典的五级流水线

一条指令的流程：
- 取指
- 译码
- 执行
- 访存
- 写回
前一条指令完成了“取指”进入“译码”阶段后，下一条指令马上就可以进入“取指”阶段。

RISC-V架构

国外的指令集架构本质上是一种授权付费的，很难实现国产自主。如果国家自己定义一套指令集架构没有太大意义，因为处理器架构必须是全球范围的一个通用架构，必须获得生态支持。现在有了RISC-V可以很好的解决这一问题，“RISC-V可能真正能成为国产的自主的指令集架构。”

最近中美贸易战激战正酣，中兴被美国禁运的消息传来，一时间国内舆论大哗，说了多年的芯片“自主研发”，这么多的国产芯片上市公司，似乎到了关键时刻就被人卡脖子了。

胡振波表示，在产业界和芯片界，主流的大公司都在用RISC-V架构来做产品。西部数据和AMD都明确的说在用RISC-V做芯片，CEVA在用RISC-V做控制芯片核，谷歌也在用RISC-V做一些新的芯片项目。还有美光。除了这些大公司，还有很多业界大公司已经非常普遍的在用RISC-V来做内核。

最后，胡振波介绍了自己研发的首颗采用RISC-V架构的MCU蜂鸟E200。据介绍，这款全球最小的32位RISC-V核心可以实现超低功耗，对标的是ARM的M0 的MCU内核，安全可控，无需向国外公司支付版税。胡振波表示蜂鸟E200还有205、205FD等一系列产品线。

“这就是开放的指令集的魅力，接下来会冒出更多无法想象的指令集版本。”胡振波最后表示。

引用

C++内存布局_nwao7890的博客-CSDN博客

【C++学习笔记】03-图说C++对象模型：对象内存布局详解_你行你上天的博客-CSDN博客

C++类对象的内存布局_一叶知秋dong的博客-CSDN博客_c++对象内存结构

https://www.jb51.net/article/225140.htm

C++类对象在内存中的布局_子木呀的博客-CSDN博客_c++对象内存布局

[RISC-V学习]《手把手教你设计CPU——RISC-V处理器》笔记（一）2021/11/10_qq_41876038的博客-CSDN博客_手把手教你设计cpu

Linux 可执行文件程序载入和执行过程 - 知乎

从源文件到可执行文件的过程 - 简书

可执行程序的生成过程 - 故事， - 博客园

liangkangnan的博客

从零开始写RISC-V处理器 | liangkangnan的博客

「OS」浅析从代码到可执行文件的过程 – better averyboy

Linux启动ELF可执行文件的过程_第二月的技术博客_51CTO博客

RISC-V架构能否让国产IC真正“自主研发”？ - 芯智讯

【UBoot】uboot启动过程分析_Evan_ZGYF丶的博客-CSDN博客_uboot启动流程

【开发工具】【readelf】查看ELF格式文件工具（readelf）的使用_Evan_ZGYF丶的博客-CSDN博客_readelf 查询字符串

C++高级编程【虚函数机制】_Wy_编程的博客-CSDN博客

C++多态_非常规自我实现的博客-CSDN博客_c++多态

《Effective C++》读书笔记(详细总结55条款)下篇_程序猿的温柔香的博客-CSDN博客
相关阅读:
各种类型游戏的乐趣与魅力
 SpringCloud Hystrix熔断之线程池
 C高级 Day2
主流开源大语言模型的微调方法
 Tomcat HTTP Status 404 tomcat 404问题解决
 2021 华数杯全国大学生数学建模竞赛A题-电动汽车无线充电优化匹配研究（附带赛题解析&获奖论文及MATLAB代码）
QT小记：警告Use multi-arg instead
php实战案例记录(16)php://input输入流
 VSCode使用
 AWS考试认证学习
原文地址：https://blog.csdn.net/qq8864/article/details/124634271

概述

总结

类对象所占的内存空间

添加虚函数之后，类的变化

结论

二进制可执行文件的执行流程

处理器流水线概述

RISC-V架构

引用