探索未对齐内存CPU的访问逻辑

问题：

如下结构体在未对齐的情况下，读取数据时CPU需要对成员变量i进行两次访问才能完全读取其中数据。


struct text
{
	char c;
	int i;
};
struct text a；

基于32位平台，CPU每次访问4个字节

为什么不能在取变量i的数据时直接从偏移量为1的位置直接开始读取呢？

这是由于计算机CPU和计算机数据存储的特点造成的，而且这个问题在硬件上大多数是没有办法有效处理。（我对硬件不熟悉，因为遇到了问题所以查资料解决一下，这里只谈实现过程）

数据在内存的存储

计算机中数据存储在内存中，而内存以硬件的形式出现，表现为不同的内存块，比如内存0有它自己的一块空间，还有内存1、内存2、内存3这些不同的内存块。这些内存的访问顺序又是对应偏移量走的，看下图：

CPU每次访问都是以偏移量访问的，每次读取4个字节，首先从偏移量为0的内存开始，之后是1，依次往后。

CPU的访问

让我们回到之前的问题，结构体中成员变量c的数据存在0x0地址处，成员变量i的数据存储在0x1、0x2、0x3、0x4地址处，此时变量i的存储范围以经到了偏移量为1的地址处。

CPU首先访问偏移量为0的四个地址，取出i变量i的三个字节。

CPU其次访问偏移量为1的四个地址，取出i变量的一个字节。

总共访问两次。

如果是在对齐的情况下

地址0x0处存放变量 c 的数据 —— 访问偏移量为0的四个地址一次取出数据

地址0x4、0x5、0x6、0x7存放变量 i 的数据 —— 访问偏移量为1的四个地址一次取出数据

总结：

虽然内存的对齐浪费掉了一些空间，但它的执行速度得以提升。在计算机内存大小持续上涨的今天，浪费掉的内存和所换取的时间相比，是可以接受的。

查阅文献：performance - Why misaligned address access incur 2 or more accesses? - Stack Overflow

相关阅读:
临近期末，这些题不来看看吗？（上）
整理uvc驱动相关函数的调用流程
CF679A.Bear and Prime 100 （交互题）
STM32F4x_中断配置
【log4j】基本使用
c语言结构体、函数以及指针练习（简单通讯录）
“第六十三天”
分布式事务（三）———TCC 解决方案
swagger2配置及注释详解
6.WPF属性

原文地址：https://blog.csdn.net/m0_52094687/article/details/126920199