• 探索未对齐内存CPU的访问逻辑


    目录

     问题:

    数据在内存的存储

    CPU的访问

    总结:


    问题:

    如下结构体在未对齐的情况下,读取数据时CPU需要对成员变量i进行两次访问才能完全读取其中数据。

    1. struct text
    2. {
    3. char c;
    4. int i;
    5. };
    6. struct text a;

     基于32位平台,CPU每次访问4个字节

    为什么不能在取变量i的数据时直接从偏移量为1的位置直接开始读取呢?

    这是由于计算机CPU和计算机数据存储的特点造成的,而且这个问题在硬件上大多数是没有办法有效处理。(我对硬件不熟悉,因为遇到了问题所以查资料解决一下,这里只谈实现过程)

    数据在内存的存储

            计算机中数据存储在内存中,而内存以硬件的形式出现,表现为不同的内存块,比如内存0有它自己的一块空间,还有内存1、内存2、内存3这些不同的内存块。这些内存的访问顺序又是对应偏移量走的,看下图:

           CPU每次访问都是以偏移量访问的,每次读取4个字节,首先从偏移量为0的内存开始,之后是1,依次往后。

    CPU的访问

    让我们回到之前的问题,结构体中成员变量c的数据存在0x0地址处,成员变量i的数据存储在0x1、0x2、0x3、0x4地址处,此时变量i的存储范围以经到了偏移量为1的地址处。

    CPU首先访问偏移量为0的四个地址,取出i变量i的三个字节。

    CPU其次访问偏移量为1的四个地址,取出i变量的一个字节。

    总共访问两次。

    如果是在对齐的情况下

    地址0x0处存放变量 c 的数据   ——  访问偏移量为0的四个地址一次取出数据

    地址0x4、0x5、0x6、0x7存放变量 i 的数据  ——  访问偏移量为1的四个地址一次取出数据

    总结:

           虽然内存的对齐浪费掉了一些空间,但它的执行速度得以提升。在计算机内存大小持续上涨的今天,浪费掉的内存和所换取的时间相比,是可以接受的。

    查阅文献:performance - Why misaligned address access incur 2 or more accesses? - Stack Overflow

  • 相关阅读:
    临近期末,这些题不来看看吗?(上)
    整理uvc驱动相关函数的调用流程
    CF679A.Bear and Prime 100 (交互题)
    STM32F4x_中断配置
    【log4j】基本使用
    c语言结构体、函数以及指针练习(简单通讯录)
    “第六十三天”
    分布式事务(三)———TCC 解决方案
    swagger2配置及注释详解
    6.WPF属性
  • 原文地址:https://blog.csdn.net/m0_52094687/article/details/126920199