• 【C语言】探讨常见自定义类型的存储形式


    🚩纸上得来终觉浅, 绝知此事要躬行。
    🌟主页:June-Frost
    🚀专栏:C语言

    🔥该文章将探讨结构体,位段,共用体的存储形式。

    🌍结构体内存对齐

     结构体(struct)是一种用于存储一组不同类型数据的复合数据类型。为了提高内存访问效率,许多计算机系统对结构体进行内存对齐。内存对齐是一种优化内存访问效率的方式,通过将数据存储在特定的内存地址上,使得CPU的内存访问速度更快。对于一些特定的硬件平台和体系结构,内存对齐的要求是必需的。为了更好的理解,我们可以通过计算结构体的大小引入。

    struct S1
    {
    	char c1;
    	int i;
    	char c2;
    };
    //大小为12
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    struct S2
    {
    	int i;
    	char c1;
    	char c2;
    };
    //大小为8
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    struct S3
    {
    	char c3;
    	struct S1;
    	char c4;
    };
    //大小为20
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

     通过offsetof计算一下结构体(S1)成员相较于结构体起始位置的偏移量,发现分别是0,4,8 。
     这也就意味着S1在内存中的分布是这样的:

     通过上面的现象分析,可以发现结构成员不是按照顺序在内存中连续存放的,而是有一定的对齐规则。

    📙结构体内存对齐的规则:

    1. 第一个成员永远存放在与结构体变量偏移量为0的地址处。
    2. 从第二个成员开始,往后的每个成员都要对齐到某个对齐数的整数倍处。

    对齐数:结构体成员自身的大小和默认对齐数的较小值。
    VS 上默认对齐数是8。
    gcc上没有默认对齐数,对齐数就是结构体成员自身的大小。

    1. 结构体的总大小,必须是最大对齐数的整数倍。

    最大对齐数:所有成员的对齐数中最大的值。

    1. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处。

    🔭为什么会有内存对齐呢?

    1.平台原因(移植原因):
     不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
    2.性能原因:
     数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

    总的来说,结构体的内存对齐是拿空间来换取时间的做法。

     所以我们在设计结构体的时候,既要满足对齐,又要节省空间:让占用空间小的成员尽量集中在一起。

    struct S1
    {
    	char c1;
    	int i;
    	char c2;
    };
    
    struct S2
    {
    	int i;
    	char c1;
    	char c2;
    };
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    这两个结构体的成员一摸一样,但是S1需要12个字节,而S2只需要8个字节。

    ✉️修改默认对齐数

    通过 #pragma 这个预处理指令,就可以改变默认对齐数。
    例如:

    #include
    #pragma pack(1)//设置默认对齐数为1
    struct S1
    {
    	char c1;
    	int i;
    	char c2;
    };
    #pragma pack()//取消设置的默认对齐数,还原为默认
    int main()
    {
    	printf("%zd", sizeof(struct S1));//结果为6
    	return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    🌎 位段

     位段是 C 语言中的一种数据类型,用于将一组数值存储到计算机内存中的二进制位中。位段通常用于在内存节省空间的同时,以一种可读性较高的方式存储多个二进制标志或数据。每个位段可以指定其所占用的二进制位数。

    ⚠注意:

    1. 位段的成员可以是 int ,unsigned int ,signed int 或者是 char (属于整形家族)类型。
    2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
    3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

    由于位段不跨平台,所以在此浅谈一下VS的位段存储。

    #include
    struct S 
    {
    	char a : 3;
    	char b : 4;
    	char c : 5;
    	char d : 4;
    };
    int main()
    {
    	struct S s = { 0 };
    	s.a = 10;
    	s.b = 12;
    	s.c = 3;
    	s.d = 4;
    	printf("%d", sizeof(s));
    	return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    在这里插入图片描述

    事实确实如此:

    位段在网络底层非常有用,例如:IP数据包的格式。


    🌏联合

     联合体(union)是一种特殊的数据类型,它允许在内存中创建多个变量,但只能存储其中一个变量的值。联合体的目的是节省内存空间,因为它可以重复利用同一块内存存储不同的变量值。

    ⚠规则:

    1. 联合的大小至少是最大成员的大小。
    2. 最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
    union Un
    {
    	char c[5];//对齐数是1
    	int i;//对齐数是4
    };
    //最大对齐数是4
    //大小为8字节
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    char c[5] 的大小为5字节,int i 的大小为4字节,所以至少为5个字节,但是这里最大对齐数是4,所以总大小会增加至 8个字节。


    ❤️ 结语

     文章到这里就结束了,如果对你有帮助,你的点赞将会是我的最大动力,如果大家有什么问题或者不同的见解,欢迎大家的留言~

  • 相关阅读:
    Oracle-DataGuard参数enabled_PDBs_on_standby禁用PDB同步
    【Python】PySpark 数据处理 ① ( PySpark 简介 | Apache Spark 简介 | Spark 的 Python 语言版本 PySpark | Python 语言场景 )
    mysql与磁盘的关系
    跨平台命令行ssh终端工具tryssh详解
    分布式架构在云计算平台中的应用及优缺点
    凝聚五城力量 2022Home尧泰汉海“益起微笑”公益活动圆满举行
    测试踩坑 - 当已有接口(或数据库表中)新增字段时,都需要注意哪些测试点?
    【技术积累】Mysql中的SQL语言【实战篇】【一】
    缩短汽车服务企业供销链,数商云经销商平台渠道订货模块打造企业销售新模式
    CISP-PTE真题演示
  • 原文地址:https://blog.csdn.net/m0_75219751/article/details/132700841