• C语言结构体深度剖析


    目录

    前言:

    什么是结构体

    结构体变量

    结构的声明:

    匿名类结构体类型

    结构体自引用

    结构体变量的定义和初始化

    结构体传参

    1.传值

    2.传址

    结构体内存对齐

    对齐规则

    修改默认对齐数

    offsetof宏

    内存对齐的意义

    位段

    什么是位段

    位段的内存分配

    位段的跨平台问题



    📌————本章重点————📌

    🔗 结构体内存对齐

    🔗位段的内存分配


     ✨————————————✨

    前言:

    什么是结构体:

            结构体是由一批数据组合而成的结构型数据。组成结构型数据的每个数据称为结构型数据的“成员”。

    结构体变量

            结构体是C语言中一种重要的数据类型,该数据类型由一组称为成员(或称为域,或称为元素)的不同数据组成,其中每个成员可以具有不同的类型。

            结构体类型不是由系统定义好的,而是需要程序设计者自己定义的。C语言提供了关键字struct来标识所定义的结构体类型。

            关键字struct和结构体名组合成一种类型标识符,其地位如同通常的int、char等类型标识符,其用途就像 int 类型标识符标识一样可以用来定义结构体变量。

            定义变量以后,该变量就可以像定义的其他变量一样使用了;成员又称为成员变量,它是结构体所包含的若干个基本的结构类型,必须用“{}”括起来,并且要以分号结束,每个成员应表明具体的数据类型。


    结构的声明:

    这里先练习一个最简单且直观的声明写法:

    1. struct Peo
    2. {
    3. char name[10];//姓名
    4. int age; //年龄
    5. char sex[5]; //性别
    6. };

    匿名类结构体类型

    • 在声明结构的时候,可以不声明标签,这样的写法叫做匿名类型;
    • 匿名结构体类型只能使用一次;
    • 如果声明多个匿名类型,即使它们的成员变量都相同,编译器也会将它们视为不同类型;
    1. struct {
    2. char name[10];//姓名
    3. int age; //年龄
    4. char sex[5]; //性别
    5. };


    结构体自引用

    • 在一个结构体内部包含类型为该结构体本身的成员,叫做自引用;
    • 结构体不能包含同类型的结构体,只能包含同类型的结构体指针;

    1.未重命名的:

    2.重命名的:


    结构体变量的定义和初始化

    1.全局定义和初始化:p1,p2,p3都作为全局变量.

    1. struct Peo
    2. {
    3. char name[10];//姓名
    4. int age; //年龄
    5. char sex[5]; //性别
    6. }p1,p2,p3;
    1. struct Peo
    2. {
    3. char name[10];//姓名
    4. int age; //年龄
    5. char sex[5]; //性别
    6. }p1={"zhangsan", 12, '男'};

    2.局部变量的定义和初始化:在主函数内部产生.

    1. struct Peo
    2. {
    3. char name[10];//姓名
    4. int age; //年龄
    5. char sex[5]; //性别
    6. };
    7. int main()
    8. {
    9. struct Peo p2 ={"zhansan", 12, '男'};//在主函数内部定义一个p2变量
    10. return 0;
    11. }


    结构体传参

    • 结构体传参时可以传值可以传址;
    • 首选传址:因为函数传参时是需要压栈的,只要压栈就会导致系统在时间和空间上的开销,倘若传的是结构体对象,而且过大时,更会导致效率大打折扣;

    1.传值

    解引用使用点号(.):

    1. struct stu
    2. {
    3. int arr[5];
    4. char ch;
    5. };
    6. void Print(struct stu s)
    7. {
    8. for (int i = 0; i < 5; i++)
    9. {
    10. printf("%d ", s.arr[i]);
    11. }
    12. printf("%c\n", s.ch);
    13. }
    14. int main()
    15. {
    16. struct stu s1 = { { 1,2,3,4,5 },'a' };
    17. Print(s1);
    18. return 0;
    19. }

    2.传址

    解引用使用指向符(->):

    1. struct stu
    2. {
    3. int arr[5];
    4. char ch;
    5. };
    6. void Print(struct stu* s)
    7. {
    8. for (int i = 0; i < 5; i++)
    9. {
    10. printf("%d ", s->arr[i]);
    11. }
    12. printf("%c\n", s->ch);
    13. }
    14. int main()
    15. {
    16. struct stu s1 = { { 1,2,3,4,5 },'a' };
    17. Print(&s1);
    18. return 0;
    19. }


    结构体内存对齐

    思考:当我们计算某个结构体的大小时,难道也是直接根据对应成员的数据类型大小求和吗?

    • 其实结构体的大小不能直接根据成员大小来计算,而是与每个成员的定义顺序有关;

     我们先来看这个在面这个例子:三个结构体的成员只是顺序不同,就导致大小有所差异。

    究其原因是因为结构体在存储时存在内存对齐。

    接下来就手把手带你计算结构体大小,不想会都难,学会了将一劳永逸。

    对齐规则:

    • 第一个成员在偏移量为0的地址处;
    • 后面的成员变量,从上一个成员的结束位置开始向后找,找到某个数(对齐数的整数倍位置);
    • 对齐数 = 编译器默认对齐数 与 该成员类型的较小值;(vs默认是8)
    • 最终结构体的总大小:是最大对齐数(每个成员的对齐数)的整数倍;
    • 如果结构体嵌套:嵌套的结构体先根据上述方法对齐到正确的位置,最终结构体的大小是所有对齐数的整数倍(包括被嵌套的结构体的对齐数);

     上述代码图解:

    修改默认对齐数:

    有时候结构对齐数不合适,我们可以使用#pragam预处理命令,可以修改默认对齐数;

    像下面这样,默认对齐数改为了1该结构体大小就变为14:

    1. #pragma pack(1)
    2. struct Peo
    3. {
    4. char name[5];
    5. int age;
    6. char sex[5];
    7. };
    8. #pragma pack()
    9. int main()
    10. {
    11. printf("%zd\n", sizeof(struct Peo));
    12. return 0;
    13. }

    若将默认对齐数改为7,会出现这样的警告:

    offsetof宏

    这里介绍一个宏:可以计算结构体成员在内存中的偏移量

    size_t offsetof( structName, memberName );

    内存对齐的意义:

    通过上述演示我们发现,既然内存对齐存在浪费空间的情况,那为什么要注意做呢?

    实质上:内存对齐是拿空间换去时间的做法;

    • 性能方面:

            首先我们要搞清楚一点:在cpu看来,内存并不是简单的以一个字节去划分的,而是以块为单位,一个块可能是2,4,8,16个字节,因此将结构体内存对齐,可以避免处理器进行二次访问内存,节省时间成本;

    • 移植性原因:

            并不是所有的硬件平台都能访问任意地址处的数据;

    结论:我们在设计结构体成员时,要尽可能安排合适的顺序,考虑到内存对齐,防止过多的空间被浪费。


    位段

    什么是位段

            位段这一概念是结构体中必须提到的知识点,C语言允许在一个结构体中以位为单位来指定其成员所占内存长度,这种以位为单位的成员称为“位段”或称“卫浴”( bit field) 。利用位段能够用较少的位数存储数据。

            比如我只需要一个表示0或1的数,那么就只需要给它分配1个bit位即可,如果只需要一个表示0~3的数,那么只需要给它分配2个bit位即可。

    要求:

    • 位段的成员必须是int、unsigned int、signed int(或者char);
    • 位段的我成员名之后有一个冒号和数字;
    • 冒号后面的大小不能超过前面类型的所属bit位大小;

    比如:下面这样一个结构体大小只占4个字节:

    因此,结构体在内存对齐时会浪费空间,那么利用位段可以节省空间

    1. struct stu
    2. {
    3. int a : 1;
    4. int b : 2;
    5. int c : 3;
    6. int d : 4;
    7. };
    8. int main()
    9. {
    10. printf("%zd\n", sizeof(struct stu));
    11. return 0;
    12. }

     既然如此,那位段的内存又是如何分配的呢?

    位段的内存分配

    下面这个例子输出为:3 0 3 12 13;

    1. struct stu
    2. {
    3. char a : 1;
    4. char b : 3;
    5. char c : 5;
    6. char d : 6;
    7. };
    8. int main()
    9. {
    10. printf("%zd\n", sizeof(struct stu));
    11. struct stu s1 = { 0 };
    12. s1.a = 10;
    13. s1.b = 11;
    14. s1.c = 12;
    15. s1.d = 13;
    16. printf("%d\n", s1.a);
    17. printf("%d\n", s1.b);
    18. printf("%d\n", s1.c);
    19. printf("%d\n", s1.d);
    20. return 0;
    21. }

    过程:

    1. a只有分配了1个bit位,而10的二进制有效位占了4个bit位,10被截断为0,先开辟一个字节(假设8个bit位)空间,放a,这个字节剩余7个bit位;
    2. b同样得到3个bit位,11被截断为三位变成3,这三位在刚才剩余的7位中能放下,则紧跟着放入b;
    3. c同样的到5个bit位,12被截断为5位,可以完整表示12,但由于刚才已经使用了(1+3=)4个bit位,剩余4位不够放c的值,那么再开辟一个字节空间,依次类推,最终为该结构开辟了3个字节空间。

    图解:

    位段的跨平台问题:

    虽说使用位段可以很好的节省空间,但是它也存在缺陷,那就是跨平台问题:

    • int 位段被当成有符号数还是无符号数是不确定的;
    • 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题);
    • 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义;
    • 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的;


  • 相关阅读:
    2022年亚太杯APMCM数学建模大赛A题结晶器熔剂熔融结晶过程序列图像特征提取及建模分析求解全过程文档及程序
    LeetCode: 4. Median of Two Sorted Arrays
    10道不得不会的 JavaEE 面试题
    Paper Reading《Torch.manual_seed(3407) is all you need》
    (转)CSS结合伪类实现icon
    getchar函数设置为非阻塞
    【C++】之类和对象 - const成员函数
    wstunnel (websocket模式代理http)
    [附源码]SSM计算机毕业设计校园疫情防控管理系统JAVA
    Educational Codeforces Round 155 (Rated for Div. 2)(A-D)
  • 原文地址:https://blog.csdn.net/m0_65190367/article/details/126538082