C语言结构体深度剖析

C语言结构体深度剖析
目录

前言：

什么是结构体

结构体变量

结构的声明：

匿名类结构体类型

结构体自引用

结构体变量的定义和初始化

结构体传参

1.传值

2.传址

结构体内存对齐

对齐规则

修改默认对齐数

offsetof宏

内存对齐的意义

位段

什么是位段

位段的内存分配

位段的跨平台问题

📌————本章重点————📌

🔗 结构体内存对齐

🔗位段的内存分配

✨————————————✨

前言：

什么是结构体：

        结构体是由一批数据组合而成的结构型数据。组成结构型数据的每个数据称为结构型数据的“成员”。

结构体变量：

        结构体是C语言中一种重要的数据类型，该数据类型由一组称为成员（或称为域，或称为元素）的不同数据组成，其中每个成员可以具有不同的类型。

        结构体类型不是由系统定义好的，而是需要程序设计者自己定义的。C语言提供了关键字struct来标识所定义的结构体类型。

        关键字struct和结构体名组合成一种类型标识符，其地位如同通常的int、char等类型标识符，其用途就像 int 类型标识符标识一样可以用来定义结构体变量。

        定义变量以后，该变量就可以像定义的其他变量一样使用了；成员又称为成员变量，它是结构体所包含的若干个基本的结构类型，必须用“{}”括起来，并且要以分号结束，每个成员应表明具体的数据类型。

结构的声明：

这里先练习一个最简单且直观的声明写法：
```
struct Peo
{
	char name[10];//姓名
	int age;	  //年龄
	char sex[5];  //性别
};
```
匿名类结构体类型
- 在声明结构的时候，可以不声明标签，这样的写法叫做匿名类型；
- 匿名结构体类型只能使用一次；
- 如果声明多个匿名类型，即使它们的成员变量都相同，编译器也会将它们视为不同类型；
```
struct {
	char name[10];//姓名
	int age;	  //年龄
	char sex[5];  //性别
};
```
结构体自引用
- 在一个结构体内部包含类型为该结构体本身的成员，叫做自引用；
- 结构体不能包含同类型的结构体，只能包含同类型的结构体指针；
1.未重命名的：

2.重命名的：

结构体变量的定义和初始化

1.全局定义和初始化：p1，p2，p3都作为全局变量.
```
struct Peo
{
	char name[10];//姓名
	int age;	  //年龄
	char sex[5];  //性别
}p1,p2,p3;
```
```
struct Peo
{
	char name[10];//姓名
	int age;	  //年龄
	char sex[5];  //性别
}p1={"zhangsan", 12, '男'};
```
2.局部变量的定义和初始化：在主函数内部产生.
```
struct Peo
{
	char name[10];//姓名
	int age;	  //年龄
	char sex[5];  //性别
};
int main()
{
	struct Peo p2  ={"zhansan", 12, '男'};//在主函数内部定义一个p2变量
 
	return 0;
}
```
结构体传参
- 结构体传参时可以传值也可以传址；
- 首选传址：因为函数传参时是需要压栈的，只要压栈就会导致系统在时间和空间上的开销，倘若传的是结构体对象，而且过大时，更会导致效率大打折扣；
1.传值

解引用使用点号（.）:
```
struct stu
{
	int arr[5];
	char ch;
};
void Print(struct stu s)
{
	for (int i = 0; i < 5; i++)
	{
		printf("%d ", s.arr[i]);
	}
	printf("%c\n", s.ch);
}
int main()
{
	struct stu s1 = { { 1,2,3,4,5 },'a' };
 
	Print(s1);
 
	return 0;
}
```
2.传址

解引用使用指向符（->）：
```
struct stu
{
	int arr[5];
	char ch;
};
void Print(struct stu* s)
{
	for (int i = 0; i < 5; i++)
	{
		printf("%d ", s->arr[i]);
	}
	printf("%c\n", s->ch);
}
int main()
{
	struct stu s1 = { { 1,2,3,4,5 },'a' };
 
	Print(&s1);
 
	return 0;
}
```
结构体内存对齐
思考：当我们计算某个结构体的大小时，难道也是直接根据对应成员的数据类型大小求和吗？
- 其实结构体的大小不能直接根据成员大小来计算，而是与每个成员的定义顺序有关；
我们先来看这个在面这个例子：三个结构体的成员只是顺序不同，就导致大小有所差异。

究其原因是因为结构体在存储时存在内存对齐。

接下来就手把手带你计算结构体大小，不想会都难，学会了将一劳永逸。

对齐规则：
- 第一个成员在偏移量为0的地址处；
- 后面的成员变量，从上一个成员的结束位置开始向后找，找到某个数（对齐数的整数倍位置）；
- 对齐数 = 编译器默认对齐数与该成员类型的较小值；（vs默认是8）
- 最终结构体的总大小：是最大对齐数（每个成员的对齐数）的整数倍；
- 如果结构体嵌套：嵌套的结构体先根据上述方法对齐到正确的位置，最终结构体的大小是所有对齐数的整数倍（包括被嵌套的结构体的对齐数）；
上述代码图解：

修改默认对齐数：

有时候结构对齐数不合适，我们可以使用#pragam预处理命令，可以修改默认对齐数；

像下面这样，默认对齐数改为了1该结构体大小就变为14：
```
#pragma pack(1)
struct Peo
{
	char name[5];
	int age;
	char sex[5];
};
#pragma pack()
int main()
{
	printf("%zd\n", sizeof(struct Peo));
 
	return 0;
}
```
若将默认对齐数改为7，会出现这样的警告：

offsetof宏

这里介绍一个宏：可以计算结构体成员在内存中的偏移量

size_t offsetof( structName, memberName );

内存对齐的意义：

通过上述演示我们发现，既然内存对齐存在浪费空间的情况，那为什么要注意做呢？

实质上：内存对齐是拿空间换去时间的做法；
- 性能方面：
首先我们要搞清楚一点：在cpu看来，内存并不是简单的以一个字节去划分的，而是以块为单位，一个块可能是2,4,8,16个字节，因此将结构体内存对齐，可以避免处理器进行二次访问内存，节省时间成本；
- 移植性原因：
并不是所有的硬件平台都能访问任意地址处的数据；
结论：我们在设计结构体成员时，要尽可能安排合适的顺序，考虑到内存对齐，防止过多的空间被浪费。

位段

什么是位段

位段这一概念是结构体中必须提到的知识点，C语言允许在一个结构体中以位为单位来指定其成员所占内存长度，这种以位为单位的成员称为“位段”或称“卫浴”( bit field) 。利用位段能够用较少的位数存储数据。

比如我只需要一个表示0或1的数，那么就只需要给它分配1个bit位即可，如果只需要一个表示0~3的数，那么只需要给它分配2个bit位即可。
要求：
- 位段的成员必须是int、unsigned int、signed int（或者char）；
- 位段的我成员名之后有一个冒号和数字；
- 冒号后面的大小不能超过前面类型的所属bit位大小；
比如：下面这样一个结构体大小只占4个字节：

因此，结构体在内存对齐时会浪费空间，那么利用位段可以节省空间
```
struct stu
{
	int a : 1;
	int b : 2;
	int c : 3;
	int d : 4;
};
int main()
{
	printf("%zd\n", sizeof(struct stu));
 
	return 0;
}
```
既然如此，那位段的内存又是如何分配的呢？

位段的内存分配

下面这个例子输出为：3 0 3 12 13；
```
struct stu
{
	char a : 1;
	char b : 3;
	char c : 5;
	char d : 6;
};
int main()
{
	printf("%zd\n", sizeof(struct stu));
 
	struct stu s1 = { 0 };
 
	s1.a = 10;
	s1.b = 11;
	s1.c = 12;
	s1.d = 13;
 
	printf("%d\n", s1.a);
	printf("%d\n", s1.b);
	printf("%d\n", s1.c);
	printf("%d\n", s1.d);
 
	return 0;
}
```
过程：
1. a只有分配了1个bit位，而10的二进制有效位占了4个bit位，10被截断为0，先开辟一个字节（假设8个bit位）空间，放a，这个字节剩余7个bit位；
2. b同样得到3个bit位，11被截断为三位变成3，这三位在刚才剩余的7位中能放下，则紧跟着放入b；
3. c同样的到5个bit位，12被截断为5位，可以完整表示12，但由于刚才已经使用了（1+3=）4个bit位，剩余4位不够放c的值，那么再开辟一个字节空间，依次类推，最终为该结构开辟了3个字节空间。
图解：

位段的跨平台问题：

虽说使用位段可以很好的节省空间，但是它也存在缺陷，那就是跨平台问题：
- int 位段被当成有符号数还是无符号数是不确定的；
- 位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题）；
- 位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义；
- 当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的；
相关阅读:
【源码系列#06】Vue3 Diff算法
 若依项目里面的数据权限注解@DataScope 注解的实现原理与使用逻辑
 实现mnist手写数字识别
 linux创建用户基本操作
 cmake中的设置目标属性set_target_properties
十天学完基础数据结构-第九天（堆（Heap））
Leetcode 1492.n的第k个因子
 在爬虫的时候发现request 中的from data 是一串数据格式
 深信服测开实习
 JavaWeb之Cookie的简单使用！！！
原文地址：https://blog.csdn.net/m0_65190367/article/details/126538082

前言：

什么是结构体：

结构体变量：

结构的声明：

匿名类结构体类型

结构体自引用

结构体变量的定义和初始化

结构体传参

1.传值

2.传址

结构体内存对齐

对齐规则：

修改默认对齐数：

offsetof宏

内存对齐的意义：

位段

什么是位段

位段的内存分配

位段的跨平台问题：