如果我们想要了解结构体内存对齐的知识点,首先我们要对结构体有一定的认识。下面我们先讲解一下结构体的基本知识点。
结构体是一些值的集合,这些值称为成员变量,结构的每个成员可以是不同类型的变量。我们可以使用结构体创建一个学生类型,里面的成员变量有:名字,年龄,性别,学号等。
int main()
{
struct str {
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
};
}
这样我们就创建了一个学生。struct str
是数据类型,我们想要使用这个学生类型,就需要创建变量和初始化,那么结构体如何创建变量和初始化呢?
//结构体创建变量
int main()
{
struct str {
char name[20];
int age;
char sex[5];
char id[20];
}str1 = {"xiongda",20, "nan","123456"};
struct str str2 = {"xionger",21,"nan","234567"};
printf("%s %d %s %s\n", str1.name, str1.age, str1.sex, str1.id);
printf("%s %d %s %s", str2.name, str2.age, str2.sex, str2.id);
}
如上图这样我们就可以创建两个学生变量并且初始化,同时我们打印了两个学生的信息。
除了上面这样最基本的情况,还有些特殊情况例如结构体的不完全声明
struct
{
int a;
char b;
float c;
} x;
struct
{
int a;
char b;
float c;
} *p;
上面两个结构在声明的时候省略掉了结构体标签,类似于这样的声明我们称为不完全声明。那么我们可以p = &x
这样写嘛?答案是不可以的,编译器会把上面的两个声明当成完全不同的两个类型。
我们在使用结构体时,可不可以在结构体中包含一个类型为该结构体本身的成员呢?
struct Node
{
int data;
struct Node next;
};
这样写是否正确呢?如果正确那么sizeof(struct Node)
是多少呢?struct Node
类型里面包含了一个struct Node
,struct Node
里面又包含了struct Node
类型,这样不是无限套娃么。所以这样自引用的方式是错误的,正确的自引用的方法是
struct Node
{
int data;
struct Node* next;
};
使用指针我们就可以找到下一个,struct Node
类型。
我们每次定义结构体变量时,我们都需要写一长串类似struct Node p
这样的东西,那么可不可以简化一下呢?typedef
就很好的解决了这个问题。
typedef struct
{
int data;
struct Node* next;
}Node;
这样声明的结构体,我们在创建结构体变量的时,可以直接使用Node p
这样的语句来创建。这样的方式是否好用呢,见仁见智,有人认为加上struct
可以更好的识别出结构体变量,有人认为不加struct
更加简单,在使用时根据自己的习惯使用就好。
在了解了上面的内容之后,就要进入我们的重点内容了,结构体的内存对齐问题。我们说变量在内存中存储,开辟的内存空间都有大小,char
类型开辟1个字节内存空间,int
类型开辟了4个字节的内存空间等,那么结构体变量时候有大小呢?大小又是多少呢?让我们来探究一下如何计算结构体的大小吧。
首先我们来看两个结构体声明
int main()
{
struct s1 {
char a;
int b;
char c;
};
printf("%d\n", sizeof(struct s1));
struct s2 {
char a;
char c;
int b;
};
printf("%d", sizeof(struct s2));
}
如果我们没有了解过结构体内存对齐的化,我们会认为这两个结构体的大小都是6个字节,因为他们的成员变量都是两个char
类型一个int
类型,但是事实真的是这样的吗?
我们看到这两个结构体的大小并不相同,并且都不为6,这是为什么呢?我们需要引入一个概念叫做偏移量,偏移量是什么呢,把储存单元的实际地址与其所在段的地址之间的距离称为偏移量,在结构体中也就是相较于结构体起始位置的距离。我们可以使用offsetof
来求偏移量。
int main()
{
struct s1 {
char a;
int b;
char c;
};
printf("%d\n", (int)offsetof(struct s1, a));
printf("%d\n", (int)offsetof(struct s1, b));
printf("%d\n", (int)offsetof(struct s1, c));
}
我们可以看见他们的偏移量分别是多少,因为偏移量是相较于结构体起始位置的距离,所以我们可以猜测一下这个结构体的内存分布。
上图是我们的对于这个结构体类型的内存分布的猜想,到底是不是这样呢,我们需要学习一下结构体内存对齐的规则。
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
VS中默认的值为8- 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
我们根据结构体内存对齐规则,再来还原一下结构体内存的开辟,验证我们的猜想是否正确。
首先第一条规则,结构体的一个成员放置在偏移量为0的地址处,所以我们将第一个char
类型放置在0地址处。
结构体第一个成员之后的其他成员,要放置在某个数字(对齐数)的整数倍的地址处。对齐数 = 编译器默认的一个对齐数与该成员大小的较小值,vs默认对齐数为8。第二个成员变量int
类型自身大小为4,默认对齐数为8,取较小值4,所以int
这个成员变量应该放在4的倍数的地址处,4是4的倍数,所以int
类型放在地址4处,自身大小占4个字节。同理,结构体第三个成员char
,自身大小1个字节,默认对齐数8个字节,取较小值1,所以应该放在1的倍数的地址处,8是1的倍数,所以第三个成员变量放在8地址处。
到此为止,我们的成员变量都在内存中开辟了空间,一共占用了9个字节,但是这个结构体的大小为12个字节,原因是我们还有第三条规则,结构体总大小为最大对齐数(每一个成员变量都有一个对齐数)的整数倍。
在这个结构体成员中,最大对齐数为4,所以继续向后开辟了3个字节的空间,将结构体总大小扩大为12,变成4的倍数。
这样验证了我们的猜想是正确的。我们使用结构体内存对齐规则,计算一下另一个结构体s2
的大小。
struct s2 {
char a;
char c;
int b;
};
地址总长度为8满足,规则三,所以该结构体的大小为8个字节。如果结构体有嵌套,那么结构体大小又该如何计算呢?
struct S3
{
double d;
char c;
int i;
};
struct S4
{
char c1;
struct S3 s3;
double d;
};
通过计算S3的大小为16,那么如何计算S4的大小呢?我们需要使用规则四:如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
所以该结构体大小为32,让我们在编译器中验证一下。
以上就是结构体内存对齐规则的详细解析,我们为什么要实现结构体内存对齐呢?
- 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特
定类型的数据,否则抛出硬件异常。- 性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访
问。
总体来说:
结构体的内存对齐是拿空间来换取时间的做法,那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到?让占用空间小的成员尽量集中在一起。
我们还可以自己修改默认对齐数,使用#pragma这个预处理指令。
int main()
{
#pragma pack(1)//设置默认对齐数为1
struct S2
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S2));
}
struct S {
int arr[100];
int num;
};
struct S s = { {1,2,3,4},100 };
void print1(struct S s)
{
printf("%d\n", s.num);
}
void printf2(struct S* s)
{
printf("%d", s->num);
}
int main()
{
print1(s);
printf2(&s);
return 0;
}
上面的两个函数都可以实现打印结构体内容的功能,那么哪一个函数比较好呢?print1
还是print2
?答案是print2
。原因是函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。所以我们在使用结构体传参时,最好传递结构体的地址。