内存管理是C/C++编程非常重要的一部分内容,熟悉C/C++中一些常见数据结构和数据类型的内存分布情况,可以很大程度上降低了coding过程中内存泄漏和越界等比较严重的内存问题,下面主要讨论一下结构体(类中同样存在内存对齐,内存对齐会复杂一些,涉及到虚表等问题,后面介绍类的时候会提到)中的内存对齐问题。
如有侵权,请联系删除,如有错误,欢迎大家指正,谢谢
内存对齐指令
- 一般来说,内存对齐过程对coding者来说是透明的,是由编译器控制完成的
- 如对内存对齐有明确要求,可用#pragma pack(n)指定,以n和结构体中最长数据成员长度中较小者为有效值
- 如未明确指定时,以结构体中最长的数据成员长度作为内存对齐的有效值
以下如没有特殊说明,均视为情况3(未明确指定)计算
内存对齐的三条规则
- 数据成员对齐规则,结构体(struct)(或联合(union))的数据成员,第一个数据成员存放在offset为0的地方,以后每个数据成员存储的起始位置要从该成员大小或者成员的子成员(只要该成员有子成员,比如数组、结构体等)大小的整数倍开始(如:int 在 64bit 目标平台下占用 4Byte,则要从4的整数倍地址开始存储)
- 结构体作为成员,如果一个结构体里有某些结构体成员,则结构体成员要从其内部最大元素大小的整数倍地址开始存储
- 结构体的总大小,即sizeof的结果,必须是其内部最大成员长度(即前面内存对齐指令中提到的有效值)的整数倍,不足的要补齐
另外还有两个需要注意的点:
- 数组在内存中存储时是分开存储的,char类型的数组每个元素是 1Byte,内存对齐时按照单个元素进行对齐
- union(联合体)类型中的数据共用内存,联合的所有成员共用一段内存空间,存储地址的起始位置都相同,一般来说最大成员的内存宽度作为union的内存大小,主要的原因是为了节省内存空间,默认的访问权限是公有的,但是它同样要遵守内存对齐的原则,特别是第3条规则
- C++中空结构体占用 1Byte
- C++中空类同样是占用 1Byte的内存空间(剑指offer 2.2.1节中中提到,当声明该类型的实例的时候,必须在内存中占有一定的空间,否则无法使用这些实例,占用多少内存由编译器决定)
下面开始举栗子说明
栗子1
struct Test1 {
int a;
double b;
char c;
};
解释:
- int a; 占用 4Byte(存储位置0-3),规则1
- double b; 占用 8Byte(存储位置是从该类型长度(也就是 8Byte)或整数倍开始存储8-15),规则1
- char c; 占用 1Byte(存储位置16),规则1
- 这时一共用了17 Byte,但是sizeof所得的大小为24,这就用到了第3条规则,最后sizeof的大小还必须是内部最大成员长度的整数倍,不足的要补齐,这个结构体中最大成员是double b; 8 Byte,最后sizeof的大小为24,规则3
栗子2
struct Test2 {
int a;
double b;
char c[6];
};
解释:
- int a; 占用 4Byte(存储位置0-3),规则1
- double b; 占用 8Byte(存储位置是从该类型长度(也就是 8Byte)或整数倍开始存储8-15),规则1
- 数组在内存中存储时是分开存储的,char类型的数组每个元素是 1Byte,按单个元素进行内存对齐,故sizeof大小还是24,注意1 & 规则3
栗子3
struct Test {
int a;
double b;
char c;
};
struct Test3 {
int a;
Test d;
double b;
char c;
};
解释:
- int a; 占用 4Byte(存储位置0-3),规则1
- Test中最大的元素是double b; 占用 8Byte,Test中的成员是按照 8Byte 的整数倍的地址开始存储的,Test中int a; 占用 4Byte(存储位置8-11),double b; 占用 8Byte(存储位置16-23),char c; 占用 1Byte(存储位置24),规则2
- double b; 占用 8Byte(存储位置32-39),规则1
- char c; 占用1 Byte(存储位置40),不是最大元素大小8的整数倍,按照规则3补齐,sizeof为48,规则1 & 规则2 & 规则3
栗子4
struct Test {
int a;
double b;
char c;
};
struct Test3 {
int a;
Test d;
char c;
};
解释:
- Test3中的最大数据成员大小比成员结构体Test内部最大成员大小要小,这时规则3是按照成员结构体内部的最大成员的整数倍进行补齐的,sizeof的结果是40
栗子5
union Test{
char a[20];
int b;
float c;
};
解释:
- sizeof的大小是20,即a[20]的大小,同样20是b和c的倍数,规则3
栗子6
union Test{
char a[20];
int b;
float c;
double d;
};
解释:
- sizeof的大小是24,即满足容下a[20],同样20是b、c和d的倍数,规则3
字节对齐的原因:
- 平台原因(移植原因),不是所有的硬件平台都能任意访问地址上的任意数据的,某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常
- 性能原因,经过内存对齐后,CPU的访问效率会得到很大的提高(CPU把内存当成是一块一块的,块的大小可以是2,4,8,16Byte 大小,因此CPU在读取内存时是一块一块进行读取的,当读取块的大小是 4Byte 时,一个数据所占的字节偏移(offset)为3|4|5|6,那么CPU访问数据时便需要访问两次,才能得到完整的数据,经过内存对齐后,便可以通过一次访问CPU获取完整的数据[引用自])
以上测试均是在win10 vs2017 64bit编译器下进行的