数据对齐的目的,是用空间换时间,提高效率.
对齐本身并不难理解,但是有这么一个古怪的命令#pragma pack()存在,它可以人为指定按几个字节来对齐.有了这个命令,就让情况变得更加复杂了.
网上有很多#pragma pack()命令的使用方法总结,但我不认为这个命令是必要的,应该尽量避免使用.
如果你的代码里使用了#pragma pack(),会导致sizeof()取得预料外的值,导致程序出错.这个错误并不容易发现.
#pragma pack()能让你的内存存储变紧凑,但会让sizeof()变得诡异,值得么?不值.
(也许写程序传输协议时需要#pragma pack()来防止结构体中出现空洞?很牵强,我不认为这是必须的.)
干脆,抛开#pragma pack()命令,简简单单来理解数据对齐吧.
对齐表明了数据在内存中的存放方式,内存的最小单位是1字节,对齐长度为1说明数据可以存储在任何内存地址.对齐长度为2说明只能存放在能被2整除的内存地址.对齐长度是4只能存放在能被4整除的内存地址.对齐长度只能是2的幂,也就是1,2,4,8,16...
数据对齐只会影响到结构体(或联合),归纳起来有如下两个规则:
1.结构体外的数据类型,它们按照自身大小来对齐.比如char型对齐长度是1,int型对齐长度是4,double型对齐长度是8.(32位系统下一般是这样).
2.结构体本身也有一个对齐长度,这个值是内部成员中自身对齐长度最大的那个值.结构体需按自身对齐长度对齐,换句话说,结构体大小必须是本身对齐长度的整数倍.
根据上面两条,你就会算结构体的大小了.
例1:
struct A { char a; long b; char c; double d; };
分析:
sizeof(struct A)=24.a占一个字节,b对齐长度是4,所以a后面补三个字节的洞后再存b.紧跟着是c占一个字节,d的对齐长度是8,所以c后面补7个字节的洞后再存d.共24字节.
struct A本身的对齐长度是8.
例2:
struct B { char a; char b; long c; double d; };
分析:
sizeof(struct B)=16.a占一个字节,b也占一个字节.c对齐长度是4,所以b后补两个字节洞后存c.d对齐长度是8,前面abc加起来恰好8字节,所以d可以紧跟c存放.共16字节.
struct B本身的对齐长度是8.
例3:
struct C { char a[123]; int b; float c; double d; };
分析:
sizeof(struct C)=144.a占123个字节,后补一个字节洞后存4字节的b,此时地址仍然能被4整除,所以紧跟着存4字节的c,目前总长度132,补4字节洞后存入8字节的d.总大小144字节.
等等!有疑问!
char a[123]的对齐长度是1还是123?是1.数组并非一种数据类型,这个数组的数据类型是char,char的对齐长度是1.
所以,struct C的自身对齐长度是8,144是8的整数倍,没问题.
例4:
struct D { struct x { char a; int b; float c; }X; int d; char e; };
分析:
sizeof(struct D)=20.先看struct x.a一个字节,补三个字节洞后跟4字节的b,之后是4字节的c.X的长度是12字节.struct x的自身对齐长度是4.再看struct D,X12字节,后跟4字节的d,之后是1个字节的e.struct D的自身对其长度是4(不是12,想一想吧).所以e后面要补三个字节洞.总长度是12+4+4=20.
例5:
struct E { union y { char a; double b; int c; }Y; int d; double e; };
分析:
sizeof(struct E)=24.Y是一个联合,联合的特点是它会占用跟最大的内部成员相同的空间,double最大,所以union y的对齐长度是8.之后是4字节的d.8+4=12为了对齐后面是8字节的e,d后面要补4字节的洞.所以总长度是8+8+8=24.
数据对齐基本就讲完了,描述不是特别清楚,还请见谅.
在网上,看到有人提出了如下的疑问,请试试看能否替他解答一下呢?
Struct A { char a,b; char arr[5]; } //这个sizeof(A)=7.。1+1+5 = 7.。对齐单位为1字节。这个可以理解。 Struct B { int a,b; char arr[5]; } //这个sizeof(B) = 16.. 是怎么对齐的? 数组占了8个字节?。为什么?
分析:
struct A自身的对齐长度是1,所以sizeof(struct A)=7这很容易理解.
struct B呢?自身的对齐长度是4,a+b+arr的长度是4+4+5=13,13不能被4整除(或者说13没有按照自身对其长度对齐),所以要在最后补3个字节的洞变成16.
补充,如果考虑#pragma pack那么规则如下:
1)数据类型自身的对齐值:就是上面交代的基本数据类型的自身对齐值。
2)指定对齐值:#pragma pack (value)时的指定对齐值value。
3)结构体或者类的自身对齐值:其成员中自身对齐值最大的那个值。
4)数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中较小的那个值。
另外,在GCC中,#pragma pack的默认值是4,vc中默认值是8.这一点差别会带来天差地别的不同,gcc里任何double类型都是按4字节对齐的.