计算机字节对齐

什么是字节对齐

计算机中内存大小的基本单位是字节（byte），理论上来讲，可以从任意地址访问某种基本数据类型，但是实际上，计算机并非逐字节大小读写内存，而是以2,4,或8的倍数的字节块来读写内存，如此一来就会对基本数据类型的合法地址作出一些限制，即它的地址必须是2，4或8的倍数。那么就要求各种数据类型按照一定的规则在空间上排列，这就是对齐。

数据类型对应字节数

下面是不同位数编译器下基本数据类型对应的字节数。

32位编译器：

char：1个字节
char*（即指针变量）:4个字节
shortint:2个字节
int：4个字节
unsignedint:4个字节
float:4个字节double:8个字节
long:4个字节
longlong:8个字节
unsignedlong:4个字节

64位编译器：

char：1个字节
char*(即指针变量):8个字节
shortint:2个字节
int：4个字节
unsignedint:4个字节
float:4个字节
double:8个字节
long:8个字节
longlong:8个字节
unsignedlong:8个字节

总结：32 位和 64 位编译器的基本数据类型字节数主要差别在 64 位的指针和 long 为 8 字节。

为什么要字节对齐

无论数据是否对齐，大多数计算机还是能够正确工作，而且从前面可以看到，结构体 test 本来只需要11字节的空间，最后却占用了16字节，很明显 浪费了空间 ，那么为什么还要进行字节对齐呢？

性能提升

以64位系统为例，访问内存的 IO 是以8个字节为单位。现在考虑8字节单位的处理器取 long 类型变量（64位系统），该处理器只能从地址为8的倍数的内存开始读取数据。

假如没有内存对齐机制，数据可以任意存放，现在一个long变量存放在从地址1开始的连续8个字节地址中，该处理器去取数据时，需要完成多个步骤：

要先从0地址开始读取第一个8字节块,剔除不想要的字节（0地址）
然后从地址8开始读取下一个8字节块,同样剔除不要的数据（9~15地址）
最后留下的两块数据合并放入寄存器

现在有了内存对齐的，long类型数据只能存放在按照对齐规则的内存中，比如说0地址开始的内存。那么现在该处理器在取数据时一次性就能将数据读出来了，而且不需要做额外的操作，提高了效率。

空间存储

还是考虑前面的结构体 test，其占用空间大小为16 字节，但是如果我们换一种声明方式，调整变量的顺序，重新运行程序，最后发现结构体 test 占用大小为 12字节

struct test
{
    int a;
    char b;
    short d;
    int c;
};

空间存储情况如下,b和d存储在了一个字节块中:

0~3	4	5	6~7	8~11
a	b	填充内容	d	c

也就是说，如果我们在设计结构的时候，合理调整成员的位置，可以大大节省存储空间。但是需要在空间和可读性之间进行权衡。

跨平台通信

由于不同平台对齐方式可能不同，如此一来，同样的结构在不同的平台其大小可能不同，在无意识的情况下，互相发送的数据可能出现错乱，甚至引发严重的问题。因此，为了不同处理器之间能够正确的处理消息，我们有两种可选的处理方法。

1字节对齐
自己对结构进行字节填充

我们可以使用伪指令#pragma pack(n)（n为字节对齐数）来使得结构间一字节对齐。
同样是前面的程序，如果在结构体test的前面加上伪指令，即如下:

#pragma pack(1) /*1字节对齐*/
struct test
{
    int a;
    char b;
    int c;
    short d;
};
#pragma pack()/*还原默认对齐*/

在这样的声明下，任何平台结构体test的大小都为11字节，这样做能够保证跨平台的结构大小一致，同时还节省了空间，但不幸的是，降低了效率。

当然了对于单个结构体，如下的方法，使其1字节对齐

struct test
{
    int a;
    char b;
    int c;
    short d;
}__attribute__ ((packed));

注:

attribute((aligned (n)))，让所作用的结构成员对齐在n字节自然边界上。如果结构中有成员的长度大于n，则按照最大成员的长度来对齐。
attribute ((packed))，取消结构在编译过程中的优化对齐，也可以认为是1字节对齐。

除了前面的1字节对齐，还可以进行人为的填充，即test结构体声明如下:

struct test{    int a;    char b;    char reserve[3];    int c;    short d;    char reserve1[2];};

访问效率高，但并不节省空间，同时扩展性不是很好，例如，当字节对齐有变化时，需要填充的字节数可能就会发生变化。

内存对齐原则

每个特定平台上的编译器都有自己的默认“对齐系数”（也叫对齐模数）。在64位系统中，gcc中默认#pragma pack(8)，可以通过预编译命令#pragma pack(n)，n = 1,2,4,8,16来改变这一系数。

有效对齐值：是给定值#pragma pack(n)和结构体中最长数据类型长度中较小的那个。有效对齐值也叫对齐单位。c++11中可以通过 alignof(t)来获取。

对齐准则

了解了上面的概念后，我们现在可以来看看内存对齐需要遵循的规则：
(1) 基本类型的对齐值就是其sizeof值;
(2) 结构(struct)(或联合(union))的数据成员，以后每个成员相对于结构体首地址的 offset 都是该成员大小与有效对齐值中较小那个的整数倍;
(3) 结构体的总大小为有效对齐值的整数倍

#include<iostream>
using namespace std;

struct{
    char a;
    long b;
    int c;
    short d;
}Test;

int main()
{
    cout<<"sizeof(char) "<<sizeof(char)<<endl;  // 1
    cout<<"sizeof(long) "<<sizeof(long)<<endl;  // 8
    cout<<"sizeof(int) "<<sizeof(int)<<endl;    // 4
    cout<<"sizeof(short) "<<sizeof(short)<<endl;// 2
    cout<<"alignof(Test) "<<alignof(Test)<<endl;// 8
    cout<<"sizeof(Test) "<<sizeof(Test)<<endl;; // 24
    return 0;
}

32 位与 64 位区别

1.先看 64 位下：


#include<stdio.h>
struct A
{
    int   a;
    char  b;
    double c;
    char  d;
};

struct B
{
    char  a;
    double b;
    char  c;
};

int main()
{
    printf("int =%lu,char=%lu,double=%lu\n",sizeof(int),sizeof(char),sizeof(double));
    printf("structA=%lu  structB=%lu\n",sizeof(struct A),sizeof(struct B));
    return 0;
}

输出结果：
structA: 4+(1+3)+8+(1+7) = 24
structB: (1+7)+8+(1+7) = 24
计算结果与输出是一样的。
这两个结构体在内存中存储应该是下面这样的：
struct A：整体按照 8 字节（double 长度）对齐
struct B :

2.在 32 位下编译，gcc 加参数 -m32


#include<stdio.h>
struct A
{
    int   a;
    char  b;
    double c;
    char  d;
};

struct B
{
    char  a;
    double b;
    char  c;
};

int main()
{
    printf("int =%u,char=%u,double=%u\n",sizeof(int),sizeof(char),sizeof(double));
    printf("structA=%u  structB=%u\n",sizeof(struct A),sizeof(struct B));
    return 0;
}

输出：
结果和 64 位下完全不一样，很显然它没有按照最长成员 double 的 8 字节对齐。稍微想一下就明白了，因为 32 位只有 4 个字节，最长对齐模数只能按 4 个字节来对齐，double 是分成了 2 个 4 字节。上面两个结构体在内存中应该是这种形式。
struct A：整体按照 4 字节对齐
4+(1+3)+8+(1+3) = 20
struct B :
(1+3)+8+(1+3) = 16

注意：内存空间实际上是连续的，上面分块的画法只是为了方便理解。

总结

虽然我们不需要具体关心字节对齐的细节，但是如果不关注字节对齐的问题，可能会在编程中遇到难以理解或解决的问题。因此针对字节对齐，总结了以下处理建议：

结构体成员合理安排位置，以节省空间
跨平台数据结构可考虑1字节对齐，节省空间但影响访问效率
跨平台数据结构人为进行字节填充，提高访问效率但不节省空间
本地数据采用默认对齐，以提高访问效率
32位与64位默认对齐数不一样，分别是4字节和8字节对齐

参考

Fetching Titl59gz
C++内存对齐 | 许森琪的博客
 32位和64位下结构体内存对齐问题_lwoyvye的博客-CSDN博客

Yes365's Garden

Explorer

Recent Notes

wireshark 分析艺术

网络基础：MTU 和 MSS

windows 设置 mtu