结构体内存对齐(面试重点)

结构体内存对齐

    • 1. 结构体类型的声明
      • 1.1 结构体的概念
        • 1.1.1 结构的声明
        • 1.1.2 结构体变量的创建和初始化
      • 1.2 结构的特殊声明
      • 1.3 结构的自引用
    • 2. 结构体内存对齐
      • 2.1 对齐规则
        • 2.1.1 练习1:
        • 2.1.2 练习2:
        • 2.1.3 练习3:
        • 2.1.4 练习4:
      • 2.2 offsetof宏的使用
      • 2.3 为什么存在内存对齐?
      • 2.4 修改默认对齐数
    • 3. 结构体传参
      • 3.1 代码一
      • 3.2 代码二

1. 结构体类型的声明

1.1 结构体的概念

结构是⼀些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。

1.1.1 结构的声明
struct tag
{
	member-list;
}variable-list;

例如描述⼀个学⽣:

struct Stu
{
	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
}; //分号不能丢
1.1.2 结构体变量的创建和初始化
#include 

struct Stu
{
	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
};

int main()
{
	//按照结构体成员的顺序初始化
	struct Stu s = { "张三", 20, "男", "20230818001" };
	printf("name: %s\n", s.name);
	printf("age : %d\n", s.age);
	printf("sex : %s\n", s.sex);
	printf("id : %s\n", s.id);

	//按照指定的顺序初始化
	struct Stu s2 = { .age = 18, .name = "lisi", .id = "20230818002", .sex = "女"};
	printf("name: %s\n", s2.name);
	printf("age : %d\n", s2.age);
	printf("sex : %s\n", s2.sex);
	printf("id : %s\n", s2.id);
	
	return 0;
}

运行结果如图:
结构体内存对齐(面试重点)_第1张图片

1.2 结构的特殊声明

在声明结构的时候,可以不完全的声明。

比如:

//匿名结构体类型
struct
{
	int a;
	char b;
	float c;
}x;

struct
{
	int a;
	char b;
	float c;
}*p;

上⾯的两个结构在声明的时候省略掉了结构体标签(tag)。那么问题来了?

//在上⾯代码的基础上,下⾯的代码合法吗?
p = &x;

警告:

  • 编译器会把上⾯的两个声明当成完全不同的两个类型,所以是非法的。
  • 匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使用⼀次。

1.3 结构的自引用

在结构中包含⼀个类型为该结构本⾝的成员是否可以呢?

比如,定义⼀个链表的节点:

struct Node
{
 int data;
 struct Node next;
};

上述代码正确吗?如果正确,那 sizeof(struct Node) 是多少?

仔细分析,其实是不⾏的,因为⼀个结构体中再包含⼀个同类型的结构体变量,这样结构体变量的⼤⼩就会⽆穷的⼤,是不合理的。

正确的自引用方式:

struct Node
{
	int data;//存放数据
	struct Node* next;//存放下一个节点的地址
};

在结构体⾃引⽤使⽤的过程中,夹杂了 typedef 对匿名结构体类型重命名,也容易引⼊问题,看看下⾯的代码,可行吗?

typedef struct
{
	int data;
	Node* next;
}Node;

答案是不⾏的,因为Node是对前⾯的匿名结构体类型的重命名产⽣的,但是在匿名结构体内部提前使⽤Node类型来创建成员变量,这是不⾏的。

解决方案如下:定义结构体不要使用匿名结构体了

typedef struct Node
{
	int data;
	struct Node* next;
}Node;

2. 结构体内存对齐

现在我们深⼊讨论⼀个问题:计算结构体的大小。这也是⼀个特别热⻔的考点: 结构体内存对齐

2.1 对齐规则

首先得掌握结构体的对齐规则:

  1. 结构体的第⼀个成员对⻬到和结构体变量起始位置偏移量为0的地址处

  2. 其他成员变量要对⻬到某个数字(对⻬数)的整数倍的地址处。
    对齐数 = 编译器默认的一个对齐数与该成员变量大小的较小值

    - 结构体内存对齐VS 中默认的值为 8

    - Linux中 gcc 没有默认对齐数,对⻬数就是成员自身的大小

  3. 结构体总⼤⼩为最⼤对⻬数(结构体中每个成员变量都有⼀个对⻬数,所有对⻬数中最⼤的)的整数倍。

  4. 如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处,结构体的整体大小就是所有最⼤对⻬数(含嵌套结构体中成员的对⻬数)的整数倍。

2.1.1 练习1:
//练习1
#include 
struct S1
{
	char c1;//0(偏移量为0的地址上)
	char c2;//1
	//因为是int,根据规则二,要对齐到4的的整数倍的地址处
	int i;//4~7
	//0~7一共7个字节
};

int main()
{
	printf("%zd", sizeof(struct S1));
	return 0;
}

运行结果如图:
结构体内存对齐(面试重点)_第2张图片

2.1.2 练习2:
//练习2:
#include 
struct S2
{
	char c1;//0(偏移量为0的地址上)
	int i;//4~7
	char c2;//8
	//对齐到4的整数倍,9~11,总共12个字节
};

int main()
{
	printf("%zd", sizeof(struct S2));
	return 0;
}

运行结果如图:
结构体内存对齐(面试重点)_第3张图片

2.1.3 练习3:
//练习3
#include 
struct S3
{
	double d;//0~7
	char c;//8
	int i;//12~15
	//一共16个字节
};

int main()
{
	printf("%zd", sizeof(struct S3));
	return 0;
}

运行结果如图:
结构体内存对齐(面试重点)_第4张图片

2.1.4 练习4:
//练习4-结构体嵌套问题
#include 
struct S3
{
	double d;
	char c;
	int i;
};

struct S4
{
	char c1;//0
	struct S3 s3;//8~23(嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处)
	double d;//24~31
	//一共32个字节
};

int main()
{
	printf("%zd", sizeof(struct S4));
	return 0;
}

运行结果如图:
结构体内存对齐(面试重点)_第5张图片

2.2 offsetof宏的使用

结构体内存对齐(面试重点)_第6张图片

offsetof (type,member)
  • offsetof - 计算结构体成员相较于起始位置的偏移量
  • 第一个参数是结构体类型,第二个参数是结构体成员名
  • 使用offsetof宏需要包含头文件 #include

代码举例:

#include 
#include 
struct S3
{
	double d;
	char c;
	int i;
};

//练习4-结构体嵌套问题
struct S4
{
	char c1;
	struct S3 s3;
	double d;
};

int main()
{
	printf("%d\n", offsetof(struct S4,c1));
	printf("%d\n", offsetof(struct S4,s3));
	printf("%d\n", offsetof(struct S4,d));
	return 0;
}

运行结果如图:
结构体内存对齐(面试重点)_第7张图片

2.3 为什么存在内存对齐?

大部分的参考资料都是这样说的:

  1. 平台原因 (移植原因):
    不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
  2. 性能原因:
    数据结构(尤其是栈)应该尽可能地在⾃然边界上对齐。原因在于,为了访问未对⻬的内存,处理器需要作两次内存访问;⽽对⻬的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对⻬成8的倍数,那么就可以⽤⼀个内存操作来读或者写值了。否则,我们可能需要执⾏两次内存访问,因为对象可能被分放在两个8字节内存块中。

那在设计结构体的时候,我们既要满⾜对⻬,⼜要节省空间,如何做到:

让占用空间小的成员尽量集中在一起

总体来说:结构体的内存对齐是拿空间来换取时间的做法。

 //例如:
struct S1
{
	char c1;
	int i;
	char c2;
	};

struct S2
{
	char c1;
	char c2;
	int i;
};

S1 和 S2 类型的成员⼀模⼀样,但是 S1 和 S2 所占空间的大小有了⼀些区别。

2.4 修改默认对齐数

#pragma 这个预处理指令,可以改变编译器的默认对齐数。

#include 
#pragma pack(1)//设置默认对齐数为1
struct S
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的对齐数,还原为默认
int main()
{
	//输出的结果是什么?
	printf("%d\n", sizeof(struct S));
	return 0;
}

结构体内存对齐(面试重点)_第8张图片

结构体在对齐方式不合适的时候,我们可以自己更改默认对齐数。

3. 结构体传参

3.1 代码一

#include 

struct S
{
	int data[1000];
	int num;
};

void print1(struct S t)
{
	printf("%d %d\n", t.data[0], t.num);

}

int main()
{
	struct S s = { {1,2,3,4,5},100 };
	print1(s);
	return 0;
}

运行结果如图:
结构体内存对齐(面试重点)_第9张图片

3.2 代码二

#include 

struct S
{
	int data[1000];
	int num;
};

void print1(struct S t)
{
	printf("%d %d\n", t.data[0], t.num);

}

void print2(struct S* ps)
{
	printf("%d %d\n", ps->data[0], ps->num);
}

int main()
{
	struct S s = { {1,2,3,4,5},100 };
	print1(s);
	print2(&s);
	return 0;
}

运行结果如图:
结构体内存对齐(面试重点)_第10张图片

上面的 print1 和 print2 函数哪个好些?

答案是:首选print2函数。

原因:

函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。

如果传递⼀个结构体对象的时候,结构体过大,参数压栈的的系统开销⽐较⼤,所以会导致性能的下降。

结论:
结构体传参的时候,要传结构体的地址。

你可能感兴趣的:(面试,职场和发展,c语言,算法)