C语言自定义类型

前言

C语言本身提供一些基本的内置类型(char,short,int,float,double等)用来定义简单对象,但却难以定义一些复杂对象(人,书等),所以C语言还给提供了可以让程序员定义的类型,我们称为“自定义类型”。像结构体、联合体(共用体)、枚举、数组。

1、结构体

1.1结构的基础知识

结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。

1.2、结构的声明

结构体的基本用法如下:

struct Stu
{
 char name[20];//名字
 int age;//年龄
 char sex[5];//性别
 char id[20];//学号
}; //分号不能丢

1.3、 特殊的声明

在声明结构的时候,可以不完全的声明。

例如:

//匿名结构体类型
struct
{
 int a;
 char b;
 float c;
}x;
struct
{
 int a;
 char b;
 float c;
}a[20], *p;

这种声明是结构体的匿名类型,上面的两个结构在声明的时候省略掉了结构体标签。
匿名类型的结构体创建变量只能创建全局变量,若创建了局部变量则会报错如下图:

C语言自定义类型_第1张图片

struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], *p;

那么问题来了?

在上面代码的基础上,下面的代码合法吗? p = &x;

答案是否定的,因为编译器会把上面的两个声明当成完全不同的两个类型。所以是非法的。

1.4、结构体的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢?
数据结构:描述的是数据在内存中的存储结构。

C语言自定义类型_第2张图片

#include 
//错误示范
struct Node
{
	int data;
	struct Node n;
};
int main()
{
	
	return 0;
}
 

C语言自定义类型_第3张图片
把数据分成两部分,第一部分放数据,第二部分放下一个数据结点,以此类推,到最后一个数据的时候,第二部分放个空指针不再往后找。

struct Node
{
	int data; 4
	struct Node *next; 4or8
};
int main()
{
	struct Node n1;
	struct Node n2;
	n1.next = &n2; n1和n2串起来了 next存放的是n2的地址
	return 0;
}
typedef struct 
{
	int data;
	char c;
	
}S;
typedef可以给匿名结构体起个类型名叫S 这里S不是全局变量 而是匿名结构体的类型名
 
 
typedef struct
{
int data;
Node* next;
}Node;  可行吗? error
 
因为Node是在最后一步定义的,而node*next早一步,有个先后顺序的问题
 
 
typedef struct Node
{
int data;
struct Node* next;
}Node;  正确写法

1.5、结构体变量的定义和初始化

有了结构体类型,那如何定义变量,其实很简单。

struct Point
{
 int x;
 int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
//初始化:定义变量的同时赋初值。
struct Point p3 = {x, y};
struct Stu        //类型声明
{
 char name[15];//名字
 int age;      //年龄
};
struct Stu s = {"zhangsan", 20};//初始化
struct Node
{
 int data;
 struct Point p;
 struct Node* next; 
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

1.6 结构体内存对齐

首先掌握结构体对齐规则
C语言自定义类型_第4张图片

#include 
struct S1
{
	char c1;
	int i;
	char c2;
};
struct S2
{
	char c1;
	int i;
	char c2;
}
struct S3
{
	double d;
	char c;
	int i;
};

int main()
{
	    printf("%d\n", sizeof(struct S1)); 
		printf("%d\n", sizeof(struct S2)); 
		printf("%d\n", sizeof(struct S3)); 
		return 0;
}

C语言自定义类型_第5张图片
为什么结果会是 8 12 12呢?

#include 
struct S1
{
	char c1;
	char i;
	int c2;
};
int main()
{
	printf("%d\n", sizeof(struct S1)); 
}

C语言自定义类型_第6张图片
C语言自定义类型_第7张图片

#include 
struct S2
{
	char c1;
	int i;
	char c2;
	
}
int main()
{
	printf("%d\n",sizeof(struct S2));
	return 0;
}

C语言自定义类型_第8张图片

C语言自定义类型_第9张图片

#include 
struct S3
{
	double d;
	char c;
	int i;
};
int main()
{
	printf("%d\n", sizeof(struct S3));
	return 0;
}

C语言自定义类型_第10张图片
C语言自定义类型_第11张图片

#include 
struct S3
{
	double d;
	char c;
	int i;
};
struct S4
{
	char c1;
	struct S3 s3;
	double d;
};
int main()
{
	printf("%d\n", sizeof(struct S4));???
	return 0;
}

C语言自定义类型_第12张图片
C语言自定义类型_第13张图片
那么为什么要存在内存对齐?

  1. 平台原因(移植原因):
    不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特
    定类型的数据,否则抛出硬件异常。
  2. 性能原因:
    数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
    原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访
    问。
    总体来说:
    结构体的内存对齐是拿空间来换取时间的做法。
    C语言自定义类型_第14张图片
    那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:

让占用空间小的成员尽量集中在一起。

struct S1
{
 char c1;
 int i;
 char c2;
};
struct S2
{
 char c1;
 char c2;
 int i;
};
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。

C语言自定义类型_第15张图片
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。

1.7、结构体传参

结构体传参有两种

1.传结构体
2.传址

struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}

函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。所以我们要首选传址。
结论:

结构体传参的时候,要传结构体的地址。

2、位段

2.1、什么是位段

位段的声明和结构是类似的,有两个不同:

1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。

struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
}

C语言自定义类型_第16张图片
可以看出位段可以节省空间,但位段在内存分配上仍会浪费一定空间

2.2、位段的内存分配

  1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
  2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
//一个例子
struct S
{
 char a:3;
 char b:4;
 char c:5;
 char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
//空间是如何开辟的?

C语言自定义类型_第17张图片

2.3、位段的跨平台问题

  1. int位段被当成有符号数还是无符号数是不确定的

  2. 位段中最大位的数目不能确定(16位机器最大是16,32位机器最大是32,如果冒号后面跟的数字是25,在32位机器跨到16位机器上的时候是会出问题的)

  3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义(在VS环境下是从右向左分配的)

  4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不能确定的(在VS环境下是舍弃的)

总结:位段相较结构体来说,虽然也是可以达到同样的效果,也比结构体更能节省空间,但是有跨平台问题存在。

2.4、位段的应用

C语言自定义类型_第18张图片
C语言自定义类型_第19张图片

3、枚举

枚举顾名思义就是一一列举。
把可能的取值一一列举。
比如我们现实生活中:

一周的星期一到星期日是有限的7天,可以一一列举。
性别有:男、女、保密,也可以一一列举。
月份有12个月,也可以一一列举

这里就可以使用枚举了。

3.1、枚举类型的定义

enum Day//星期
{
 Mon,
 Tues,
 Wed,
 Thur,
 Fri,
 Sat,
 Sun
};
enum Sex//性别
{
 MALE,
 FEMALE,
 SECRET
}enum Color//颜色
{
 RED,
 GREEN,
 BLUE
};

以上定义的 enum Day , enum Sex , enum Color 都是枚举类型。
{}中的内容是枚举类型的可能取值,也叫 枚举常量 。
这些可能取值都是有值的,默认从0开始,一次递增1,当然在定义的时候也可以赋初值。
例如:

enum Color//颜色
{
 RED=1,
 GREEN=2,
 BLUE=4
};

3.2、枚举的优点

为什么使用枚举?
我们可以使用 #define 定义常量,为什么非要使用枚举?

枚举的优点:

  1. 增加代码的可读性和可维护性
  2. 和#define定义的标识符比较枚举有类型检查,更加严谨。
  3. 防止了命名污染(封装)
  4. 便于调试
  5. 使用方便,一次可以定义多个常量

3.3、枚举的使用

enum Color//颜色
{
	RED=1 ,
	GREEN = 2,
	BLUE = 4
};
int main()
{
	//printf("%d\n", sizeof(union Un1));
	enum Color col=RED ;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异,枚举常量实质就是整型。
	col = 3.8;
	printf("%d", col);
}


4、联合(共用体)

4.1、联合类型的定义

联合也是一种特殊的自定义类型,这种类型也包含一系列的成员,最明显的特征是这些成员共用同一块空间(所以联合体也叫共用体)。

其次,联合体大小也有自己的计算规则:

  1. 联合的成员是共用一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)

  2. 当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍

union Un
{
	int i;
	char c;
};
union Un un;

int main()
{
	printf("%p\n", &(un.i));
	printf("%p\n", &(un.c));
	un.i = 0x11223344;
	un.c = 0x55;
	printf("%x\n", un.i);
}

C语言自定义类型_第20张图片

4.2、联合的特点

联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联
合至少得有能力保存最大的那个成员)。
union Un
{
int i ;
char c ;
};
union Un un ;
// 下面输出的结果是一样的吗?
printf ( "%d\n" , & ( un . i ));
printf ( "%d\n" , & ( un . c ));
// 下面输出的结果是什么?
un . i = 0x11223344 ;
un . c = 0x55 ;
printf ( "%x\n" , un . i );
}

C语言自定义类型_第21张图片
这个输入至少证明了一个联合体的成员就是共用一块内存空间。

4.3、联合大小的计算

联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。

#include 
union Un1
{				//每个元素/变量自身大小 编译器默认对齐数——最大对齐数: 成员大小
	char c[5];	//1 8 —— 1 : 5
	int i;		//4 8 —— 4 : 4
};
union Un2
{
	short c[7];	//2 8 —— 2 : 14
	int i;		//4 8 —— 4 : 4
};
 
 
int main() {
	printf("%d\n", sizeof(union Un1));	// 8
	printf("%d\n", sizeof(union Un2));	// 16
	return 0;
}

C语言自定义类型_第22张图片
联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
就比如说Un2的大小,short数组就占了14个字节,而int 只占了4个字节,所以short占的空间是最大的,所以最终空间的大小是按short的大小决定的,而又Un2的大小不是对齐数的整数倍,也就是不是4的倍数,所以最终要变成4的倍数,所以最终就是16.

int check_sys()
{
	union S
	{
		char a;
		int b;
	};
	//联合体大小为4个字节,第一个字节是a,只不过b占4个字节将其覆盖了,可通过取出a的值来判断系统的大小端
	union S s;
	s.b = 1;
	return s.a;		//返回a的值,如果是1,则说明是小端,如果是0,则说明是大端
}
int main()
{
	//联合体计算系统大小端
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端\n");
	}
	else 
	{
		printf("大端\n");
	}
}

C语言自定义类型_第23张图片
好了今天的学习就到这里,我们下次再见了。

你可能感兴趣的:(c语言,开发语言)