c语言踩坑心得

1 0 与 NULL

在c语言中,0和NULL等价,NULL是个define ((void *)0)

2 malloc 与 calloc

malloc申请连续的内存空间,但是不会擦除该内存的数据,如果你忘记初始化了,会用到上次遗留的内容,所以最好用memset初始化为0
calloc按块申请内存空间,有个参数n,数组的话不再是n*sizeof(sth.),而是(n,sizeof(sth.)),并且会初始化内存数据为0

3 free 与 野指针

申请了内存空间的指针才可以被free,不然会报错
当声明了一个指针时,它指向的地址是随机的,比如int *a;,这个a就是随机指向的,是个野指针
所以为了让它确定指向,必须要初始化,比如int *a=NULL;
当指针成功申请了内存空间后,它指向了某个内存地址,可能是0xabcdef之类的这个时候调用了free,内存被回收了,但是它的指向没有变,是个野指针。
所以在free之后必须将指针重新赋值,比如free(a);a=NULL;
我们可以用指向指针的指针来封装一个free函数,在free后,将指针赋值为空
一个启发式的实现如下

void free_pointer(int **a_ptr) {
    if (*a_ptr != NULL) {
        free(*p_ptr);
        *a_ptr = NULL;
    }
}
......
free_pointer(&a);

4 sizeof 与 size_t

sizeof一个数组时,他是数组一共占的大小
sizeof一个指针时,他是指针的大小
sizeof计算的是栈中分配的空间大小

size_t是一个无符号整数,当它和int比较大小时,会将int变为无符号整数比较。
int a=-1;size_t b=1; 如果进行比较a>b,那么程序里将得到真值true

5 strcpy

strcpy是一个不安全的函数,当dest字符串的容量小于src的长度就会引起缓冲区溢出或者字符串没有结束符号'\0'
strncpy是一个相对安全的函数,但注意地非常多
当dest字符串容量远大于src的长度时,如果你的n设定为dest的容量,那么他会在赋值完毕之后,在空的地方全部写入'\0',非常耗费时间
当dest字符串容量小于等于src的长度时,src会被截断或刚好复制完毕,但是这时候strncpy并不会帮你加上'\0',即使成功复制。也就是说,如果n设定为src的长度(strlen,返回长度不算'\0'),需要程序员去补上字符串结束符
一个启发式的实现如下

char *str_copy_safe(char *dest, const char *src, size_t dest_size) {
    if (src == NULL || dest == NULL || dest_size <= 0) {
        return NULL;
    }
    size_t src_len = strlen(src);
    if (src_len < dest_size) {
        strncpy(dest, src, src_len);
        *(dest + src_len) = '\0';
    } else {
        strncpy(dest, src, dest_size);
        *(dest + dest_size - 1) = '\0';
    }
    return dest;
}

6 static 与 extern

当我们使用全局变量的时候,如果不加static,那么多个文件一起编译的时候,其他文件不能定义这个同名变量。这样封装性不好,如果我们不想让其他文件使用,只要在全局变量前加上static就可以了。这是static重要作用之一,隐藏这个全局变量。要注意static的变量放在静态数据区,默认值是0。static char[10]; static int a;字符串就是空的,整数就是0
那如果我们想引用其他文件的变量,可以加上extern对同名变量进行声明

a.c
int a=0;

b.c
extern a; // 声明就可以了
int b=a;

7 结构体的大小及内存对齐

开辟空间时,尽量以4为约数,如char a[12]
定义变量的时候,尽量从上到下,由小到大排列

现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始, 但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问, 这就需要各种类型数据按照一定的规则在空间上排列, 而不是顺序的一个接一个的排放,这就是对齐。

各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定的地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误, 那么在这种架构下编程必须保证字节对齐。其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对数据存放进行对齐的话, 会在存取效率上带来损失。 比如有些平台每次读都是从偶地址开始, 如果一个int型数据存放在4字节对齐的位置, 那么一个读周期就可以读出这32bit; 而如果存放的位置不是4字节对齐,则很有可能需要多个读周期才能将这32bit数据读取出来(可能需要进行高低字节拼凑)。

字节对齐: 计算机存储系统中以byte为单位存储数据,不同数据类型所占的空间不同。例如,整形(int)数据占用4个字节,字符型(char)数据占用一个字节, 短整形(short)数据占用两个字节,等等。计算机为了快速的读写数据,默认情况下将数据存放在某个地址的起始位置,如: 整形数据(int)默认存储在地址能被4整除的起始位置,字符型数据(char)可以存放在任何地址位置(被1整除),短整形(short)数据存储在地址能被2整除的起始位置。这就是默认字节对齐方式。

1) 成员都相同时(或含数组,且数组数据类型与结构体其他成员数据类型相同)

结构体长度 = 成员数据类型长度 x 成员个数;

结构体中数组长度 = 数组数据类型长度 x 数组元素个数;

2) 成员不同且不含其他结构体时

分析各个成员长度;

找出最大长度的成员, 其长度M, 则结构体的长度一定是M的整数倍;

并按最大成员长度出现的位置将结构体分为若干部分;

各个部分长度一次相加,求出和S,然后使S进行M字节上对齐,即为该部分的长度;

将各个部分长度相加之和即为结构体长度;

3) 含有其他结构体时

分析各个成员长度;

如果该成员是另一个结构体,则其长度按上面的方法计算;

分析各个成员的长度(成员为另一个结构体的,则继续分析其子成员),求出最大值M;

若长度最大成员在子结构体中,则按结构体成员为分界点分界; 若其他成员中有最大成员,则该成员为分界点。然后求出各段长度S,然后使S进行M字节上对齐

将各个部分长度相加之和即为结构体长度

8 volatile

声明变量是易变的,以阻止编译器对指令进行优化,确保数据从内存中读取,而不是寄存器(缓存)中
同const一样,有volatile指针,在结构体中要小心

struct {
  int a;
  char b[4];
  char *c;
}

volatile int *a;   // a指向的内存是易变的
int *volatile a;  // a这个指针是易变的

// 当应用在结构体变量时
volatile struct  a; // 结构体内的变量是易挥发的,指针是易挥发指针(不是指向的内存)
//(volatile a;char *volatile c;)

https://stackoverflow.com/questions/2044565/volatile-struct-semantics

你可能感兴趣的:(c语言踩坑心得)