程序环境和预处理 C语言入门到入土(进阶篇)

目录

序言

1. 程序的翻译环境和执行环境   

2. 详解编译+链接

2.1 翻译环境

2.2 编译本身也分为几个阶段

2.3 运行环境

3. 预处理详解

3.1 预定义符号

3.2 #define

3.2.1 #define 定义标识符

3.2.2 #define 定义宏

3.2.3 #define 替换规则

3.2.4 #和##

3.2.5 带副作用的宏参数

3.2.6 宏和函数对比

3.2.7 命名约定

3.3 #undef

3.4 命令行定义

3.5 条件编译

3.6 文件包含

3.6.1 头文件被包含的方式

3.6.2 嵌套文件包含

4. 其他预处理指令


序言

hello✨,大家好呀,这里是原来 ,随着文章篇幅越来越多可能有很多小伙伴们找不到自己想要看的文章,所以我就出来啦,这里附带各文章链接哈。


C语言入门篇深剖篇都整理在这里了哈,进阶篇今天就完结了哈!!! 接下来就是初阶的数据结构,就只剩下二叉树八大排序了,后面会总结,链接也会放在这里哈。然后这里是个人主页,比点头像更好找文章哈。后面的话应该就会更c++和linux的知识了,当然,进阶的数据结构也会在c++中更新哈。如果你想学习c\c++方面的知识,关注博主一定会对你有所帮助哈 。最后,感谢观看此篇文章的你,更感谢关注的你 ,让我们一起加油吧!


最后是打鸡血环节:改变的确很难,但结果值得冒险,拿出点勇气来。路还很长,现在才刚开始而已。过去无可挽回,未来可以改变。

1. 程序的翻译环境和执行环境   

ANSI C 的任何一种实现中,存在两个不同的环境。
1 种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。
2 种是执行环境,它用于实际执行代码。

2. 详解编译+链接

2.1 翻译环境

程序环境和预处理 C语言入门到入土(进阶篇)_第1张图片
组成一个程序的每个源文件通过编译(编译分为预处理(预编译),编译和汇编)过程分别转换成目标代码(object code)。
每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。

2.2 编译本身也分为几个阶段

程序环境和预处理 C语言入门到入土(进阶篇)_第2张图片

程序环境和预处理 C语言入门到入土(进阶篇)_第3张图片程序环境和预处理 C语言入门到入土(进阶篇)_第4张图片

符号表 

程序环境和预处理 C语言入门到入土(进阶篇)_第5张图片

程序环境和预处理 C语言入门到入土(进阶篇)_第6张图片程序环境和预处理 C语言入门到入土(进阶篇)_第7张图片

1. 预处理 选项 gcc -E test.c -o test.i
预处理完成之后就停下来,预处理之后产生的结果都放在test.i文件中。
2. 编译 选项 gcc -S test.c
编译完成之后就停下来,结果保存在test.s中。
3. 汇编 gcc -c test.c
汇编完成之后就停下来,结果保存在test.o中。
VIM 学习资料
简明 VIM 练级攻略:
https://coolshell.cn/articles/5426.html
给程序员的 VIM 速查卡
https://coolshell.cn/articles/5479.html

2.3 运行环境

程序执行的过程:

1. 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
2. 程序的执行便开始。接着便调用main函数。
3. 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
4. 终止程序。正常终止main函数;也有可能是意外终止。

3. 预处理详解

3.1 预定义符号

__FILE__       // 进行编译的源文件
__LINE__     // 文件当前的行号
__DATE__     // 文件被编译的日期
__TIME__     // 文件被编译的时间
__STDC__     // 如果编译器遵循 ANSI C ,其值为 1 ,否则未定义(VS2019不支持)
这些预定义符号都是语言内置的。
举个栗子:
printf ( "file:%s line:%d\n" , __FILE__ , __LINE__);

3.2 #define

3.2.1 #define 定义标识符

语法:
#define name stuff
举个栗子:
#define MAX 1000
#define reg register           // register 这个关键字,创建一个简短的名字
#define do_forever for(;;)     // 用更形象的符号来替换一种实现
#define CASE break;case         // 在写 case 语句的时候自动把 break 写上。
// 如果定义的 stuff 过长,可以分成几行写,除了最后一行外,每行的后面都加一个反斜杠 ( 续行符 )
#define DEBUG_PRINT printf("file:%s\tline:%d\t \
                          date:%s\ttime:%s\n" ,\
                          __FILE__,__LINE__ ,       \
                          __DATE__,__TIME__ )  
注意:#define定义的时候,后面最好不要加上";",容易出错。

3.2.2 #define 定义宏

#define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏(define macro)。

下面是宏的申明方式:

其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在stuff中。

注意:

参数列表的左括号必须与 name 紧邻。
如果两者之间有任何空白存在,参数列表就会被解释为 stuff 的一部分
如:
#define SQUARE( x ) x * x
这个宏接收一个参数 x .
如果在上述声明之后,你把
SQUARE ( 5 );
置于程序中,预处理器就会用下面这个表达式替换上面的表达式:
5 * 5
警告:
这个宏存在一个问题:
观察下面的代码段:
int a = 5 ;
printf ( "%d\n" , SQUARE ( a + 1 ) );
乍一看,你可能觉得这段代码将打印 36 这个值。
事实上,它将打印 11.
为什么?
替换文本时,参数 x 被替换成 a + 1, 所以这条语句实际上变成了:
printf ("%d\n",a + 1 * a + 1 );
这样就比较清晰了,由替换产生的表达式并没有按照预想的次序进行求值。
在宏定义上加上两个括号,这个问题便轻松的解决了:
#define SQUARE(x) (x) * (x)
这样预处理之后就产生了预期的效果:
printf ( "%d\n" ,( a + 1 ) * ( a + 1 ) );
这里还有一个宏定义:
#define DOUBLE(x) (x) + (x)
定义中我们使用了括号,想避免之前的问题,但是这个宏可能会出现新的错误。
int a = 5 ;
printf ( "%d\n" , 10 * DOUBLE ( a ));
这将打印什么值呢?
warning
看上去,好像打印 100 ,但事实上打印的是 55.
我们发现替换之后:
printf ( "%d\n" , 10 * ( 5 ) + ( 5 ));
乘法运算先于宏定义的加法,所以出现了
55 .
这个问题,的解决办法是在宏定义表达式两边加上一对括号就可以了。
#define DOUBLE( x)   ( ( x ) + ( x ) )
提示:
所以用于对数值表达式进行求值的宏定义都应该用这种方式加上括号,避免在使用宏时由于参数中的操作符或邻近操作符之间不可预料的相互作用。

3.2.3 #define 替换规则

在程序中扩展#define定义符号和宏时,需要涉及几个步骤。
1. 在调用宏时,首先对参数进行检查,看看是否包含任何由#define定义的符号。如果是,它们首先被替换。
2. 替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值所替换。
3. 最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。
注意:
1. 宏参数和#define 定义中可以出现其他#define定义的符号。但是对于宏,不能出现递归。
2. 当预处理器搜索#define定义的符号的时候,字符串常量的内容并不被搜索。

3.2.4 ###

的作用

使用 # 把一个宏参数变成对应的字符串

比如:
程序环境和预处理 C语言入门到入土(进阶篇)_第8张图片

## 的作用

## 可以把位于它两边的符号合成一个符号。
它允许宏定义从分离的文本片段创建标识符。
程序环境和预处理 C语言入门到入土(进阶篇)_第9张图片
注:
这样的连接必须产生一个合法的标识符。否则其结果就是未定义的。
 

3.2.5 带副作用的宏参数

当宏参数在宏的定义中出现超过一次的时候,如果参数带有副作用,那么你在使用这个宏的时候就可能出现危险,导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。
例如:
x + 1 ; // 不带副作用
x ++ ; // 带有副作用
MAX 宏可以证明具有副作用的参数所引起的问题。
#define MAX(a, b) ( (a) > (b) ? (a) : (b) )
...
x = 5 ;
y = 8 ;
z = MAX ( x ++ , y ++ );
printf ( "x=%d y=%d z=%d\n" , x , y , z ); // 输出的结果是什么?
这里我们得知道预处理器处理之后的结果是什么:
z = ( ( x ++ ) > ( y ++ ) ? ( x ++ ) : ( y ++ ));
所以输出的结果是:
x = 6 y = 10 z = 9

3.2.6 宏和函数对比

宏通常被应用于执行简单的运算。
比如在两个数中找出较大的一个。
#define MAX(a, b) ((a)>(b)?(a):(b))
那为什么不用函数来完成这个任务?
原因有二:
1. 用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。
所以宏比函数在程序的规模和速度方面更胜一筹
2. 更为重要的是函数的参数必须声明为特定的类型。
所以函数只能在类型合适的表达式上使用。反之这个宏怎可以适用于整形、长整型、浮点型等可以用于> 来比较的类型。
宏是类型无关的
宏的缺点: 当然和函数相比宏也有劣势的地方:
1. 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。
2. 宏是没法调试的。
3. 宏由于类型无关,也就不够严谨。 
4. 宏可能会带来运算符优先级的问题,导致程容易出现错。
宏有时候可以做函数做不到的事情。比如:宏的参数可以出现 类型 ,但是函数做不到。
#define MALLOC(num, type)\
(type *)malloc(num * sizeof(type))
...
// 使用
MALLOC ( 10 , int ); // 类型作为参数
// 预处理器替换之后:
( int * ) malloc ( 10 * sizeof ( int ));

宏和函数的一个对比

#define 定义宏
函数
每次使用时,宏代码都会被插入到程序中。除了非常
小的宏之外,程序的长度会大幅度增长
函数代码只出现于一个地方;每
次使用这个函数时,都调用那个
地方的同一份代码
更快
存在函数的调用和返回的额外开 销,所以相对慢一些
宏参数的求值是在所有周围表达式的上下文环境里,
除非加上括号,否则邻近操作符的优先级可能会产生
不可预料的后果,所以建议宏在书写的时候多些括
号。
函数参数只在函数调用的时候求
值一次,它的结果值传递给函
数。表达式的求值结果更容易预
测。
参数可能被替换到宏体中的多个位置,所以带有副作
用的参数求值可能会产生不可预料的结果。
函数参数只在传参的时候求值一
次,结果更容易控制。
宏的参数与类型无关,只要对参数的操作是合法的,
它就可以使用于任何参数类型。
函数的参数是与类型有关的,如
果参数的类型不同,就需要不同
的函数,即使他们执行的任务是
不同的。
宏是不方便调试的
函数是可以逐语句调试的
宏是不能递归的
函数是可以递归的

 

3.2.7 命名约定

一般来讲函数的宏的使用语法很相似。所以语言本身没法帮我们区分二者。
那我们平时的一个习惯是:
把宏名全部大写
函数名不要全部大写

3.3 #undef

这条指令用于移除一个宏定义。

#undef NAME
// 如果现存的一个名字需要被重新定义,那么它的旧名字首先要被移除。

3.4 命令行定义

许多C 的编译器提供了一种能力,允许在命令行中定义符号。用于启动编译过程。
例如:当我们根据同一个源文件要编译出不同的一个程序的不同版本的时候,这个特性有点用处。(假定某个程序中声明了一个某个长度的数组,如果机器内存有限,我们需要一个很小的数组,但是另外一个机器内存大写,我们需要一个数组能够大写。)
#include 
int main()
{
    int array [ARRAY_SIZE];
    int i = 0;
    for(i = 0; i< ARRAY_SIZE; i ++)
   {
        array[i] = i;
   }
    for(i = 0; i< ARRAY_SIZE; i ++)
   {
        printf("%d " ,array[i]);
   }
    printf("\n" );
    return 0; }
编译指令:
//linux 环境演示
gcc - D ARRAY_SIZE = 10 programe . c

3.5 条件编译

在编译一个程序的时候我们如果要将一条语句(一组语句)编译或者放弃是很方便的。因为我们有条件编译指令。

 比如说: 调试性的代码,删除可惜,保留又碍事,所以我们可以选择性的编译。

#include 
#define __DEBUG__
int main()
{
 int i = 0;
 int arr[10] = {0};
 for(i=0; i<10; i++)
 {
 arr[i] = i;
#ifdef __DEBUG__
 printf("%d\n", arr[i]);//为了观察数组是否赋值成功。 
 #endif //__DEBUG__
 }
 return 0; }
常见的条件编译指令:
1.
#if 常量表达式
//...
#endif
// 常量表达式由预处理器求值。
如:
#define __DEBUG__ 1
#if __DEBUG__
//..
#endif
2. 多个分支的条件编译
#if 常量表达式
//...
#elif 常量表达式
//...
#else
//...
#endif
3. 判断是否被定义
#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol
        
4. 嵌套指令
#if defined(OS_UNIX)
        #ifdef OPTION1
                unix_version_option1 ();
        #endif
        #ifdef OPTION2
                unix_version_option2 ();
        #endif
#elif defined(OS_MSDOS)
        #ifdef OPTION2
                msdos_version_option2 ();
        #endif
#endif

3.6 文件包含

我们已经知道, #include 指令可以使另外一个文件被编译。就像它实际出现于 #include 指令的地方一样。

 这种替换的方式很简单: 预处理器先删除这条指令,并用包含文件的内容替换。 这样一个源文件被包含10次,那就实际被编译10次。

3.6.1 头文件被包含的方式

本地文件包含

#include "filename"

查找策略:先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件。
如果找不到就提示编译错误。

Linux环境的标准头文件的路径:

/usr/include

VS(2013)环境的标准头文件的路径 

C : \Program Files ( x86 ) \Microsoft Visual Studio 12.0 \VC\include
注意按照自己的安装路径去找。
库文件包含
#include
查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。
这样是不是可以说,对于库文件也可以使用 “” 的形式包含?
答案是肯定的, 可以
但是这样做查找的效率就低些,当然这样也不容易区分是库文件还是本地文件了。

3.6.2 嵌套文件包含

如果出现这样的场景: 

程序环境和预处理 C语言入门到入土(进阶篇)_第10张图片

comm.h comm.c 是公共模块。
test1.h test1.c 使用了公共模块。
test2.h test2.c 使用了公共模块。
test.h test.c 使用了 test1 模块和 test2 模块。
这样最终程序中就会出现两份 comm.h 的内容。这样就造成了文件内容的重复。
如何解决这个问题?
答案:条件编译。

每个头文件的开头写:

#ifndef __TEST_H__
#define __TEST_H__
// 头文件的内容
#endif   //__TEST_H__
或者:
#pragma once (这个比较古老的编译器可能没有哈)
就可以避免头文件的重复引入。

4. 其他预处理指令

#error
#pragma
#line
...
不做介绍,自己去了解哈。
#pragma pack() 在结构体部分介绍过了。

今天的内容就到这里了哈!!!创作实属不易QAQ

要是认为作者有一点帮助你的话!

就来一个点赞加关注吧!!!当然订阅是更是求之不得!

赠人玫瑰,手有余香=。=!

最后的最后感谢大家的观看!!!

你们的支持是作者写作的最大动力!!!

下期见哈!!! 

你可能感兴趣的:(C语言,C语言进阶篇,笔记,c语言,开发语言,后端,编译,运行环境)