程序是如何执行有关的c程序的?
C程序总是从main
函数开始执行。main
函数的原型是
int main(int argc,char *argv[]);
其中,argc
是命令行参数的数目,argv
是指向参数的各个指针所构成的数组。
当内核执行C程序时(使用一个exec
函数),在调用main
前先调用一个特殊的启动例程。可执行程序文件将此启动例程指定为程序的起始地址——这是由连接编辑器设置的,而连接编辑器则由C编译器(通常是cc)调用。启动例程从内核取得命令行参数和环境变量值,然后为按上述方式调用main函数做好安排。
有8种方式使进程终止,其中5种为正常终止,它们是:
main
返回。exit
。_exit
或_Exit
。pthread_exit
异常终止有3种方式,它们是:
abort
;从历史上讲,C程序一直由下面几部分组成:
初始化数据段。通常将此称为数据段,它包含了程序中需明确地赋初值的变量。例如,C程序中出现在任何函数之外的声明:
int maxcount = 99;
非初始化数据段。通常将此段称为bss段,这一名称来源于一个早期的汇编运算符,意思是“block started by symbol"(由符号开始的块),在程序开始执行之前,内核将此段中的数据初始化为0或空指针。出现在任何函数外的C声明
long sum[1000];
堆。通常在堆中进行动态存储分配。由于历史上形成的惯例,堆位于非初始化数据段和栈之间。
环境字符串的形式通常如下:
name=value
环境表(指向实际name=value
字符串的指针数组)和环境字符串通常存放在进程存储空间的顶部(栈之上)。
在C中,goto
语句是不能跨越函数的,而执行这类跳转功能的是函数setjmp
和longjmp
。但是记住,对于longjmp
,大多数实现并不回滚这些自动变量和寄存器变量的值。
每个进程都有一组资源限制,其中一些可以用getrlimit
和setrlimit
函数查询和更改。
exit
或return
的程序,则程序的返回代码为13(用shell来grep检查),解释其原因。原因在于printf
的返回值(输出的字符数)变成了main
函数的返回值。当然,并不是所有的系统都会出现该情况。
当程序处于交互运行方式时,标准输出通常处于行缓冲方式,所以当输出换行符时,上次的结果才被真正输出。如果标准输出被定向到一个文件而处于完全缓冲方式,则当标准I/O清理操作执行时,结果才真正被输出。
由于 argc
和argv
的副本不像environ
一样保存在全局变量中,所以大多数UNIX系统中没有办法实现。(而有关environ
环境变量的话,可以通过函数getenv
来调用,因为命令行参数和环境变量位于栈之上的高地址)
原因在于当程序上对一个空指针(地址为NULL,即0)进行解引用操作时,可以由于访问不到想要的地址而终止程序,防止程序访问到意想不到的数据,在程序开发中,如果指针指向或者操作了意想不到的数据都会视为危险的行为。
关于空指针的解引用,在网上找到:
空指针解引用是否导致异常应该是硬件设备和OS组合决定的。以前在VXwork下工作,空指针也可以解引用,可以访问内存0地址,还可以修改内容。这种情况下,为了便于程序员debug,印象中我们大概是采用了对于0地址内容监控,如果内容有改动则报告或者crash。
我们先看一下atexit
的原型:
#include <stdlib.h>
int atexit(void (*func)(void));
所以通过typedef
定义的新的数据类型Exitfunc
如下:
typedef void Exitfunc(void); //定义一个数据类型Exitfunc,指向函数void func(void)的函数入口
int atexit(Exitfunc *func); //改写后的atexit的原型
//注上面的typedef解释如下:
Exitfunc * ptr; //相当于 void (*ptr)(void); //ptr指向函数的入口
另外对于typedef的使用,有如下介绍:
用途一:定义一种类型的别名,而不只是简单的宏替换。
可以用作同时声明指针型的多个对象。比如:
char* pa, pb; // 这多数不符合我们的意图,它只声明了一个指向字符变量的指针,
// 和一个字符变量;
//以下则可行:
typedef char* PCHAR;
PCHAR pa, pb;
这种用法很有用,特别是
char* pa, pb
的定义,初学者往往认为是定义了两个字符型指针,其实不是,而用typedef char* PCHAR
就不会出现这样的问题,减少了错误的发生。
用途二:用在旧的C代码中,帮助struct。
以前的代码中,声明struct新对象时,必须要带上struct,即形式为: struct 结构名对象名,如:
struct tagPOINT1{
int x;
int y;
};
struct tagPOINT1 p1;
而在C++中,则可以直接写:结构名对象名,即:
tagPOINT1 p1;
typedef struct tagPOINT{
int x;
int y;
}POINT;
POINT p1;
这样就比原来的方式少写了一个struct,比较省事,尤其在大量使用的时候,或许,在C++中,typedef的这种用途二不是很大,但是理解了它,对掌握以前的旧代码还是有帮助的,毕竟我们在项目中有可能会遇到较早些年代遗留下来的代码。
用途三:用typedef来定义与平台无关的类型。
比如定义一个叫 REAL 的浮点类型,在目标平台一上,让它表示最高精度的类型为:
typedef long double REAL;
在不支持
long double
的平台二上,改为:
typedef double REAL;
在连
double
都不支持的平台三上,改为:
typedef float REAL;
也就是说,当跨平台时,只要改下
typedef
本身就行,不用对其他源码做任何修改。
标准库就广泛使用了这个技巧,比如size_t。另外,因为typedef是定义了一种类型的新别名,不是简单的字符串替换,所以它比宏来得稳健。
这个优点在我们写代码的过程中可以减少不少代码量哦!
用途四:为复杂的声明定义一个新的简单的别名。
方法是:在原来的声明里逐步用别名替换一部分复杂声明,如此循环,把带变量名的部分留到最后替换,得到的就是原声明的最简化版。举例:
原声明:
void (*b[10]) (void (*)());
变量名为b,先替换右边部分括号里的,pFunParam为别名一:
typedef void (*pFunParam)();
再替换左边的变量b,pFunx为别名二:
typedef void (*pFunx)(pFunParam);
原声明的最简化版:
pFunx b[10];
原声明:
doube(*)() (*e)[9];
变量名为e,先替换左边部分,pFuny为别名一:
typedef double(*pFuny)();
再替换右边的变量e,pFunParamy为别名二
typedef pFuny (*pFunParamy)[9];
原声明的最简化版:
pFunParamy e;
理解复杂声明可用的“右左法则”:从变量名看起,先往右,再往左,碰到一个圆括号就调转阅读的方向;括号内分析完就跳出括号,还是按先右后左的顺序,如此循环,直到整个声明分析完。举例:
int (*func)(int *p);
首先找到变量名func,外面有一对圆括号,而且左边是一个号,这说明func是一个指针;然后跳出这个圆括号,先看右边,又遇到圆括号,这说明(func)是一个函数,所以func是一个指向这类函数的指针,即函数指针,这类函数具有int*类型的形参,返回值类型是int。
int (*func[5])(int *);
func右边是一个[]运算符,说明func是具有5个元素的数组;func的左边有一个,说明func的元素是指针(注意这里的不是修饰func,而是修饰func[5]的,原因是[]运算符优先级比高,func先跟[]结合)。跳出这个括号,看右边,又遇到圆括号,说明func数组的元素是函数类型的指针,它指向的函数具有int类型的形参,返回值类型为int。这种用法是比较复杂的,出现的频率也不少,往往在看到这样的用法却不能理解,相信以上的解释能有所帮助。
是的。
答案说的:只有通过exec
函数执行一个程序时,才会分配堆和堆栈。
int f1(int val){
int *ptr;
if(val == 0){
int val;
val = 5;
ptr = &val;
}
return (*ptr + 1);
}
这段代码肯定是不正确的,当if语句块结束后,局部变量val会被释放,指针将指向未被定义的空间,成为所谓的“悬空指针”。这样运行的话会提示Debug Error的。