Dennis Ritchie 过世了,他发明了C语言,一个影响深远并彻底改变世界的计算机语言。一门经历40多年的到今天还长盛不衰的语言,今天很多语言都受到C的影响,C++,Java,C#,Perl, PHP, Javascript, 等等。但是,你对C了解吗?相信你看过本站的《C语言的谜题》还有《谁说C语言很简单?》,这里,我再写一篇关于深入理解C语言的文章,一方面是缅怀Dennis,另一方面是告诉大家应该如何学好一门语言。(顺便注明一下,下面的一些例子来源于这个slides)
首先,我们先来看下面这个经典的代码:
1
2
3
4
5
|
int
main()
{
int
a = 42;
printf
(“%d\n”, a);
}
|
从这段代码里你看到了什么问题?我们都知道,这段程序里少了一个#include <stdio.h> 还少了一个return 0;的返回语句。
不过,让我们来深入的学习一下,
我们再来看一段代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
#include <stdio.h>
void
f(
void
)
{
static
int
a = 3;
static
int
b;
int
c;
++a; ++b; ++c;
printf
(
"a=%d\n"
, a);
printf
(
"b=%d\n"
, b);
printf
(
"c=%d\n"
, c);
}
int
main(
void
)
{
f();
f();
f();
}
|
这个程序会输出什么?
说到全局变量,你知道 静态全局变量和一般全局变量的差别吗?是的,对于static 的全局变量,其对链接器不可以见,也就是说,这个变量只能在当前文件中使用。
我们再来看一个例子:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
#include <stdio.h>
void
foo(
void
)
{
int
a;
printf
(
"%d\n"
, a);
}
void
bar(
void
)
{
int
a = 42;
}
int
main(
void
)
{
bar();
foo();
}
|
你知道这段代码会输出什么吗?A) 一个随机值,B) 42。A 和 B都对(在“在函数外存取局部变量的一个比喻”文中的最后给过这个例子),不过,你知道为什么吗?
下面,我们再来看一个示例:
1
2
3
4
5
6
7
8
|
#include <stdio.h>
int
b(
void
) {
printf
(“3”);
return
3; }
int
c(
void
) {
printf
(“4”);
return
4; }
int
main(
void
)
{
int
a = b() + c();
printf
(“%d\n”, a);
}
|
这段程序会输出什么?,你会说是,3,4,7。但是我想告诉你,这也有可能输出,4,3,7。为什么呢? 这是因为,在C/C++中,表达的评估次序是没有标准定义的。编译器可以正着来,也可以反着来,所以,不同的编译器会有不同的输出。你知道这个特性以后,你就知道这样的程序是没有可移植性的。
我们再来看看下面的这堆代码,他们分别输出什么呢?
1
|
int
a=41; a++;
printf
(
"%d\n"
, a);
|
1
|
int
a=41; a++ &
printf
(
"%d\n"
, a);
|
1
|
int
a=41; a++ &&
printf
(
"%d\n"
, a);
|
1
|
int
a=41;
if
(a++ < 42)
printf
(
"%d\n"
, a);
|
1
|
int
a=41; a = a++;
printf
(
"%d\n"
, a);
|
只有示例一,示例三,示例四输出42,而示例二和五的行为则是未定义的。关于这种未定义的东西是因为Sequence Points的影响(Sequence Points是一种规则,也就是程序执行的序列点,在两点之间的表达式只能对变量有一次修改),因为这会让编译器不知道在一个表达式顺列上如何存取变量的值。比如a = a++,a + a++,不过,在C中,这样的情况很少。
下面,再看一段代码:(假设int为4字节,char为1字节)
1
2
3
4
|
struct
X {
int
a;
char
b;
int
c; };
printf
(
"%d,"
,
sizeof
(
struct
X));
struct
Y {
int
a;
char
b;
int
c;
char
d};
printf
(
"%d\n"
,
sizeof
(
struct
Y));
|
这个代码会输出什么?
a) 9,10
b)12, 12
c)12, 16
答案是C,我想,你一定知道字节对齐,是向4的倍数对齐。
另外,再提一下,上述程序的printf中的%d并不好,因为,在64位下,sizeof的size_t是unsigned long,而32位下是 unsigned int,所以,C99引入了一个专门给size_t用的%zu。这点需要注意。在64位平台下,C/C++ 的编译需要注意很多事。你可以参看《64位平台C/C++开发注意事项》。
下面,我们再说说编译器的Warning,请看代码:
1
2
3
4
5
6
|
#include <stdio.h>
int
main(
void
)
{
int
a;
printf
(
"%d\n"
, a);
}
|
考虑下面两种编译代码的方式 :
前一种是不会编译出a未初化的警告信息的,而只有在-O的情况下,才会有未初始化的警告信息。这点就是为什么我们在makefile里的CFLAGS上总是需要-Wall和 -O。
最后,我们再来看一个指针问题,你看下面的代码:
1
2
3
4
5
6
7
8
9
|
#include <stdio.h>
int
main(
void
)
{
int
a[5];
printf
(
"%x\n"
, a);
printf
(
"%x\n"
, a+1);
printf
(
"%x\n"
, &a);
printf
(
"%x\n"
, &a+1);
}
|
假如我们的a的地址是:0Xbfe2e100, 而且是32位机,那么这个程序会输出什么?
看过这么多,你可能会觉得C语言设计得真扯淡啊。不过我要告诉下面几点Dennis当初设计C语言的初衷:
1)相信程序员,不阻止程序员做他们想做的事。
2)保持语言的简洁,以及概念上的简单。
3)保证性能,就算牺牲移植性。
今天很多语言进化得很高级了,语法也越来越复杂和强大,但是C语言依然光芒四射,Dennis离世了,但是C语言的这些设计思路将永远不朽。