关于C之缓冲输入

先看一个看似很简单的例子: 

#include 
int main(void) { 
    char ch;
    while ((ch = getchar()) != '#')
        putchar(ch);
    return 0;
}
|Hello, there. I would[enter]
Hello, there. I would
|like a #3 bag of potatoes.[enter]
like a

在while循环里面,按常理理解,先通过getchar()输入一个字符,由于!='#',就直接执行putchar()函数在屏幕上打印输出刚输入的字符,但结果并非如此。通过断点调试发现,在输入一大段字符的过程中循环体里面putchar(ch);这行始终没有执行,直至按下回车键[Enter]时,断点才跳到putchar(ch); 把刚输入的字符全部打印出来了。也就是说,不按回车键,就把输入的字符一直存入缓冲区,就无法执行下面的打印语句,直到按下回车键结束缓冲区为止。(注:回车符[Enter]也是一个字符'\n'也会被缓冲,能被getchar()读取)

如果在老式系统运行上面的程序, 你输入文本时可能显示如下:

HHeelllloo,, tthheerree..II wwoouulldd[enter]
lliikkee aa #

while循环中先getchar一个字符'H',然后执行循环体里面的函数putchar立即打印这个字符'H',即输入什么就立马打印什么,[Enter]键单纯的就是换行。其他字符输入输出一样的道理。这样理解,上面的显示就完全解释的通了。

以上行为是个例外。像这样回显用户输入的字符后立即重复打印该字符是属于无缓冲( 或直接)输入,即正在等待的程序可立即使用输入的字符。

你可能好奇,为何输入的字符能直接显示在屏幕上?如果用一个特殊字符( 如,#)来结束输入,就无法在文本中使用这个字符,是否有更好的方法结束输入?要回答这些问题,首先要了解 C程序如何处理键盘输入,尤其是缓冲和标准输入文件的概念。 

对于该例,大部分系统在用户按下Enter键之前不会重复打印刚输入的字符,这种输入形式属于缓冲输入。用户输入的字符被收集并储存在一个被称为缓冲区( buffer)的临时存储区,按下Enter键后,程序才可使用用户输入的字符。

关于C之缓冲输入_第1张图片

为什么要有缓冲区?

首先, 把若干字符作为一个块进行传输比逐个发送这些字符节约时间。

其次,如果用户打错字符,可以直接通过键盘修正错误。当最后按下Enter键时,传输的是正确的输入。

虽然缓冲输入好处很多, 但是某些交互式程序也需要无缓冲输入。例如,在游戏中,你希望按下一个键就执行相应的指令。因此,缓冲输入和无缓冲输入都有用武之地。

缓冲分为两类: 完全缓冲I/O和行缓冲I/O。 完全缓冲输入指的是当缓冲区被填满时才刷新缓冲区( 内容被发送至目的地),通常出现在文件输入中。 缓冲区的大小取决于系统,常见的大小是 512 字节和 4096字节。行缓冲I/O指的是在出现换行符时刷新缓冲区。键盘输入通常是行缓冲输入,所以在按下Enter键后才刷新缓冲区。

那么,使用缓冲输入还是无缓冲输入?ANSI C和后续的C标准都规定输入是缓冲的,不过最初K&R把这个决定权交给了编译器的编写者。 你可以运行最上面的程序观察输出的情况,了解所用的输出类型。

ANSI C决定把缓冲输入作为标准的原因是: 一些计算机不允许无缓冲输入。如果你的计算机允许无缓冲输入,那么你所用的C编译器很可能会提供一个无缓冲输入的选项。 例如,许多IBM PC兼容机的编译器都为支持无缓冲输入提供一系列特殊的函数,其原型都在conio.h头文件中。这些函数包括用于回显无缓冲输入的getche()函数和用于无回显无缓冲输入的getch()函数(回显输入意味着用户输入的字符直接显示在屏幕上,无回显输入意味着击键后对应的字符不显示)。UNIX系统使用另一种不同的方式控制缓冲。在UNIX系统中,可以使用ioctl()函数( 该函数属于UNIX库,但是不属于C标准)指定待输入的类型,然后用getchar()执行相应的操作。在ANSI C中,用setbuf()和setvbuf()函数控制缓冲,但是受限于一些系统的内部设置,这些函数可能不起作用。总之,ANSI没有提供调用无缓冲输入的标准方式,这意味着是否能进行无缓冲输入取决于计算机系统。鉴于此,在这里要对所有的输入都是缓冲输入。

你可能感兴趣的:(C语言常见问题及深度解析)