C/C++零散知识点汇总之缓冲区

缓冲区是为了让低速的输入输出设备和高速的用户程序能够协调工作,并降低输入输出设备的读写次数。

用户程序的执行速度可以看做CPU的允许速度,如果没有各种硬件的阻碍,理论上它们是同步的。

例如,我们都知道硬盘的速度要远低于CPU,它们之间有好几个数量级的差距,当向硬盘写入数据是,程序需要等到,不能做任何事情,就像卡顿了一样,用户体验非常差。计算机上绝大多数应用程序都需要和硬件打交道,例如读写硬盘、向显示器输出、从键盘输入等,如果每个程序都等待硬件,那么整台计算机也将变得卡顿。

但是如果有了缓冲区,就可以将数据先放入缓冲区中(内存的读写速度也远高于硬盘),然后程序可以继续向下执行,等所有的数据都准备好了,再将缓冲区的所有数据一次性写入硬盘,这样程序就减少了等待的次数,变得流畅起来。

缓冲区的另外一个好处是可以减少硬件设备的读写次数。其实我们的程序并不能只讲读写硬件。它必须告诉操作系统,让操作系统内核(Kernel)去调用驱动程序,只有驱动程序才能真正的操作硬件。

从用户程序到硬件设备要经过好几层的转换,每一层的转换都有时间和空间的开销,而且开销不一定小;一旦用户程序需要秘籍的输入输出操作,这种开销将变得非常大,会成为制约程序性能的瓶颈。

这时候分配缓冲区是必不可少的。每次调用读写函数,先将数据放入缓冲区,等数据都准备好了再真正的进行读写操作,这就大大减少了转换的次数。实践证明,合理的缓冲区设置能成倍提高程序性能。

缓冲区其实就是一块内存空间,它用在硬件设备和用户程序之间,用了缓存数据,目的是让快速的CPU不必等待慢速的输入输出设备,同时减少操作硬件的次数。

缓冲区的类型

根据不同的标准,缓冲区可以有不同的分类。

根据缓冲区对应的输入设备还是输出设备,可以分为输入缓冲区和输出缓冲区。

根据数据刷新(也可以称为清空缓冲区,就是讲缓冲区中的数据“倒出”)的时机,可以分为全缓冲、行缓冲、不带缓冲。

1、全缓冲

       在这种情况下,当缓冲区被填满之后才进行真正的输入输出操作。缓冲区的大小都有限制的,比如1KB、4MB等,数据

量达到最大值时就清空缓存区。全缓冲的典型代表就是对硬盘文件的读写。

        在实际开发中,将数据写入文件后,打开文件并不能立即看到内容,只有清空缓冲区,或者关闭文件,或者关闭程序

后,才能在文件中看到内容。这种现象,就是缓冲区在作怪。

2、行缓冲

        当在输入或者输出的过程中遇到换行符时,才知晓真正的输入输出操作。行缓冲的典型代表就是标准输入设备和标准输

出设备。

3、不带缓冲

        不带缓冲区,数据就没有地方缓存,必须立即进行输入输出。

         getche(),getch()就不带缓冲区,输入一个字符后立即就执行了,根本不用按下回车键。Windows下的printf()也不带缓

冲区,不管最后有没有换行符\n,都会立即输出,所以对于类似的输出代码,Windows、Linux和Mac OS会有不同的表现。

         错误信息输出函数perror()也没有缓冲区,错误信息必须刻不容缓、立刻、马上显示出来,缓冲区将会增加捕获错误的

时间,这是毫无理由的。

缓冲区的刷新

所谓刷新缓冲区,就是讲缓冲区的内容送达目的地。缓冲区的刷新遵循以下的规则:

1、不管是行缓冲还是全缓冲,缓冲区满时自动刷新。

2、行缓冲遇到换行符\n时会刷新。

3、关闭文件时会刷新缓冲区。

4、程序关闭时一般也会刷新缓冲区,这个是由标准卡来保障的。

5、特定的函数也可以手动刷新缓冲区。

总结

缓冲区是位于用户程序和硬件设备之间,用了缓存数据,目的是让快速的CPU不必等待慢速的输入输出设备,同时减少操作硬件的次数。对于IO密集型的网络应用程序,比如网站、数据库、DNS、CDN等,缓冲区的设计至关重要,它能十倍设置一百倍的提高程序性能。

 

你可能感兴趣的:(#,C++)