【什么时候用多线程——IO篇】

1. 什么叫做IO密集型(IO-bound)

什么叫做IO?

  • IO是在主存与外部设备(磁盘驱动器、终端和网络)之间的数据拷贝的过程。
  • 站在主存的角度去看,I表示输入到主存;O从主存输出。

什么叫做IO密集型?

  • 就是IO很多呗。比如大量的“数据写入磁盘,数据上传到远程服务器,从磁盘读取文件”等操作。

2.磁盘IO

  • 指标(外设拖了主存的后腿)
磁盘 耗时
Main memory reference 100ns
Disk seek 8~10ms
Read 1MB sequentially from disk 20~25ms
机械磁盘吞吐量 120MB

3. 从cpu下发指令到IO整个流程(计算某一个文件的行数)

3.1 程序可能是这样写的

  1. open()
  2. read() #读取x字节,返回0表示读完或-1表示出错,则退出。
  3. 判断是否包含'\n','\r','\r\n',如果是则count++; 否则回到2继续读 取。

3.2 面对上面的程序,机器部件都怎么运作的呢?


【什么时候用多线程——IO篇】_第1张图片
Paste_Image.png

【什么时候用多线程——IO篇】_第2张图片
磁盘IO栈

注:

  • VFS: 对ext3/ext4/ZFS文件系统的虚拟接口(一层抽象,不管你底层是什么文件系统,对于上层来说都是统一的接口)
  • 卷管理器:文件系统可以建立在多块磁盘上。卷把多块磁盘组合成一个虚拟磁盘(一层抽象)
  • 块设备接口:通用的块层接口(一层抽象,磁盘、usb、CD-ROM都是块设备,对于上层来说都是统一的接口)
  • IO驱动:向设备发出命令、读出设备的状态。每一个连接到计算机上的IO设备都需要特定的代码来对其进行控制。这样的代码叫做设备驱动程序。每一个操作系统都有自己的驱动程序,属于内核一部分。如果每一次出现一个新的设备,都必须为新设备更改操作系统的话,那就完蛋了。所以,操作系统定义的统一的设备驱动程序接口,不同厂商按照接口来实现即可。
  • 总线适配器驱动(控制器驱动):将IO总线连接到控制器。控制传输的驱动程序。
  • 磁盘设备
  • 磁盘控制器:从磁盘中按照串行位流方式读取数据。在自己内部缓存区中组装成一个字节块,校验数据没有错误后,再将复制到内存。(反向同理)
  • 磁盘驱动器:接收IO请求,排队,寻道,返回IO数据。

大概步骤如下:(CPU只负责发指令,然后干其他事情——采用程序中断+IO端口独立编址。还有其他DMA、内存IO映射统一编址方式)

  1. open调用,从文件系统中读取文件属性和磁盘地址表,并装入内存中
  2. 将文件的地址写入寄存器
  3. CPU读到IN/OUT指令。启动中断,下发指令到控制器中要读取该地址的数据,CPU就干其他事情了。
  4. 磁盘控制器从磁盘驱动器中串行地一位一位读一个块,直到整个块放入控制器内部的缓存区。
  5. 磁盘控制器产生一个中断。等待CPU响应中断继续服务。
  6. 中断控制器看总线情况是否繁忙,以及中断优先级,来做中断标志位。
  7. CPU看到中断标志位信息OK,就下发指令拷贝到内存中。
  8. 磁盘控制器将数据传达内存。

你可能感兴趣的:(【什么时候用多线程——IO篇】)