《深入理解计算机系统》1.2:计算机系统漫游

目录

高速缓存至关重要

存储器层次结构

操作系统管理硬件

进程

虚拟内存

文件


高速缓存至关重要

hello程序的机器指令最初是存放在磁盘上,程序加载时,它们被复制到主存;当处理器运行时,指令又从主存复制到处理器。相似地,数据串"hello, world\n"开始时在磁盘上,然后被复制到主存,最后从主存复制到显示设备。这些复制,都是开销。系统设计者的一个主要目标就是使这些复制操作尽可能快地完成。

根据机械原理,较大的存储设备比较小的存储设备运行得慢,而快速设备的造价远高于同类的低速设备。一个典型的寄存器文件只能存储几百字节的信息,而主存可存放几十亿字节。然而,处理器从寄存器文件中读数据比从主存中读取几乎要快100倍。更麻烦的是,随着这些年半导体技术的进步,这种处理器与主存之间的差距还在持续增大。加快处理器的运行速度比加快主存的运行速度要容易和便宜得多。

这种处理器与主存之间的差异,系统设计者采用了更小更快的存储设备,称为高速缓存存储器(cache memory)。

《深入理解计算机系统》1.2:计算机系统漫游_第1张图片

之所以要用高速缓存,是因为局部性原理。即程序具有访问局部区域里的数据和代码的趋势,通过让高速缓存里存放可能经常访问的数据,大部分的内存操作都能在快速的高速缓存中完成。

存储器层次结构

《深入理解计算机系统》1.2:计算机系统漫游_第2张图片

存储器层次结构的主要思想是上一层的存储器作为低一层存储器的高速缓存。因此寄存器文件就是L1的高速缓存,L1是L2的高速缓存,L2是L3的高速缓存,L3是主存的高速缓存,而主存又是磁盘的高速缓存。在某些具有分布式文件系统的网络系统中,本地磁盘就是存储在其他系统中磁盘上的数据的高速缓存。

操作系统管理硬件

hello程序没有直接访问键盘、显示器、磁盘或者主存。取而代之的是,它们依靠操作系统提供的服务。我们可以把操作系统看成是应用程序和硬件之间插入的一层软件,所有应用程序对硬件的操作尝试都必须通过操作系统。如图:

《深入理解计算机系统》1.2:计算机系统漫游_第3张图片

操作系统有两个基本功能:

1.防止硬件被失控的应用程序滥用;

2.向应用程序提供简单一致的机制来控制复杂而又通常大不相同的低级硬件设备。

操作系统通过几个基本的抽象概念(进程、虚拟内存和文件)来实现这两个功能。

《深入理解计算机系统》1.2:计算机系统漫游_第4张图片

文件是对IO设备的抽象表示,虚拟内存是对主存和磁盘IO设备的抽象表示,进程则是对处理器、主存和IO设备的抽象表示。

小结:缓存与抽象,计算机技术的两大核心

进程

进程是操作系统对一个正在运行的程序的一种抽象。在一个系统上可以同时运行多个进程,而每个进程都好像在独占地使用硬件。而并发运行,则是说一个进程的指令和另一个进程的指令是交错执行的。在大多数系统中,需要运行的进程数是多于可以运行它们的CPU个数的。传统系统在一个时刻只能执行一个程序,而先进的多核处理器同时能够执行多个程序。无论是在单核还是多核系统中,一个CPU看上去都像是在并发地执行多个进程,这是通过处理器在进程间切换来实现的。操作系统实现这种交错执行的机制称为上下文切换

操作系统保持跟踪进程运行所需的所有状态信息。这种状态,也就是上下文,包括许多信息,比如PC和寄存器文件的当前值,以及主存的内容。在任何一个时刻,单处理器系统都只能执行一个进程的代码。当操作系统决定把控制权从当前进程转移到某个新进程时,就会进行上下文切换,即保存当前进程的上下文、恢复新进程上下文,然后将控制权传递到新进程。新进程就会从它上次停止的地方开始。如图:

《深入理解计算机系统》1.2:计算机系统漫游_第5张图片

从一个进程到另一个进程的转换是由操作系统内核(kernel)管理的。内核是操作系统代码常驻内存的部分。当应用程序需要操作系统的某些操作时,比如读写文件,它就执行一条特殊的系统调用指令,将控制权传递给内核。然后内核执行被请求的操作并返回应用程序。注意,内核不是一个独立的进程。相反,它是系统管理全部进程所用代码和数据结构的集合。

在现代操作系统中,一个进程实际上可以由多个称为线程的执行单元组成,每个线程都运行在进程的上下文中,并共享同样的代码和全局数据。由于网络服务对并行处理的需求,线程成为越来越重要的编程模型,因为多线程之间比多进程之间更容易共享数据,也因为线程一般来说都比进程更高效。当有多个处理器时,多线程也是一种使得程序可以运行得更快的方法。

小结:有了上下文,系统可以在多个进程间自由穿梭

虚拟内存

虚拟内存是一个抽象概念,它为每个进程提供了一个假象,即每个进程都在独占地使用主存。每个进程看到的内存都是一致的,称为虚拟地址空间。虚拟地址空间(其他Unix系统的设计也与此类似)。在Linux中,地址空间最上面的区域是保留给操作系统中的代码和数据的,这对所有进程来说都是一样的。地址空间的底部区域存放用户进程定义的代码和数据。

《深入理解计算机系统》1.2:计算机系统漫游_第6张图片

上图地址从下往上增大

虚拟内存的运作需要硬件和操作系统软件之间精密复杂的交互,包括对处理器生成的每个地址的硬件翻译。基本思想是把一个进程虚拟内存的内容存储在磁盘上,然后用主存作为磁盘的高速缓存。

文件

文件就是字节序列,仅此而已。每个IO设备,包括磁盘、键盘、显示器甚至网络,都可以看成是文件。系统中的所有输入输出都是通过使用一小组称为Unix I/O的系统函数调用读写文件来实现的。

文件这个简单而精致的概念是非常强大的,因为它向应用程序提供了一个统一的视图,来看待系统中可能含有的所有各式各样的IO设备。例如,处理磁盘文件的应用程序员可以非常幸福,因为他们无须了解具体的磁盘技术。进一步来说,同一个程序可以在使用不同磁盘技术的不同系统上运行。

小结:抽象简化了问题,并且可以使代码变得更通用。

你可能感兴趣的:(深入理解计算机系统,计算机科学基础,读书笔记)