数学家冯·诺依曼提出了计算机制造的三个基本原则,即采用二进制逻辑、程序存储执行以及计算机由五个部分组成运算器、控制器、存储器、输入设备、输出设备),这套理论被称为冯·诺依曼体系结构。
存储器:
在当前的计算机组成当中,存储方式分为内存存储与硬盘存储等;
与之不同的是硬盘为非易失性存储器(断电不易失),内存为易失性存储器(断电易失);
输入设备:
在生活当中, 键盘,摄像头,话筒,磁盘(读取文件),网卡等都为输入设备;
输出设备:
显示器,音响,磁盘(写入文件)网卡等都为输出设备;
CPU(中央处理器):
运算器
算逻运算 - 算术运算(±运算等)与逻辑运算(
if
,else
)控制器
CUP是可以相应外部事件的(协调外部就绪事件,例如将数据拷贝至内存当中)
在各个存储介质当中,不同类型的存储介质的读取速度也不同
响应速度分别为:
CPU&&寄存器
>内存
>磁盘/SSD
>光盘
>磁带
在最早的计算机当中是不存在内存的;
也就是外设与CUP之间直接进行交互;
但是实际上在计算机当中,最影响计算机整体速度的并不是计算机中最快的,而是最慢的;
若是使外设直接与CPU直接进行交互将会导致外设的速度大大拖慢CPU的速度导致计算机整体效率变慢;
而若是在计算机当中添加存储器后,可以使得外设中的数据通过操作系统率先load(加载)至存储器中,而又由于存储器与CPU的读写速度相差跨度并不是特别大,所以当数据加载至存储器当中CPU可以直接访问存储器从而加快计算机整体的速度;
以当前大环境而言,CPU一般读取数据(数据,代码)都是从内存之中进行读取;所以若是以数据的角度进行观察:CPU不和外设直接进行交互;
当CPU需要处理数据时会首先将外设中的数据加载到内存当中(外设只与内存进行交互);
以这种方式可以进行一种分类
input
将数据从外设(输入设备)加载至内存中;
output
将数据从内存加载至外设(输出设备)当中;
当数据需要处理时数据首先会加载至内存,通过CPU读取内存数据并作出相应处理;
当数据处理完毕之后并不会直接从CPU转至外设(输出设备),会先将处理后的数据存放回内存并让外设(输出设备)进行显示;
操作系统可以看作一个用来对软硬件资源进行管理的软件;
硬件
硬件是整个计算机之中最基本的,任何操作系统都是基于硬件之上;
而在一个机器当中的所有硬件都是按照冯诺依曼体系结构进行存放,不存在杂乱无章;
驱动程序
而紧接着在硬件之上就是驱动程序,驱动程序也是系统软件部分的一部分,它的主要功能就是对硬件进行操作;
主要提供软件级别的对硬件操作的接口;
操作系统的主要工作分为两个方面:
操作系统对资源进行管理时主要按先描述后组织
的概念进行管理;
操作系统在整体中处于一个管理者的位置,而这里的先描述后组织的意思即为:
管理者将所有的被管理者以特定的结构进行描述,由于被管理者类型的不同,所以整体的结构也跟着不同;
由于大部分常见的操作系统都是由C/C++开发,所以可以将这个所谓的结构看成是一个结构体(被管理者可以看成类似实例化);
struct A{ /*属性*/ };
而管理者正式通过这些对象的属性,根据需要的条件对资源进行操作和管理;
由于操作系统需要对软硬件资源都进行管理,当然这里的资源也包括进程;
从之前的知识点中可以总结出一条结论:当一个程序被运行时,必须将该程序先加载到内存当中,这是因为由于冯诺依曼体系结构规定CPU访问数据时或者要对数据进行对应操作时首先必需从内存中访问;
当然这句话说的并不全面,对于"当一个程序被运行时,必须将改程序先加载到内存当中",事实是如此,但这仅仅只是以硬件的角度进行观察,真正意义上来说,当一个程序被运行之后,将不能叫做程序,应该叫做"进程的一部分";
以Windows11为例,当我Ctrl
+Alt
+del
并选择任务管理器时可以观察到许多进程;
根据用户的需要,用户可以通过这个任务管理器去结束相应的进程;
本质上操作系统并不具备直接管理程序的能力,但是操作系统中存在着一个进程管理;
当一个程序被运行起来之后,它将被加载进内存成为进程的一部分,而操作系统通过进程管理可以完成对这个进程的资源管理;
在Linux中也是如此,每当运行一个程序或者执行一条命令时都是将程序/命令加载进内存使其成为进程从而对该资源进行对应的管理;
在Linux中,可以同时运行多个程序或者同时执行多条命令的,当然这也意味着在Linux是可能同时存在大量的进程;
那么当Linux同时存在大量的进程时,操作系统该如何对进程这个资源进行管理;
其实很简单,在上文中我们提到的一个概念为 “先描述,后组织”;
操作系统对进程的管理也是如此;
在进程种有一种数据结构叫做PCB(Process Control Block),也可以称之为进程控制块,可以理解为进程属性的集合;
而在Linux下描述进程信息的PCB为task_struct
,是以结构体的形式进行实现的;
当一个程序加载进内存成为进程时,操作系统将自动为这个进程创建一个PCB结构体对象,实现对这些进程的描述;相应的这个结构体内存着对应进程的所有属性,而操作系统将用某种数据结构将这些结构体对象链接在一起,从而使得能够通过不同的属性对进程进行对应的资源管理;
这就可以理解了为什么说"当程序被加载进内存的时候就成为了进程的一部分",因为只有加载进内存的程序(代码与数据) + 该进程所对应的PCB结构体这个整体才能称为是一个进程;
在PCB种包含的结构体化的数据属性中包含了:
标识符
描述本进程的标识符;
状态
任务状态,退出代码等;
优先级
程序相对于其他进程的优先级;
程序计数器
程序中即将被执行的下一条指令的地址;
内存指针
程序对应的代码以及数据的位置信息;
上下文数据
进程执行时处理器的寄存器中的数据;
I/O状态
记账信息
可能包括处理器时间总和等各种信息;
其他
在上文中我们提到了进程有关的概念,那么在Linux中该如何观察进程?
ps
来观察进程; 但是ps
只能观察当前窗口(终端)的进程;
若是想要观察所有的进程的话需要使用指令ps axj
,当然也可以配合管道|
与grep
来查到对应所需要的进程;
那么该如何更直观的观察到进程?
假设有一个.cpp
文件,代码为:
#include
using namespace std;
int main()
{
while(1) cout<<"进程1"<
并执行这段程序;
此时就已经是执行了一个进程,当然可以使用ps
命令的方式观察这个进程;
使用ps axj | head -1 && ps axj | grep myproc
查询该进程:
该进程就已经跑了起来;
此时在终端使用
ctrl
+C
结束该进程并再次查询该进程时发现该进程不存在;
ps
命令以外还可以使用top
命令; top
命令在Linux中可以看作是Windows下的任务管理器;
以上面的方式我们再次运行那个程序,将进程跑起来;
先使用ps
的方式查看进程的对应信息;
将会看到PID与PPID;
我们首先观察23460
的这个进程(下面的进程为使用grep
时的进程,在本次中可以不进行观察);
再使用ls
查看目录/proc
;
可以发现/proc
目录下的文件就是一些进程;
再使用ll
并使用grep
来找当前目录下的PID
为23460
的这个进程(此时进程还在运行当中);
当我们手动使用Ctrl
+C
将程序结束时再使用该指令查找该进程时将发现该进程已经不存在;
但这并不说明进程在Linux中是以目录的形式存在,实际上/proc
是Linux中的一个文件系统,而这个文件系统是一个伪文件系统,通过该文件系统可以访问进程的属性信息而已;
使用ll
观察23460
这个目录下的文件可以发现,在该目录下存在着两个文件;
这两个文件分别以cwd
与exe
开头;
exe
后所跟的路径为,当前进程所对应程序所在的路径;
cwd
后所跟的路径为,当前进程的工作目录;
当一个程序运行时,每个进程都将会有一个属性来保存当前自身所在的工作路径;
在上面提到了关键字PID
,而实际上PID
即为进程的标识符;
每个进程所对应的PCB
都将会存储这个进程标识符;
进程标识符是每个进程中独有的属性;
当然每个进程在每次运行时其PID
都将不同;
在程序中也可以使用getpid()
函数来进行对当前进程PID
的获取;
其中pid_t
为操作系统中的一个数据类型,是一个无符号整型;
#include
#include
using namespace std;
int main()
{
while(1) cout<<"进程1 "<<"PID : "<
从这里可以看到这里所获取的PID
与之前观察到的PID
都不同,可以验证在上面所说的"每个进程在每次运行时其PID
都将不同";
除了进程以外还有父进程,也可以在程序中使用getppid()
函数来获取该进程的父进程的PID
;
而实际上PPID
即为bash
(Bash 是一种命令行解释器和 shell 程序);
Shell通过创建子进程的方式来完成对应的任务;