目录
前言:
一、操作系统:
操作系统的定位:
应用程序:
系统调用:
操作系统内核:
驱动程序:
硬件设备:
二、进程:
什么是进程?
进程的描述与组织:
描述:
组织:
PCB中的 特征(属性)
CPU分配——进程调度:
进程调度的相关属性:
三、内存管理:
虚拟地址空间:
由于最近忙于备考和学习新的知识以及疫情返乡政策等原因,博客的内容有一段时间没有更新了。不过从今天开始,依然是步入正轨了,继续我总结知识的过程。同时马上就是新年了,在这里预祝大家2023年新年快乐,在新的一年里更进一步,早日实现梦想,进入理想的企业哈!!!
好了,那么书归正传。开始进行多线程的学习。今天主要总结的是初步对操作系统有个认识,外加对进程和内存管理的相关部分进行一个总结。
首先我们要知道什么是操作系统,我们在市面上听说的Windows系统,Linux系统,iOS系统,Unix系统,Android系统等等都是比较常见的操作系统。操作系统就是一组做计算机资源管理的软件的统称。
操作系统:
对上要为软件的运行提供稳定的运行环境, 对下要管理硬件设备。
一句话就是:操作系统是用户,软件,硬件之间交互的媒介。
在我们日常生活中最熟悉和最常用的就是我们的Windows系统了,Linux系统是每个程序猿都要会的系统,因为该系统特别适合我们进行开发和部署。
这个需要我们画个图来进行理解一下:
总的来说,操作系统的定位还是我们上面说的“上有软件,下有硬件”。
如何来理解这里的这几个词?
应用程序不用我们多说,就是我们手机上的app,电脑上下载的qq,wx,游戏等等各种软件。
系统调用可以简单的理解为操作系统给应用程序提供的API,如果一个软件想要操作一下硬件设备,就需要通过系统调用告诉操作系统内核,由操作系统内核调用驱动程序来操作对应的硬件设备。
操作系统内核特指操作系统的核心功能:资源管理,对上为软件的运行提供稳定的运行环境,对下管理硬件设备。
驱动程序是每个硬件设备的开发商来进行开发时配置的对应的驱动,只有装了相应的驱动程序我们的电脑才能够识别硬件设备。
硬件设备不用多说了,你把电脑后盖打开,你可以看到的都是硬件设备。
进程是操作系统对正在运行的程序的一种抽象,换句话说就是,程序的一次运行过程可以称为进程。
像我们所看到的应用程序,当我们没有运行它的时候,不能称为进程,当我们打开运行的时候,才可以称为进程。“没有跑起来的程序不算进程!”
同时,在我们的操作系统的内部,进程又是操作系统进行资源分配的基本单位。
我们通常认为进程是描述和组织起来的 。
进程的描述是用C语言中的结构体来实现的。操作系统通常都是由C/C++写的。用来描述的结构体被称为“PCB(进程控制块)”。
进程的组织就是相当于用一个双向的链表把这些PCB都串起来。(注意:只是相当于,实际不是一个单纯的双向链表,实际要复杂的多)。
我们可以这样理解:创建一个进程的本质就是创建一个这样的PCB对象,然后把这个PCB插入到链表中,销毁一个进程就是把对应的PCB对象从链表中删除。像我们查看到的任务管理器所看到的进程就可以相当于是把链表遍历了一遍。
1、pid pid是进程的身份标识,就相当于我们的身份证一样,每个进程都有一个唯一的pid。
2、内存指针 注意我们这里说的指针不是C/C++里说的指针,我们说它是指针只是个形象的说法,这个内存指针非常的重要,它描述了进程的关联到的程序的信息,比如描述了程序加载到的内存位置等等,以便更好的分配内存。
3、文件描述符表 这个文件描述符表描述了该进程使用到的其他的资源的信息,包括硬盘上的文件等等其他的资源。
4、进程调度信息 这个模块非常的重要,它解决了CPU的资源分配的问题,由于内容比较多和复杂,我们在下面再进行详细的说明这部分的内容。
以上PCB的几个特性主要解决了资源分配中的进程标识,内存分配,CPU资源分配的问题。
除了第四条,前面的三条都是描述了进程持有哪些的硬件资源。CPU的资源分配相对来说会比较复杂一点。目前我们所用的电脑大多数都是多核CPU。比如我的电脑:
我的电脑是16核的CPU,一般情况下我们的电脑的进程会有很多个,比如我此时电脑上的进程数目:
这就出现了狼多肉少的局面。那么我们的电脑的CPU是如何解决这个难题的呢?
这就涉及到了我们进程调度的问题。
1、进程的状态
进程的状态有三种状态:
1)就绪状态:进程随时准备去CPU上执行(随叫随到)
2)运行状态:正在CPU上执行
3)阻塞状态:短时间内阻塞住了,没有办法进行响应。
(注意:很多的操作系统其实不区分就绪和运行状态)
2、优先级
优先级就好比排队时,孕妇和军人优先一样,资源的分配也是有优先级的,比如给谁先分,给谁分的多点。操作系统在进行进程调度的时候并不是“平均式”分配。为了在有限的核心上执行多的进程,就需要提到我们的并行和并发的概念了。
并行:不管是从宏观上还是微观上来看同一时刻,两个核心上的进程是同时执行的。
并发:同一时刻,一个核心上是只能执行一个进程的。但是如果在这个核心上快速的切换不同的进程进行执行(快到人分辨不出来到底切换了没有),也就是其实微观上这些进程不是同时执行的,但是在宏观上我们可以认为它们是同时运行的。像我的电脑3.20Ghz,也就是说一秒内可以执行32亿条指令。这是我们人眼所分辨不出来的。
因此我们通常把并行和并发统称为并发。(没有特别要求的情况下)
3、上下文
由于我们上面说的CPU上的进程在不断的切换,但是我们还要让切换的过程中不会影响到后续的运行,就需要记录一下切换时的中间状态,如果不记录中间状态,再次切换回来的时候CPU就不能正常执行该进程了。就好比我们打游戏的时候要进行一个“存档”一样,如果不进行及时的存档,再次打开时就要重新来过了。所以我们可以简单的理解为“存档”,“读档”。上下文本质上就是你“存档”的内容。而我们进程中的上下文就是CPU各个寄存器中所存的值。寄存器是CPU内置的存储数据的一个模块。
保存进程的上下文就是把CPU寄存器中的值保存到内存中去,恢复进程的上下文就是把这些值再加载回去。
4、记账信息
记账信息就是操作系统会记录每个进程在CPU上执行的时间和执行的指令的数量,然后再根据执行的时间和指令的数量来决定接下来如何来进行调度。
什么是虚拟地址空间?这么说吧,我们平时所说的内存就是虚拟地址空间。程序中所获取到的内存地址,并不是真正意义上的物理地址,它是经过了一层的抽象,虚拟出来的地址。
那么为什么要进行抽象,变成虚拟地址呢?
主要原因还是为了减少bug的出现。(避免进程之间相互产生影响)
比如:
一旦出现这种情况我们可以试想一下,本来qq和微信的代码正常的时候,两个运行的程序相安无事,这个时候突然微信的代码出现了越界,导致内存出现交叉了,明明是微信的bug,却把qq搞坏了:明明你打开的qq好好的,然后又打开了个微信,结果微信崩了,qq也崩了。你就说qq冤不冤吧!
所以为了避免这种冲突的出现引入了抽象,进行了地址的虚拟化(由操作系统和硬件设备进行地址的转换):
通过这样的手段,如果操作系统发现了进程1的地址超出其访问的范围的时候就会报错(具体来说是发送一个 SIGN SEGEMENT FAULT 信号,引起进程的崩溃)。这样的话进程1出现bug就是进程1崩溃,进程2则不受影响。(谁出bug谁崩溃)。
解决了进程之间的相互影响的问题后,依然会有一个问题出现在我们面前:如果有进程之间确实需要相互交互怎么办?那就需要在引入一个公共的空间了。就是两个进程都可以访问的空间,这样就可以解决这问题了。
好了,有关操作系统,进程和内存管理的知识就分享到这里了,这部分的内容还是非常重要的,特别是进程调度的过程需要我们认真的理解一下。最好做到心中有数就行。谢谢啦!!!