目录
冯诺依曼体系结构
操作系统OS
系统调用和库函数概念
进程
task_struct内容分类
组织进程
初识fork
进程状态
Z(zombie)-僵尸进程
孤儿进程
进程优先级
环境变量
和环境变量相关的命令
环境变量的组织方式
程序地址空间
关于冯诺依曼,必须强调几点:
这里的存储器指的是内存
不考虑缓存情况,这里的CPU能且只能对内存进行读写,不能访问外设(输入或输出设备)
外设(输入或输出设备)要输入或者输出数据,也只能写入内存或者从内存中读取。
一句话,所有设备都只能直接和内存打交道。
OS是一款专门针对软硬件资源进行管理工作的软件。对下,管理好软硬件资源(方式)。对上,给用户提供稳定的,高效安全的运行环境(目的)。
计算机管理硬件:1、描述,使用struct结构体2、使用数据结构组织起来
在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分 由操作系统提供的接口,叫做系统调用。
系统调用在使用上,功能比较基础,对用户的要求相对也比较高,所以,有心的开发者可以对部分系统调用进行适度封装,从而形成库,有了库,就很有利于更上层用户或者开发者进行二次开发。
什么是进程?进程就是加载到内存中的程序
任何进程在形成的时候,操作系统都要为该进程创建PCB(Process Control Block)进程控制块。在OS上面,PCB就是一个结构体,用于描述进程,也可以理解为进程属性的集合。
Linux中描述进程的PCB是task_struct。
标识符:描述本进程的唯一标识符,用于区别其他进程
状态:任务状态,退出代码,退出信号等
优先级: 相对于其他进程的优先级。
程序计数器: 程序中即将被执行的下一条指令的地址。
内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
上下文数据: 进程执行时处理器的寄存器中的数据。
所有运行在系统里的进程都以task_struct链表的形式存在内核里。
fork的作用是创建一个子进程。
fork有两个返回值。创建失败就返回一个小于0的数。创建成功就给父进程返回子进程的pid,给子进程返回0
僵死状态(Zombies)是一个比较特殊的状态。当进程退出并且父进程没有读取到子进程退出的返回代码时就会产生僵死(尸)进程
僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码。
所以,只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入Z状态
僵尸进程的危害:
进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎么样了。如果父进程一直不读取,那子进程就一直处于Z状态。
维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在task_struct(PCB)中,换句话 说,Z状态一直不退出,PCB一直都要维护。
那一个父进程创建了很多子进程,就是不回收,就会造成内存资源的浪费。因为数据结构对象本身就要占用内存。
父进程先退出,子进程就称之为“孤儿进程”
孤儿进程被1号init进程(OS)领养,当然要由init进程回收。
为什么会有优先级?------->因为资源少,本质是分配资源的一种方式
cpu资源分配的先后顺序,就是指进程的优先权(priority)。
优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用,可以改善系统性能。
还可以把进程运行到指定的CPU上,这样一来,把不重要的进程安排到某个CPU,可以大大改善系统整体性能。
查看进程的时候,可以观察到PRI、NI这个两个参数,PRI即进程的优先级。NI称为nice值,是PRI的修正值,取值为-20~19,共四十个级别。
ps:Linux中的优先级数据,值越小优先级越高
竞争性: 系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争属性的。为了高 效完成任务,更合理竞争相关资源,便具有了优先级
独立性: 多进程运行,需要独享各种资源,多进程运行期间互不干扰
并行: 多个进程在多个CPU下分别,同时进行运行,这称之为并行
并发: 多个进程在一个CPU下采用进程切换的方式,在一段时间之内,让多个进程都得以推进,称之为并发
常见环境变量
PATH : 指定命令的搜索路径
HOME : 指定用户的主工作目录(即用户登陆到Linux系统中时,默认的目录)
SHELL : 当前Shell,它的值通常是/bin/bash。
环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数 。
如:我们在编写C/C++代码的时候,在链接的时候,从来不知道我们的所链接的动态静态库在哪里,但 是照样可以链接成功,生成可执行程序,原因就是有相关环境变量帮助编译器进行查找。
环境变量通常具有某些特殊用途,还有在系统当中通常具有全局特性
命令,程序,工具等等本质都是一个可执行的文件。
但是为什么执行系统命令,直接敲命令就行了。我们自己写的可执行程序前面还要加上./
因为PATH环境变量的设置,输入命令之后,系统按照PATH中的路径逐个去寻找命令所处的路径。
当我们把自己写的程序添加在PATH的环境变量下的时候,我们的可执行程序也能向命令一样,直接输入就能执行。
我们现在能看见,我们的命令也能像系统命令那样直接执行了。
影响了整个“用户系统”。环境变量具有“全局属性”。本质:环境变量能被子进程继承下去
1. echo: 显示某个环境变量值
2. export: 设置一个新的环境变量
3. env: 显示所有环境变量
4. unset: 清除环境变量
5. set: 显示本地定义的shell变量和环境变量
查看文档。也就是environ是一个二级指针,指向一个指针数组,指针数组指向不同的环境变量。
编写以下程序,打印出环境变量
编写如下程序:
我们开一个子进程,在子进程里边打印并修改全局变量g_val的值。在父进程里边也不断打印全局变量的值和地址。
运行结果如下
我们观察到,这里子进程修改g_val的值之后,地址并没有发生改变。但是按理说,这里的地址是会发生改变的,因为g_val的值修改了,并且是在子进程里边修改的,会发生写实拷贝(将父进程的数据拷贝一份,进行修改)。
这里没有发生改变是因为这里的地址并不是物理地址,而是虚拟地址。
通过观察下图得出虚拟地址和物理地址的关系
上面的图就足矣说名问题,同一个变量,地址相同,其实是虚拟地址相同,内容不同其实是被映射到了 不同的物理地址!