第2章 2-6、2-7进程通信、线程

进程通信是指进程之间的信息交换。

一、低级通信——进程之间的互斥和同步

信号量机制是有效的同步工具，但作为通信工具

缺点如下：

(1)效率低（通信量少）

(2)通信对用户不透明（程序员实现，操作系统只提供共享存储器供代码操作）

二、高级进程通信

用户直接利用操作系统提供的一组通信命令，高效地传送大量数据的通信方式。

操作系统隐藏了进程通信的细节，对用户透明，减少了通信程序编制上的复杂性。

1.进程通信的类型

高级通信机制可归结为四大类

①共享存储器系统（操作存储区方式）

相互通信的进程共享某些数据结构或共享存储区，进程之间能够通过这些空间进行通信。

a.基于共享数据结构的通信方式（低级）

诸进程公用某些数据结构，借以实现诸进程间的信息交换。

如生产消费问题，定义共享的数据结构：n个长度的有界缓冲区。

程序员：提供对公用数据结构的设置及对进程间同步的处理。

操作系统：提供共享存储器。

特点：复杂、低效率，还只适合传递相对少量的数据。

b.基于共享存储区的通信方式（高级）

在存储器中划出了一块共享存储区，诸进程可通过对共享存储区中数据的读或写来实现通信。

进程通信前先向系统申请获得共享存储区中的一个分区，并指定该分区的关键字；

若系统已经分给了其他进程，则将该分区的描述符返回给申请者，申请者把获得的共享存储分区连接到本进程上；此后，便可像读、写普通存储器一样地读、写该公用存储分区。多进程借助该区通信。

②消息传递系统（发--收方式）

最广泛使用的一种，进程间的数据交换，以格式化的消息为单位。屏蔽底层复杂操作。

单机：操作系统底层编程中的消息传递系统调用；

计算机网络：消息称为报文。程序员直接利用系统提供的一组通信命令(原语)进行通信。（④客户机-服务器系统）

如socket编程，利用函数库的send、receive等命令即可实现网络通信

③管道通信（中间文件方式）

所谓“管道”，是指用于连接一读进程和一写进程以实现通信的一个共享文件，又名pipe文件。

向共享文件输入的写进程以字符流形式将大量的数据送入管道；而接收管道输出的读进程则从管道中接收(读)数据。

首创于UNIX系统。其管道机制需提供三方面的协调能力：互斥、同步、确定对方是否存在。

④Client-Server system

套接字（Socket）

一个套接字就是一个通信标识类型的数据结构，包含了通信目的的地址，端口号，传输层协议、进程所在的网络地址，以及针对C\S程序提供的不同系统调用（API函数）等。

系统中所有的连接都持有唯一的一对套接字及端口连接，从而方便地区分来自不同应用程序进程或网络连接的通信，确保通信双方间逻辑链路的唯一性。

远程过程调用（远程方法调用）

RPC 有很多正面的应用，比如网络文件系统NFS、Web Service等，也是网络安全中容易被攻击的技术。

Remote Procedure Call，远程过程调用。也就是说，调用过程代码并不是在调用者本地运行，而是要实现调用者与被调用者二地之间的连接与通信。

RPC的基本通信模型是基于Client/Server进程间相互通信模型的一种同步通信形式；它对Client提供了远程服务的过程抽象，其底层消息传递操作对Client是透明的。

RPC应用开发步骤

定义客户端、服务器端的通信协议（定义服务过程的名称、调用参数的数据类型、返回参数的数据类型、底层传输类型（UDP/TCP）等。2.开发客户端程序。3.开发服务器端程序。

对于RPC通信协议的生成，最简单的方法是利用协议编译工具：生成实现RPC协议的生成器rpcgen（ C程序），Remotetea（ java程序）。

2.消息传递通信的实现方法

1）直接通信方式

发送进程利用OS所提供的发送命令（原语），直接把消息发送给目标进程。此时，发送进程和接收进程都以显式方式提供对方的标识符。通常利用系统通信命令（原语）：

Send(Receiver, message);

Receive(Sender, message);

2）间接通信方式

基于共享数据结构的实体用来暂存发送给目标进程的消息；接收进程则从该实体中，取出对方发送给自己的消息。通常把这种实体称为信箱。

消息在信箱中可以安全地保存，只允许核准的目标用户随时读取。既可实时通信，又可非实时通信。

3.消息传递系统的实现

单机和网络环境下的高级进程通信广泛采用“消息传递”方式，需要考虑的问题：

①通信链路的建立

计算机网络环境下，用原语显式建立/拆除链路

单机系统只须利用系统原语，进程间链路由系统自动管理。

②消息格式

单机系统，发送与接收进程在同一台机器，环境相同故格式简单；

网络环境下，受不同目标机器的环境和长距离信息传输等因素的影响，消息格式较复杂，消息常是“大头+正文”

③同步方式（如何控制发送和接收的状态）

即考虑平时闲着，还是平时忙碌？

发送进程阻塞、接收进程阻塞（无缓冲紧密同步）

发送进程不阻塞、接收进程阻塞（服务器程序）

发送进程和接收进程均不阻塞（缓冲队列）

4.消息缓冲队列通信机制

美国Hansan提出，在RC 4000系统上实现。后被广泛应用于本地进程通信。

①不需管理链路

②定义简单数据结构（亦即消息格式）

即消息队列中的消息格式如何？

本机通信消息结构简单，如下：

type message buffer = record

sender; 发送者进程标识符

size; 消息长度

text; 消息正文

next; 指向下一消息缓冲区的指针

end

PCB中需要记录有关通信的信息项

③实现发送和接收的操作原语

一、认识线程

1.线程的引入

多道程序管理：追求效率的目的下实现“并发”

并发性与效率的讨论

利用进程实现的多道程序系统中

进程是一个可拥有资源的独立单位；

是一个可独立调度和分派资源的基本单位

有如下频繁操作：创建进程、撤销进程、进程切换

PCB信息，CPU环境的管理等付出不少时空开销，尤其在进程切换上。

所以并发程度不是随意设定的：

并发进程数量不宜过多，切换频率不宜过高。

限制并发程度问题所在：进程实体信息量大，对进程的管理操作越多，与运行时间的比值就越大，运行效率就低。

怎样进一步提高并发效率，节约时空开销？

2.线程的属性

多线程OS中，一个进程包括多个线程，每个线程都是利用CPU的基本单位。

轻型实体：只需一点必不可少的、能保证独立运行的资源。（TCB）

独立调度和分派的基本单位：调度切换迅速且开销小。

可并发执行

共享进程资源：同进程中的线程可共享相同的进程地址空间、已打开文件、信号量机构等。

3.线程的信息

（TCB管理什么信息？）

状态参数

标识符、运行状态、优先级、寄存器状态、堆栈、专有存储器、信号屏蔽等。

运行状态

执行、就绪、阻塞

4. 线程的创建和终止

在多线程OS中，应用程序启动时，通常只有一个线程(初始化线程)在执行，它根据需要再创建若干线程。

创建新线程

利用线程创建函数(或系统调用)，提供相应参数。线程创建函数执行完后，返回一个线程标识符供以后使用。

线程被终止：

不立即释放资源，只有当进程中的其它线程执行分离函数后，资源才分离出来能被其它线程利用。

被终止而未释放资源的线程仍可被需要它的线程调用，使其重新恢复运行。

多线程的应用

一个应用程序有多个任务或功能需要同时进行处理，就最适合多线程机制。

应用情况举例：

网络软件，需要同时进行用户界面响应、收数据、发数据。

网络下载工具：多线程下载的下载工具

编程举例

多线程编程过程是类似的：

可用win32 API编写C风格程序

C的main既是规定了主线程的代码。启动程序时，系统根据main地址，启动主线程。

在主线程代码某处利用线程创建函数即可创建线程；给创建函数编写线程功能代码；

利用其他一系列函数使系统管理多个线程。

也可用封装好的类库，如JAVA，MFC

VC++的MFC类库提供了线程操作

CWinThread类

①写一个符合格式规定的线程控制函数UNIT 名称（LPVOID pParam）{…}

② 调用AfxBeginThread(…)创建并启动新线程：用户提供需要的执行参数，即启动了上面定义的功能函数。

理论联系实践

windows编程

侯捷《Win32多线程编程》

同步 Critical Section、Event、Mutex、Semaphores

通信：

（一）本地机进程间通讯：

1）采用微软消息队列（Microsoft Message Queue，MSMQ）；

2）采用内存映射文件；

（二）网络中不同机器间数据通讯：

Winsock ；

5.多线程系统中的进程

进程只是用于分配系统资源

包括多个线程

不是执行实体，线程在进程范围内作为执行实体。

线程与进程的比较

调度：线程作为CPU调度的基本单位，而进程只作为其它资源分配单位。

并发性：进程之间可以并发，实质上是不同进程中的两个线程并发。一个进程的多个线程之间亦可并发。

拥有资源：进程间资源相互独立；同一进程的各线程间共享。某进程内的线程在其它进程不可见

系统开销：线程上下文切换在同进程环境下上下文切换要快得多。因为同进程内线程间共享内存地址和打开的文件资源；

6.线程的管理

同步和通信机制

1）互斥锁

比较简单的，控制线程互斥访问资源；

适用于高频度使用的关键共享数据和程序段；

unlock和lock两个锁操作原语；

2）条件变量

与互斥锁一起使用

锁保证互斥进入临界区，但利用条件变量使线程阻塞

注意不满足条件时，wait条件变量：

释放互斥锁

进程阻塞在条件变量指向队列中

被唤醒后要重新再设互斥锁

3）信号量

私用信号量（private samephore）

用于同进程的线程间同步，数据结构存放在应用程序的地址空间。属于特定进程，OS感知不到其存在。

公用信号量（public samephore）

用于不同进程间或不同进程中线程的同步，数据结构由OS管理，存放在受保护的系统存储区。

互斥锁是为了上锁而优化的；条件变量是为了等待而优化的；信号灯即可用于上锁，也可用于等待，因而可能导致更多的开销和更高的复杂性。

三种机制适用逐渐复杂的同步情况

二、线程的实现方式

1.内核线程KST(kernel-level thread)

依赖于内核，利用系统调用由OS内核在内核空间完成创建、撤消、切换等线程工作。

时间片分配给线程，所以多线程的进程获得更多CPU时间。

2.用户线程ULT(user-level thread)

无须利用系统调用，不依赖于OS核心。进程利用线程库函数创建、同步、调度和管理控制用户线程。

调度由应用软件内部进行，通常采用非抢先式和更简单的规则，也无需用户态/核心态切换，速度比kst快。

3.组合方式

内核支持多KST线程的管理，同时也允许用户应用程序级的线程管理。

用户级线程需借助某种形式的中间系统取得内核服务，用户程序复杂

①运行时系统：管理和控制线程的函数/过程集合。

所有函数驻留在用户空间上

线程切换由切换过程实现，线程的CPU状态保存在自己的堆栈中，切换不需要转入内核态执行

根本上操作系统资源还是要由内核做。用户线程的所有要求给了运行时系统，由它通过相应的系统调用获得系统资源。

②内核控制线程，轻型进程LWP

每个轻权进程由一个单独的内核线程来支持。

用户级线程只要连接到一个LWP，就可使用系统调用（如文件读写时，先“捆绑(bound)”在一个LWP上）

永久捆绑：一个LWP固定被一个用户级线程占用，该LWP移到LWP池之外

临时捆绑：从LWP池中临时分配一个未被占用的LWP

在使用系统调用时，如果所有LWP已被其他用户级线程所占用（捆绑），则该线程阻塞直到有可用的LWP－－例如6个用户级线程，而LWP池中有4个LWP

如果LWP执行系统调用时阻塞（如read()调用），则当前捆绑在LWP上的用户级线程也阻塞。

第2章 2-6、2-7进程通信、线程

你可能感兴趣的:(第2章 2-6、2-7进程通信、线程)