第2章 2-6、2-7进程通信、线程

进程通信是指进程之间的信息交换。

一、低级通信——进程之间的互斥和同步

        信号量机制是有效的同步工具,但作为通信工具

        缺点如下:

                (1)效率低(通信量少)

                (2)通信对用户不透明(程序员实现,操作系统只提供共享存储器供代码操作)

二、高级进程通信

        用户直接利用操作系统提供的一组通信命令,高效地传送大量数据的通信方式。

                操作系统隐藏了进程通信的细节,对用户透明,减少了通信程序编制上的复杂性。

1.进程通信的类型

        高级通信机制可归结为四大类

                ①共享存储器系统(操作存储区方式)

                    相互通信的进程共享某些数据结构或共享存储区,进程之间能够通过这些空间进行通信。

                            a.基于共享数据结构的通信方式(低级)

                                        诸进程公用某些数据结构,借以实现诸进程间的信息交换。

                                                如生产消费问题,定义共享的数据结构:n个长度的有界缓冲区。

                                                程序员:提供对公用数据结构的设置及对进程间同步的处理。

                                                操作系统:提供共享存储器。

                                                特点:复杂、低效率,还只适合传递相对少量的数据。

                            b.基于共享存储区的通信方式(高级)

                                        在存储器中划出了一块共享存储区,诸进程可通过对共享存储区中数据的读或写来实现通信。

                                        进程通信前先向系统申请获得共享存储区中的一个分区,并指定该分区的关键字;

                                        若系统已经分给了其他进程,则将该分区的描述符返回给申请者,申请者把获得的共享存储分区连接到本进程上;此后,便可像读、写普通存储器一样地读、写该公用存储分区。多进程借助该区通信。

               ②消息传递系统(发--收方式)

                            最广泛使用的一种,进程间的数据交换,以格式化的消息为单位。屏蔽底层复杂操作。

                            单机:操作系统底层编程中的消息传递系统调用;

                            计算机网络:消息称为报文。程序员直接利用系统提供的一组通信命令(原语)进行通信。(④客户机-服务器系统)

                                    如socket编程,利用函数库的send、receive等命令即可实现网络通信

              ③管道通信(中间文件方式)

                            所谓“管道”,是指用于连接一读进程和一写进程以实现通信的一个共享文件,又名pipe文件。

                            向共享文件输入的写进程以字符流形式将大量的数据送入管道;而接收管道输出的读进程则从管道中接收(读)数据。

                            首创于UNIX系统。其管道机制需提供三方面的协调能力:互斥、同步、确定对方是否存在。

              ④Client-Server system

                            套接字(Socket)

                                        一个套接字就是一个通信标识类型的数据结构,包含了通信目的的地址,端口号,传输层协议、进程所在的网络地址,以及针对C\S程序提供的不同系统调用(API函数)等。

                                        系统中所有的连接都持有唯一的一对套接字及端口连接,从而方便地区分来自不同应用程序进程或网络连接的通信,确保通信双方间逻辑链路的唯一性。

                            远程过程调用(远程方法调用)

                                        RPC 有很多正面的应用,比如网络文件系统NFS、Web Service等,也是网络安全中容易被攻击的技术。

                                        Remote Procedure Call,远程过程调用。也就是说,调用过程代码并不是在调用者本地运行,而是要实现调用者与被调用者二地之间的连接与通信。

                                        RPC的基本通信模型是基于Client/Server进程间相互通信模型的一种同步通信形式;它对Client提供了远程服务的过程抽象,其底层消息传递操作对Client是透明的。

                            RPC应用开发步骤

                                        定义客户端、服务器端的通信协议(定义服务过程的名称、调用参数的数据类型、返回参数的数据类型、底层传输类型(UDP/TCP)等。2.开发客户端程序。3.开发服务器端程序。

                                        对于RPC通信协议的生成,最简单的方法是利用协议编译工具:生成实现RPC协议的生成器rpcgen( C程序) ,Remotetea( java程序)。

2.消息传递通信的实现方法

        1)直接通信方式

                发送进程利用OS所提供的发送命令(原语),直接把消息发送给目标进程。此时,发送进程和接收进程都以显式方式提供对方的标识符。通常利用系统通信命令(原语):

                        Send(Receiver, message);

                        Receive(Sender, message);

第2章 2-6、2-7进程通信、线程_第1张图片

        2)间接通信方式

                基于共享数据结构的实体用来暂存发送给目标进程的消息;接收进程则从该实体中,取出对方发送给自己的消息。通常把这种实体称为信箱。

                消息在信箱中可以安全地保存,只允许核准的目标用户随时读取。既可实时通信,又可非实时通信。

第2章 2-6、2-7进程通信、线程_第2张图片
第2章 2-6、2-7进程通信、线程_第3张图片

3.消息传递系统的实现

        单机和网络环境下的高级进程通信广泛采用“消息传递”方式,需要考虑的问题:

                ①通信链路的建立

                        计算机网络环境下,用原语显式建立/拆除链路

                        单机系统只须利用系统原语,进程间链路由系统自动管理。

                ②消息格式

                        单机系统,发送与接收进程在同一台机器,环境相同故格式简单;

                        网络环境下,受不同目标机器的环境和长距离信息传输等因素的影响,消息格式较复杂,消息常是“大头+正文”

                ③同步方式(如何控制发送和接收的状态)

                        即考虑平时闲着,还是平时忙碌?

                        发送进程阻塞、接收进程阻塞(无缓冲紧密同步)

                        发送进程不阻塞、接收进程阻塞(服务器程序)

                        发送进程和接收进程均不阻塞(缓冲队列)

4.消息缓冲队列通信机制

        美国Hansan提出,在RC 4000系统上实现。后被广泛应用于本地进程通信。

                ①不需管理链路

                ②定义简单数据结构(亦即消息格式)

                        即消息队列中的消息格式如何?

                        本机通信消息结构简单,如下:

                        type message buffer = record

                        sender;  发送者进程标识符

                        size;  消息长度

                        text;  消息正文

                        next;  指向下一消息缓冲区的指针

                        end

                PCB中需要记录有关通信的信息项

第2章 2-6、2-7进程通信、线程_第4张图片

                ③实现发送和接收的操作原语

第2章 2-6、2-7进程通信、线程_第5张图片
第2章 2-6、2-7进程通信、线程_第6张图片
第2章 2-6、2-7进程通信、线程_第7张图片

一、认识线程

1.线程的引入

        多道程序管理:追求效率的目的下实现“并发”

第2章 2-6、2-7进程通信、线程_第8张图片

并发性与效率的讨论

        利用进程实现的多道程序系统中

        进程是一个可拥有资源的独立单位;

        是一个可独立调度和分派资源的基本单位

        有如下频繁操作:创建进程、撤销进程、进程切换

                    PCB信息,CPU环境的管理等付出不少时空开销,尤其在进程切换上。

        所以并发程度不是随意设定的:

                并发进程数量不宜过多,切换频率不宜过高。

                限制并发程度问题所在:进程实体信息量大,对进程的管理操作越多,与运行时间的比值就越大,运行效率就低。

怎样进一步提高并发效率,节约时空开销?

第2章 2-6、2-7进程通信、线程_第9张图片

2.线程的属性

        多线程OS中,一个进程包括多个线程,每个线程都是利用CPU的基本单位。

                轻型实体:只需一点必不可少的、能保证独立运行的资源。(TCB)

                独立调度和分派的基本单位:调度切换迅速且开销小。

                可并发执行

                共享进程资源:同进程中的线程可共享相同的进程地址空间、已打开文件、信号量机构等。

3.线程的信息

        (TCB管理什么信息?)

        状态参数

                标识符、运行状态、优先级、寄存器状态、堆栈、专有存储器、信号屏蔽等。

                运行状态

                        执行、就绪、阻塞

4. 线程的创建和终止

        在多线程OS中,应用程序启动时,通常只有一个线程(初始化线程)在执行,它根据需要再创建若干线程。

                创建新线程

                        利用线程创建函数(或系统调用),提供相应参数。线程创建函数执行完后,返回一个线程标识符供以后使用。

                线程被终止:

                        不立即释放资源,只有当进程中的其它线程执行分离函数后,资源才分离出来能被其它线程利用。

                        被终止而未释放资源的线程仍可被需要它的线程调用,使其重新恢复运行。

多线程的应用

        一个应用程序有多个任务或功能需要同时进行处理,就最适合多线程机制。

        应用情况举例:

                网络软件,需要同时进行用户界面响应、收数据、发数据。

                网络下载工具:多线程下载的下载工具

编程举例

        多线程编程过程是类似的:

                可用win32 API编写C风格程序

                        C的main既是规定了主线程的代码。启动程序时,系统根据main地址,启动主线程。

                        在主线程代码某处利用线程创建函数即可创建线程;给创建函数编写线程功能代码;

                        利用其他一系列函数使系统管理多个线程。

                也可用封装好的类库,如JAVA,MFC

第2章 2-6、2-7进程通信、线程_第10张图片

VC++的MFC类库提供了线程操作

        CWinThread类

                ①写一个符合格式规定的线程控制函数UNIT 名称(LPVOID pParam){…}

               ② 调用AfxBeginThread(…)创建并启动新线程:用户提供需要的执行参数,即启动了上面定义的功能函数。

理论联系实践

        windows编程

                侯捷 《Win32多线程编程》

                同步  Critical Section、Event、Mutex、Semaphores

                通信:

                        (一)本地机进程间通讯:

                                1)采用微软消息队列(Microsoft   Message   Queue,MSMQ);

                                2)采用内存映射文件;

                        (二)网络中不同机器间数据通讯:

                                Winsock ;

5.多线程系统中的进程

        进程只是用于分配系统资源

        包括多个线程

        不是执行实体,线程在进程范围内作为执行实体。

线程与进程的比较

        调度:线程作为CPU调度的基本单位,而进程只作为其它资源分配单位。

        并发性:进程之间可以并发,实质上是不同进程中的两个线程并发。一个进程的多个线程之间亦可并发。

        拥有资源:进程间资源相互独立;同一进程的各线程间共享。某进程内的线程在其它进程不可见

        系统开销:线程上下文切换在同进程环境下上下文切换要快得多。因为同进程内线程间共享内存地址和打开的文件资源;

6.线程的管理

        同步和通信机制

                1)互斥锁

                        比较简单的,控制线程互斥访问资源;

                        适用于高频度使用的关键共享数据和程序段;

                        unlock和lock两个锁操作原语;

                2)条件变量

                        与互斥锁一起使用

                        锁保证互斥进入临界区,但利用条件变量使线程阻塞

                        注意不满足条件时,wait条件变量:

                                释放互斥锁

                                进程阻塞在条件变量指向队列中

                                被唤醒后要重新再设互斥锁

                3)信号量

                        私用信号量(private samephore)

                                用于同进程的线程间同步,数据结构存放在应用程序的地址空间。属于特定进程,OS感知不到其存在。

                        公用信号量(public samephore)

                                用于不同进程间或不同进程中线程的同步,数据结构由OS管理,存放在受保护的系统存储区。

        互斥锁是为了上锁而优化的;条件变量是为了等待而优化的;信号灯即可用于上锁,也可用于等待,因而可能导致更多的开销和更高的复杂性。

        三种机制适用逐渐复杂的同步情况

二、线程的实现方式

1.内核线程KST(kernel-level thread)

        依赖于内核,利用系统调用由OS内核在内核空间完成创建、撤消、切换等线程工作。

                时间片分配给线程,所以多线程的进程获得更多CPU时间。

第2章 2-6、2-7进程通信、线程_第11张图片

2.用户线程ULT(user-level thread)

        无须利用系统调用,不依赖于OS核心。进程利用线程库函数创建、同步、调度和管理控制用户线程。

                调度由应用软件内部进行,通常采用非抢先式和更简单的规则,也无需用户态/核心态切换,速度比kst快。

第2章 2-6、2-7进程通信、线程_第12张图片

3.组合方式

        内核支持多KST线程的管理,同时也允许用户应用程序级的线程管理。

第2章 2-6、2-7进程通信、线程_第13张图片

        用户级线程需借助某种形式的中间系统取得内核服务,用户程序复杂

                ①运行时系统:管理和控制线程的函数/过程集合。

                        所有函数驻留在用户空间上

                        线程切换由切换过程实现,线程的CPU状态保存在自己的堆栈中,切换不需要转入内核态执行

                        根本上操作系统资源还是要由内核做。用户线程的所有要求给了运行时系统,由它通过相应的系统调用获得系统资源。

                ②内核控制线程,轻型进程LWP

                        每个轻权进程由一个单独的内核线程来支持。

                        用户级线程只要连接到一个LWP,就可使用系统调用(如文件读写时,先“捆绑(bound)”在一个LWP上)

                                永久捆绑:一个LWP固定被一个用户级线程占用,该LWP移到LWP池之外

                                临时捆绑:从LWP池中临时分配一个未被占用的LWP

                        在使用系统调用时,如果所有LWP已被其他用户级线程所占用(捆绑),则该线程阻塞直到有可用的LWP--例如6个用户级线程,而LWP池中有4个LWP

                        如果LWP执行系统调用时阻塞(如read()调用),则当前捆绑在LWP上的用户级线程也阻塞。

第2章 2-6、2-7进程通信、线程_第14张图片

你可能感兴趣的:(第2章 2-6、2-7进程通信、线程)