概念: 进程通信是指进程之间的信息交换。
低级进程通信: 由于进程的互斥与同步,需要在进程间交换一定的信息。
低级的原因:
在低级进程通信中,OS只为进程之间的通信提供了共享存储器,而关于进程之间通信所需之共享数据结构的设置、数据的传送、进程的互斥与同步,都必须由程序员去实现,显然,对于用户而言,这是非常不方便的。为了将管理进程之间传送大量数据的任务交给OS而不是程序员去处理,便引入了高级通信工具。
OS提供的高级通信工具的主要特点:
使用方便。OS隐藏了实现了进程通信的具体细节,向用户提供了一组用于实现高级通信的命令(原语),用户可方便地直接利用它实现进程之间的通信。或者说,通信过程对用户是透明的。这样就大大减少了通信程序编制上的复杂性。
高效地传送大量数据。用户可直接利用高级通信命令(原语)高效地传送大量的数据。
概念: 在共享存储器系统中,相互通信的进程共享某些数据结构或共享存储区,进程之间能够通过这些空间进行通信。
据此,可以将其分为两种类型:
(1)基于共享数据结构的通信方式
在这种通信方式中,要求诸进程公用某些数据结构,借以实现诸进程间的数据交换。例如,在生产者-消费者问题中的有界缓冲区。
操作系统仅提供共享存储器,由程序员负责对公用数据结构的设置及对进程间同步的处理。这种通信方式仅适用于传递相对少量的数据,通信效率低下,属于低级通信。
(2)基于共享存储区的通信方式
为了传输大量数据,在内存中划出了一块共享存储区域,诸进程可通过对该共享区的读或写操作交换信息,实现通信,数据的形式和位置甚至访问控制都是由进程负责,而不是OS。这种通信方式属于高级通信。
需要通信的进程在通信前,先向系统申请获得共享存储区中的一个分区,并将其附加到自己的地址空间中,便可对其中的数据进行正常读、写,读写完成或不再需要时,将其归还给共享存储区。
概念: 所谓“管道”,是指用于连接一个读进程和一个写进程以实现它们之间通信的一个共享文件,又名pipe文件。
过程: 向管道(共享文件)提供输入的发送进程(即写进程)以字符流形式将大量的数据送入管道;而接受管道输出的接收进程(即读进程)则从管道中接收(读)数据。(能有效地传送大量数据)
为了协调双方的通信,管道机制必须提供以下三方面的协调能力:互斥、同步和确定对方是否存在。
互斥: 即当一个进程正在对pipe执行读/写操作时,其它(另一)进程必须等待。
同步: 指当写(输入)进程把一定数量(如 4KB)的数据写入pipe,便去睡眠等待,直到读(输出)进程取走数据后再把它唤醒。当读进程读一空pipe时,也应睡眠等待,直至写进程将数据写入管道后才将之唤醒。
确定对方是否存在: 只有对方已存在时才能进行通信。
在消息传递系统中,进程间的数据交换是以格式化的消息(message)为单位的。若通信的进程之间不存在可直接访问的共享空间,则必须利用操作系统提供的消息传递方法实现进程通信。进程通过系统提供的发送消息和接收消息两个原语进行数据交换。
举例,在计算机网络中,消息又称为报文;在微内核操作系统中,微内核与服务器之间的通信无一例外都是采用了消息传递机制;由于该机制能很好地支持多处理机系统、分布式系统和计算机网络,因此也成为这些领域最主要的通信工具。
客户机-服务器系统的通信机制,在网络环境的各种应用领域已成为当前主流的通信实现机制,主要的实现方法分为三类:套接字、远程过程调用和远程方法调用。
套接字(Socket)
一个套接字就是一个通信标识类型的数据结构,包含了通信目的的地址、通信使用的端口号、通信网络的传输层协议、进程所在的网络地址,以及针对客户或服务器程序提供的不同系统调用(或API函数)等,是进程通信和网络通信的基本构件。套接字是为客户/服务器模型而设计的。
通常,套接字包括两类:
(1)基于文件型:通信进程都运行在同一台机器的环境中,套接字是基于本地文件系统支持的。一个套接字关联到一个特殊的文件,通信双方通过对这个特殊文件的读写实现通信,其原理类似于前面所讲的管道。
(2)基于网络型:通常采用的是非对称方式通信,即发送者需要提供接收者命名。过程: 通信双方的进程运行在不同主机的网络环境下,被分配了一对套接字,一个属于接收进程(或服务器端),一个属于发送进程(或客户端)。一般地,发送进程(或客户端)发送连接请求时,随机申请一个套接字,主机为之分配一个端口,与该套接字绑定,不再分配给其它进程。接收进程(或服务器端)拥有全局公认的套接字和指定的端口(如ftp服务器监听端口为21,Web或http服务器监听端口为80),并通过监听端口等待客户请求。接收进程(或服务器端)一旦收到请求,就接受来自发送进程(或客户端)的连接,完成连接,即在主机间传送的数据可以准确地发送到通信进程,实现进程间地通信;当通信结束时,系统通过关闭接受进程(或服务器端)的套接字撤销连接。
远程过程调用和远程方法调用
远程过程(函数)调用 RPC,是一个通信协议,用于通过网络连接的系统。该协议允许运行于一台主机(本地)系统上的进程调用另一台主机(远程)系统上的进程,而对程序员表现为常规的过程调用,无需额外地为此编程。如果涉及的软件采用面向对象编程,那么远程过程调用亦可称做远程方法调用。
负责处理远程过程调用的进程有两个:本地客户进程、远程服务器进程。
这两个进程也被称为网络守护进程,主要负责在网络间的消息传递。
一般情况下,两个进程都是处于阻塞状态,等待消息。
Q:如何使远程过程调用看上去与本地过程调用一样,即希望实现RPC的透明性,使得调用者感觉不到此次调用的过程是在其他主机(远程)上执行的?
A:RPC引入一个存根(stub) 的概念:在本地客户端,每个能够独立运行的远程过程都拥有一个客户存根(client stubborn),本地进程调用远程过程实际是调用该过程关联的存根;与此类似,在每个远程进程所在的服务器端,其所对应的实际可执行进程也存在一个服务器存根(stub)与其关联。
本地客户存根与对应的远程服务器存根一般也是处于阻塞状态,等待消息。
Q:远程过程调用的主要步骤?
A:(1)本地过程调用者以一般方式调用远程过程在本地关联的客户存根,传递相应的参数,然后将控制权转移给客户存根;
(2)客户存根执行,完成包括过程名和调用参数等信息的消息建立,将控制权转移给本地客户进程;
(3)本地客户进程完成于服务器的消息传递,将消息发送到远程服务器进程;
(4)远程服务器进程接受消息后转入执行,并根据其中的远程过程名找到对应的服务器存根,将消息转给该存根。
(5)该服务器存根接到消息后,由阻塞状态转入执行状态,拆开消息从中取出过程调用的参数,然后以一般方式调用服务器上关联的过程;
(6)在服务器端的远程过程运行完毕后,将结果返回给与之关联的服务器存根;
(7)该服务器存根获得控制权运行,将结果打包为消息,并将控制权转移给远程服务器进程;
(8)远程服务器进程将消息发送回客户端;
(9)本地客户进程接收到消息后,根据其中的过程名将消息存入关联的客户存根,再将控制权转移给客户存根;
(10)客户存根从消息中取出结果,返回给本地调用者进程,并完成控制权的转移。
分为直接和间接两种通信方式。
如,直接消息系统、信箱通信。
在消息缓冲队列通信机制中,发送进程利用Send原语将消息直接发送给接收进程;接收进程则利用Receive原语接收信息。
(1)消息缓冲区。在消息缓冲队列通信方式中,主要利用的数据结构是消息缓冲区。它可描述如下:
typedef struct message_buffer {
int sender; //发送者进程标识符
int size; //消息长度
char* text; //消息正文
struct message_buffer *next; //指向下一个消息缓冲区的指针
}
(2)PCB中有关通信的数据项。在操作系统中采用了消息缓冲队列通信机制时,除了需要为进程设置消息缓冲队列外,还应在进程的PCB中增加消息队列队首指针,用于对消息队列进行操作,以及用于实现同步的互斥信号量mutex和资源信号量sm。在PCB中应增加的数据项可描述如下:
typedef struct processcontrol_block {
...
struct message_buffer *mq; //消息队列队首指针
semaphore mutex; //消息队列互斥信号量
semaphore sm; //消息队列资源信号量
...
}PCB;
发送进程在利用发送原语发送消息之前,应先在自己的内存空间设置一发送区a,并把带发送的消息正文、发送进程标识符、消息长度等信息填入其中,然后调用发送原语,把消息发送给目标(接收)进程。发送原语首先根据发送区a中所设置的消息程度a.size来申请一缓冲区i,接着,把发送去a中的信息复制到缓冲区i中。为了能将i挂在接收进程的消息队列mq上,应先获得接收进程的内部标识符j,然后将i挂在j.mq上。由于该队列属于临界资源,故在执行insert操作的前后都要执行wait和signal操作。
发送原语描述:
void send(receive,a){ //receive 为接送进程标识符, a 为发送区首址
getbuf(a.size,i); //根据a.size申请缓冲区
i.sender = a.sender;
i.size = a.size;
copy(i.text, a.text); //将发送区a中的信息复制到消息缓冲区i中
i.next = 0;
getid(PCBset,receive.j); //获得接收进程内部的标识符;
wait(j.mutex);
insert(&j.mq,i); //将消息缓冲区插入消息队列;
signal(j.mutex);
signal(j.sm);
}
void receive(b){
j = internal name; //j为接收进程内部的标识符
wait(j.sm);
wait(j.mutex);
remove(j.mq,i); //将消息队列中第一个消息移出
signal(j.mutex);
b.sender = i.sender;
b.size = a.size;
copy(b.text,i.text); //将消息缓冲区i中的信息复制到接收区b
releasebuf(i); //释放消息缓冲区
}