前言:
最近Linux进程间通信视频课程很火爆,很多同学通过这个课程开始对Linux进程间通信原理有所了解,本文继续围绕Linux进程间通信这个主题,由浅入深讲解Linux进程间通信,让你彻底学懂Linux进程间通信。
1.进程间通信介绍
进程间通信(简称IPC)是指在多个进程之间传输数据或共享信息的机制。在操作系统中,每个进程都具有独立的地址空间和资源,为了实现进程之间的数据交换和协作,需要使用IPC机制。
数据交换:进程间通信可以实现在不同进程之间传递数据。
共享资源:进程间通信可以实现多个进程之间共享资源,如共享内存、文件、设备等。
进程同步:进程间通信可以用于实现进程之间的同步操作。
消息传递:进程间通信可以通过消息传递的方式实现进程之间的通信和协作。
(理论知识,了解一下就行了)。
2.由浅入深探索进程间通信
2.1从最简单开始
(本文以32位CPU来讲解进程间通信)。
32位CPU能访问的地址空间范围为0x00000000-0xFFFFFFFF共4GB。
4GB分为两部分:
用户空间:0x00000000-0xC0000000,共3GB,用户态和内核态都能访问。
内核空间:0xC0000000-0XFFFFFFFF,共1GB,内核态访问。
CPU从用户态切换到内核态的方法:
系统调用
异常
外部设备中断
2.2 难度升级
我们在前面的基础上加入新的概念地址映射。
地址映射就是把虚拟地址转换为物理地址,通过物理地址去访问物理内存。
CPU寻址是使用虚拟地址,必须通过地址映射将虚拟地址转换成物理地址,才能正确读写物理内存。
每个进程都需要维护一个虚拟地址空间表,进程被CPU选中后,CPU会去读取进程地址空间的代码段和数据段,然后执行对应的指令。
注意内核空间是直接映射,直接映射是指虚拟地址等同于物理地址。
直接映射区域的物理内存可以通过虚拟地址直接访问(记住这个结论)。
2.3 难度再次升级
我们以进程A和进程B为例来讲解。
首先我们思考一个问题,进程A和进程B都处于用户态能相互通信吗?
答案:不能,因为进程A和进程B的虚拟地址空间(0-3GB)需要进行地址映射,映射后进程A和进程B访问的物理内存不是同一块内存,所以进程A和进程B无法在用户态通信。
既然用户态无法通信,所以我们只能想另外的办法,我们把进程切换到内核态,看一下进程A和进程B是否能通信。
内核地址空间是直接映射,所以进程A和进程B能通过相同的虚拟地址空间访问物理内存,进程A和进程B实现通信就有了理论依据。
因为直接映射的这个机制,所有的进程的内核空间都指向同一块物理内存,所有进程共享内核代码段和数据段。
进程间通信的本质:进程之间能够访问内核空间相同的物理内存。
2.4 揭开进程间通信神秘面纱
从内核的角度来看,进程其实就是一个tast_struct对象。
task_struct对象有三个成员:
mm_struct *mm:用来存储进程地址空间表。
files_struct *files:用来存储进程已打开文件表,可用于管道和Posix进程间通信。
nsproxy*nsproxy:用来存储进程命名空间信息,可用于System v进程间通信。
两个进程(task_struct对象)能够通过对象成员访问相同的物理内存区域,那么两个进程就能实现进程间通信。
进程间通信的步骤如下:
通过系统调用,进程A从用户态切换到内核态。
进程A切换到内核态后,进程A获取到task_struct对象成员,通过对象成员找到物理内存区域,读写物理内存区域。
进程B执行步骤1,2就能和进程A通信。
3.进程间通信方法之管道
管道是Linux进程通信的一种方式,管道的内核实现是pipe inode文件节点,pipe inode文件节点基于pipefs文件系统(伪文件系统)实现,为了方便理解,我们把pipe inode节点分为三个部分:
读端:对应读file。
写端:对应写file。
管道:内核空间一块内存区域,用于读写数据。
读端,写端,管道三个部分的不同组合也就产生了无名管道(pipe)和命名管道(fifo)。
无名管道和命名管道底层实现原理相同,都是基于pipe inode实现。
3.1 无名管道
无名管道不能通过文件名创建和打开pipe inode文件节点。
无名管道读端和写端都属于同一个进程已打开文件表,非亲缘关系的其他进程无法获取到读端和写端,所以无名管道不能用于非亲缘关系进程间通信。
为什么亲缘关系进程能使用无名管道通信呢?
答案:父进程调用fork函数时,把文件表复制给了子进程,子进程通过继承方式获取到了无名管道的读端和写端,所以父子进程都能往同一pipe inode读写数据,也就能完成通信。
3.2 命名管道
命名管道能通过指定的文件名来创建和打开pipe inode节点。
命名管道的读端和写端可以属于不同的进程,当然也可以属于同一进程或者父子进程。
因为命名管道是通过文件名创建和打开的,进程只要有文件名,就有了打开命名管道的钥匙,就能对管道进程操作。
使用命名管道的时候,不需要去关注进程之间的关系,只需要关注进程是否知道文件名。
最后思考一下:管道为什么满足进程间通信要求?
管道(pipe inode)属于内核空间的一块内存区域,进程(task_struct对象)能够通过文件表访问这块内存区域,所以管道满足进程间通信要求。
前言
上一篇文章由浅入深探讨Linux进程间通信(上篇)只讲解到了进程间通信方法之管道,这一篇文章继续讲解System V进程间通信,话不多说直接开始。
1.System V进程间通信实现原理
System V进程间通信需要借助Linux命名空间来实现。
1.1什么是Linux命名空间?
Linux命名空间是一种虚拟化技术,它提供了一种轻量级的虚拟化方式,可以将一个系统中的全局资源隔离开来,使得不同的进程可以拥有自己独立的资源视图。
命名空间其实就是一些列资源的集合,每个进程都需要指向这个集合,不同的进程如果指向相同的命名空间,那么进程间就能共享命名空间资源。
命名空间内核定义如下:
System V进程间通信需要用到IPC命名空间。
IPC命名空间有一个数组成员ids,该成员主要用来存储消息队列,信号量,共享内存IPC对象。
System V三种进程间通信方式(消息队列,信号量,共享内存)都是基于IPC对象实现,消息队列,信号量,共享内存都继承了IPC对象(kern_ipc_perm),学习System V进程间通信首先我们得知道IPC对象如何创建和销毁。
1.2 IPC对象创建和销毁
IPC对象创建和销毁需要通过键值(Key)来完成。
什么是IPC键值(Key)?
IPC键值(Key)是一个整型值,用于唯一标识一个IPC对象,在创建IPC对象时,需要指定一个IPC键值,进程可以使用这个IPC键值来访问该IPC对象,同一个IPC键值只能对应一个IPC对象,不同的IPC键值对应不同的IPC对象。
创建IPC对象时,首先得生成一个IPC Key,IPC Key有以下三种生成方式:
使用一个随机的整数。
使用IPC_PRIVATE标志生成,此种方法只能用于有亲缘关系进程。
使用ftok函数生成。
生成Key后,通过Key索引ipc_namespace->ids->key_ht(哈希表),Key主要是用来索引哈希表,如果哈希表中已经有IPC对象,直接返回IPC对象ID,否则需要创建一个新的IPC对象,并为新的IPC生成对象ID,再把IPC对象插入哈希表,新的IPC对象会以IPC对象ID为索引,插入ipc_namespace->ids->ipcs_id(radix树)。
同样IPC对象销毁也是通过Key删除哈希表IPC对象记录。
什么是IPC对象ID?
IPC对象ID是一个整数标识符,用于标识System V IPC对象(如消息队列、信号量和共享内存),IPC对象ID是由内核分配的,IPC对象主要用来索引ipc_namespace->ids->ipcs_id(radix树),radix树主要用来加快查询效率。
2.System V消息队列
有了前面的铺垫,我们就很容理解消息队列,信号量,共享内存的实现。
消息队列创建
msgget函数通过Key创建消息队列并返回IPC对象ID。
发送消息
得到IPC对象ID后,就能通过调用msgsnd函数发送消息,发送的消息存储在msg_queue(消息队列)->q_messages(队列)。
接收消息
通过msgrcv函数接收消息,msgrcv函数从msg_queue(消息队列)->q_messages(队列)读取消息。
两个进程因为都指向相同的IPC命名空间,所以两个进程通过相同的Key返回同一个IPC对象ID,有了相同的ID就能通过ID进行消息发送和接收。
3.System V信号量
信号量创建
semget函数通过Key创建信号量并返回IPC对象ID。
信号量PV操作
semop函数实现信号量PV操作。
信号量销毁
semctl函数通过IPC_RMID命令销毁信号量。
System V信号量(sem_array)维护的是信号量数组,也就是同时支持多个信号量,所以在初始化信号量时需指定信号量数量,操作信号量时需通过数组下标指定操作的是哪个信号量。
4.System V共享内存
共享内存创建
semget函数通过Key创建共享内存并返回IPC对象ID。
共享内存映射
通过shmat函数实现内存映射,通过同一共享文件完成内存映射的内存区域,进程间可以相互访问。
数据拷贝
完成共享内存映射后,就能通过普通的内存拷贝函数,如:memcpy函数,实现数据的写入和读取,完成进程间通信。
取消共享内存内存映射
通过shmdt函数取消内存映射。
共享内存销毁
shmctl函数通过IPC_RMID命令销毁信号量。
System V共享内存(shmid_kernel)维护的是一个struct file对象(shm_filesem),shm_filesem为共享内存文件,用来实现内存映射,不同的进程通过相同的shm_filesem共享内存文件完成内存映射后,就能访问同一块物理内存区域,从而实现进程间通信。
最后思考一下:System V进程间通信方法为什么满足进程间通信要求?
IPC对象属于内核空间的一块内存区域,进程(task_struct对象)能够通过IPC命名空间表访问这块内存区域,所以System V进程间通信方法满足进程间通信要求。