由浅入深探讨Linux进程间通信

由浅入深探讨Linux进程间通信(上)

前言:

由浅入深探讨Linux进程间通信_第1张图片

最近Linux进程间通信视频课程很火爆,很多同学通过这个课程开始对Linux进程间通信原理有所了解,本文继续围绕Linux进程间通信这个主题,由浅入深讲解Linux进程间通信,让你彻底学懂Linux进程间通信。

1.进程间通信介绍

进程间通信(简称IPC)是指在多个进程之间传输数据或共享信息的机制。在操作系统中,每个进程都具有独立的地址空间和资源,为了实现进程之间的数据交换和协作,需要使用IPC机制。

  • 数据交换:进程间通信可以实现在不同进程之间传递数据。

  • 共享资源:进程间通信可以实现多个进程之间共享资源,如共享内存、文件、设备等。

  • 进程同步:进程间通信可以用于实现进程之间的同步操作。

  • 消息传递:进程间通信可以通过消息传递的方式实现进程之间的通信和协作。

    (理论知识,了解一下就行了)。

2.由浅入深探索进程间通信

2.1从最简单开始

由浅入深探讨Linux进程间通信_第2张图片

(本文以32位CPU来讲解进程间通信)。

32位CPU能访问的地址空间范围为0x00000000-0xFFFFFFFF共4GB。

4GB分为两部分:

  • 用户空间:0x00000000-0xC0000000,共3GB,用户态和内核态都能访问。

  • 内核空间:0xC0000000-0XFFFFFFFF,共1GB,内核态访问。

CPU从用户态切换到内核态的方法:

  • 系统调用

  • 异常

  • 外部设备中断

2.2 难度升级

由浅入深探讨Linux进程间通信_第3张图片

我们在前面的基础上加入新的概念地址映射

地址映射就是把虚拟地址转换为物理地址,通过物理地址去访问物理内存。

  • CPU寻址是使用虚拟地址,必须通过地址映射将虚拟地址转换成物理地址,才能正确读写物理内存。

  • 每个进程都需要维护一个虚拟地址空间表,进程被CPU选中后,CPU会去读取进程地址空间的代码段和数据段,然后执行对应的指令。

  • 注意内核空间是直接映射,直接映射是指虚拟地址等同于物理地址。

直接映射区域的物理内存可以通过虚拟地址直接访问(记住这个结论)。

2.3 难度再次升级

由浅入深探讨Linux进程间通信_第4张图片

我们以进程A和进程B为例来讲解。

首先我们思考一个问题,进程A和进程B都处于用户态能相互通信吗?

答案:不能,因为进程A和进程B的虚拟地址空间(0-3GB)需要进行地址映射,映射后进程A和进程B访问的物理内存不是同一块内存,所以进程A和进程B无法在用户态通信。

既然用户态无法通信,所以我们只能想另外的办法,我们把进程切换到内核态,看一下进程A和进程B是否能通信。

内核地址空间是直接映射,所以进程A和进程B能通过相同的虚拟地址空间访问物理内存,进程A和进程B实现通信就有了理论依据。

因为直接映射的这个机制,所有的进程的内核空间都指向同一块物理内存,所有进程共享内核代码段和数据段。

进程间通信的本质:进程之间能够访问内核空间相同的物理内存。

2.4 揭开进程间通信神秘面纱

由浅入深探讨Linux进程间通信_第5张图片

从内核的角度来看,进程其实就是一个tast_struct对象。

task_struct对象有三个成员:

  • mm_struct *mm:用来存储进程地址空间表。

  • files_struct *files:用来存储进程已打开文件表,可用于管道和Posix进程间通信。

  • nsproxy*nsproxy:用来存储进程命名空间信息,可用于System v进程间通信。

两个进程(task_struct对象)能够通过对象成员访问相同的物理内存区域,那么两个进程就能实现进程间通信。

进程间通信的步骤如下:

  1. 通过系统调用,进程A从用户态切换到内核态。

  2. 进程A切换到内核态后,进程A获取到task_struct对象成员,通过对象成员找到物理内存区域,读写物理内存区域。

  3. 进程B执行步骤1,2就能和进程A通信。

3.进程间通信方法之管道

    管道是Linux进程通信的一种方式,管道的内核实现是pipe inode文件节点,pipe inode文件节点基于pipefs文件系统(伪文件系统)实现,为了方便理解,我们把pipe inode节点分为三个部分:

  • 读端:对应读file。

  • 写端:对应写file。

  • 管道:内核空间一块内存区域,用于读写数据。

读端,写端,管道三个部分的不同组合也就产生了无名管道(pipe)和命名管道(fifo)。

无名管道和命名管道底层实现原理相同,都是基于pipe inode实现。

由浅入深探讨Linux进程间通信_第6张图片

3.1 无名管道

无名管道不能通过文件名创建和打开pipe inode文件节点。

无名管道读端和写端都属于同一个进程已打开文件表,非亲缘关系的其他进程无法获取到读端和写端,所以无名管道不能用于非亲缘关系进程间通信。

为什么亲缘关系进程能使用无名管道通信呢?

答案:父进程调用fork函数时,把文件表复制给了子进程,子进程通过继承方式获取到了无名管道的读端和写端,所以父子进程都能往同一pipe inode读写数据,也就能完成通信。

由浅入深探讨Linux进程间通信_第7张图片

3.2 命名管道

命名管道能通过指定的文件名来创建和打开pipe inode节点。

命名管道的读端和写端可以属于不同的进程,当然也可以属于同一进程或者父子进程。

因为命名管道是通过文件名创建和打开的,进程只要有文件名,就有了打开命名管道的钥匙,就能对管道进程操作。

使用命名管道的时候,不需要去关注进程之间的关系,只需要关注进程是否知道文件名。

由浅入深探讨Linux进程间通信_第8张图片

最后思考一下:管道为什么满足进程间通信要求?

管道(pipe inode)属于内核空间的一块内存区域,进程(task_struct对象)能够通过文件表访问这块内存区域,所以管道满足进程间通信要求。

由浅入深探讨Linux进程间通信(中)

前言

上一篇文章由浅入深探讨Linux进程间通信(上篇)只讲解到了进程间通信方法之管道,这一篇文章继续讲解System V进程间通信,话不多说直接开始。

1.System V进程间通信实现原理

由浅入深探讨Linux进程间通信_第9张图片

System V进程间通信需要借助Linux命名空间来实现。

1.1什么是Linux命名空间?

Linux命名空间是一种虚拟化技术,它提供了一种轻量级的虚拟化方式,可以将一个系统中的全局资源隔离开来,使得不同的进程可以拥有自己独立的资源视图。

命名空间其实就是一些列资源的集合,每个进程都需要指向这个集合,不同的进程如果指向相同的命名空间,那么进程间就能共享命名空间资源。

命名空间内核定义如下:

由浅入深探讨Linux进程间通信_第10张图片

System V进程间通信需要用到IPC命名空间。

IPC命名空间有一个数组成员ids,该成员主要用来存储消息队列,信号量,共享内存IPC对象。

System V三种进程间通信方式(消息队列,信号量,共享内存)都是基于IPC对象实现,消息队列,信号量,共享内存都继承了IPC对象(kern_ipc_perm),学习System V进程间通信首先我们得知道IPC对象如何创建和销毁。

1.2 IPC对象创建和销毁

IPC对象创建和销毁需要通过键值(Key)来完成。

什么是IPC键值(Key)?

IPC键值(Key)是一个整型值,用于唯一标识一个IPC对象,在创建IPC对象时,需要指定一个IPC键值,进程可以使用这个IPC键值来访问该IPC对象,同一个IPC键值只能对应一个IPC对象,不同的IPC键值对应不同的IPC对象。

创建IPC对象时,首先得生成一个IPC Key,IPC Key有以下三种生成方式:

  1. 使用一个随机的整数。

  2. 使用IPC_PRIVATE标志生成,此种方法只能用于有亲缘关系进程。

  3. 使用ftok函数生成。

生成Key后,通过Key索引ipc_namespace->ids->key_ht(哈希表),Key主要是用来索引哈希表,如果哈希表中已经有IPC对象,直接返回IPC对象ID,否则需要创建一个新的IPC对象,并为新的IPC生成对象ID,再把IPC对象插入哈希表,新的IPC对象会以IPC对象ID为索引,插入ipc_namespace->ids->ipcs_id(radix树)。

同样IPC对象销毁也是通过Key删除哈希表IPC对象记录。

什么是IPC对象ID?

IPC对象ID是一个整数标识符,用于标识System V IPC对象(如消息队列、信号量和共享内存),IPC对象ID是由内核分配的,IPC对象主要用来索引ipc_namespace->ids->ipcs_id(radix树),radix树主要用来加快查询效率。

2.System V消息队列

由浅入深探讨Linux进程间通信_第11张图片

有了前面的铺垫,我们就很容理解消息队列,信号量,共享内存的实现。

  • 消息队列创建

msgget函数通过Key创建消息队列并返回IPC对象ID。

  • 发送消息

得到IPC对象ID后,就能通过调用msgsnd函数发送消息,发送的消息存储在msg_queue(消息队列)->q_messages(队列)。

  • 接收消息

通过msgrcv函数接收消息,msgrcv函数从msg_queue(消息队列)->q_messages(队列)读取消息。

两个进程因为都指向相同的IPC命名空间,所以两个进程通过相同的Key返回同一个IPC对象ID,有了相同的ID就能通过ID进行消息发送和接收。

3.System V信号量

由浅入深探讨Linux进程间通信_第12张图片

  • 信号量创建

semget函数通过Key创建信号量并返回IPC对象ID。

  • 信号量PV操作

semop函数实现信号量PV操作。

  • 信号量销毁

semctl函数通过IPC_RMID命令销毁信号量。

System V信号量(sem_array)维护的是信号量数组,也就是同时支持多个信号量,所以在初始化信号量时需指定信号量数量,操作信号量时需通过数组下标指定操作的是哪个信号量。

4.System V共享内存

由浅入深探讨Linux进程间通信_第13张图片

  • 共享内存创建

semget函数通过Key创建共享内存并返回IPC对象ID。

  • 共享内存映射

通过shmat函数实现内存映射,通过同一共享文件完成内存映射的内存区域,进程间可以相互访问。

  • 数据拷贝

完成共享内存映射后,就能通过普通的内存拷贝函数,如:memcpy函数,实现数据的写入和读取,完成进程间通信。

  • 取消共享内存内存映射

通过shmdt函数取消内存映射。

  • 共享内存销毁

shmctl函数通过IPC_RMID命令销毁信号量。

System V共享内存(shmid_kernel)维护的是一个struct file对象(shm_filesem),shm_filesem为共享内存文件,用来实现内存映射,不同的进程通过相同的shm_filesem共享内存文件完成内存映射后,就能访问同一块物理内存区域,从而实现进程间通信。

最后思考一下:System V进程间通信方法为什么满足进程间通信要求?

IPC对象属于内核空间的一块内存区域,进程(task_struct对象)能够通过IPC命名空间表访问这块内存区域,所以System V进程间通信方法满足进程间通信要求。

你可能感兴趣的:(Linux开发,开发语言)