mpi4py 中的组与通信子

在上一篇中我们简要总结了 mpi4py 中的点到点通信,下面我们将介绍组与通信子的基本概念。

为了理解 MPI 中的组与通信子的概念,我们先来了解以下一些术语的含义。

  1. 组(group)

所谓组,在 MPI 环境里就是指一组进程标识所组成的有序集合。组中的每个进程都有一个唯一的 rank 加以标识。组对象存在于通信子环境内,为通信子定义和描述通信参与者(进程),并提供表示和管理进程的若干功能。组内的每个进程与一个整数 rank 相联系,rank 的序列号是连续的并从 0 开始。mpi4py 有一个特殊的预定义组 MPI_GROUP_EMPTY,这是一个没有成员的组。预定义的常数 MPI_GROUP_NULL 是为无效组句柄使用的值。

注意:不要将 MPI_GROUP_EMPTY 与 MPI_GROUP_NULL 混淆,前者是一个空组的有效句柄,而后者则是一个无效句柄。前者可以在组操作中作为一个参数使用;后者在组释放时被返回,不能存在于一个有效参数中。

  1. 上下文(context)

上下文是通信子所具有的一个属性,它允许对通信空间进行划分。一个上下文所发送的消息不能被另一个上下文所接收。不同的库可使用彼此独立的上下文,彼此互不干扰。上下文不是显式的 MPI 对象;它们仅作为通信子实现的一部分而出现。

同一进程内的不同通信子有不同的上下文。上下文实质上是一个系统管理的标志,用于保证通信子在点对点和 MPI 定义的集合通信中的安全性。安全意味着同一通信子内的集合和点对点通信互不干扰,而且不同通信子上的通信也互不干扰。

在组间通信中(严格的点对点通信〕,每个通信子中都存放这两个上下文标志,一个在组 A 中用于发送,在组 B 中用于接收,第二个在组 B 中用于发送,在组 A 中用于接收。

  1. 通信子(communicator)

通信子定义了封装 MPI 通信的基本模型。通信子可分为两类:组内通信子(intra-communicator)和组间通信子(inter-communicator)。

  1. 通信子缓存(cache)

通信子提供了一种缓存机制,使得用户可为其关联属性。

  1. 组内通信子(intra-communicator)

组内通信子将组的概念和上下文的概念结合到一起,其包含了一个 group 实例,作为点到点和/或集合通信的通信上下文,并包含了虚拟进程拓扑和其它属性。每个 MPI 通信函数都要通过通信子确定其通信环境。每个通信子都包含了一组进程,消息的源和目的进程都由组内保存的进程 rank 加以区分。每个组都必然包含其宿主进程本身,即组内必然包含本地进程。

对于集合通信,组内通信子指明了一系列参加集合操作的进程(及它们的次序——当需要时〕。这样通信子就约束了通信的空间范围,而且通过 rank 提供了与机器无关的进程访问。

mpi4py 的 MPI 环境启动后,自动创建两个组内通信子,MPI.COMM_WORLD 和 MPI.COMM_SELF,前者包含了启动时的所有进程,后者则仅包含进程自身。另外,预定义的常数 MPI.COMM_NULL 是为无效通信子使用的值。

在 MPI 的静态进程模型中,所有参加计算的进程在 MPI 被初始化后都可得到。对于这种情况,MPI.COMM_WORLD 是所有进程在计算时都可获得的通信子;该通信子在所有进程具有同样的值。在进程可以动态加入 MPI 执行的 MPI 实现中,可能是这样的情形:一个进程开始一个 MPI 计算无需访问其它的进程。在这种情况下,MPI.COMM_WORLD 是合并所有进程的通信子,每一个加入的进程都可立即与之通信。因此 MPI.COMM_WORLD 可能在不同的进程中同时具有不同的值。

所有的 MPI 实现都要求提供 MPI.COMM_WORLD 通信子。在进程的生命期中不允许将其释放。与该通信子对应的组不是以预定义常数的形式出现的,但是可以使用 MPI.Comm.Get_group 来获取和访问它。MPI 不指明 MPI.COMM_WORLD 中进程序列号间的对应关系及其(与机器相关的〕绝对地址,MPI 也不指明任何主进程函数。

  1. 组间通信子(inter-communicator)

组间通信与组内通信是两个相对的概念,参与组内通信的进程,都属于相同的进程组,并在相同的组内通信子对象上下文环境中执行。相应地,组间通信子把两个组绑定在一起,共享通信上下文,用于管理两者之间的通信。组间通信常用于解决采取模块化结构设计的,在多个空间中运行的复杂应用中的通信问题。一个组内的进程要与另一个组的进程进行通信就要指定目标组和目标进程在目标组内的 rank 两个信息。

MPI 的进程总是属于某些进程组。我们称发起通信的进程所属进程组为本地组(local group),而称包含某次通信发起者所指定目标进程的组为远程组(remote group)。所谓远程组和本地组只是在一次通信过程中形成的相对的、临时的概念。

对点到点通信,通信双方所需指定的消息“信封”仍是(通信子,rank,tag),与组内通信不同的是,组间通信的 rank 总是远程组里的 rank。

以上介绍了 mpi4py 中组与通信子的基本概念,要很好地使用组与通信子进行组间和/或组内的通信操作,我们需要知道怎么管理组与通信子,访问组与通信子的相关信息和属性,这些都是通过 mpi4py 中提供的相应函数方法来完成的,在下一篇中我们将介绍组管理 API。

你可能感兴趣的:(mpi4py 中的组与通信子)