在上一篇中概要地介绍了 mpi4py 中的点到点通信方法及其消息传递的流程,下面我们介绍 mpi4py 中标准的阻塞通信模式。
阻塞通信是指消息发送方的 send 调用需要接收方的 recv 调用的配合才可完成。即在发送的消息信封和数据被安全地“保存”起来之前,send 函数的调用不会返回。标准模式的阻塞 send 调用要求有接收进程的 recv 调用配合。
下面是 mpi4py 中用于标准阻塞点到点通信的方法接口(MPI.Comm 类的方法):
send(self, obj, int dest, int tag=0)
recv(self, buf=None, int source=ANY_SOURCE, int tag=ANY_TAG, Status status=None)
Send(self, buf, int dest, int tag=0)
Recv(self, buf, int source=ANY_SOURCE, int tag=ANY_TAG, Status status=None)
首先交代一下这些方法调用中用到的参数,mpi4py 中其它的点到点通信方法都有类似的参数格式。
以小写字母开头的 send 方法可以发送任意可被 pickle 系列化的 Python 对象 obj
,在发送之前这个对象被 pickle 系列化为字符串或二进制数据,int 类型的 dest
指明发送的目的地(要接收该消息的进程的进程号),可选的 int 类型的 tag
指明发送消息的 tag。recv 方法可以有一个可选的 buf
参数以指明一个预先分配好的内存缓冲区作为接收缓冲区。在大多数情况下都用不着这个参数,只有在某些需要考虑优化消息接收的情况下,你可以预先分配一个足够大的内存缓冲区,并用这个缓冲区来反复接收多个消息。另外需要注意的是这个缓冲区中存放的是被 pickle 系列化了的字符串和二进制数据,你需要使用 pickle.loads
来恢复所接收的 Python 对象。可选的 int 类型的 source
指明接收的消息源(发送该消息的进程的进程号),可选的 tag
指明消息的 tag,另外一个可选的 status
参数可以传人一个 MPI.Status 对象。接收进程可指定通用接收信封即 MPI.ANY_SOURCE,MPI.ANY_TAG,接收来自任何源进程的任意 tag 消息。可见,send 和 recv 操作是非对称的,即发送方必须给出特定的目的地址,而接收方则可以从任意源接收谢谢。从任意源和任意 tag 接收的消息可能无法判断其来源,这时可以从 status
对象的相关属性中找到对应的信息。recv 方法返回所接收的 Python 对象。
以大写字母开头的 Send/Recv 方法具有几乎一样的参数,不同的是其第一个参数 buf
应该是一个长度为2或3的 list 或 tuple,类似于 [data, MPI.DOUBLE]
,或者 [data, count, MPI.DOUBLE]
,以指明发送/接收数据缓冲区,数据计数以及数据类型。当 count
省略时会利用 data
的字节长度和数据类型计算出对应的 count
。对 numpy 数组,其计数和数据类型可以自动推断出来,因此可以直接以 data
作为第一个参数传给 buf
。
下面分别给出 send/recv 和 Send/Recv 的使用例程。
# send_recv.py
from mpi4py import MPI
comm = MPI.COMM_WORLD
rank = comm.Get_rank()
send_obj = {'a': [1, 2.4, 'abc', -2.3+3.4J],
'b': {2, 3, 4}}
if rank == 0:
comm.send(send_obj, dest=1, tag=11)
recv_obj = comm.recv(source=1, tag=22)
elif rank == 1:
recv_obj = comm.recv(source=0, tag=11)
comm.send(send_obj, dest=0, tag=22)
print 'process %d receives %s' % (rank, recv_obj)
运行结果如下:
$ mpiexec -n 2 python send_recv.py
process 0 receives {'a': [1, 2.4, 'abc', (-2.3+3.4j)], 'b': set([2, 3, 4])}
process 1 receives {'a': [1, 2.4, 'abc', (-2.3+3.4j)], 'b': set([2, 3, 4])}
# Send_Recv.py
import numpy as np
from mpi4py import MPI
comm = MPI.COMM_WORLD
rank = comm.Get_rank()
count = 10
send_buf = np.arange(count, dtype='i')
recv_buf = np.empty(count, dtype='i')
if rank == 0:
comm.Send([send_buf, count, MPI.INT], dest=1, tag=11)
# comm.Send([send_buf, MPI.INT], dest=1, tag=11)
# comm.Send(send_buf, dest=1, tag=11)
comm.Recv([recv_buf, count, MPI.INT], source=1, tag=22)
# comm.Recv([recv_buf, MPI.INT], source=1, tag=22)
# comm.Recv(recv_buf, source=1, tag=22)
elif rank == 1:
comm.Recv([recv_buf, count, MPI.INT], source=0, tag=11)
# comm.Recv([recv_buf, MPI.INT], source=0, tag=11)
# comm.Recv(recv_buf, source=0, tag=11)
comm.Send([send_buf, count, MPI.INT], dest=0, tag=22)
# comm.Send([send_buf, MPI.INT], dest=0, tag=22)
# comm.Send(send_buf, dest=0, tag=22)
print 'process %d receives %s' % (rank, recv_buf)
运行结果如下:
$ mpiexec -n 2 python Send_Recv.py
process 0 receives [0 1 2 3 4 5 6 7 8 9]
process 1 receives [0 1 2 3 4 5 6 7 8 9]
下面再给出一个使用一个预分配的内存缓冲区进行数据接收的例程。
# send_recv_buf.py
import pickle
import numpy as np
from mpi4py import MPI
comm = MPI.COMM_WORLD
rank = comm.Get_rank()
send_obj = np.arange(10, dtype='i')
recv_buf = bytearray(2000) # pre-allocate a buffer for message receiving
if rank == 0:
comm.send(send_obj, dest=1, tag=11)
elif rank == 1:
recv_obj = comm.recv(recv_buf, source=0, tag=11)
# print recv_buf
print pickle.loads(recv_buf)
print 'process %d receives %s' % (rank, recv_obj)
运行结果如下:
$ mpiexec -n 2 python send_recv_buf.py
[0 1 2 3 4 5 6 7 8 9]
process 1 receives [0 1 2 3 4 5 6 7 8 9]
上面我们介绍了 mpi4py 中标准阻塞通信模式,在下一篇中我们将介绍缓冲阻塞通信模式。