torch.distributed.elastic.multiprocessing.api: [ERROR] failed (exitcode: -7)

在docker中运行时,由于配置的共享内存不足导致。新建docker时,shm-size设个大点的值。
不设置时,默认值时64M

你可能感兴趣的:(docker,torch,multiprocessing)