mindspore-NPU单卡可以执行,多卡会报错

图模式,数据并行

单卡可以正常执行训练和推断,多卡训练会报错,hccl 的 json 文件和多卡的脚本都按照官方文档构建的。

mindspore-NPU单卡可以执行,多卡会报错_第1张图片

 建立 hccl 的 json 文件的问题,我在 8p 的机器上只希望使用 4 张卡,在构建 json 文件时就要指出,不能构建 8 卡的 json 文件,但是使用四张卡。

你可能感兴趣的:(深度学习,python,计算机视觉)