关于pytorch的conv函数中group的理解

首先从二维图像说起,二维图像的中 一个RGB图像的卷积核大小为N*N*D,其中D通常为3,对应的为RGB三通道数据,在每一个卷积核中,不同的D层具有不同的权重。而当需要输出为M个通道时,就会有M个卷积核。参考文章多通道卷积计算理解_AI视觉网奇的博客-CSDN博客_多通道卷积

当谈及Group时,我的理解时对一个多通道数据,比如一个RGBD的数据,包括四个输入通道,这时假设group=2,那么可以认为同时有两个卷积核,每个卷积的大小为N*N*(D/2).这里D=4,然后一个卷积核对RG两个通道进行卷积,一个通道对BD两个通道进行卷积。至于输出通道数,如果输出通道数是M那么两种不同类型(针对不同通道进行卷积,因此认为是不同类型的卷积核)平分M通道,即存在两种卷积核,每个卷积核的大小均为N*N*(D/2),个数均为M/2。这样做的好处在于对于一个多通道的数据,如果认为不同通道之间是独立的,那么可以分别处理,提取出不同的特征出来。一维卷积神经网络理解(torch.nn.Conv1d)_zhangfei_bk的博客-CSDN博客_一维卷积神经网络

你可能感兴趣的:(pytorch,深度学习,人工智能)