torchvision.transforms.Normalize()中的mean和std参数

参数的含义

根据源码,是对数据进行归一化的操作

image = (image - mean) / std

假设你数据的范围是图片的数据范围四[0,1],那么如果mean = [.5, .5, .5],std = [.5, .5, .5],根据上述式子计算
( 0 − 0.5 ) / 0.5 = − 1 (0-0.5)/0.5= -1 (00.5)/0.5=1 , ( 1 − 0.5 ) / 0.5 = 1 (1-0.5)/0.5= 1 (10.5)/0.5=1就可将数据归一化到[-1,1]。

疑问

在pytorch的官方教程里,经常看到

 normalize = T.Normalize(mean = [0.485, 0.456, 0.406], 
                         std = [0.229, 0.224, 0.225])

ImageNet里面用你的图片不是RGB三个范围是[0,255]的图片吗,用这样的归一化参数怎么能归一化到[-1,1]呢

解答

有两种情况:

  1. 如果是imagenet数据集,那么ImageNet的数据在加载的时候就已经转换成了[0, 1].
  2. 应用了torchvision.transforms.ToTensor,其作用是
    ( Converts a PIL Image or numpy.ndarray (H x W x C) in the range [0, 255] to a torch.FloatTensor of shape (C x H x W) in the range [0.0, 1.0] )

所以我们常常在代码中看到normallize在ToTensor之后

self.transforms = T.Compose([
                   T.Scale(224),
                   T.CenterCrop(224),
                   T.ToTensor(),
                   normalize
               ]

你可能感兴趣的:(torchvision.transforms.Normalize()中的mean和std参数)