计算两幅图像的相似度总结

1. SSIM(结构相似性度量)

这是一种全参考的图像质量评价指标,分别从亮度、对比度、结构三个方面度量图像相似性。

SSIM取值范围[0, 1],值越大,表示图像失真越小。

在实际应用中,可以利用滑动窗将图像分块,令分块总数为N,考虑到窗口形状对分块的影响,采用高斯加权计算每一窗口的均值、方差以及协方差,然后计算对应块的结构相似度SSIM,最后将平均值作为两图像的结构相似性度量,即平均结构相似性SSIM。


   
   
   
   
  1. from skimage.measure import compare_ssim
  2. from scipy.misc import imread
  3. import numpy as np
  4. img1 = imread( '1.jpg')
  5. img2 = imread( '2.jpg')
  6. img2 = np.resize(img2, (img1.shape[ 0], img1.shape[ 1], img1.shape[ 2]))
  7. print(img2.shape)
  8. print(img1.shape)
  9. ssim = compare_ssim(img1, img2, multichannel= True)
  10. print(ssim)

  计算两幅图像的相似度总结_第1张图片                      计算两幅图像的相似度总结_第2张图片

计算出来SSIM为0.343769017234

该方法通常用来衡量一张图片压缩后的失真度,比较少的用来计算两图的相似度。

 

2. cosin相似度(余弦相似度)

把图片表示成一个向量,通过计算向量之间的余弦距离来表征两张图片的相似度。


   
   
   
   
  1. from PIL import Image
  2. from numpy import average, linalg, dot
  3. def get_thumbnail(image, size=(1200, 750), greyscale=False):
  4. image = image.resize(size, Image.ANTIALIAS)
  5. if greyscale:
  6. image = image.convert( 'L')
  7. return image
  8. def image_similarity_vectors_via_numpy(image1, image2):
  9. image1 = get_thumbnail(image1)
  10. image2 = get_thumbnail(image2)
  11. images = [image1, image2]
  12. vectors = []
  13. norms = []
  14. for image in images:
  15. vector = []
  16. for pixel_tuple in image.getdata():
  17. vector.append(average(pixel_tuple))
  18. vectors.append(vector)
  19. norms.append(linalg.norm(vector, 2))
  20. a, b = vectors
  21. a_norm, b_norm = norms
  22. res = dot(a / a_norm, b / b_norm)
  23. return res
  24. image1 = Image.open( '1.jpg')
  25. image2 = Image.open( '2.jpg')
  26. cosin = image_similarity_vectors_via_numpy(image1, image2)
  27. print(cosin)

计算出来cosin相似度为0.911241243612

该方法运算量较大,速度明显比ssim方法慢,但是只管感受结果比ssim靠谱。

3. 基于直方图

直方图能够描述一幅图像中颜色的全局分布,是一种入门级的图像相似度计算方法。


   
   
   
   
  1. from PIL import Image
  2. def make_regalur_image(img, size = (256, 256)):
  3. return img.resize(size).convert( 'RGB')
  4. def hist_similar(lh, rh):
  5. assert len(lh) == len(rh)
  6. return sum( 1 - ( 0 if l == r else float(abs(l - r))/max(l, r)) for l, r in zip(lh, rh))/len(lh)
  7. def calc_similar(li, ri):
  8. return hist_similar(li.histogram(), ri.histogram())
  9. if __name__ == '__main__':
  10. img1 = Image.open( '1.jpg')
  11. img1 = make_regalur_image(img1)
  12. img2 = Image.open( '2.jpg')
  13. img2 = make_regalur_image(img2)
  14. print(calc_similar(img1, img2))

计算出来的直方图相似度为0.490183408809

直方图过于简单,只能捕捉颜色信息的相似性,捕捉不到更多的信息。只要颜色分布相似,就会判定二者相似度较高,显然不合理。

4. 基于互信息(Mutual Information)

 通过计算两个图片的互信息来表征他们之间的相似度。


   
   
   
   
  1. from sklearn import metrics as mr
  2. from scipy.misc import imread
  3. import numpy as np
  4. img1 = imread( '1.jpg')
  5. img2 = imread( '2.jpg')
  6. img2 = np.resize(img2, (img1.shape[ 0], img1.shape[ 1], img1.shape[ 2]))
  7. img1 = np.reshape(img1, -1)
  8. img2 = np.reshape(img2, -1)
  9. print(img2.shape)
  10. print(img1.shape)
  11. mutual_infor = mr.mutual_info_score(img1, img2)
  12. print(mutual_infor)

如果两张图片尺寸相同,还是能在一定程度上表征两张图片的相似性的。但是,大部分情况下图片的尺寸不相同,如果把两张图片尺寸调成相同的话,又会让原来很多的信息丢失,所以很难把握。经过实际验证,此种方法的确很难把握。

5. 计算图像的“指纹信息”

将图像归一化成一定大小,计算 一个序列作为他的指纹信息,然后比较两张图片指纹信息序列相同的位数。如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。

 

你可能感兴趣的:(计算机视觉)