k-means算法另类应用:压缩图片

k-means算法另类应用:压缩图片_第1张图片

不看广告,直接看“疗效”:

网络上下载的图片,图片中有大面积色块的还是有压缩空间:


保留原图片中64种颜色。压缩率:66%,也就是节省了1/3的存储空间

对于网络上色彩斑斓的图片。压缩率有可能不降反增。



其实很多网站的图片已经优化压缩了,能再压缩的空间很小。

自己拍摄的图片,即使保留更多的颜色也能获得较大压缩比:


压缩率:33%

原理:

  • 保留少数量的颜色,取代原图片中的N多颜色
  • 采用聚类方式得到新的颜色种类,用种类中心的颜色代表这个颜色种类
  • 用选出来的颜色重新对图片着色

代码在此:

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
import imageio

iname = "original.jpg"
cname = "compress_" + iname

#保留的颜色数量
n_colors = 64
img = imageio.imread(iname)


ax = plt.axes(xticks=[], yticks=[])
ax.imshow(img);


img.shape


data = img / 255.0 # 颜色从0-255转换为0-1之间的小数
data = data.reshape(-1, 3)
data.shape

#批量KMeans
from sklearn.cluster import MiniBatchKMeans
kmeans = MiniBatchKMeans(n_colors)
kmeans.fit(data)
new_colors = kmeans.cluster_centers_[kmeans.predict(data)]


#重新着色
new_img = new_colors.reshape(img.shape)
new_img = (255 * new_img).astype(np.uint8)

fig, ax = plt.subplots(1, 2, figsize=(16, 6),
                       subplot_kw=dict(xticks=[], yticks=[]))
fig.subplots_adjust(wspace=0.05)
ax[0].imshow(img)
ax[0].set_title('Original Image', size=16)
ax[1].imshow(new_img)
ax[1].set_title(str(n_colors)+'-color Image', size=16);
#保存压缩后的图片
imageio.imsave(cname,new_img)


# 计算压缩率

import os
from os.path import join, getsize

compress_ratio = getsize(cname) / getsize(iname)
compress_ratio

代码参考:
https://mybinder.org/v2/gh/jakevdp/PythonDataScienceHandbook/master?filepath=notebooks%2FIndex.ipynb

里面的In Depth: k-Means Clustering

k-means算法另类应用:压缩图片_第2张图片

KevinZhang
Sep 20, 2018

你可能感兴趣的:(k-means算法另类应用:压缩图片)