机器学习04-K均值算法--应用

1. 应用K-means算法进行图片压缩

读取一张图片

观察图片文件大小,占内存大小,图片数据结构,线性化

用kmeans对图片像素颜色进行聚类

获取每个像素的颜色类别,每个类别的颜色

压缩图片生成:以聚类中收替代原像素颜色,还原为二维

观察压缩图片的文件大小,占内存大小

 (1)查看大小,内存,数据结构并线性化

机器学习04-K均值算法--应用_第1张图片 机器学习04-K均值算法--应用_第2张图片

 

 (2)kmeans进行聚类,获取每个像素的颜色类别,每个类别的颜色

 

 

(3)压缩图片生成

机器学习04-K均值算法--应用_第3张图片

 

 原图片:                                                                                    压缩后图片:

机器学习04-K均值算法--应用_第4张图片                                          机器学习04-K均值算法--应用_第5张图片

 

 (4)观察压缩图片的文件大小,占内存大小

 

 

 

 

 

 

完整代码:

##图片压缩应用
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import matplotlib.image as img
import numpy as np
import sys

cat = img.imread('1055407.jpg') ##读取图片
print("原图片文件大小:",cat.size) ##查看文件大小
print("原图片占内存大小:",sys.getsizeof(cat)) ##查看占内存大小
print("原图片数据结构:",cat.shape) ##查看数据结构
print("原图片数据:\n",cat) ##查看数据


cats = cat[::8,::8] ##降低分辨率
X = cats.reshape(-1,3) ##线性化
print(cats.shape,X.shape)

n_colors = 64 ##将255*255*255种颜色聚类成64种
model = KMeans(n_colors)
labels = model.fit_predict(X) ##获取每个像素点的颜色类别存放在labels中
colors = model.cluster_centers_ ##将64种颜色存放在colors中,即聚类中心

new_image = colors[labels].reshape(cats.shape) ##reshape回原来的形状
plt.imshow(cat) ##压缩前的图片
plt.show()
plt.imshow(new_image.astype(np.uint8)) ##压缩后的图片
plt.show()

print("压缩后图片文件大小:",new_image.size) ##查看文件大小
print("压缩后图片占内存大小:",sys.getsizeof(new_image)) ##查看占内存大小
img.imsave('cats.jpg',new_image.astype(np.uint8))

 

2. 观察学习与生活中可以用K均值解决的问题。

从数据-模型训练-测试-预测完整地完成一个应用案例。

这个案例会作为课程成果之一,单独进行评分。

 

你可能感兴趣的:(机器学习04-K均值算法--应用)