机器学习K-means作业

作业

作业2:利用Kmeans,完成china.jpg文件的压缩与显示。

代码

from skimage import io
from sklearn.cluster import KMeans
import numpy as np
# 读入图像
def getImg(image):
    return io.imread(image)
# 图像展示
def plotImg(image):
    io.imshow(image)
    io.show()
# Kmeans图像处理    
def recoverByKmeans(image):
    rows = image.shape[0]
    cols = image.shape[1] 
    image = image.reshape(image.shape[0] * image.shape[1], 3)
    kmeans = KMeans(n_clusters=128)  # 把集合分成128个簇
    kmeans.fit(image) 
    labels = np.asarray(kmeans.labels_, dtype=np.uint8)  # labels_ 每个点的标签
    labels = labels.reshape(rows, cols)
img = getImg("china.jpg")
recoverByKmeans(img)
converimg = getImg("compressed_test.jpg")
plotImg(converimg)

结果

原始图片

机器学习K-means作业_第1张图片

128簇处理

机器学习K-means作业_第2张图片

256簇处理

机器学习K-means作业_第3张图片

心得体会

作为经典的聚类分析算法, K-means算法常用于数据集分类,未曾想过K-means聚类分析算法可用于压缩图片。所谓通过k-means压缩图片,其实就是将图片所有的像素点聚为指定k类,然后k-means得到的聚类中心与每个像素点所对应类的记录就成了压缩的结果, 本质也是基于距离判断断属于哪一类。当然,通过K-means完成文件的压缩固然节省大量空间, 但代价是压缩过程较为耗时且效果不佳。上述采用128个簇,测试中耗时16-17秒, 若采用256个簇,测试中耗时30+秒。128簇图像相对模糊, 256簇图像也差强人意。

原创不易
转载请标明出处
如果对你有所帮助 别忘啦点赞支持哈
在这里插入图片描述

你可能感兴趣的:(机器学习作业,机器学习,kmeans,聚类)