使用聚类算法进行图片压缩

问题如下:

对于一张图片flower.jpg,我们希望使用聚类算法对图像进行压缩,其思想是:其核心思想是通过聚类将颜色表示数量减少。例如,传统RGB,每个通道0~255(8 bits),则可以表示16777216 (24 bits)种颜色,通过聚类可以减少到16种颜色。
STEP1:完成compress_image函数,该函数实现图片压缩功能,思想是将每个像素作为一个元素进行聚类,然后使用每个类别的质心数值替换原像素数据,以此减少其颜色个数。该函数参数img是图片传入的接口,因此我们需要知道变量img的数据结构,请自行查看。
问题一:代码实现,将img结构进行转换即每个像素作为一个元素,使之能符合聚类算法数据输入的要求。完成后创建KMeans聚类模型并进行训练。
问题二:代码实现,分别获取每个数据聚类后的label,以及每个label的质心的值cluster_centers_.squeeze。
问题三:使用质心的数值代替原数据的label值,那么我们将获得一个新的图像。 提示,使用numpy的choose函数进行进行质心值的代替,reshape函数回复原图片的数据结构,并返回结果。
STEP2:创建plot_image函数打印图片。

STEP3:读入图片,设置压缩率,实现压缩。

原图:

使用聚类算法进行图片压缩_第1张图片

 

import numpy as np
from scipy import misc
from sklearn import cluster
import matplotlib.pyplot as plt
import imageio


# STEP1
# compress_image函数实现图片压缩功能,compress_image函数将每个像素作为一个元素进行聚类,以此减少其颜色个数。
# 参数img是图片传入的接口,因此我们需要知道变量img的数据结构,请自行查看。
def compress_image(img, num_clusters):
    # 思考,聚类算法对输入的数据结构要求如何?
    # 问题一:补全代码,将img结构进行转换即每个像素作为一个元素,使之能符合聚类算法数据输入的要求。
    X = img.reshape((-1, 1))  # 将原来的img文件的数据结构转化为单列格式。不知道img原来的数据结构可能是一个矩阵,我们将每一个像素点都转化为单列的格式。

    # print(X.shape)
    # 创建KMeans聚类模型,并训练。
    kmeans = cluster.KMeans(n_clusters=num_clusters, n_init=4, random_state=5)
    kmeans.fit(X)

    # 问题二:补全代码,分别获取每个数据聚类后的label,以及每个label的质心。
    centroids = kmeans.cluster_centers_.squeeze()  # 把img文件新生成的数组将其数组形状中的维度删除 也就是将shape中为1的删除。
    labels = kmeans.labels_  # 那到新数据的质心,目的要替换原来像素点的质心

    # 问题三:使用质心的数值代替原数据的label值,那么我们将获得一个新的图像。
    # 提示,使用numpy的choose函数进行进行质心值的代替,reshape函数回复原图片的数据结构,并返回结果。
    input_image_compressed = np.choose(labels, centroids).reshape(img.shape)
    # 使用choose函数将质心替换原来的数据。

    return input_image_compressed


# STEP2
# plot_image函数打印图片
def plot_image(img, title):
    vmin = img.min()
    vmax = img.max()
    plt.figure()
    plt.title(title)
    plt.imshow(img, cmap=plt.cm.gray, vmin=vmin, vmax=vmax)


# STEP3
# 读入图片,设置压缩率,实现压缩
if __name__ == '__main__':
    # 设置图片的路径和压缩比例
    input_file = "C:/"
    num_bits = 2
    if not 1 <= num_bits <= 8:
        raise TypeError('Number of bits should be between 1 and 8')
    num_clusters = np.power(2, num_bits)
    # 输出压缩的比例
    compression_rate = round(100 * (8.0 - num_bits) / 8.0, 2)
    print("\nThe size of the image will be reduced by a factor of", 8.0 / num_bits)
    print("\nCompression rate = " + str(compression_rate) + "%")
    # 加载需要压缩的图片
    input_image = imageio.imread(input_file, as_gray=True).astype(np.uint8)
    # 原始图像的输出
    plot_image(input_image, 'Original image')
    # 压缩后的图像输出
    input_image_compressed = compress_image(input_image, num_clusters)
    plot_image(input_image_compressed, 'Compressed image; compression rate = ' + str(compression_rate) + '%')
    plt.show()

输出结果:

使用聚类算法进行图片压缩_第2张图片

 

你可能感兴趣的:(聚类,算法)