使用K—Means进行图像分割
一、需要用到的库:
sklearn.cluster中的kmeans、PIL中的image、skimage中的color、PIL中的image
PIL是图像处理标准库,用image得到图像的像素值和尺寸大小,依据尺寸,可以得到各个点的RGB值(三通道值),还可以利用image内的函数保存图片。利用PIL库可以对图像进行读写
import PIL.Image as image# 得到图像的像素值
img = image.open(f)
# 得到图像尺寸
width, height = img.size
二、准备阶段
加载数据—获取图像信息【包括图像像素数据、图像的尺寸和通道数】—对图像每个通道的数据进行数据规范化
jpg格式的图像具有三个通道(R,G,B),也就是一个像素点具有3个特征值,特征值的范围在0-255之间。
为了加速聚类的收敛,可以对通道值进行规范化。
三、进行聚类
Fit_predict进行kmeans
四、将聚类结果可视化
将聚类表示转换为不同颜色的矩阵,可以手动对各个聚类标识规定颜色,比如得到各个聚类中心的RGB通道来代表这一类的RGB通道值,下图举了三个例子,表示第0、1、2类的通道值
五、总的代码
import numpy as np
import PIL.Image as image
from sklearn.cluster import KMeans
from sklearn import preprocessing
# 加载图像,并对数据进行规范化
def load_data(filePath):
# 读文件
f = open(filePath,'rb')
data = []
# 得到图像的像素值
img = image.open(f)
# 得到图像尺寸
width, height = img.size
for x in range(width):
for y in range(height):
# 得到点 (x,y) 的三个通道值
c1, c2, c3 = img.getpixel((x, y))
data.append([(c1+1)/256.0, (c2+1)/256.0, (c3+1)/256.0])
f.close()
return np.mat(data), width, height
# 加载图像,得到规范化的结果 imgData,以及图像尺寸
img, width, height = load_data(r'C:\users\dell\Desktop\weixin.jpg')
# 用 K-Means 对图像进行 16 聚类
kmeans =KMeans(n_clusters=16)
label = kmeans.fit_predict(img)#因为fit和predict传入的数据是一样的,所以可以直接写在一起,直接得到聚类结果
# 将图像聚类结果,转化成图像尺寸的矩阵
label = label.reshape([width, height])
# 创建个新图像 img,用来保存图像聚类压缩后的结果
img=image.new('RGB', (width, height))
for x in range(width):
for y in range(height):
c1 = kmeans.cluster_centers_[label[x, y], 0]
c2 = kmeans.cluster_centers_[label[x, y], 1]
c3 = kmeans.cluster_centers_[label[x, y], 2]
#c1,c2,c3代表了每个类RGB通道的数值
img.putpixel((x, y), (int(c1*256)-1, int(c2*256)-1, int(c3*256)-1))
# #用 putpixel 函数对新图像的点进行RGB的设置,因为前面对通道值进行了规范化,控制在了0-1,但是通道值要在0-255的时候才会显示出颜色,所以这边*256恢复到0-255的范围
img.save(r'C:\users\dell\Desktop\weixin_new.jpg')
<\pre>
得到的图片如下所示: