SKlearn + Image 基于Kmeans的图像分割

读取图片并缩放

读取单个图片,出于实际需要与减少工作量的考量,将图片以100个像素的固定宽度按比例缩小。

def load_pic(pic_path):
    # 加载图片并缩放

    with open(pic_path, 'rb') as f:
        pic = image.open(f)

        # 缩放
        m, n = pic.size
        S_x = 100
        S_y = int((S_x / m) * n)
        pic = pic.resize((S_x, S_y), image.ANTIALIAS)

    return pic

Kmeans图像分割

直接对图像利用k均值算法进行分割

def km_pic(f):
    # 图像分割

    # 读取图片
    pic = load_pic(f)
    row, col = pic.size

    # 图片转为矩阵
    data = []
    for i in range(row):
        for j in range(col):
            x, y, z = pic.getpixel((i, j))
            data.append([x / 256.0, y / 256.0, z / 256.0])

    pic = np.mat(data)

    # 聚类
    label = KMeans(n_clusters=3).fit_predict(pic)
    label = label.reshape([row, col])
    pic_new = image.new("L", (row, col))

    for i in range(row):
        for j in range(col):
            pic_new.putpixel((i, j), int(label[i][j]))

    return pic_new

对于四张测试图片,其中第二、三张得到了不错的效果,但第一、四张却十分不理想,主体区分不明显,噪点也很多。

SKlearn + Image 基于Kmeans的图像分割_第1张图片
直接聚类的效果.jpeg

加入滤波降噪

为了改进程序,修改了km_pic函数,将图片转为矩阵的过程抽出,编写一个新的函数用于图像的预处理,加入滤波处理降噪。

def pic_change(pic):
    # 预处理,滤波

    # 滤波
    pic = pic.filter(ImageFilter.RankFilter(3, 8))

    # 图片转为矩阵
    m, n = pic.size
    data = []
    for i in range(m):
        for j in range(n):
            x, y, z = pic.getpixel((i, j))
            data.append([x / 256.0, y / 256.0, z / 256.0])

    d = np.mat(data)

    return d, m, n

滤波后主体被明显区分出来,噪点减少,但仔细观察,图像的阴影部分效果仍有待提高(例如图二右下角)。

SKlearn + Image 基于Kmeans的图像分割_第2张图片
加入滤波后的效果.jpeg

对数变换降低对比度

编写对数变换的函数并加入到预处理的函数中。

def log_pic(pic_m, v):
    # 对数变换算法

    g = np.log2(1 + v * pic_m) / np.log2(v + 1)
    img_m = (g * 255)

    return img_m
SKlearn + Image 基于Kmeans的图像分割_第3张图片
对数变换后的效果.jpeg

根据结果抠图

由于是采用的k=3的聚类,对得到的结果二值化处理

# 二值化
back = pic_new.getpixel((0, 0))
pic_new = pic_new.point(lambda x: 0 if x == back else 1)

编写函数根据最终的结果在原图上抠图。

def pic_split(f, p):
    # 由得到的结果在原图上抠图。

    # 加载原图
    pic = load_pic(f)
    m, n = pic.size
    
    # 比较与抠图
    for i in range(m):
        for j in range(n):
            if p.getpixel((i, j)) == 0:
                pic.putpixel((i, j), 0)

    return pic

最终效果

对代码进一步修改,得到的最终结果如下:


SKlearn + Image 基于Kmeans的图像分割_第4张图片
最终结果.jpeg

完整代码

import numpy as np
import PIL.Image as image
from PIL import ImageFilter
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt


def log_pic(pic_m, v):
    # 对数变换算法

    g = np.log2(1 + v * pic_m) / np.log2(v + 1)
    img_m = (g * 255)

    return img_m


def load_pic(pic_path):
    # 加载图片并缩放

    with open(pic_path, 'rb') as f:
        pic = image.open(f)

        # 缩放
        m, n = pic.size
        S_x = 100
        S_y = int((S_x / m) * n)
        pic = pic.resize((S_x, S_y), image.ANTIALIAS)

    return pic


def pic_change(pic):
    # 预处理,滤波与对数变换

    # 滤波
    pic = pic.filter(ImageFilter.RankFilter(5, 24))

    m, n = pic.size
    data = []
    for i in range(m):
        for j in range(n):
            x, y, z = pic.getpixel((i, j))
            data.append([x / 256.0, y / 256.0, z / 256.0])

    d = np.mat(data)

    # 对数变换
    d = log_pic(d, 10)

    return d, m, n


def pic_split(f, p):
    # 由得到的结果在原图上抠图

    # 加载原图
    pic = load_pic(f)
    m, n = pic.size

    # 比较与抠图
    for i in range(m):
        for j in range(n):
            if p.getpixel((i, j)) == 0:
                pic.putpixel((i, j), 0)

    return pic


def km_pic(f):
    # 图像分割

    pic = load_pic(f)
    img_data, row, col = pic_change(pic)

    # 聚类
    label = KMeans(n_clusters=3).fit_predict(img_data)
    label = label.reshape([row, col])
    pic_new = image.new("L", (row, col))

    for i in range(row):
        for j in range(col):
            pic_new.putpixel((i, j), int(256 / (label[i][j] + 1)))

    # 滤波
    pic_new = pic_new.filter(ImageFilter.ModeFilter(7))

    # 二值化
    back = pic_new.getpixel((0, 0))
    pic_new = pic_new.point(lambda x: 0 if x == back else 1)

    # 抠图
    pic_new = pic_split(f,pic_new)

    return pic_new


f1 = 'F:/g.jpg'
f2 = 'F:/k.jpg'
f3 = 'F:/q.jpg'
f4 = 'F:/t.jpg'

p1 = image.open(f1)
p2 = image.open(f2)
p3 = image.open(f3)
p4 = image.open(f4)

plt.subplot(241)
plt.imshow(p1)
plt.subplot(242)
plt.imshow(p2)
plt.subplot(243)
plt.imshow(p3)
plt.subplot(244)
plt.imshow(p4)

plt.subplot(245)
plt.imshow(km_pic(f1))
plt.subplot(246)
plt.imshow(km_pic(f2))
plt.subplot(247)
plt.imshow(km_pic(f3))
plt.subplot(248)
plt.imshow(km_pic(f4))

plt.show()

你可能感兴趣的:(SKlearn + Image 基于Kmeans的图像分割)