我用Python把某音上的美女图片转字符画,期望的AI目标更进一步【机器学习算法实战小项目,k聚类算法图片转化字符画】

大家好,我是辣条。

最近在学习算法,今天给大家带来一个机器学习实战小项目

项目效果展示

image

学习目标

1.cv2转换图片数据
2.numpy提取图片矩阵数据
3.k均值算法获取图片的分类

工具使用

开发工具: pycharm

开发环境: Windows10,Python3.7

使用工具包: cv2,numpy

项目准备

  • 你所需要转换对应的图片 -cv2的工具包的下载: pip install opencv-python
CV2是什么意思

CV2指的是OpenCV2,OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库copy,可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。

OpenCV 拥有包括 500 多个C函数的跨平台的中、百高层 API。它不依赖于其它的外部库——尽管也可以使用某些外部库。

image.gif

项目思路解析

首先准备需要处理的图片

在这里插入图片描述
image.gif

利用opencv读取对应的图片数据

  • 读取图片
    fp = r"1.jpg"
    img = cv2.imread(fp)  
    print(img.shape)
image.gif

读取的数据返回的是矩阵元组数据分别是(高度, 宽度,通道数)

  • 将图片转换成灰度 -通过黑白两种颜色来区分图片颜色的深浅 -利用kmeans算法进行区分画点
    height, width, *_ = frame.shape
    frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    frame_array = np.float32(frame_gray.reshape(-1))
    compactness, labels, centroids = cv2.kmeans(frame_array, K, None, (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0), 10, cv2.KMEANS_RANDOM_CENTERS)
image.gif

image.gif

kmeans:返回三个参数 compactness:紧密度,返回每个点到相应重心的距离的平方和 labels:结果标记,每个成员被标记为分组的序号,如 0,1,2,3,4...等 centers:由聚类的中心组成的数组

  • 将的到的对应的中心点进行排序 -0最暗, 分类的多少是由自己决定的 -排序之后在将对应的图片相素点跟换成中心点的分类 -就能得到图片对应的颜色深浅关系 -颜色暗的用字符代替 -颜色浅的可以跟换成空白,或者横杆 -提现出颜色的差距感 -替换之后在将其放入到新的画布 -拼接成新的图片(注意图片的缩放比列)

简易源码分享

import cv2
import random
import numpy as np


def img2strimg(frame, K=3):
    height, width, *_ = frame.shape
    frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    # 转换数据类型,一列显示
    frame_array = np.float32(frame_gray.reshape(-1))
    compactness, labels, centroids = cv2.kmeans(frame_array, K, None, (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0), 10, cv2.KMEANS_RANDOM_CENTERS)
    centroids = np.uint8(centroids)  # 转换成整形
    # labels的数个矩心以随机顺序排列,所以需要简单处理矩心.
    # 返回一个折叠成一维的数组
    centroids = centroids.flatten()
    # 排序
    centroids_sorted = sorted(centroids)
    # 获得不同centroids的明暗程度,0最暗
    centroids_index = np.array([centroids_sorted.index(value) for value in centroids])
    bright = [abs((3 * i - 2 * K) / (3 * K)) for i in range(1, 1 + K)]
    bright_bound = bright.index(np.min(bright))
    shadow = [abs((3 * i - K) / (3 * K)) for i in range(1, 1 + K)]
    shadow_bound = shadow.index(np.min(shadow))
    labels = labels.flatten()
    # 将labels转变为实际的明暗程度列表,0最暗。
    labels = centroids_index[labels]
    labels_picked = [labels[rows * width:(rows + 1) * width:2] for rows in range(0, height, 2)]
    canvas = np.zeros((3 * height, 3 * width, 3), np.uint8)
    canvas.fill(255)  # 创建长宽为原图三倍的白色画布。
    y = 0
    for rows in labels_picked:
        x = 0
        for cols in rows:
            if cols <= shadow_bound:
                cv2.putText(canvas, str(random.randint(2, 9)), (x, y), cv2.FONT_HERSHEY_PLAIN, 0.45, 0.1)
            elif cols <= bright_bound:
                cv2.putText(canvas, "-", (x, y),cv2.FONT_HERSHEY_PLAIN, 0.4, 0, 1)
            x += 6
        y += 6

    return canvas


if __name__ == '__main__':
    fp = r"1.jpg"
    img = cv2.imread(fp)
    print(img)
    str_img = img2strimg(img)
    cv2.imwrite("result.jpg", str_img)
image.gif

你可能感兴趣的:(我用Python把某音上的美女图片转字符画,期望的AI目标更进一步【机器学习算法实战小项目,k聚类算法图片转化字符画】)