Python简单换脸程序改进输出图片

Python简单换脸程序改进输出图片

  • 环境
    • 需要的模型
    • 代码
    • 总结

 

环境

windows 10 64位
Python 3.6
PyCharm 社区版
dlib 19.6.1
numpy 1.15.4
opencv-python 3.4.5.20

需要的模型

特征提取器(predictor)要一个粗糙的边界框作为算法输入,由传统的能返回一个矩形列表的人脸检测器(detector)提供,其每个矩形列表在图像中对应一个脸。
为了构建特征提取器,预训练模型必不可少,相关模型可从dlib sourceforge库下载(http://sourceforge.net/projects/dclib/files/dlib/v18.10/shape_predictor_68_face_landmarks.dat.bz2)。

代码


import cv2
import dlib
import numpy
import matplotlib.pyplot as plt # plt 用于显示图片
import matplotlib.image as mpimg # mpimg 用于读取图片
import sys

# !/usr/bin/python
# -*- coding: utf-8 -*-

# sys.argv第一个为程序名,第二个是图片路径-脸移植到这个上面,第三个为图片路径-获取需要的脸。
sys.argv = ["SwapFace.py", "E:/pycharm/Project/head.jpg", "E:/pycharm/Project/face.jpg"]
PREDICTOR_PATH = "E:/pycharm/Project/shape_predictor_68_face_landmarks.dat"# 训练好的一个模型这里直接调用就可以
SCALE_FACTOR = 1
FEATHER_AMOUNT = 11

FACE_POINTS = list(range(17, 68))
MOUTH_POINTS = list(range(48, 61))
RIGHT_BROW_POINTS = list(range(17, 22))
LEFT_BROW_POINTS = list(range(22, 27))
RIGHT_EYE_POINTS = list(range(36, 42))
LEFT_EYE_POINTS = list(range(42, 48))
NOSE_POINTS = list(range(27, 35))
JAW_POINTS = list(range(0, 17))

# Points used to line up the images.
ALIGN_POINTS = (LEFT_BROW_POINTS + RIGHT_EYE_POINTS + LEFT_EYE_POINTS +
                RIGHT_BROW_POINTS + NOSE_POINTS + MOUTH_POINTS)

# Points from the second image to overlay on the first. The convex hull of each
# element will be overlaid.
OVERLAY_POINTS = [
    LEFT_EYE_POINTS + RIGHT_EYE_POINTS + LEFT_BROW_POINTS + RIGHT_BROW_POINTS,
    NOSE_POINTS + MOUTH_POINTS,
]

# Amount of blur to use during colour correction, as a fraction of the
# pupillary distance.
COLOUR_CORRECT_BLUR_FRAC = 0.6

#使用dlib提取面部标志
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor(PREDICTOR_PATH)


class TooManyFaces(Exception):
    pass


class NoFaces(Exception):
    pass


def get_landmarks(im):
    rects = detector(im, 1) #进行人脸检测

    if len(rects) > 1:
        raise TooManyFaces #在if条件下,raise抛出异常,表示检测到多个脸。
    if len(rects) == 0:
        raise NoFaces

    return numpy.matrix([[p.x, p.y] for p in predictor(im, rects[0]).parts()]) #进行人脸面部轮廓特征提取:


def annotate_landmarks(im, landmarks):
    im = im.copy()
    for idx, point in enumerate(landmarks):
        pos = (point[0, 0], point[0, 1])
        cv2.putText(im, str(idx), pos,
                    fontFace=cv2.FONT_HERSHEY_SCRIPT_SIMPLEX,
                    fontScale=0.4,
                    color=(0, 0, 255))
        cv2.circle(im, pos, 3, color=(0, 255, 255))
    return im

# 将图 2 的特征融合到图 1 中
def draw_convex_hull(im, points, color):
    points = cv2.convexHull(points) # 寻找凸包
    cv2.fillConvexPoly(im, points, color=color) # 填充凸包


# 常规的 get_face_mask() 函数定义是:为一张图像和一个标志矩阵生成一个蒙版。蒙版会画出两个白色的凸多边形:
# 一个是眼睛周围的区域,一个是鼻子和嘴部周围的区域。之后,蒙版的边缘区域向外羽化 11 个像素,
# 这可以帮助消除剩下的不连续部分。
def get_face_mask(im, landmarks):
    im = numpy.zeros(im.shape[:2], dtype=numpy.float64) # 定制数据类型

    for group in OVERLAY_POINTS:
        draw_convex_hull(im,
                         landmarks[group],
                         color=1)

    # array([[[0, 1, 2],
    #         [3, 4, 5]],
    #
    #        [[6, 7, 8],
    #         [9, 10, 11]]])
    #
    # In[61]: arr1.shape  # 看形状
    # Out[61]: (2, 2, 3)  # 说明这是一个2*2*3的数组(矩阵),返回的是一个元组,可以对元组进行索引,也就是0,1,2
    # In[62]: arr1.transpose((1, 0, 2))
    # Out[62]:
    # array([[[0, 1, 2],
    #         [6, 7, 8]],
    #
    #        [[3, 4, 5],
    #         [9, 10, 11]]])
    # 比如,数值6开始的索引是[1, 0, 0],变换后变成了[0, 1, 0]。

    im = numpy.array([im, im, im]).transpose((1, 2, 0))

    im = (cv2.GaussianBlur(im, (FEATHER_AMOUNT, FEATHER_AMOUNT), 0) > 0) * 1.0
    im = cv2.GaussianBlur(im, (FEATHER_AMOUNT, FEATHER_AMOUNT), 0)

    return im

#用普氏分析法(Procrustes Analysis)实现人脸对齐
def transformation_from_points(points1, points2): # 输入的是矩阵
    """
    Return an affine transformation [s * R | T] such that:
        sum ||s*R*p1,i + T - p2,i||^2
    is minimized.
    """
    '''现在我们已经有两个面部标志矩阵,其中的每一行都含有某个面部特征的坐标(如第 30 行给出了鼻尖的坐标)。
    我们现在只要弄明白如何旋转、平移和缩放第一个向量的所有点,使其尽可能匹配第二个向量中的点。
    同理,
        同样的变换可用于将第二张图叠加在第一张图上。为使其更加数学化,我们设 T,s 和 R,并求如下等式最小值:  
    其中,R 是一个 2x2 的正交矩阵,s 是一个标量,T 是一个二维向量,pi 和 qi 是之前计算出的面部标志矩阵行标和列标。
        事实证明,这类问题用常规普氏分析法(Ordinary Procrustes Analysis)可以解决:'''

    points1 = points1.astype(numpy.float64) # 将输入矩阵转换为浮点型
    points2 = points2.astype(numpy.float64)

    c1 = numpy.mean(points1, axis=0) # 这里计算出了矩心
    c2 = numpy.mean(points2, axis=0)
    points1 -= c1
    points2 -= c2

    s1 = numpy.std(points1) # 计算标准差
    s2 = numpy.std(points2)
    points1 /= s1 # 除于标准差,这消除了缩放偏差
    points2 /= s2

    U, S, Vt = numpy.linalg.svd(points1.T * points2) # 使用奇异值分解(singular value decomposition)计算旋转部分。
    R = (U * Vt).T # .T应该是转置

    return numpy.vstack([numpy.hstack(((s2 / s1) * R,
                                       c2.T - (s2 / s1) * R * c1.T)),
                         numpy.matrix([0., 0., 1.])])


def read_im_and_landmarks(fname): # 读取图片
    # 使用函数cv2.imread()
    # 读入图像。这幅图像应该在此程序的工作路径,或者给函数提供完整路径。
    # 第二个参数是要告诉函数应该如何读取这幅图片。
    # cv2.IMREAD_COLOR:读入一副彩色图像。图像的透明度会被忽略,这是默认参数。
    # cv2.IMREAD_GRAYSCALE:以灰度模式读入图像
    #
    # import cv2
    # img = cv2.imread('lena.jpg', 0)
    #
    # PS:调用opencv,就算图像的路径是错的,OpenCV
    # 也不会提醒你的,但是当你使用命令printimg时得到的结果是None。
    im = cv2.imread(fname, cv2.IMREAD_COLOR)
    # import cv2
    # image = cv2.imread("D:/shape.bmp")
    # print(image.shape[0])
    # print(image.shape[1])
    # print(image.shape[2])
    # 结果
    # 300
    # 200
    # 3
    # 其中shape.bmp是一张水平200像素,垂直300像素的彩色图
    im = cv2.resize(im, (im.shape[1] * SCALE_FACTOR,
                         im.shape[0] * SCALE_FACTOR))
    s = get_landmarks(im)

    return im, s


def warp_im(im, M, dshape):
    output_im = numpy.zeros(dshape, dtype=im.dtype)
    cv2.warpAffine(im,
                   M[:2],
                   (dshape[1], dshape[0]),
                   dst=output_im,
                   borderMode=cv2.BORDER_TRANSPARENT,
                   flags=cv2.WARP_INVERSE_MAP)
    return output_im

# 两幅图像之间不同的 肤色 和 光线 造成了覆盖区域边缘的不连续。所以我们尝试修正它:
def correct_colours(im1, im2, landmarks1):
    # blur_amount用来计算出高斯核
    blur_amount = COLOUR_CORRECT_BLUR_FRAC * numpy.linalg.norm(
        numpy.mean(landmarks1[LEFT_EYE_POINTS], axis=0) -
        numpy.mean(landmarks1[RIGHT_EYE_POINTS], axis=0))
    blur_amount = int(blur_amount)
    if blur_amount % 2 == 0:
        blur_amount += 1
    im1_blur = cv2.GaussianBlur(im1, (blur_amount, blur_amount), 0)
    im2_blur = cv2.GaussianBlur(im2, (blur_amount, blur_amount), 0)

    # 防止除于零的情况,为什么是乘以128不清楚
    im2_blur += (128 * (im2_blur <= 1.0)).astype(im2_blur.dtype)

    return (im2.astype(numpy.float64) * im1_blur.astype(numpy.float64) /
            im2_blur.astype(numpy.float64))


im1, landmarks1 = read_im_and_landmarks(sys.argv[1])
im2, landmarks2 = read_im_and_landmarks(sys.argv[2])

M = transformation_from_points(landmarks1[ALIGN_POINTS],
                               landmarks2[ALIGN_POINTS])

mask = get_face_mask(im2, landmarks2)
warped_mask = warp_im(mask, M, im1.shape)
combined_mask = numpy.max([get_face_mask(im1, landmarks1), warped_mask],
                          axis=0)

warped_im2 = warp_im(im2, M, im1.shape)
warped_corrected_im2 = correct_colours(im1, warped_im2, landmarks1)

output_im = im1 * (1.0 - combined_mask) + warped_corrected_im2 * combined_mask

cv2.imwrite('output.jpg', output_im)

lena = mpimg.imread('output.jpg')
plt.imshow(lena)  # 显示图片
plt.axis('off')  # 不显示坐标轴
plt.show()

(含有源码和训练好的数据模型) 教程地址:https://edu.csdn.net/course/detail/26812

你可能感兴趣的:(python3)