我们有时候会听到这么一个词–“蒙太奇”,但却不知道这个词是什么意思。蒙太奇原为建筑学术语,意为构成、装配。而后又延伸为一种剪辑理论:当不同镜头拼接在一起时,往往又会产生各个镜头单独存在时所不具有的特定含义。这就是我们经常听到了蒙太奇手法,在电影《飞屋环游记》中皮克斯运用蒙太奇手法,用一个不到5分钟的短片展现了主角的大半人生,感动无数观众。下面我们就看看今天的内容同蒙太奇有何关系。
说这么多都是虚的,下面我们看看效果实现的效果,到底什么是蒙太奇马赛克图片,这里用小松菜奈的照片作为测试:
最左边的是蒙太奇图缩小的效果,第二个则是正常大小显示的效果,第三张是原图,第四张是截取的某个区域的细节。从图四可以很容易看出,我们的蒙太奇图片是使用许多不同的图片拼接而成的。
程序的实现分为几个步骤,首先我们需要准备工作,一个是我们的底图,也就是上面的图三。另外就是需要一个图片集,这个图片集的选取有几个规范,首先不能有gif图和png图片,其次就是图片的颜色尽量丰富,图片数量也多一些,这样效果会更好。另外就是选取长宽比接近1的图片效果会更好。然后就是我们代码部分的工作了:
大家对于上面的步骤或许还有些疑问,这些疑问在具体实现中细说。先看看我们要用到的一些模块:
import os
import cv2
import math
import numpy as np
其中opencv的安装如下:
pip install opencv-python
人工挑图片还是比较麻烦的,所以我们只要求人先挑好一些图片,然后我们将不符合规范的图片删除即可:
def renameImages(path):
//获取图片路径列表
filelist = [path + i for i in os.listdir(path)]
//用数字给图片命名
img_num = str(len(filelist))
name = int(math.pow(10, len(img_num)))
//遍历列表
for file in filelist:
//删除gif和png图片
if file.endswith('.gif') or file.endswith('.GIF') or file.endswith('.png') or file.endswith('.PNG'):
os.remove(file)
continue
# 对图片以数字编号重命名
os.rename(file, path + str(name) + '.jpg')
name += 1
执行上面的方法后我们就把合适的图片筛选出来了。
获取主色调列表前我们需要先获取主色调,这里直接使用bgr值的平均值作为主色调:
def getDominant(im):
"""获取主色调"""
b = int(round(np.mean(im[:, :, 0])))
g = int(round(np.mean(im[:, :, 1])))
r = int(round(np.mean(im[:, :, 2])))
return (b, g, r)
通常RGB模式的图片我们接触的比较多,但是在OpenCV中图片是以BGR模式读取,每个字母的含义是一样的,只是顺序不同,这里需要注意一下。接下来我们获取主色调列表:
def getColors(path):
"""获取图片列表的色调表"""
colors = []
# 获取图片列表
filelist = [path + i for i in os.listdir(path)]
# 遍历列表
for file in filelist:
# 读取图片
im = cv2.imdecode(np.fromfile(file, dtype=np.uint8), -1)
try:
# 获取图片主色调
dominant = getDominant(im)
except:
continue
# 将主色调添加到色调列表中
colors.append(dominant)
return colors
有了色调列表,我们对比颜色的操作就可以直接同色调列表进行了。
我是通过比较两张图片主色调的BGR值,然后将差的绝对值相加的方式获得色调的差异:
def fitColor(color1, color2):
"""返回两个颜色之间的差异大小"""
# 求出b通道之间的差异
b = color1[0] - color2[0]
# 求出g通道之间的差异
g = color1[1] - color2[1]
# 求出r通道之间的差异
r = color1[2] - color2[2]
# 返回绝对值的和
return abs(b) + abs(g) + abs(r)
这里就是我们的方法主体了,内容比较多,我们先看看代码:
def generate(im_path, imgs_path, box_size, multiple=1):
"""生成图片"""
# 读取图片列表
img_list = [imgs_path + i for i in os.listdir(imgs_path)]
# 读取图片
im = cv2.imread(im_path)
im = cv2.resize(im, (im.shape[1]*multiple, im.shape[0]*multiple))
# 获取图片宽高
width, height = im.shape[1], im.shape[0]
# 遍历图片像素
for i in range(height // box_size+1):
for j in range(width // box_size+1):
# 图块起点坐标
start_x, start_y = j * box_size, i * box_size
# 初始化图片块的宽高
box_w, box_h = box_size, box_size
# 截取当前遍历到的图块
box_im = im[start_y:, start_x:]
if i == height // box_size:
box_h = box_im.shape[0]
if j == width // box_size:
box_w = box_im.shape[1]
if box_h == 0 or box_w == 0:
continue
# 获取主色调
dominant = getDominant(im[start_y:start_y+box_h, start_x:start_x+box_w])
img_loc = 0
# 差异,同主色调最大差异为255*3
dif = 255 * 3
# 遍历色调表,查找差异最小的图片
for index in range(colors.__len__()):
if fitColor(dominant, colors[index]) < dif:
dif = fitColor(dominant, colors[index])
# 色调列表同图片列表的位置是一致的,所以我们获取色调下标即可
img_loc = index
# 读取差异最小的图片,img_list[img_loc]为差异最小的图片
box_im = cv2.imdecode(np.fromfile(img_list[img_loc], dtype=np.uint8), -1)
# 转换成合适的大小
box_im = cv2.resize(box_im, (box_w, box_h))
# 铺垫色块
im[start_y:start_y+box_h, start_x:start_x+box_w] = box_im
j += box_w
i += box_h
# 返回结果图
return im
首先我们看看传入的参数都是什么含义:
im_path : 底图的路径
imgs_path : 图片列表的根目录
box_size : 像素块的大小
multiple=1 : 图片的缩放大小,默认为1
前面两个参数非常好理解。对于box_size
参数的解释就是效果图四种,每张照片的尺寸,因为我全部以正方形处理,所以只有一个大小。而multiple
参数则是缩放大小,当我们底图为50*50
没有设置缩放时,结果图也是50*50
,当我们将缩放设置为2,结果图则为100*100
。因为图片太小的话看不到像素块中的图片,所以利用缩放让效果更好,但是缩放值设置过大的话图片内存会大许多。其它部分的解释都在代码中了。最后再给大家看一张效果图:
因为事先效果不是非常乐观,所以给大家看一张朦胧的效果图。感兴趣的读者可以关注我的个人公众号:ZackSock。如果觉得文章有帮助可以动动小手点个赞哈~