core | 核心模块,主要包含了OpenCV中最基本的结构(矩阵,点线和形状等),以及相关的基础运算/操作。 |
imgproc | 图像处理模块,包含和图像相关的基础功能(滤波,梯度,改变大小等),以及一些衍生的高级功能(图像分割,直方图,形态分析和边缘/直线提取等)。 |
highgui | 提供了用户界面和文件读取的基本函数,比如图像显示窗口的生成和控制,图像/视频文件的IO等。 |
video: | 用于视频分析的常用功能,比如光流法(Optical Flow)和目标跟踪等。 |
calib3d: | 三维重建,立体视觉和相机标定等的相关功能。 |
features2d: | 二维特征相关的功能,主要是一些不受专利保护的,商业友好的特征点检测和匹配等功能,比如ORB特征。 |
object: | 目标检测模块,包含级联分类和Latent SVM |
ml: | 机器学习算法模块,包含一些视觉中最常用的传统机器学习算法。 |
flann: | 最近邻算法库,Fast Library for Approximate Nearest Neighbors,用于在多维空间进行聚类和检索,经常和关键点匹配搭配使用。 |
gpu: | 包含了一些gpu加速的接口,底层的加速是CUDA实现。 |
photo: | 计算摄像学(Computational Photography)相关的接口,当然这只是个名字,其实只有图像修复和降噪而已。 |
stitching: | 图像拼接模块,有了它可以自己生成全景照片。 |
nonfree: | 受到专利保护的一些算法,其实就是SIFT和SURF。 |
contrib: | 一些实验性质的算法,考虑在未来版本中加入的。 |
legacy: | 字面是遗产,意思就是废弃的一些接口,保留是考虑到向下兼容。 |
ocl: | 利用OpenCL并行加速的一些接口。 |
superres: | 超分辨率模块,其实就是BTV-L1(Biliteral Total Variation – L1 regularization)算法 |
viz: | 基础的3D渲染模块,其实底层就是著名的3D工具包VTK(Visualization Toolkit)。 |
从使用的角度来看,和OpenCV2相比,OpenCV3的主要变化是更多的功能和更细化的模块划分。
#导入cv模块
import cv2 as cv
import numpy as np
# 可以在画面上绘制线段,圆,矩形和多边形等,还可以在图像上指定位置打印文字
import numpy as np
import cv2
# 定义一块宽1600,高1200的画布,初始化为白色
canvas = np.zeros((400, 600, 3), dtype=np.uint8) + 255 #(400, 600, 3) 宽,高,通道
# 画一条纵向的正中央的黑色分界线
cv2.line(canvas, (300, 0), (300, 399), (0, 0, 0), 2) #(300, 0) 宽,高
# 画一条右半部份画面以199为界的横向分界线
cv2.line(canvas, (300, 199), (599, 199), (0, 0, 0), 2) #(300, 0) 宽,高
# 左半部分的右下角画个红色的圆
cv2.circle(canvas, (150, 300), 88, (0, 0, 255), 5) #(80, 300), 100-》圆心,半径
# 左半部分的左下角画个蓝色的矩形
cv2.rectangle(canvas, (10, 300), (50, 390), (255, 0, 0), thickness=3) #(10, 10), (60, 60) 左上角坐标, 右下角坐标,
# 定义两个三角形,并执行内部绿色填充
triangles = np.array([
[(150, 240), (95, 333), (205, 333)],
[(60, 160), (20, 217), (100, 217)]])
cv2.fillPoly(canvas, triangles, (0, 255, 0))
# 画一个黄色五角星
# 第一步通过旋转角度的办法求出五个顶点
phi = 4 * np.pi / 5
rotations = [[[np.cos(i * phi), -np.sin(i * phi)], [i * np.sin(phi), np.cos(i * phi)]] for i in range(1, 5)]
pentagram = np.array([[[[0, -1]] + [np.dot(m, (0, -1)) for m in rotations]]], dtype=np.float)
# 定义缩放倍数和平移向量把五角星画在左半部分画面的上方
pentagram = np.round(pentagram * 80 + np.array([160, 120])).astype(np.int)
# 将5个顶点作为多边形顶点连线,得到五角星
cv2.polylines(canvas, pentagram, True, (0, 255, 255), 9)
# 按像素为间隔从左至右在画面右半部份的上方画出HSV空间的色调连续变化
for x in range(302, 600):
color_pixel = np.array([[[round(180*float(x-302)/298), 255, 255]]], dtype=np.uint8)
line_color = [int(c) for c in cv2.cvtColor(color_pixel, cv2.COLOR_HSV2BGR)[0][0]]
cv2.line(canvas, (x, 0), (x, 197), line_color)
# 如果定义圆的线宽大于半径,则等效于画圆点,随机在画面右下角的框内生成坐标
np.random.seed(42)
n_pts = 30
pts_x = np.random.randint(310, 590, n_pts) #x范围
pts_y = np.random.randint(210, 390, n_pts) #y范围
pts = zip(pts_x, pts_y)
# 画出每个点,颜色随机
for pt in pts:
pt_color = [int(c) for c in np.random.randint(0, 255, 3)]
cv2.circle(canvas, pt, 3, pt_color, 5)
# 在左半部分最上方打印文字,按此方法不能显示中文
# cv2.putText(canvas,
# '打印的文字just english',
# (5, 15),
# cv2.FONT_HERSHEY_SIMPLEX,
# 0.5,
# (0, 0, 0),
# 1)
# cv2.imshow('窗口名称', canvas)
# cv2.waitKey()
# OpenCV-Python在图片上输出中文
# 在Python中,可以借助PIL(Python Imaging Library)模块实现
from PIL import Image, ImageDraw, ImageFont
# 图像从OpenCV格式转换成PIL格式
pil_img = cv2.cvtColor(canvas,cv2.COLOR_BGR2RGB)#cv2和PIL中颜色的hex码的储存顺序不同,需转RGB模式
pilimg = Image.fromarray(pil_img)#Image.fromarray()将数组类型转成图片格式,与np.array()相反
draw = ImageDraw.Draw(pilimg)#PIL图片上打印汉字
#参数1:字体文件路径,参数2:字体大小;Windows系统“simhei.ttf”默认存储在路径:C:\Windows\Fonts中
font = ImageFont.truetype("SIMLI.TTF",30,encoding="utf-8")
draw.text((0,0),"打印的文字 English",(255,0,0),font=font)
cv2img = cv2.cvtColor(np.array(pilimg),cv2.COLOR_RGB2BGR)#将图片转成cv2.imshow()可以显示的数组格式
cv2.imshow("hanzi 汉字",cv2img) #显示窗口仍然不能显示汉字
cv2.waitKey()
cv2.destroyAllWindows()
代码结果:
#导入cv模块
import time
import cv2
import os
import sys
from itertools import cycle
# =====================OpenCV窗口显示===============================
# img = cv2.imread('D:/test/1.jpg')
# cv2.imshow('窗口标题', img)
# cv2.waitKey()
# =====================OpenCV窗口循环===============================
frame_path="D:/test" # 图片的文件夹路径
# 列出frames文件夹下的所有图片
filenames = os.listdir(frame_path)
# 通过itertools.cycle生成一个无限循环的迭代器,每次迭代都输出下一张图像对象
img_iter = cycle([cv2.imread(os.sep.join([frame_path, x])) for x in filenames])
key = 0
while key & 0xFF != 27:
cv2.imshow('window title', next(img_iter))
key = cv2.waitKey(1000) #1000为间隔1000毫秒 cv2.waitKey()参数不为零的时候则可以和循环结合产生动态画面
代码结果:
动态显示图片,无法截图了
#导入cv模块
import time
import cv2
import os
import sys
from itertools import cycle
# 定义鼠标事件回调函数
def on_mouse(event, x, y, flags, param):
# 鼠标左键按下,抬起,双击
if event == cv2.EVENT_LBUTTONDOWN:
print('左键按下 ({}, {})'.format(x, y))
elif event == cv2.EVENT_LBUTTONUP:
print('左键弹起 ({}, {})'.format(x, y))
elif event == cv2.EVENT_LBUTTONDBLCLK:
print('左键双击 ({}, {})'.format(x, y))
# 鼠标右键按下,抬起,双击
elif event == cv2.EVENT_RBUTTONDOWN:
print('右键按下 ({}, {})'.format(x, y))
elif event == cv2.EVENT_RBUTTONUP:
print('右键弹起 ({}, {})'.format(x, y))
elif event == cv2.EVENT_RBUTTONDBLCLK:
print('右键双击 ({}, {})'.format(x, y))
# 鼠标中/滚轮键(如果有的话)按下,抬起,双击
elif event == cv2.EVENT_MBUTTONDOWN:
print('中间键按下 ({}, {})'.format(x, y))
elif event == cv2.EVENT_MBUTTONUP:
print('中间键弹起 ({}, {})'.format(x, y))
elif event == cv2.EVENT_MBUTTONDBLCLK:
print('中间键双击 ({}, {})'.format(x, y))
# 鼠标移动
elif event == cv2.EVENT_MOUSEMOVE:
print('移动到 ({}, {})'.format(x, y))
# 为指定的窗口绑定自定义的回调函数
cv2.namedWindow('window title')
img = cv2.imread('D:/2.jpg')
cv2.imshow('window title', img)
cv2.setMouseCallback('window title', on_mouse) # 第一个参数为要绑定的窗口名称,第二个参数为要绑定的鼠标事件
cv2.waitKey()
代码结果:
#!/usr/bin/env python
# coding: utf-8
import numpy as np
import cv2
#可以读取带中文路径的图
def cv_imread(file_path,type=0):
cv_img=cv2.imdecode(np.fromfile(file_path,dtype=np.uint8),-1)
if(type==0):
if(len(cv_img.shape)==3):
cv_img = cv2.cvtColor(cv_img, cv2.COLOR_BGR2GRAY)
return cv_img
readPath="D:/测试/2.jpg"
image=cv_imread(readPath,type=1)
#将图片存储到带中文的路径里
savePath="D:/测试/3.jpg"
cv2.imencode('.jpg', image)[1].tofile(savePath)
代码结果: