最常见的色彩空间就是RGB
,人眼也是基于RGB
的色彩空间去分辨颜色的
OpenCV默认使用的是BGR
,BGR
和RGB
色彩空间的区别在于图片在色彩通道上的排列顺序不同
显示图片时要注意适配图片的色彩空间和显示环境的色彩空间:比如传入的图片是BGR色彩空间,显示环境是RGB色彩空间,就会出现颜色混乱的情况
HSV
,HSL
和YUV
HSV(HSB)
OpenCV用的最多的色彩空间就是HSV
Hue
:色相,即色彩,如红色、蓝色,用角度来度量,取值范围为0°~360°,从红色开始按照逆时针方向计算,红色为0°,绿色为120°,蓝色为240°Saturation
:饱和度, 表示颜色接近光谱色的程度。一种颜色,可以看成是某种光谱色与白色混合的结果。其中光谱色所占的比例愈大,颜色接近光谱色的程度就愈高,颜色的饱和度也就愈高。饱和度高,颜色则深而艳。光谱色的白光成分为0,饱和度达到最高。通常取值范围为0%~100%,值越大,颜色越饱和。Value(brightness)
: 明度. 明度表示颜色明亮的程度,对于光源色,明度值与发光体的光亮度有关;对于物体色,此值和物体的透射比或反射比有关。通常取值范围为0%(黑)到100%(白)。HSV
?方便OpenCV做图像处理.比如根据hue
的值就可以判断背景颜色.
HSL
HSL
和HSV
差不多
Hue
: 色相Saturation
: 饱和度Lightness
: 亮度HSL
在顶部是纯白的, 不管是什么颜色.
YUV
YUV
是一种颜色编码方法。常使用在各个视频处理组件中。 YUV
在对照片或视频编码时,考虑到人类的感知能力,允许降低色度的带宽(因为我们人眼分不出太多的颜色,因此可以节约带宽)
Y
”表示明亮度(Luminance或Luma),也就是灰阶值,以前的黑白电视就是只用Y调整灰度即可U
”和“V
”表示的则是色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。Y'UV
的发明是由于彩色电视与黑白电视的过渡时期。
Y'UV
最大的优点在于只需占用极少的带宽。
每4个Y
只有——>2个U
或者2个V
关键API cv2.cvtColor()
# 关键API cv2.cvtColor()
import cv2
# 定义一个回调函数callback——> 我们要使用trackbar滑块
def callback(value):
pass # 我们不需要功能实现 因此直接pass
# 创建窗口
cv2.namedWindow('color',cv2.WINDOW_NORMAL)
cv2.resizeWindow('color',640,480)
# 读取图片 ——> opencv读进来的格式默认是BGR的色彩空间
img = cv2.imread('./cat.jpeg')
# 定义颜色空间转化列表
color_spaces = [
# 记忆:所有颜色空间的转化都是以"COLOR"开头的
cv2.COLOR_BGR2RGBA , cv2.COLOR_BGR2BGRA ,# BGRA中的‘A’表示透明度
cv2.COLOR_BGR2GRAY , cv2.COLOR_BGR2HSV ,
cv2.COLOR_BGR2YUV
]
# 设置一个trackbar滑块
cv2.createTrackbar('trackbar' , 'color' , 0 , 4 , callback) # (trackbar的名字,在哪个窗口上实现,默认值,最大值)
# 不停地循环展示窗口
while True:
# 获取trackbar的值 ——> 转换成索引(用于选择颜色空间转换的形式)
index = cv2.getTrackbarPos('trackbar','color') # (trackbar的名字,窗口的名字)
# 进行颜色空间转化 ——> 把我们的img图片转换成对应的色彩
cvt__img = cv2.cvtColor( img , color_spaces[index] )
# 展示图片
cv2.imshow('color' , cvt__img)
# 退出的条件
key = cv2.waitKey(1)
if key == ord('q') or key == ord('Q'):
break
# 消除窗口
cv2.destroyAllWindows()
Mat是OpenCV在C++语言中用来表示图像数据的一种数据结构,在python中转化为numpy的darray
在python中Mat数据对应numpy的ndarray,使用numpy提供的深浅拷贝方法可以实现对Mat的拷贝
# 关于深浅拷贝
# 浅拷贝:仅仅是复制出一个“指针”,共同指向一份data数据 ——> data数据发生改变,浅拷贝的数据也会改变
# 深拷贝:完全复制出一份和原始数据一样的数据(包括data)——> data数据发生改变,深拷贝的数据不会发生改变!
# 因为在python中,图片数据已经包装成ndarray,而非mat
# 因此对ndarray的深浅拷贝 ——> 就是对mat的深浅拷贝
import cv2
import numpy as np
cv2.namedWindow('img',cv2.WINDOW_NORMAL)
cv2.resizeWindow('img',480,640)
# 读入图片
img = cv2.imread('./cat.jpeg')
# 浅拷贝
img2 = img.view() # 其底层数据的内存地址是一样的,仅仅是名字不一样而已
# 深拷贝
img3 = img.copy()
# 改变图片中某个位置的颜色,便于观察深浅拷贝结果
img[10:100,10:100] = [0,0,255] # 把img图像上[10:100,10::100]的位置颜色改为红色[0,0,255]
# 展示图片 ——> 我们让图片一起显示出来 np.hstack()使图像横向堆叠 ;np.vstack()使图像纵向堆叠
cv2.imshow( 'img' , np.hstack( (img,img2,img3) ) )
# 退出的条件
cv2.waitKey(0)
cv2.destroyAllWindows()
结果:
我们发现前两张图片的颜色给改了,而最后一张图片的颜色没有被修改——> 因为前两个是浅拷贝,所以它们的底层数据是一样的,而最后一个是深拷贝,是一份独立的数据
opencv的Mat在python中已经转换成了ndarray,通过ndarray的属性即可访问Mat图像的属性
import cv2
import numpy as np
img = cv2.imread('./cat,jpeg')
# shape 属性中包含了三个信息
# 高度、长度、通道数
print(img.shape)
# 图像占用空间计算
# 高度×长度×通道数
print(img.size)
# 图像中每一个图像的位深
print(img.dtype)
split(mat)
分割图像的色彩通道merge((ch1,ch2,ch3......))
融合多个色彩通道# 图像的分割与融合
import cv2
import numpy as np
# 导入一个全黑的图片
img = np.zeros((200,200,3),np.uint8)
# 分割通道 ——> 得到原图中三个通道的值
b , g , r = cv2.split(img)
# 修改颜色:分别改变b蓝色通道和g绿色通道的一小段数据
b[10:100 , 10:100] = 255
g[10:100 , 10:100] = 255
# 合并色彩通道 ——> 相当于创建一个新的图片(注意括号内要写元组,并且要按照BGR的顺序写入)
img2 = cv2.merge((b,g,r))
cv2.imshow('img',np.hstack((img,img2)))
# 我们也顺便展示一下b,g修改后的值,方便理解
cv2.imshow('b_and_g',np.hstack((b,g)))
cv2.waitKey(0)
cv2.destroyAllWindows()
结果:
先看色彩通道b
和色彩通道g
修改后的样子(我们将两幅图横向拼接在了一起)
由于我们创建的是全黑的图img = np.zeros((200,200,3),np.uint8)
,因此图像是全黑的,而我们把 [10:100 , 10:100] 区域内的值拉到最大,因此该区域就变白了
右半部分是将修改后的色彩通道重新叠加:由于我们把b蓝色通道
和g绿色通道
的部分值拉满了,对应蓝色和绿色的合成色即为上图的颜色
利用OpenCV提供的绘制图形API可以轻松地在图像上绘制各种图形,比如直线、矩形、圆、椭圆等图形
line(img, pt1, pt2, color, thickness, lineType, shift)
画直线
img
::在哪个图像上画线pt1, pt2
: 开始点, 结束点. 指定线的开始与结束位置color
::颜色thickness
: 线宽lineType
: 线型.线型为-1, 4, 8, 16, 默认为8shift
: 坐标缩放比例.# 绘制直线
import cv2
import numpy as np
# 创建一个纯黑的背景图 用于画图
img = np.zeros((480,640,3),np.uint8)
# 画一条直线:line(img, pt1, pt2, color, thickness, lineType, shift) ——> 位置参数pt1、pt2,颜色color必须为元组形式
cv2.line(img,(10,20),(300,400),(0,0,255),5,4)
cv2.line(img,(10,20),(400,700),(0,0,255),5,18) # lineType越小,线的锯齿状越明显,且值必须是2的幂次方
# 展示图片
cv2.imshow('draw',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
结果:
rectangle(img, pt1, pt2, color, thickness, lineType, shift)
参数同上— 画矩形
# 绘制矩形
import cv2
import numpy as np
# 创建一个纯黑的背景图 用于画图
img = np.zeros((480,640,3),np.uint8)
# 画一个矩形:(和画直线的参数一样
cv2.rectangle(img,(80,200),(300,400),(0,0,255),5,4)
cv2.rectangle(img,(100,200),(200,300),(0,255,255),5,18) # lineType越小,线的锯齿状越明显,且值必须是2的幂次方
# 展示图片
cv2.imshow('draw',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
结果:
注意:
如果想填充矩形框,使之变成实心矩形,只需要将thickness = -1
即可
# 绘制矩形
import cv2
import numpy as np
# 创建一个纯黑的背景图 用于画图
img = np.zeros((480,640,3),np.uint8)
# 画一个矩形:(和画直线的参数一样
cv2.rectangle(img,(80,200),(300,400),(0,0,255),5,4)
cv2.rectangle(img,(100,200),(200,300),(0,255,255),5,18) # lineType越小,线的锯齿状越明显,且值必须是2的幂次方
img2 = img.copy()
cv2.rectangle(img2,(80,200),(300,400),(0,0,255),-1,4)
cv2.rectangle(img2,(100,200),(200,300),(0,255,255),-1,18) # lineType越小,线的锯齿状越明显,且值必须是2的幂次方
# 展示图片
cv2.imshow('draw',np.hstack((img,img2)))
cv2.waitKey(0)
cv2.destroyAllWindows()
circle(img, center, radius, color[, thickness[, lineType[, shift]]])
:中括号内参数表示可选参数
center
:圆形坐标radius
:半径# 绘制圆
import cv2
import numpy as np
# 创建一个纯黑的背景图 用于画图
img = np.zeros((480,640,3),np.uint8)
img2 = img.copy()
# 画一个圆:需要传入圆心、半径
cv2.circle(img,(320,240),100,(0,150,255),10) # 中括号[]内的参数可以不写,有默认值
# 展示图片
cv2.imshow('draw',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
结果:
注意:和绘制矩形一样,如果想要画出一个实心的圆,只需要让thickness = -1
即可
# 绘制圆
import cv2
import numpy as np
# 创建一个纯黑的背景图 用于画图
img = np.zeros((480,640,3),np.uint8)
img2 = img.copy()
# 画一个圆:需要传入圆心、半径
cv2.circle(img,(320,240),100,(0,150,255),10) # 中括号[]内的参数可以不写,有默认值
cv2.circle(img2,(320,240),100,(0,150,255),-1) # 中括号[]内的参数可以不写,有默认值
# 展示图片
cv2.imshow('draw',np.hstack((img,img2)))
cv2.waitKey(0)
cv2.destroyAllWindows()
关键API:ellipse(img, center, axes, angle, startAngle, endAngle, color[, thickness[, lineType[, shift]]])
img
:图像center
:椭圆圆心 ——> 用元组表示axes
:是轴axis的复数,表示横轴X,纵轴Y的长短——>X在前Y在后 (用元组表示)angle
:椭圆的角度(顺时针偏转)startAngle
&endAngle
:控制显示的角度,如果是0,360表示显示整个椭圆(椭圆是从右顶点开始顺时针画的)# 绘制椭圆
import cv2
import numpy as np
# 创建一个纯黑的背景图 用于画图
img = np.zeros((480,640,3),np.uint8)
# 画一个圆:需要传入圆心、半径
# ellipse(img, center, axes, angle, startAngle, endAngle, color[, thickness[, lineType[, shift]]])
# ellipse(img, 中心点, 长宽的一半, 角度, 从哪个角度开始, 从哪个角度结束,...)
cv2.ellipse(img,(320,240),(100,50),0,0,360,(0,0,255)) # 中括号[]内的参数可以不写,有默认值
# 展示图片
cv2.imshow('draw',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
角度为0°,从0-180
polylines(img, pts, isClosed, color[, thickness[, lineType[, shift]]])
画多边形
pts
:points的简写,是多边形的点集,并且这个点集必须是有符号32位的整形isClosed
:图形是否闭合# 绘制多边形
import cv2
import numpy as np
# 创建一个纯黑的背景图 用于画图
img = np.zeros((480,640,3),np.uint8)
# 绘制多边形
#polylines(img, pts, isClosed, color[, thickness[, lineType[, shift]]]) 画多边形
pts = np.array([(300,10),(150,100),(450,100)],np.int32) # 创建多边形的点集pts
cv2.polylines(img,[pts],True,(0,0,255),5,16) # 注意参数格式!!!pts要用"[]"
# 展示图片
cv2.imshow('draw',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
结果:
曲线闭合isClosed = True
曲线闭合isClosed = False
fillPoly(img, pts, color[, lineType[, shift[, offset]]])
画填充多边形(函数名P
要大写!)
# 绘制多边形
import cv2
import numpy as np
# 创建一个纯黑的背景图 用于画图
img = np.zeros((480,640,3),np.uint8)
# 绘制多边形
#polylines(img, pts, isClosed, color[, thickness[, lineType[, shift]]]) 画多边形
pts = np.array([(300,10),(150,100),(450,100)],np.int32) # 创建多边形的点集pts
cv2.fillPoly(img,[pts],False,(0,0,255),5,16) # 注意参数格式!!!pts要用"[]"
# 展示图片
cv2.imshow('draw',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
注意: 如果是绘制等腰矩形这些规则形状的图形,pts
中的点集一定要按顺时针或者逆时针顺序写入,否则无法绘制出目标图形
putText(img, text, org, fontFace, fontScale, color[, thickness[, lineType[, bottomLeftOrigin]]])
绘制文本
其中:
text
:要绘制的文本org
:文本框在图片中的左下角坐标fontFace
:字体类型(即字体)fontScale
:字体大小# 绘制多边形
import cv2
import numpy as np
# 创建一个纯黑的背景图 用于画图
img = np.zeros((480,640,3),np.uint8)
# 绘制文本putText(img, text, org, fontFace, fontScale, color[, thickness[, lineType[, bottomLeftOrigin]]]) 绘制文本
cv2.putText(img, 'Hello OpenCV' , (50,400) , cv2.FONT_HERSHEY_COMPLEX , 2,[0,0,255])# 注意!opencv只能显示英文字体-没有中文字体的包
# 展示图片
cv2.imshow('draw',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
如果想在系统图片上显示文本,则只用修改img = np.zeros((480,640,3),np.uint8) # 创建全黑图
为——> 导入系统中的图img = cv2.imread('./cat.jpeg')
即可
如果我们想在图片上展示中文字体,由于OpenCV没有方法来绘制中文,需要借助其他的包 ——> pillow
该方法和opencv没啥关系…
# 安装pillow
import cv2
import numpy as np
from PIL import ImageFont, ImageDraw, Image
# 生成一张纯白的图片
img = np.full((200, 200, 3), fill_value=255, dtype=np.uint8)
# 定义字体路径(有点多余说实话...) ——> 在我们的电脑C盘-Windows-Fonts-找到对应的文件拷贝到当前目录下
font_path = 'msyhbd.ttc' # 拷贝的字体文件
# 导入字体文件
my_font = ImageFont.truetype(font_path, 30) # 30为字体大小fontscal
# 创建一个pillow的图片
img_pil = Image.fromarray(img)
# 绘制该图片
draw = ImageDraw.Draw(img_pil)
# 利用draw绘制中文
draw.text((10, 150), '绘制中文', font=my_font, fill=(0, 255, 0, 0))
# 将格式重新变回ndarray,这样才能用opencv的工具cv2.imshow去显示
img = np.array(img_pil)
# 中文会显示问号
cv2.putText(img, '中文', (10, 100), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 1)
cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
写一个程序, 实现按L
键之后拖动鼠标绘制直线, 按R
键之后拖动鼠标绘制矩形, 按C
键拖动鼠标绘制圆形
# opencv控制鼠标
import cv2
import numpy as np
import math
# 设置此时画图的模式,由按键可改变
mode = 0
# 模式1:画直线 模式2:画矩形 模式3:画圆
# 定义鼠标的回调函数(函数名可以随便取,但是参数必须是五个!)
def mouse_callback(event,x,y,flags,userdata): # event:鼠标事件;xy:鼠标坐标;flags:鼠标的组合操作;userdata:传给用户的数据
global x_start,y_start # 要定义为全局!否则cv2.line()中读取不了
#print(event,x,y,flags,userdata)
# 增加功能:按下鼠标右键退出
if event == 2:
cv2.destroyAllWindows() # 窗口会闪一下 然后继续出现,其实我们是运行成功了,只不过下方是个死循环,会一直存在
# 增加功能:按下‘L’键后拖动鼠标绘制直线 (按下时记录此时鼠标的坐标—> 直线起点 松手时记录此时鼠标的坐标 —> 终点)
if mode == 1 and event == cv2.EVENT_LBUTTONDOWN :# 如果此时 "L" 被按下且鼠标左键也被按下没有松开
x_start,y_start = x,y # 记录此时的鼠标位置 —> 起始
elif mode == 1 and event == cv2.EVENT_MOUSEMOVE and flags == cv2.EVENT_FLAG_LBUTTON:# 在上面if按下左键的基础上,如果鼠标被拖动(event == cv2.EVENT_MOUSEMOVE)并且是左键(cv2.EVENT_FLAG_LBUTTON)
# 注意我们没有用到左键松开的事件!这可以让我们的笔迹跟随着鼠标,而不是单纯的拖动后才出现笔迹
#x_end,y_end = x,y # 记录此时的鼠标位置 —> 终止
print("正在绘制直线!")
cv2.line(img, (x_start,y_start), (x,y), [255,0,255], 5, 16) # 画直线
#cv2.line(img, (x_start,y_start), (x_end,y_end ), [0,255,255], 5, 16) # 记不记录终点信息都可以:我们时一直循环展示图片
# 增加功能:按下‘R’键后拖动鼠标绘制矩形
if mode == 2 and event == cv2.EVENT_LBUTTONDOWN :# 如果此时 "R" 被按下且鼠标左键也被按下没有松开
x_start,y_start = x,y # 记录此时的鼠标位置 —> 起始
elif mode == 2 and event == cv2.EVENT_MOUSEMOVE and flags == cv2.EVENT_FLAG_LBUTTON:# 在上面if按下左键的基础上,如果鼠标被拖动(event == cv2.EVENT_MOUSEMOVE)并且是左键(cv2.EVENT_FLAG_LBUTTON)
print("正在绘制矩形!")
cv2.rectangle(img, (x_start,y_start), (x,y), [0,255,255], -5, 16) # 画矩形
# 增加功能:按下‘C’键后点击图片,生成以点击位置为圆形,半径固定的圆
if mode == 3 and event == cv2.EVENT_LBUTTONDOWN :# 如果此时 "R" 被按下且鼠标左键也被按下没有松开
x_start,y_start = x,y # 记录此时的鼠标位置 —> 起始
elif mode == 3 and event == cv2.EVENT_MOUSEMOVE :# 在上面if按下左键的基础上,如果鼠标被拖动(event == cv2.EVENT_MOUSEMOVE)并且是左键(cv2.EVENT_FLAG_LBUTTON)
print("正在绘制圆!")
cv2.circle(img,( x_start,y_start),50,(255,255,255))
# 创建窗口
cv2.namedWindow('mouse',cv2.WINDOW_NORMAL)
cv2.resizeWindow('mouse',640,360) # 宽度(列)和高度(行)
# 设置鼠标的回调函数
cv2.setMouseCallback('mouse',mouse_callback,'123') # '123'为用户数据,会传到上方的参数userdata中
# 在我们生成的mouse的窗口上,做任何鼠标的操作,它都会去执行我们定义的mouse_callback()函数
# 生成一个全黑的图片(先行后列——> 要和上面反过来)
img = np.zeros((360,640,3),np.uint8) # np.zeros()生成全是0的图片 np.uint8表示0-255 u表示无符号
# 循环展示图片
while True:
cv2.imshow('mouse',img) # 展示刚才生成的全黑图片
# 用变量 "key" 来接受我们在键盘上按下的按键
key = cv2.waitKey(1)
if key == ord('q') or key == ord('Q'):
break
elif key == ord('l') or key == ord('L'): # 按下键盘上的 "L" 键,开始画直线
mode = 1 # 模式1:画直线
elif key == ord('r') or key == ord('R'): # 按下键盘上的 "R" 键,开始画矩形
mode = 2 # 模式2:画矩形
elif key == ord('c') or key == ord('C'): # 按下键盘上的 "C" 键,开始画矩形
mode = 3 # 模式3:画圆
cv2.destroyAllWindows()
怎么拖动鼠标画圆我还搞不出来目前实现的是点击屏幕,以点击位置为圆心,画出一个固定半径的圆