一、OpenCV简介
1.图像
(1)图:物体反射或透射光的分布。
(2)像:人的视觉系统所接受的图在人脑中所形成的印象或认识·····
2.模拟图像和数字图像
(1)模拟图像(连续存储的数据):通过某种物理量(光,电子等)的强弱变化来记录图像亮度信息,是连续变化的,容易受到干扰。
(2)数字图像(分级存储的数据):用0/1来记录信息,包含0~255灰度;0表示最黑,255表示最白。
3.图像的分类
(1)二值图像:二维矩阵仅由0、1构成,0表示黑色,1表示白色。通常用于文字、线条图的扫描识别(OCR)和掩膜图像的存储。
(2)灰度图像:灰度图像在黑色和白色之间的许多级的颜色深度。
(3)彩色图像:每个像素通常由红(R)、绿(G)、蓝(B)三个分量来表示,分量介于(0,255);通常用于表示和存放真彩色图像。
4.OpenCv
OpenCv:计算机视觉的开源库
优势:
(1)支持多种编程语言
(2)跨平台
(3)活跃的开发团队
(4)丰富非API
5.OpenCV的模块
(1)core:最核心的数据结构
(2)highgui:视频与图像的读取、显示、存储
(3)imgproc:图像处理的基础方法
(4)features2d:图像特征以及特征匹配
二、OpenCV基本操作
1. 图像的IO操作
1.1 读取图像
语法:cv.imread()
参数:
(1)要读取的图像
(2)读取方式的标志:1(彩色图),0(灰度图),-1(alpha通道)
注意:如果加载的路径有错误,不会报错,会返回一个None值
1.2 显示图像
语法:cv.imshow()
参数:
(1)显示图像的窗口名称,以字符串类型显示
(2)要加载的图像
注意:
(1)在调用显示图像的语法后,要调用cv.waitKey()给图像绘制留下时间,否则窗口会出现无响应且图像无法显示;0表示永远的等待
(2)也可以使用matplotlib对图像进行显示
1.3 保存图像
语法:cv.imwrite()
参数:
(1)文件名,要保存在哪里
(2)要保存的图像
import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
#1. 读取图像
img=cv.imread('nice.jpg',0)
#2. 显示图像
#2.1 OpenCV
# cv.imshow('nice',img)
# cv.waitKey(0)
# cv.destroyAllWindows()
#2.2 matplotlib
plt.imshow(img,cmap=plt.cm.gray) #灰度图显示
plt.show()
#3. 保存图像
cv.imwrite('wownice.png',img)
2. 绘制几何图形
2.1 绘制直线
语法:cv.line(img,start,end,color,thickness)
参数:
(1)img:要绘制直线的图像
(2)start,end:直线的起点和终点
(3)color:线条的颜色
(4)thickness:线条宽度
2.2 绘制圆形
语法:cv.circle(img,centerpoint,r,color,thickness)
参数:
(1)img:要绘制直线的图像
(2)centerpoint,r:圆心和半径
(3)color:线条的颜色
(4)thickness:线条宽度,为-1时生成闭合图案并填充颜色
2.3 绘制矩形
语法:cv.rectangle(img,leftupper,rightdown,color,thickness)
参数:
(1)img:要绘制直线的图像
(2)leftupper,rightdown:矩形的左上角和右下角坐标
(3)color:线条的颜色
(4)thickness:线条宽度
2.4 向图像中添加文字
语法:cv.putText(img,text,station,font,fontsize,color,thickness,cv.LINE_AA)
参数:
(1)img:图像
(2)text:要写入的文本数据
(3)station:文本的放置位置
(4)font:字体
(5)fontsize:字体大小
(6)color:线条的颜色
(7)thickness:线条宽度
#1. 创建图像
img=np.zeros((512,512,3),np.uint8)
#2. 绘制图像
cv.line(img,(0,0),(511,511),(255,0,0),5) #绘制直线
cv.circle(img,(256,256),60,(0,0,255),-1) #绘制圆形
cv.rectangle(img,(100,100),(400,400),(0,255,0),5) #绘制矩形
cv.putText(img,"hello",(100,150),cv.FONT_HERSHEY_COMPLEX_SMALL,5,(255,255,255),3) #添加文字
#3. 显示结果
plt.imshow(img[:,:,::-1])
plt.show()
3.获取并修改图像中的像素点
可以通过行和列的坐标值来获取该像素点的像素值,对于BGR图像,返回一个蓝、绿,红的数组,对于灰度图像,仅返回相应的强度值。
4. 获取图像的属性
(1)形状:img.shape
(2)图像大小:img.size
(3)数据类型:img.dtype
5. 图像通道的拆分与合并
(1)拆分:cv.split() b,g,r=cv.split(img)
(2)合并:cv.merge() img=cv.merge((b,g,r))
6. 色彩空间的改变
语法:cv.cvtColor(input_image,flag)
参数:
(1)input_image:进行颜色空间转换的图像
(2)flag:转换类型