一、计算机视觉
计算机视觉=图像处理+机器学习。图像处理技术用于将图像处理为适合进入机器学习模型中的输入,机器学习则负责从图像中识别出相关的模式。计算机视觉相关的应用非常的多,例如百度识图、手写字符识别、车牌识别等等应用。这个领域是应用前景非常火热的,同时也是研究的热门方向。随着机器学习的新领域深度学习的发展,大大促进了计算机图像识别的效果,因此未来计算机视觉界的发展前景不可估量。
二、OpenCV简介
OpenCV是计算机视觉领域应用最广泛的开源工具包,基于C/C++,支持Linux/Windows/MacOS/Android/iOS,并提供了Python,Matlab和Java等语言的接口,因为其丰富的接口,优秀的性能和商业友好的使用许可,不管是学术界还是业界中都非常受欢迎。
OpenCV最早源于Intel公司1998年的一个研究项目,当时在Intel从事计算机视觉的工程师盖瑞·布拉德斯基(Gary Bradski)访问一些大学和研究组时发现学生之间实现计算机视觉算法用的都是各自实验室里的内部代码或者库,这样新来实验室的学生就能基于前人写的基本函数快速上手进行研究。于是OpenCV旨在提供一个用于计算机视觉的科研和商业应用的高性能通用库。
三、OpenCV的结构
和Python一样,当前的OpenCV也有两个大版本,OpenCV2和OpenCV3。相比OpenCV2,OpenCV3提供了更强的功能和更多方便的特性。不过考虑到和深度学习框架的兼容性,以及上手安装的难度,这部分先以3.31版本为主进行介绍。
打开链接:https://opencv.org/releases.html
根据不同的系统下载不同的文件,我用的是MacBook,所以选择IOS pack,下载打开后如下图
根据功能和需求的不同,OpenCV中的函数接口大体可以分为如下部分:
core:核心模块,主要包含了OpenCV中最基本的结构(矩阵,点线和形状等),以及相关的基础运算/操作。
imgproc:图像处理模块,包含和图像相关的基础功能(滤波,梯度,改变大小等),以及一些衍生的高级功能(图像分割,直方图,形态分析和边缘/直线提取等)。
highgui:提供了用户界面和文件读取的基本函数,比如图像显示窗口的生成和控制,图像/视频文件的IO等。
如果不考虑视频应用,以上三个就是最核心和常用的模块了。针对视频和一些特别的视觉应用,OpenCV也提供了强劲的支持:
video:用于视频分析的常用功能,比如光流法(Optical Flow)和目标跟踪等。
calib3d:三维重建,立体视觉和相机标定等的相关功能。
features2d:二维特征相关的功能,主要是一些不受专利保护的,商业友好的特征点检测和匹配等功能,比如ORB特征。
object:目标检测模块,包含级联分类和Latent SVM
ml:机器学习算法模块,包含一些视觉中最常用的传统机器学习算法。
flann:最近邻算法库,Fast Library for Approximate Nearest Neighbors,用于在多维空间进行聚类和检索,经常和关键点匹配搭配使用。
gpu:包含了一些gpu加速的接口,底层的加速是CUDA实现。
photo:计算摄像学(Computational Photography)相关的接口,当然这只是个名字,其实只有图像修复和降噪而已。
stitching:图像拼接模块,有了它可以自己生成全景照片。
nonfree:受到专利保护的一些算法,其实就是SIFT和SURF。
contrib:一些实验性质的算法,考虑在未来版本中加入的。
legacy:字面是遗产,意思就是废弃的一些接口,保留是考虑到向下兼容。
ocl:利用OpenCL并行加速的一些接口。
superres:超分辨率模块,其实就是BTV-L1(Biliteral Total Variation – L1 regularization)算法
viz:基础的3D渲染模块,其实底层就是著名的3D工具包VTK(Visualization Toolkit)。
从使用的角度来看,和OpenCV2相比,OpenCV3的主要变化是更多的功能和更细化的模块划分。
四、安装开发环境
我使用的是Anaconda3 + python3.6 + Tensorflow + opencv3
1、Anaconda的安装
Mac OS系统:https://blog.csdn.net/ff_smile/article/details/78871294
Window系统:https://jingyan.baidu.com/article/eae078275a31851fec5485b8.html
liunx系统:https://www.jianshu.com/p/03d757283339
Anaconda和包的安装和使用教程:https://www.cnblogs.com/alummox/p/7887211.html
2、opencv的安装
Mac安装(其他包安装原理一样):
其他系统安装:https://www.cnblogs.com/minsons/p/7966190.html
五、图片的基础处理
1、引入opencv
import cv2
复制代码
2、引入图片
函数imread从指定文件加载图像并返回它。如果图像无法读取(由于文件丢失,权限不当,格式不受支持或格式无效),函数返回一个空矩阵(Mat :: data == NULL)
openCV目前支持的图片格式
- Windows位图文件 - BMP, DIB;
- JPEG文件 - JPEG, JPG, JPE;
- 便携式网络图片 - PNG;
- 便携式图像格式 - PBM,PGM,PPM;
- Sun rasters - SR,RAS;
- TIFF文件 - TIFF,TIF;
- OpenEXR HDR 图片 - EXR;
- JPEG 2000 图片- jp2。
# 1、文件的读取 2、封装格式解析 3、数据解码 4、数据加载
img = cv2.imread('canton.jpg',1)
复制代码
3、图片的读取和展示
cv2.imshow('image',img)
# jpg png 1、文件头 2、文件数据
cv2.waitKey (0)
# waitKey(0),以毫秒为单位延迟。0是指“永远”的特殊值
复制代码
4、图片的写入
cv2.imwrite('canton01.jpg',img)
复制代码
True
复制代码
5、不同图片的质量保存
图像占用内存空间的大小:分辨率 * 位深 / 8
分辨率:宽 * 高
位深度:指定图像中的每个像素可以使用的颜色信息数量。
每个像素使用的信息位数越多,可用的颜色就越多,颜色表现就更逼真。
例如:
一幅图像分辨率:1366*768,24位,则其大小计算如下:
大小 = 1366 * 768 * 24 / 8 = 3147264 byte = 3147 KB
cv2.imwrite('canton02.jpg',img,[cv2.IMWRITE_JPEG_QUALITY,50])
# JPG 的数值越低,压缩比越高,范围0~100
复制代码
结果:
True
复制代码
cv2.imwrite('canton03.png',img,[cv2.IMWRITE_PNG_COMPRESSION,0])
# PNG 的数值越低,压缩比越低,范围0~9
复制代码
结果:
True
复制代码
6、像素读取写入
(b,g,r) = img[123,100]
print(b,g,r)
复制代码
结果:
116 129 167
复制代码
7、添加像素
for i in range(1,100):
img[10 +i,100] = (255,0,0)
cv2.imshow('image',img)
cv2.waitKey(0)
复制代码
本文章,如有侵权,联系删除