此次发布有DNN模块对ONNX Attention、Einsum等层的支持、新的fastGEMM实现、transformers的实验性支持等诸多亮点。
(来自OpenCV中国团队以及中国社区的贡献以标出)
DNN模块:
实验性transformers支持
#24476 ONNX Attention层支持
#24037 ONNX Einsum层支持
#23987 OpenVINO后端对INT8模型的支持
#24092 ONNX Gather Elements层支持
#24378 ONNX InstanceNorm layer层支持
#24295 用cv::broadcast对ONNX Expand层重构
#24463 #24577 #24483 改进DNN图融合
#23897 #24694 #24509 新的fastGEMM实现
#23654 ARM上Winograd fp16的优化
Yolo系列模型支持的测试和bug修复
CUDA后端新的层的支持和bug修复: GEMM, Gelu, Add
#24462 CANN后端: bug修复, HardSwish, LayerNormalization和InstanceNormalization的支持
#24552 OpenVINO, OpenCL和CUDA后端LayerNormalization的支持
Core模块:
Objdetect模块:
#24364 修复QR码编码器版本估计的bug
#24355 使用动态窗口的更准确的ArUco标记角点细化
#24479 ArUco中过滤轮廓的bug修复
#24598 Android的QR码检测示例
ArUco标记, Charuco板及QR码的bug修复和文档更新
Video:
Calibration模块:
棋盘格标定中的多个修复和改进
#23025 修复标定中stdDev的计算问题
#24482 修复findEssentialMat使用USAC时的bug
#24527 修复cv::cornerSubPix中超出图像的访问
#23607 Fixed ap3p中的崩溃
#24035 修复stereoRectify图像边界
#24211 修复essential_solver.cpp中的"use after free"问题
Python Bindings:
对丢失的类型和手动封装的类型添加了类型存根生成
#24026 Numpy数组添加只读标志处理
#24028 修复了模块内的异常处理和绑定
#23958 改进了Numpy数组类型处理中的错误消息
#24468 修复了 Python 中的构造函数文档
Android:
在Maven Central发布新的Android Archive Package (AAR)
新的Android示例: QR码检测,视频IO;更新DNN和Face Detector示例
改用Gradle 7.6.3
平台支持:
其他:
自OpenCV 4.9.0起,OpenCV Model Zoo (https://github.com/opencv/opencv_zoo) 将与opencv同步发布。
Documentation
Sources
OpenCV中国团队是OpenCV在中国的开发团队,非营利目的,致力于OpenCV的开发、维护和推广工作。
函数cv.imread用于从指定文件加载图像并返回该图像的矩阵。
函数原型
cv.imread(filename[, flags=IMREAD_COLOR]) → retval
参数说明
注意问题
(1) 在OpenCV中,最常用的图像数据结构是C++语言定义的Mat类。在Python语言中,Mat类的对象创建和操作是通过Numpy数组实现的。OpenCV对图像的任何操作,本质上都是对 Numpy数组的运算。
(2) OpenCV读取图像文件,返回值是二维或三维Numpy数组。当读取灰度图像时,返回值是形为(h,w)的二维数组;当读取彩色图像时,返回值是形为(h,w,ch)的三维数组。
(3) 如果无法读取图像(如文件不存在、权限不正确、格式不被支持或无效),并不会有报错提示,而会返回一个空矩阵。
(4) 该函数不支持带有中文或空格的文件路径和文件名,但也不会出现报错提示。当必须使用中文路径或文件名时,可以使用函数cv.imdecode 处理,具体参见【例程0103】。
(5) 在OpenCV中,使用的彩色图像为BGR格式的图像,读取图像文件后,图像文件可按B/G/R的顺序存储为多维数组。PIL、PyQt、Matplotlib 等库使用的是RGB格式的图像,图像文件按R/G/B的顺序存储。
(6) 该函数默认忽略图像的透明通道(Alpha通道),通过设置参数flags=IMAGE_
UNCHANGED可以读取透明通道。
(7) 对于彩色图像文件,该函数默认按彩色图像格式读取,也可以通过设置flags=0读取为灰度图像格式。将彩色图像格式读取为灰度图像格式,本质上是读取的彩色图像,并将彩色图像转换为灰度图像。
(8) 目前支持的文件及扩展名如下。
◎ Windows 位图:.bmp、.dib。
◎ JPEG 文件:.jpeg、.jpg、.jpe。
◎ JPEG 2000文件:.jp2。
◎ 便携式网络图形:.png。
◎ WebP:.webp。
◎ 便携式图像:.pbm、.pgm、.ppm、.pxm、.pnm。
◎ TIFF 文件:.tiff、.tif。
函数cv.imwrite可以基于扩展名的格式将图像保存到指定文件。
函数原型
cv.imwrite(filename, img[,params]) → retval
参数说明
本例程用OpenCV读取和保存图像文件,注意读取图像文件时的参数设置。
# 【0101】用OpenCV 读取和保存图像文件
import cv2 as cv
if __name__ == '__main__':
# 读取图像文件,支持 BMP、JPG、PNG、TIFF 等常用格式
filepath = "../images/Lena.tif" # 读取图像文件的路径
img = cv.imread(filepath, flags=1) # flags=1 读取彩色图像文件(BGR)
gray = cv.imread(filepath, flags=0) # flags=0 读取为灰度图像
saveFile = "../images/imgSave1.png" # 保存图像文件的路径
cv.imwrite(saveFile, img, [int(cv.IMWRITE_PNG_COMPRESSION), 8])
cv.imwrite("../images/imgSave2.png", gray)
程序说明
(1) 本例程读取的图像文件是彩色图像文件。读取为彩色图像时可以设置flags=1,也可以省略;读取为灰度图像时必须设置flags=0。
(2) 读取和保存图像文件可以使用相对路径或绝对路径。
(3) 读取文件时要注意检查指定路径的图像文件是否存在。
本例程使用函数cv.imdecode从指定的内存缓存中读取数据,并将数据转换为图像格式,用于从网络传输数据中恢复图像。
# 【0102】从网络地址读取图像文件
import cv2 as cv
import numpy as np
if __name__ == '__main__':
import urllib.request as request
response = request.urlopen\
("https://profile.csdnimg.cn/8/E/F/0_youcans") # 指定的 url 地址
imgUrl = cv.imdecode(np.array(bytearray(response.read()), dtype=np.uint8), -1)
cv.imshow("imgUrl", imgUrl) # 在窗口显示图像
key = cv.waitKey(5000) # 5000 毫秒后自动关闭
cv.destroyAllWindows()
程序说明
(1) 从网络地址读取图像文件不能使用函数cv.imread,而要使用函数cv.imdecode。
(2) 函数cv.imdecode能将图像编码为流数据,赋值到内存缓存中,以方便网络传输。
本例程用于读取/保存文件路径中带有中文字符的图像。
# 【0103】读取和保存文件路径中带有中文字符的图像
import cv2 as cv
import numpy as np
if __name__ == '__main__':
filepath = "../images/测试图01.tif" # 带有中文的文件路径和文件名
# img1 = cv.imread(filepath, flags=1) # 中文路径读取失败,但不会报错
img2 = cv.imdecode(np.fromfile(filepath, dtype=np.uint8), flags=-1)
saveFile = "../images/测试图02.tif" # 带有中文的保存文件路径
# cv.imwrite(saveFile, img2) # 中文路径保存失败,但不会报错
cv.imencode(".jpg", img2)[1].tofile(saveFile)
程序说明
如果读取/保存图像的路径和文件名中含有中文字符,则不能用函数cv.imread/cv.imwrite操作,可以使用函数cv.imdecode/cv.imencode处理。