weixin_39706367

opencv python教程简书_OpenCV Python 系列教程4 - OpenCV 图像处理（上）

import cv2

cv2.__version__

'3.4.1'

更改色彩空间

学习目标：

改变色彩空间

等。

创建一个应用程序来提取视频中的彩色对象

cv2.cvtColor(), cv2.inRange()

改变色彩空间

OpenCV 中有 150 多种色彩空间转化的方法，这里只讨论两种：

import cv2

import numpy as np

# OpenCV 中色彩空间的方法

flags = [i for i in dir(cv2) if i.startswith('COLOR_')]

flags

['COLOR_BAYER_BG2BGR',

'COLOR_BAYER_BG2BGRA',

'COLOR_BAYER_BG2BGR_EA',

'COLOR_BAYER_BG2BGR_VNG',

'COLOR_BAYER_BG2GRAY',

'COLOR_BAYER_BG2RGB',

'COLOR_BAYER_BG2RGBA',

'COLOR_BAYER_BG2RGB_EA',

'COLOR_BAYER_BG2RGB_VNG',

...

'COLOR_mRGBA2RGBA']

HSV的色相范围为[0,179]，饱和度范围为[0,255]，值范围为[0,255]。不同的软件使用不同的规模。如果要比较 OpenCV 值和它们，你需要标准化这些范围。

目标跟踪

HSV 和 HLV 解释

image

cap = cv2.VideoCapture(0)

while(1):

# 提取每一帧, frame 源视频

_, frame = cap.read()

# BGR -> HSV

hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)

# 在 HSV 中定义蓝色的范围

lower_blue = np.array([110, 50, 50], dtype=np.uint8)

upper_blue = np.array([130, 255, 255], dtype=np.uint8)

# 将 HSV 图像的阈值设置为只获取蓝色

mask = cv2.inRange(hsv, lower_blue, upper_blue)

# 把像素值在 lower_blue 和 upper_blue 之间的像素置 255(白)，之外的置 0（黑）

res = cv2.bitwise_and(frame, frame, mask=mask) # 白留黑除

cv2.imshow("frame", frame) # 源视频

cv2.imshow("hsv", hsv) #

cv2.imshow("mask", mask)

cv2.imshow("res", res)

k = cv2.waitKey(1) & 0xFF

if k == 27:

break

cap.release() # 记得释放掉捕获的视频

cv2.destroyAllWindows()

运行结果：该段程序的作用是检测蓝色目标，同理可以检测其他颜色的目标

结果中存在一定的噪音，之后的章节将会去掉它

image

这是物体跟踪中最简单的方法。一旦你学会了等高线的函数，你可以做很多事情，比如找到这个物体的质心，用它来跟踪这个物体，仅仅通过在相机前移动你的手来画图表，还有很多其他有趣的事情。

如何找到要跟踪的 HSV 值?

green = np.uint8([[[255, 0, 0]]])

hsv_green = cv2.cvtColor(green, cv2.COLOR_BGR2HSV)

hsv_green

array([[[120, 255, 255]]], dtype=uint8)

比如要找出绿色的 HSV 值，可以使用上面的程序，得到的值取一个上下界。如上面的取下界 [H-10, 100, 100]，上界 [H+10, 255, 255]

或者使用其他工具如 GIMP

更多例程（跟踪红色目标和绿色目标）

green = np.zeros([512, 512, 3], np.uint8)

green[:, :, 1] = 255

hsv_green = cv2.cvtColor(green, cv2.COLOR_BGR2HSV)

cv2.imshow("hsv_green", hsv_green)

cv2.waitKey(0)

cv2.destroyAllWindows()

红色目标

绿色目标

图像阈值

学习目标：

简单阈值处理、自适应阈值处理、 Otsu's 阈值处理

cv2.threshold, cv2.adaptiveThreshold

对图像进行阈值处理，算是一种最简单的图像分割方法，基于图像与背景之间的灰度差异，此项分割是基于像素级的分割

简单阈值处理

threshold(src, thresh, maxval, type[, dst]) -> retval, dst

src: 源图像，必须是灰度图

thresh：阈值，用于对像素的区分

maxval: 当像素大于等于阈值时，将像素赋值为 maxval

阈值样式：

cv2.THRESH_BINARY # 若源像素大于阈值，设置为 maxval，否则设置为 0

cv2.THRESH_BINARY_INV # 与上面相反，若源像素大于阈值，则将像素设置为 0，否则是设置为 maxval

cv2.THRESH_TRUNC # 若源像素大于阈值，设定为阈值, maxval 被忽略否则像素保持不变

cv2.THRESH_TOZERO # 若源像素大于阈值，保持像素不变，否则设置为 0， maxval 被忽略

cv2.THRESH_TOZERO_INV # 与上面相反，若源像素大于阈值，设置为 0，否则保持像素不变， maxval 被忽略

retval: 下面介绍

dst: 得到的图像

image

import cv2

import numpy as np

import matplotlib.pyplot as plt

img = cv2.imread("./sample_img/gradient.png", 0)

ret, thresh1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

ret, thresh2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)

ret, thresh3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)

ret, thresh4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)

ret, thresh5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)

titles = ['Original Image', 'BINARY',

'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']

images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]

for i in range(6):

plt.subplot(2, 3, i+1), plt.imshow(images[i], 'gray')

plt.title(titles[i])

plt.xticks([]), plt.yticks([])

plt.show()

image

自适应阈值处理

计算图像小区域的阈值。所以我们对同一幅图像的不同区域得到不同的阈值，这给我们在不同光照下的图像提供了更好的结果。

三个特殊的输入参数和一个输出参数

adaptiveThreshold(src, maxValue, adaptiveMethod, thresholdType, blockSize, C[, dst]) -> dst

Adaptive Method：

cv2.ADAPTIVE_THRESH_MEAN_C # 阈值是临近区域的平均值

cv2.ADAPTIVE_THRESH_GAUSSIAN_C # 阈值是权值为高斯窗口的邻域值的加权和。

thresholdType

THRESH_BINARY # 若源像素大于阈值，则像素赋值 maxval，否则为 0

THRESH_BINARY_INV # 与上面相反

Block Size：

决定临近区域的大小，

，取3，5，7等（取奇数）

C：

从计算的平均值或加权平均值中减去的一个常数。

import cv2

import numpy as np

from matplotlib import pyplot as plt

img = cv2.imread('./sample_img/dave.png', 0)

img = cv2.medianBlur(img, 5)

ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

# 若源像素大于阈值（阈值为临近区域的平均值减去常数），设置为 maxval，否则置 0

th2 = cv2.adaptiveThreshold(

img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 3, 4)

th3 = cv2.adaptiveThreshold(

img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 3, 4)

titles = ['Original Image', 'Global Thresholding (v = 127)',

'Adaptive Mean Thresholding', 'Adaptive Gaussian Thresholding']

images = [img, th1, th2, th3]

"""

cv2.imshow("th1", th1)

cv2.imshow("th2", th2)

cv2.imshow("th3", th3)

cv2.waitKey(0)

cv2.destroyAllWindows()

"""

for i in range(4):

plt.subplot(2, 2, i+1)

plt.imshow(images[i], 'gray')

plt.title(titles[i])

plt.xticks([]), plt.yticks([])

plt.show()

image

Otsu’s 二值化（不是很懂，先给个例子，后面再看）

import cv2

import numpy as np

from matplotlib import pyplot as plt

img = cv2.imread("./sample_img/noisy2.png", 0)

# global thresholding

ret1, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

# Otsu's thresholding

ret2, th2 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY+cv2.THRESH_OTSU)

# Otsu's thresholding after Gaussian filtering

blur = cv2.GaussianBlur(img, (5, 5), 0)

ret3, th3 = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY+cv2.THRESH_OTSU)

# plot all the images and their histograms

images = [img, 0, th1,

img, 0, th2,

blur, 0, th3]

titles = ['Original Noisy Image', 'Histogram', 'Global Thresholding (v=127)',

'Original Noisy Image', 'Histogram', "Otsu's Thresholding",

'Gaussian filtered Image', 'Histogram', "Otsu's Thresholding"]

for i in range(3):

plt.subplot(3, 3, i*3+1), plt.imshow(images[i*3], 'gray')

plt.title(titles[i*3]), plt.xticks([]), plt.yticks([])

plt.subplot(3, 3, i*3+2), plt.hist(images[i*3].ravel(), 256)

plt.title(titles[i*3+1]), plt.xticks([]), plt.yticks([])

plt.subplot(3, 3, i*3+3), plt.imshow(images[i*3+2], 'gray')

plt.title(titles[i*3+2]), plt.xticks([]), plt.yticks([])

plt.show()

image

更多资料

图像的几何变换

学习目标：

学习将不同的几何变换应用于图像，如平移、旋转、仿射变换等。

cv2.getPerspectiveTransform

变换

OpenCV 提供两种变换函数：cv2.warpAffine 和 cv2.warpPerspective

缩放

cv2.resize() 完成缩放

src: 输入的图像

dsize: 输出图像的大小，设置为 None 则由 fx, fy 决定

fx: 宽度的缩放比例

fy: 高度的缩放比例

interpolation：插值方法

INTER_NEAREST - 最近邻插值 (速度最快)

INTER_LINEAR - 双线性插值（默认）放大的效果还 OK ，速度较快

INTER_AREA - 使用像素区域关系重新采样。它可能是图像抽取的首选方法，因为它可以提供无莫尔条纹的结果。但是当图像被缩放时，它类似于 INTER_NEAREST 方法。缩小图像效果最好的方法

INTER_CUBIC - 4x4 像素邻域上的双三次插值放大的效果最好（慢）

INTER_LANCZOS4 - 8x8 像素邻域的 Lanczos 插值

dst: 输出图像

import cv2

import numpy as np

import matplotlib.pyplot as plt

def opencv2matplot(src):

"""

将 opencv 颜色通道转换成 matplot 的颜色通道

"""

b, g, r = cv2.split(src)

return cv2.merge([r, g, b])

img = cv2.imread("./sample_img/messi5.jpg")

# 方法一

res = cv2.resize(img, None, fx=2, fy=3, interpolation=cv2.INTER_CUBIC)

# 方法二

height, width = img.shape[:2]

res_2 = cv2.resize(img, (2*width, 2*height), interpolation=cv2.INTER_CUBIC)

images = [img, res, res_2]

img_title = ['Original', "method_1", "method_2"]

for i, img in enumerate(images):

plt.subplot(1, 3, i+1)

plt.imshow(opencv2matplot(img))

plt.title(img_title[i])

plt.show()

运行结果

image

%timeit -r 10 res = cv2.resize(img, None, fx=2, fy=3, interpolation=cv2.INTER_CUBIC)

%timeit -r 10 res = cv2.resize(img, None, fx=2, fy=3, interpolation=cv2.INTER_LINEAR)

%timeit -r 10 res = cv2.resize(img, None, fx=2, fy=3, interpolation=cv2.INTER_NEAREST)

%timeit -r 10 res = cv2.resize(img, None, fx=2, fy=3, interpolation=cv2.INTER_AREA)

%timeit -r 10 res = cv2.resize(img, None, fx=2, fy=3, interpolation=cv2.INTER_LANCZOS4)

13.5 ms ± 680 µs per loop (mean ± std. dev. of 10 runs, 100 loops each)

17.2 ms ± 2.2 ms per loop (mean ± std. dev. of 10 runs, 100 loops each)

12.1 ms ± 1.85 ms per loop (mean ± std. dev. of 10 runs, 100 loops each)

20.5 ms ± 7 ms per loop (mean ± std. dev. of 10 runs, 100 loops each)

79.3 ms ± 2.19 ms per loop (mean ± std. dev. of 10 runs, 10 loops each)

说明 : cv2.INTER_LINEAR 方法比 cv2.INTER_CUBIC 还慢，好像与官方文档说的不一致？有待验证。

速度比较： INTER_CUBIC > INTER_NEAREST > INTER_LINEAR > INTER_AREA > INTER_LANCZOS4

平移

改变图像的位置，创建一个 np.float32 类型的变换矩阵，

warpAffine(src, M, dsize[, dst[, flags[, borderMode[, borderValue]]]]) -> dst

src: 源图像

M：变换矩阵。

（列偏移）

（行偏移）就是要偏移的量

dsize: 输出图像的大小，形式如： (width, height)。width：列数， height：行数

import cv2

import numpy as np

img = cv2.imread('messi5.jpg', 0)

rows,cols = img.shape

M = np.float32([[1,0,100],[0,1,50]])

dst = cv2.warpAffine(img, M, (cols,rows))

cv2.imshow('img',dst)

cv2.waitKey(0)

cv2.destroyAllWindows()

运行结果：

image

旋转

旋转角度（

）是通过一个变换矩阵变换的：

OpenCV 提供的是可调旋转中心的缩放旋转，这样你可以在任何你喜欢的位置旋转。修正后的变换矩阵为

这里

OpenCV 提供了 cv2.getRotationMatrix2D 控制

cv2.getRotationMatrix2D(center, angle, scale) → retval

center: 源图像的旋转中心

angle: 角度的旋转。正值表示逆时针旋转(假设坐标原点为左上角)。

scale: 比例因子

img = cv2.imread("messi5.jpg", 0)

rows, cols = img.shape

M = cv2.getRotationMatrix2D((cols/2, rows/2), 90, 0.9)

# 设置旋转中心为源图像的图中心，逆时针旋转 90 度，缩放比例为 0.9

dst = cv2.warpAffine(img, M, (cols, rows))

cv2.imshow("img", img)

cv2.imshow("dst", dst)

cv2.waitKey(0)

cv2.destroyAllWindows()

运行结果

image

仿射变换

cv2.getAffineTransform(src, dst) → retval

src: 源图像中三角形顶点的坐标。

dst: 目标图像中相应三角形顶点的坐标。

retval: 得到一个矩阵 map_matrix

函数关系：

\begin{bmatrix} x'_i \ y'_i \end{bmatrix}\begin{bmatrix} x'_i \ y'_i \end{bmatrix} =

其中

例程 1

# 创建一个测试图片，便于观察

img = np.zeros((512, 512, 3), dtype=np.uint8) + 255

cv2.circle(img, (50, 50), 7, (255, 0, 0), -1)

cv2.circle(img, (200, 50), 7, (255, 0, 0), -1)

cv2.circle(img, (50, 200), 7, (255, 0, 0), -1)

cv2.imwrite("./sample_img/drawing_2.png", img)

cv2.imshow("img", img)

cv2.waitKey(0)

cv2.destroyAllWindows()

%matplotlib notebook

def opencv2matplot(src):

"""

将 opencv 颜色通道转换成 matplot 的颜色通道

"""

b, g, r = cv2.split(src)

return cv2.merge([r, g, b])

img = cv2.imread("./sample_img/drawing_2.png")

#img = cv2.resize(img, None, fx=0.2, fy=0.2, interpolation=cv2.INTER_NEAREST) # 源图片太大了，进行缩放

rows, cols, ch = img.shape

pts1 = np.float32([[50, 50], [200, 50], [50, 200]])

pts2 = np.float32([[10, 100], [200, 50], [100, 250]])

M = cv2.getAffineTransform(pts1, pts2)

dst = cv2.warpAffine(img, M, (cols, rows))

plt.subplot(1, 2, 1)

plt.imshow(img)

plt.subplot(1, 2, 2)

plt.imshow(dst)

plt.show()

cv2.imshow("img", img)

cv2.imshow("dst", dst)

cv2.waitKey(0)

cv2.destroyAllWindows()

运行结果：图上的点便于观察，两图中的红点是相互对应的

image

平移

import numpy as np

import cv2

import matplotlib.pyplot as plt

def opencv2matplot(src):

"""

将 opencv 颜色通道转换成 matplot 的颜色通道

"""

b, g, r = cv2.split(src)

return cv2.merge([r, g, b])

img = cv2.imread("./sample_img/drawing_2.png")

#img = cv2.resize(img, None, fx=0.2, fy=0.2, interpolation=cv2.INTER_NEAREST) # 源图片太大了，进行缩放

rows, cols, ch = img.shape

pts1 = np.float32([[50, 50], [200, 50], [50, 200]])

pts2 = np.float32([[100, 100], [250, 100], [100, 250]])

M = cv2.getAffineTransform(pts1, pts2)

dst = cv2.warpAffine(img, M, (cols, rows))

plt.subplot(1, 2, 1)

plt.imshow(img)

plt.subplot(1, 2, 2)

plt.imshow(dst)

plt.show()

透视转换

透视变换需要一个 3x3 变换矩阵。转换之后直线仍然保持笔直，要找到这个变换矩阵，需要输入图像上的 4 个点和输出图像上的对应点。在这 4 个点中，有 3 个不应该共线。通过 cv2.getPerspectiveTransform 计算得到变换矩阵，得到的矩阵 cv2.warpPerspective 变换得到最终结果。

img = cv2.imread("./sample_img/sudokusmall.png")

rows, cols, ch = img.shape

pts1 = np.float32([[73, 85], [488, 71], [36, 513], [518, 518]])

pts2 = np.float32([[0, 0], [350, 0], [0, 350], [350, 350]])

M = cv2.getPerspectiveTransform(pts1, pts2)

dst = cv2.warpPerspective(img, M, (350, 350))

cv2.imwrite("dst.png", dst)

plt.subplot(121),plt.imshow(img),plt.title('Input')

plt.subplot(122),plt.imshow(dst),plt.title('Output')

plt.show()

cv2.imshow("img", img)

cv2.imshow("dst", dst)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

更多资料

线性滤波：方框滤波、均值滤波、高斯滤波

平滑处理

平滑处理（smoothing）也称模糊处理（bluring）,是一种简单且使用频率很高的图像处理方法。平滑处理的用途：常见是用来减少图像上的噪点或失真。在涉及到降低图像分辨率时，平滑处理是很好用的方法。

图像滤波与滤波器

图像滤波：尽量保留图像细节特征的条件下对目标图像的噪声进行抑制，其处理效果的好坏将直接影响到后续图像处理和分析的有效性和可靠性。

消除图像中的噪声成分叫做图像的平滑化或滤波操作。信号或图像的能量大部分集中在幅度谱的低频和中频段，在高频段，有用的信息会被噪声淹没。因此一个能降低高频成分幅度的滤波器就能够减弱噪声的影响。

滤波的目的：抽出对象的特征作为图像识别的特征模式；为适应图像处理的要求，消除图像数字化时混入的噪声。

滤波处理的要求：不能损坏图像的轮廓及边缘等重要信息；图像清晰视觉效果好。

平滑滤波是低频增强的空间滤波技术，目的：模糊和消除噪音。

空间域的平滑滤波一般采用简单平均法，即求邻近像元点的平均亮度值。邻域的大小与平滑的效果直接相关，邻域越大平滑效果越好，但是邻域过大，平滑也会使边缘信息的损失的越大，从而使输出图像变得模糊。因此需要选择合适的邻域。

滤波器：一个包含加权系数的窗口，利用滤波器平滑处理图像时，把这个窗口放在图像上，透过这个窗口来看我们得到的图像。

线性滤波器

线性滤波器：用于剔除输入信号中不想要的频率或者从许多频率中选择一个想要的频率。

低通滤波器、高通滤波器、带通滤波器、带阻滤波器、全通滤波器、陷波滤波器

常用滤波器

方框滤波器 (boxblur 函数)

boxFilter(src, ddepth, ksize[, dst[, anchor[, normalize[, borderType]]]]) -> dst

src: 源图片

ddepth: 输出图像的深度， -1 代表使用原图深度

kesize: 核

dst: 输出图像

anchor：锚点，表示要处理的像素点 (-1, -1) 代表核的中心

normalize：表示内核是否被归一化，默认值: True 值为 True 时与 cv2.blur() 作用相同。

image

borderType：图像边缘处理参数

均值滤波是方框滤波归一化后的特殊情况。归一化就是要把处理的量缩放到一个范围内如 (0,1)，以便统一处理和直观量化。非归一化的方框滤波用于计算每个像素邻近内的积分特性，比如密集光流算法中用到的图像倒数的协方差矩阵。

import cv2

import numpy as np

img = cv2.imread("./sample_img/opencv-logo.png")

boxFilter = cv2.boxFilter(img, -1, (5, 5), normalize=False)

cv2.imshow("original", img)

cv2.imshow("boxFilter", boxFilter)

cv2.waitKey(0)

cv2.destroyAllWindows()

运行结果：

image

程序说明原理

# 构造一个例子进行说明

temp = np.array([i for i in range(25)], dtype=np.uint8).reshape(5, 5)

# cv2.BORDER_DEFAULT 是对边缘进行镜像操作

result = cv2.boxFilter(temp, -1, (3, 3), normalize=False)

print("temp:", temp, "result:", result, "copyMakeBorder:", cv2.copyMakeBorder(temp, 1, 1, 1, 1, cv2.BORDER_DEFAULT), sep='\n')

temp:

[[ 0 1 2 3 4]

[ 5 6 7 8 9]

[10 11 12 13 14]

[15 16 17 18 19]

[20 21 22 23 24]]

result:

[[ 36 39 48 57 60]

[ 51 54 63 72 75]

[ 96 99 108 117 120]

[141 144 153 162 165]

[156 159 168 177 180]]

copyMakeBorder:

[[ 6 5 6 7 8 9 8]

[ 1 0 1 2 3 4 3]

[ 6 5 6 7 8 9 8]

[11 10 11 12 13 14 13]

[16 15 16 17 18 19 18]

[21 20 21 22 23 24 23]

[16 15 16 17 18 19 18]]

均值滤波（ blur 函数）

均值滤波是典型的线性滤波算法，主要方法为邻域平均法，即用一片图像区域的各个像素的均值来代替原图像中的各个像素值。一般需要在图像上对目标像素给出一个模板（内核），该模板包括了其周围的临近像素（比如以目标像素为中心的周围8（3x3-1）个像素，构成一个滤波模板，即去掉目标像素本身）。再用模板中的全体像素的平均值来代替原来像素值。即对待处理的当前像素点（x，y），选择一个模板，该模板由其近邻的若干像素组成，求模板中所有像素的均值，再把该均值赋予当前像素点（x，y），作为处理后图像在该点上的灰度个g（x，y），即个g（x，y）=1/m ∑f（x，y），其中m为该模板中包含当前像素在内的像素总个数。

均值滤波本身存在着固有的缺陷，即它不能很好地保护图像细节，在图像去噪的同时也破坏了图像的细节部分，从而使图像变得模糊，不能很好地去除噪声点。

cv2.blur(src, ksize[, dst[, anchor[, borderType]]]) → dst

src：源图像

ksize：内核大小（k, k）

image

anchor: 锚点默认值点(- 1,1) 表示锚点位于内核中心。

borderType：用于外推图像像素的边界模式。一般使用默认值即可。

import cv2

import numpy as np

img = cv2.imread("./sample_img/opencv-logo.png")

blur = cv2.blur(img, (5, 5))

cv2.imshow("original", img)

cv2.imshow("blur", blur)

cv2.waitKey(0)

cv2.destroyAllWindows()

结果：

image

程序说明原理：图像边缘的处理

# 构造一个例子进行说明

temp = np.array([i for i in range(25)], dtype=np.uint8).reshape(5, 5)

# cv2.BORDER_DEFAULT 是对边缘进行镜像操作

result = cv2.blur(temp, (3, 3))

print("temp:", temp, "result:", result, "copyMakeBorder:", cv2.copyMakeBorder(temp, 1, 1, 1, 1, cv2.BORDER_DEFAULT), sep='\n')

temp:

[[ 0 1 2 3 4]

[ 5 6 7 8 9]

[10 11 12 13 14]

[15 16 17 18 19]

[20 21 22 23 24]]

result:

[[ 4 4 5 6 7]

[ 6 6 7 8 8]

[11 11 12 13 13]

[16 16 17 18 18]

[17 18 19 20 20]]

copyMakeBorder:

[[ 6 5 6 7 8 9 8]

[ 1 0 1 2 3 4 3]

[ 6 5 6 7 8 9 8]

[11 10 11 12 13 14 13]

[16 15 16 17 18 19 18]

[21 20 21 22 23 24 23]

[16 15 16 17 18 19 18]]

高斯滤波

高斯滤波：线性滤波，可以消除高斯噪声，广泛应用于图像处理的减噪过程。高斯滤波就是对整幅图像进行加权平均的过程，每一个像素点的值，都由其本身和邻域内的其他像素值经过加权平均后得到。高斯滤波的具体操作是：用一个模板（或称卷积、掩模）扫描图像中的每一个像素，用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值。

高斯滤波有用但是效率不高。

高斯模糊技术生成的图像，其视觉效果就像是经过一个半透明屏幕在观察图像，这与镜头焦外成像效果散景以及普通照明阴影中的效果都明显不同。高斯平滑也用于计算机视觉算法中的预先处理阶段，以增强图像在不同比例大小下的图像效果（参见尺度空间表示以及尺度空间实现）。从数学的角度来看，图像的高斯模糊过程就是图像与正态分布做卷积。由于正态分布又叫作高斯分布，所以这项技术就叫作高斯模糊。

高斯滤波器是一类根据高斯函数的形状来选择权值的线性平滑滤波器。高斯平滑滤波器对于抑制服从正态分布的噪声非常有效。

一维零均值高斯函数为:

高斯分布参数

决定了高斯函数的宽度。

对于图像处理来说，常用二维零均值离散高斯函数作平滑滤波器。二维高斯函数为：

image

高斯噪声的产生

图像传感器在拍摄时视场不够明亮、亮度不够均匀；

电路各元器件自身噪声和相互影响；

图像传感器长期工作，温度过高。

GaussianBlur(src, ksize, sigmaX[, dst[, sigmaY[, borderType]]]) -> dst

src: 源图片

ksize: 内核大小,。其中 ksize.width 和 ksize.height 可以不同，但他们都必须为正数和奇数。或者，它们可以是零的，它们都是由 sigma 计算而来。

sigmaX: 表示高斯核函数在 X 方向的的标准偏差。

dst：目标输出

sigmaY：表示高斯核函数在 Y 方向的的标准偏差。若 sigmaY 为零，就将它设为 sigmaX ，如果 sigmaX 和 sigmaY 都是 0，那么就由 ksize.width 和ksize.height 计算出来。

borderType: 边缘处理参数

import cv2

import numpy as np

img = cv2.imread("./sample_img/opencv-logo.png")

blur = cv2.GaussianBlur(img, (5, 5), 0)

cv2.imshow("original", img)

cv2.imshow("blur", blur)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

综合例程

import cv2

import numpy as np

def nothing(x):

pass

img_box = cv2.imread("./sample_img/opencv-logo.png")

img_blur = img_Gauusian = img_box

cv2.namedWindow("image_boxFilter")

cv2.namedWindow("image_blur")

cv2.namedWindow("image_GaussianBlur")

cv2.createTrackbar("boxFilter", "image_boxFilter", 1, 8, nothing)

cv2.createTrackbar("blur", "image_blur", 1, 8, nothing)

cv2.createTrackbar("GaussianBlur", "image_GaussianBlur", 1, 8, nothing)

while(1):

box_val = cv2.getTrackbarPos("boxFilter", "image_boxFilter")

blur_val = cv2.getTrackbarPos("blur", "image_blur")

guassian_val = cv2.getTrackbarPos("GaussianBlur", "image_GaussianBlur")

"""

if (box_val == 0) | (blur_val == 0) | (guassian_val == 0):

box_val = 1

blur_val = 1

guassian_val = 1

"""

img_box_dst = cv2.boxFilter(img_box, -1, (2*box_val+1, 2*box_val+1), normalize=False)

img_blur_dst = cv2.blur(img_blur, (2*blur_val+1, 2*blur_val+1))

"""

if guassian_val % 2 == 1:

img_Gauusian_dst = cv2.GaussianBlur(img_Gauusian, (guassian_val, guassian_val), 0)

else:

guassian_val = guassian_val+1

"""

img_Gauusian_dst = cv2.GaussianBlur(img_Gauusian, (2*guassian_val+1, 2*guassian_val+1), 0)

cv2.imshow("image_boxFilter", img_box_dst)

cv2.imshow("image_blur", img_blur_dst)

cv2.imshow("image_GaussianBlur", img_Gauusian_dst)

k = cv2.waitKey(1) & 0xFF

if k == 27:

break

cv2.destroyAllWindows()

几点说明：

以上所有滤波器的内核值不能为 0，故在程序中设置了当轨迹条值为 0 时，重置为 1。

高斯滤波器的内核值必须为奇数如：(1, 1)、(3, 3) 等，程序中设置当轨迹条为偶数时，加 1

非线性滤波：中值滤波、双边滤波

线性滤波容易构造，并且易于从频率响应的角度来进行分析。

许多情况，使用近邻像素的非线性滤波会得到更好的结果。比如在噪声是散粒噪声而不是高斯噪声，即图像偶尔会出现很大值的时候，用高斯滤波器进行图像模糊时，噪声像素不会被消除，而是转化为更为柔和但仍然可见的散粒。

中值滤波

中值滤波（Median filter）是一种典型的非线性滤波技术，基本思想是用像素点邻域灰度值的中值来代替该像素点的灰度值，该方法在去除脉冲噪声、椒盐噪声『椒盐噪声又称脉冲噪声，它随机改变一些像素值，是由图像传感器，传输信道，解码处理等产生的黑白相间的亮暗点噪声。椒盐噪声往往由图像切割引起。』的同时又能保留图像边缘细节，

中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术，其基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替，让周围的像素值接近的真实值，从而消除孤立的噪声点，对于斑点噪声（speckle noise）和椒盐噪声（salt-and-pepper noise）来说尤其有用，因为它不依赖于邻域内那些与典型值差别很大的值。中值滤波器在处理连续图像窗函数时与线性滤波器的工作方式类似，但滤波过程却不再是加权运算。

中值滤波在一定的条件下可以克服常见线性滤波器如最小均方滤波、方框滤波器、均值滤波等带来的图像细节模糊，而且对滤除脉冲干扰及图像扫描噪声非常有效，也常用于保护边缘信息, 保存边缘的特性使它在不希望出现边缘模糊的场合也很有用，是非常经典的平滑噪声处理方法。

与均值滤波比较：

优势：消除噪声和保护边缘的效果好

劣势：消耗的时间是均值滤波的 5 倍左右

说明：中值滤波在一定条件下，可以克服线性滤波器（如均值滤波等）所带来的图像细节模糊，而且对滤除脉冲干扰即图像扫描噪声最为有效。在实际运算过程中并不需要图像的统计特性，也给计算带来不少方便。但是对一些细节多，特别是线、尖顶等细节多的图像不宜采用中值滤波。

程序说明原理

image

疑问？图像的边缘中值滤波是如何处理的？

# 边缘处理

img = cv2.imread("./sample_img/pic2.png", 0)

img = img[0:5, 0:5]

result = cv2.medianBlur(img, 3)

img, result, cv2.copyMakeBorder(img, 1, 1, 1, 1, cv2.BORDER_DEFAULT)

(array([[239, 201, 241, 250, 214],

[255, 119, 255, 202, 219],

[255, 175, 236, 134, 195],

[254, 193, 216, 247, 156],

[219, 247, 248, 212, 168]], dtype=uint8),

array([[239, 239, 241, 241, 214],

[239, 239, 202, 219, 214],

[254, 236, 202, 216, 195],

[247, 236, 216, 212, 168],

[219, 247, 247, 212, 168]], dtype=uint8),

array([[119, 255, 119, 255, 202, 219, 202],

[201, 239, 201, 241, 250, 214, 250],

[119, 255, 119, 255, 202, 219, 202],

[175, 255, 175, 236, 134, 195, 134],

[193, 254, 193, 216, 247, 156, 247],

[247, 219, 247, 248, 212, 168, 212],

[193, 254, 193, 216, 247, 156, 247]], dtype=uint8))

中值滤波例程

import cv2

import numpy as np

img = cv2.imread("./sample_img/pic2.png")

median = cv2.medianBlur(img, 3)

cv2.imshow("img", img)

cv2.imshow("median", median)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

双边滤波

双边滤波（Bilateral filter）是一种非线性的滤波方法，是结合图像的空间邻近度和像素值相似度的一种折衷处理，同时考虑空域信息和灰度相似性，达到保边去噪的目的。具有简单、非迭代、局部的特点。

双边滤波器的好处是可以做边缘保存（edge preserving），一般过去用的维纳滤波或者高斯滤波去降噪，都会较明显地模糊边缘，对于高频细节的保护效果并不明显。双边滤波器顾名思义比高斯滤波多了一个高斯方差 sigma－d ，它是基于空间分布的高斯滤波函数，所以在边缘附近，离的较远的像素不会太多影响到边缘上的像素值，这样就保证了边缘附近像素值的保存。但是由于保存了过多的高频信息，对于彩色图像里的高频噪声，双边滤波器不能够干净的滤掉，只能够对于低频信息进行较好的滤波。

import cv2

import numpy as np

img = cv2.imread("./sample_img/pic2.png")

bilateralFilter = cv2.bilateralFilter(img, 9, 75, 75)

cv2.imshow("img", img)

cv2.imshow("bilateralFilter", bilateralFilter)

cv2.waitKey(0)

cv2.destroyAllWindows()

运行结果

image

形态学转换 1 - 腐蚀和膨胀

学习目标:

cv2.erode(), cv2.dilate(), cv2.morphologyEx()

理论

形态变换是基于图像形状的一些简单操作。它通常在二进制图像上执行。

膨胀与腐蚀实现的功能

消除噪声

分割（isolate）出独立的图像元素，在图像中连接（join）相邻的元素

寻找图像中的明显的极大值区域或极小值区域

求出图像的梯度

腐蚀

侵蚀的基本思想就像土壤侵蚀一样，它会侵蚀前景物体的边界（总是试图保持前景为白色）。那它是做什么的？内核在图像中滑动（如在2D卷积中）。只有当内核下的所有像素都是 1 时，原始图像中的像素（ 1 或 0 ）才会被视为 1 ，否则它将被侵蚀（变为零）

erode(src, kernel[, dst[, anchor[, iterations[, borderType[, borderValue]]]]]) -> dst

src: 源图像

kernel: 内核，通常结合 getStructuringElement(shape, ksize[, anchor]) -> retval 一起使用

shape: 内核的形状，可选参数

cv2.MORPH_RECT cv2.MORPH_CROSS cv2.MORPH_ELLIPSE

ksize：内核尺寸

anchor：锚点位置默认：(-1, -1) 内核形状的中心。注：十字形的 element 形状唯一依赖于锚点的位置，在其他情形，锚点只影响形态学运算结果的偏移

anchor：锚点位置

iterations: 迭代使用 erode 的次数，默认为 1

borderType：边界处理参数，默认 cv2.BORDER_DEFAULT

borderValue: 一般不用管它

dst：处理后的图像

import numpy as np

import cv2

img = cv2.imread("./sample_img/Morphology_Original_Image.png", 0)

# kernel = np.ones((5,5),np.uint8) # OpenCV 教程中使用的方法

kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (5, 5))

erosion = cv2.erode(img, kernel, iterations = 1)

cv2.imshow("img", img)

cv2.imshow("erosion", erosion)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

膨胀

与腐蚀的操作相反。如果内核下的至少一个像素为“1”，则像素元素为“1”。因此它增加了图像中的白色区域或前景对象的大小增加。通常，在去除噪音的情况下，侵蚀之后是扩张。因为，侵蚀会消除白噪声，但它也会缩小我们的物体。所以我们扩大它。由于噪音消失了，它们不会再回来，但我们的物体区域会增加。它也可用于连接对象的破碎部分

import numpy as np

import cv2

img = cv2.imread("./sample_img/Morphology_Original_Image.png", 0)

# kernel = np.ones((5,5), np.uint8)

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))

dilation = cv2.dilate(img, kernel, iterations = 1)

cv2.imshow("img", img)

cv2.imshow("dilation", dilation)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

直观例程

# 创建一个测试图像

img = np.zeros((10, 10), dtype=np.uint8)

img

# 画上一个圆

cv2.circle(img, (5, 5), 3, (255, 0, 0), -1)

img

# 图像边缘的处理

cv2.copyMakeBorder(img, 1, 1, 1, 1, cv2.BORDER_DEFAULT)

# 结果展示

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))

dilation = cv2.dilate(img, kernel, iterations = 1)

dilation

erosion = cv2.erode(img, kernel, iterations = 1)

erosion

形态学转换 2 - 开运算、闭运算、形态学梯度、顶帽、黑帽

morphologyEx(src, op, kernel[, dst[, anchor[, iterations[, borderType[, borderValue]]]]]) -> dst

src: 源图像

op: 形态学运算的类型

- cv2.MORPH_ERODE = 0 腐蚀

- cv2.MORPH_DILATE = 1膨胀

- cv2.MORPH_OPEN = 2 开运算

- cv2.MORPH_CLOSE = 3 闭运算

- cv2.MORPH_GRADIENT = 4 形态学梯度

- cv2.MORPH_TOPHAT = 5 顶帽

- cv2.MORPH_BLACKHAT = 6 黑帽

- cv2.MORPH_HITMISS = 7 hit or miss

kernel：内核

dst：输出

开运算

先腐蚀后膨胀的过程，对于滤除噪声很有用。

开运算可以用来消除小物体，在纤细点分离物体，并且在平滑较大物体的边界的同时不明显改变其面积。

import numpy as np

import cv2

img = cv2.imread("./sample_img/Opening_Original_Image.png", 0)

cv2.imshow("img", img)

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))

#opening = cv2.morphologyEx(img, cv2.MORPH_OPEN, kernel)

opening = cv2.morphologyEx(img, 2, kernel) # 同上

cv2.imshow("opening", opening)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

闭运算

先膨胀后腐蚀，它在去除前景对象内部的小洞或对象上的小黑点时非常有用。

import numpy as np

import cv2

"""

# 创建一个测试图片

for num in range(250):

i = np.random.randint(np.where(img==255)[0].shape[0])

img[np.where(img==255)[0][i], np.where(img==255)[1][i]] = 0

"""

img = cv2.imread("./sample_img/Closing_Original_Image.png", 0)

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))

closing = cv2.morphologyEx(img, 3, kernel)

cv2.imshow("img", img)

cv2.imshow("closing", closing)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

形态学梯度

膨胀图与腐蚀图之差，保留物体的边缘轮廓

# 例程 1

import numpy as np

import cv2

img = cv2.imread("./sample_img/Morphology_Original_Image.png", 0)

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))

gradient = cv2.morphologyEx(img, 4, kernel)

cv2.imshow("img", img)

cv2.imshow("gradient ", gradient)

cv2.waitKey(0)

cv2.destroyAllWindows()

# 例程 2

import numpy as np

import cv2

img = cv2.imread("./sample_img/Morphology_Original_Image.png", 0)

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))

gradient = cv2.morphologyEx(img, 4, kernel)

cv2.imshow("img", img)

cv2.imshow("gradient ", gradient)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

import numpy as np

import cv2

img = cv2.imread("./sample_img/img.jpg", 0)

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))

gradient = cv2.morphologyEx(img, 4, kernel)

cv2.imshow("img", img)

cv2.imshow("gradient ", gradient)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

顶帽（Top Hat）——“礼帽”

原图像和开运算的结果之差

开运算的效果是放大了裂缝或者局部地亮度的区域，顶帽的效果突出了比原图轮廓周围的区域更明亮的区域，该操作与内核的选择有关。

应用场景：分离比邻近点亮的一些斑块，在一幅画像具有大幅的背景而微小物品比较有规律的情况下，可以运用顶帽进行背景提取。

import numpy as np

import cv2

img = cv2.imread("./sample_img/Morphology_Original_Image.png")

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9, 9))

opening = cv2.morphologyEx(img, 2, kernel) # 同上

tophat = img - opening

tophat_2 = cv2.morphologyEx(img, cv2.MORPH_TOPHAT, kernel) # 同上

cv2.imshow("img", img)

cv2.imshow("tophat ", tophat)

cv2.imshow("tophat_2", tophat_2)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

黑帽

闭运算与原图之差

运算效果图突出了比原图轮廓周围的区域更暗的区域，与内核的选择有关

分离比邻近点暗的斑块

import numpy as np

import cv2

img = cv2.imread("./sample_img/cat.jpg")

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9, 9))

closing = cv2.morphologyEx(img, 3, kernel)

blackhat = closing - img

blackhat_2 = cv2.morphologyEx(img, cv2.MORPH_BLACKHAT, kernel) # 同上

cv2.imshow("img", img)

cv2.imshow("blackhat", blackhat)

cv2.imshow("blackhat_2", blackhat_2)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

结构元素

print("MORPH_RECT: \n", cv2.getStructuringElement(cv2.MORPH_RECT,(5,5)))

print("MORPH_ELLIPSE: \n", cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(5,5)))

print("MORPH_CROSS: \n", cv2.getStructuringElement(cv2.MORPH_CROSS,(5,5)))

更多资料

漫水填充（待续）

基本概念

定义

用特定颜色填充连通区域，通过设置可连通像素的上下限以及连通方式来达到不同的填充效果的方法

应用

用来标记或者分离图像的一部分，以便对其进行处理或者分析，也可以用来从输入图像获取掩码区域，掩码会加速处理过程，或者只处理掩码部分的像素点，操作的结果总是一个连续的区域。

基本思想与算法

漫水填充实例

import cv2

import numpy as np

img = cv2.imread("./sample_img/floodfill.jpg")

mask = np.zeros((img.shape[0]+2, img.shape[1]+2), dtype=np.uint8)

ret, dst, mask, rect = cv2.floodFill(img, mask, (155, 255), 255)

cv2.imshow("img", img)

cv2.imshow("dst", dst)

cv2.waitKey(0)

cv2.destroyAllWindows()

图像金字塔（主要用于图像分割）

学习目标：

了解 Image Pyramids

cv2.pyrDown(), cv2.pyrUp()

基本概念

在某些情况下，我们需要处理同一图像的不同分辨率的图像。例如，在搜索图像中的某些内容时，如脸部，我们不确定对象在图像中的大小。在这种情况下，我们需要创建一组具有不同分辨率的图像，并在所有图像中搜索对象。这些具有不同分辨率的图像被称为图像金字塔（因为它们被保存在堆叠中，底部最大图像，顶部最小图像看起来像金字塔）。

cv2.pyrDown(), cv2.pyrUp() 函数的功能和缩小，放大图片差不多，与 cv2.resize() 功能差不多，但它们分属不同的模块。

注意： pyrDown、pyrUp 两者不是一个互逆过程

类型

高斯金字塔：用来向下采样，主要的图像金字塔

拉普拉斯金字塔：用来从金字塔低层图像重建上层未采样图像，在图像处理中即预测残差，可以对图像最大程度的进行还原，配合高斯金字塔一起使用。

区别：高斯金字塔用来向下降采样图像，拉普拉斯金字塔则用来从底层图像中向上采样，重建一个图像。

向上采样——放大，向下采样——缩小

例程

import numpy as np

import cv2

img = cv2.imread("messi5.jpg")

down = cv2.pyrDown(img)

up = cv2.pyrUp(down)

cv2.imshow("img", img)

cv2.imshow("down", down)

cv2.imshow("up", up)

cv2.waitKey(0)

cv2.destroyAllWindows()

先对图像进行缩小，再对缩小后的图像进行放大，放大后的图像变得模糊了

image

img.shape, down.shape, up.shape

((342, 548, 3), (171, 274, 3), (684, 1096, 3))

image

图像金字塔进行图像混合（苹果和橙子混合）

基本原理

第一步

第二步

第三步

分步例程

import cv2

import numpy as np

import sys

A = cv2.imread('./sample_img/apple.jpg')

B = cv2.imread('./sample_img/orange.jpg')

# generate Gaussian pyramid for A

# 生成高斯金字塔，即一步一步缩小

G = A.copy()

gpA = [G]

for i in range(6):

G = cv2.pyrDown(G)

gpA.append(G)

# generate Gaussian pyramid for B

G = B.copy()

gpB = [G]

for i in range(6):

G = cv2.pyrDown(G)

gpB.append(G)

# 生成拉普拉斯金字塔，即在高斯金字塔变换后进行多次 pyrUp 函数变换

# generate Laplacian Pyramid for A

lpA = [gpA[5]]

for i in range(5, 0, -1):

GE = cv2.pyrUp(gpA[i])

L = cv2.subtract(gpA[i-1], GE)

lpA.append(L)

# generate Laplacian Pyramid for B

lpB = [gpB[5]]

for i in range(5, 0, -1):

GE = cv2.pyrUp(gpB[i])

L = cv2.subtract(gpB[i-1], GE)

lpB.append(L)

# Now add left and right halves of images in each level

LS = []

for la, lb in zip(lpA, lpB):

rows, cols, dpt = la.shape

ls = np.hstack((la[:, 0:cols//2], lb[:, cols//2:]))

LS.append(ls)

# now reconstruct

ls_ = LS[0]

for i in range(1, 6):

ls_ = cv2.pyrUp(ls_)

ls_ = cv2.add(ls_, LS[i])

# 直接进行连接的效果

# image with direct connecting each half

real = np.hstack((A[:, :cols//2], B[:, cols//2:]))

cv2.imshow('Pyramid_blending2.jpg', ls_)

cv2.imshow('Direct_blending.jpg', real)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

图像金字塔函数封装

import cv2

import numpy as np

def img_pyramids(src1, src2, num):

"""

src1: 图像 1

src2: 图像 2

num: 金字塔层数

"""

# 判断两张图片的大小是否匹配

if src1.shape == src2.shape:

# 找到 src1 和 src2 的高斯金字塔

src1_G = src1.copy() # 中间变量保存每次的变换值

src1_gp = [src1_G] # src1 的图像高斯金字塔

src2_G = src2.copy() # 中间变量保存每次的变换值

src2_gp = [src2_G] # src2 的图像高斯金字塔

for i in range(num):

src1_gp.append(cv2.pyrDown(src1_gp[i]))

src2_gp.append(cv2.pyrDown(src2_gp[i]))

# 从高斯金字塔找到拉普拉斯金字塔

src1_lp = [src1_gp[num-1]] # 拉普拉斯金字塔保存，最后一个高斯金字塔就是第一个拉普拉斯金字塔

src2_lp = [src2_gp[num-1]]

for i in range(num-1, 0, -1):

src1_lp.append(cv2.subtract(src1_gp[i-1], cv2.pyrUp(src1_gp[i])))

src2_lp.append(cv2.subtract(src2_gp[i-1], cv2.pyrUp(src2_gp[i])))

# 拉普拉斯各层金字塔进行合并

LS = []

for L1, L2 in zip(src1_lp, src2_lp):

rows, clos, ch = L1.shape

LS.append(np.hstack((L1[:, 0:clos//2], L2[:, clos//2:])))

ls = LS[0]

for i in range(1, num):

ls = cv2.pyrUp(ls)

ls = cv2.add(ls, LS[i])

return ls

else:

return -1

A = cv2.imread('./sample_img/apple.jpg')

B = cv2.imread('./sample_img/orange.jpg')

def nothing(x):

pass

cv2.namedWindow("result")

cv2.createTrackbar("num", "result", 0, 7, nothing) #

while(1):

num = cv2.getTrackbarPos("num", "result")

cv2.imshow("result", img_pyramids(A, B, num)) # num 不能太大，太大的话程序会报错，应该是图像太小后无法求高斯金字塔

k = cv2.waitKey(1) & 0xff

if k == 27:

break

cv2.destroyAllWindows()

image

更多资料

边缘检测

边缘检测的一般步骤：

滤波：边缘检测算法主要是基于图像强度的一阶和二阶导数，但导数通常对噪声很敏感，因此需要采用滤波来改善边缘检测器的性能。常用的滤波方法有高斯滤波。

增强：增强边缘的基础是确定图像各点邻域强度的变化值。增强算法可以将图像灰度点邻近强度值有显著变化的点凸显出来。通过计算梯度幅值来确定。

检测：通过增强的图像，往往邻域中有很多点的梯度值比较大，在特定应用中，这些点并不是要找的边缘点，所以应该采用某种方法来对这些点进行取舍，常用的方法是通过阈值化方法来检测。

学习目标

查找图像梯度，边缘等

cv2.Sobel(), cv2.Scharr(), cv2.Laplacian()

OpenCV 有三种类型的梯度滤波器或高通滤波器 Sobel, Scharr 和 Laplacian.

Sobel 算子

用于边缘检测的离散微分算子。结合律高斯平滑和微分求导，用来计算图像灰度函数的近似梯度，在图像的任何一点使用此算子，都会产生对应的梯度矢量或者其法向量。

Sobel 算子的计算过程

水平变化，设图像为 I

image

垂直变化

image

对图像的每个点进行处理，来得到导数的近似值

image

有时也有下面的结果来代替

image

Sobel 算子可以计算一阶，二阶，三阶或者混合图像差分

Sobel(src, ddepth, dx, dy[, dst[, ksize[, scale[, delta[, borderType]]]]]) -> dst

src: 原图像

ddepth: 输出图像的深度

src.depth() = CV_8U, ddepth = -1/CV_16S/CV_32F/CV_64F

src.depth() = CV_16U/CV_16S, ddepth = -1/CV_32F/CV_64F

src.depth() = CV_32F, ddepth = -1/CV_32F/CV_64F

src.depth() = CV_64F, ddepth = -1/CV_64F

dx: x 方向的差分阶数

dy: y 方向的差分阶数

ksize: 内核大小，必须是奇数，默认为 3

scale: 计算导数时可选的缩放因子，默认为 1 表示没有进行缩放

delta: 表示结果存入目标图, dst 参数

borderType: 边界处理参数

当内核为 3 时，Sobel 内核可能产生比较明显的误差，为此， OpenCV 提供了 Scharr 函数，该函数只作用与大小为 3 的内核，与 Sobel 函数一样快，但是精度更高。

Sobel 算子结合了高斯平滑和分化，因此结果具有抗噪性，大多数，使用 Sobel 函数时【dx=1, dy=0, ksize=3】来计算图像 X 方向的导数，dx=0, dy=1, ksize=3】来计算 Y 方向的导数。

%matplotlib notebook

import cv2

import numpy as np

import matplotlib.pyplot as plt

img = cv2.imread("./sample_img/dave.png", 0)

# laplacian = cv2.Laplacian(img, cv2.CV_64F)

sobelx = cv2.Sobel(img, cv2.CV_16S, 1, 0, ksize=3)

sobely = cv2.Sobel(img, cv2.CV_16S, 0, 1, ksize=3)

sobelx_abs = cv2.convertScaleAbs(sobelx) # 取绝对值

sobely_abs = cv2.convertScaleAbs(sobely)

dst = cv2.addWeighted(sobelx_abs, 0.5, sobely_abs, 0.5, 0) # 将 x, y 两个梯度的图像结合起来

"""

plt.subplot(2, 3, 1), plt.imshow(img, cmap='gray')

plt.title('Original'), plt.xticks([]), plt.yticks([])

plt.subplot(2, 3, 2), plt.imshow(laplacian, cmap='gray')

plt.title('Laplacian'), plt.xticks([]), plt.yticks([])

plt.subplot(2, 3, 3), plt.imshow(sobelx, cmap='gray')

plt.title('Sobel X'), plt.xticks([]), plt.yticks([])

plt.subplot(2, 3, 4), plt.imshow(sobely, cmap='gray')

plt.title('Sobel Y'), plt.xticks([]), plt.yticks([])

plt.subplot(2, 3, 5), plt.imshow(sobelx_abs, cmap='gray')

plt.title('sobelx_abs'), plt.xticks([]), plt.yticks([])

plt.subplot(2, 3, 6), plt.imshow(sobely_abs, cmap='gray')

plt.title('sobely_abs'), plt.xticks([]), plt.yticks([])

plt.show()

"""

cv2.imshow("img", img)

cv2.imshow("soblex", sobelx)

cv2.imshow("sobely", sobely)

cv2.imshow("sobelx_abs", sobelx_abs)

cv2.imshow("sobely_abs", sobely_abs)

cv2.imshow("Dst", dst)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

边缘检测函数封装

def sobel_edge(src, ddepth, ksize):

sobelx = cv2.Sobel(src, ddepth, 1, 0, ksize)

sobely = cv2.Sobel(src, ddepth, 0, 1, ksize)

sobelx_abs = cv2.convertScaleAbs(sobelx)

sobely_abs = cv2.convertScaleAbs(sobely)

dst = cv2.addWeighted(sobelx_abs, 0.5, sobely_abs, 0.5, 0)

return dst

def scharr_edge(src, ddepth):

scharrx = cv2.Scharr(src, ddepth, 1, 0, 3)

scharry = cv2.Scharr(src, ddepth, 0, 1, 3)

scharrx_abs = cv2.convertScaleAbs(scharrx)

scharry_abs = cv2.convertScaleAbs(scharry)

dst = cv2.addWeighted(scharrx_abs, 0.5, scharry_abs, 0.5, 0)

return dst

img = cv2.imread("./sample_img/dave.png", 0)

sobel_opt = sobel_edge(img, cv2.CV_64F, 3)

scharr_opt = scharr_edge(img, cv2.CV_64F)

cv2.imshow("img", img)

cv2.imshow("sobel_opt", sobel_opt)

cv2.imshow("scharr_opt", scharr_opt)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

OpenCV 数据类型问题（ cv2.CV_8U cv2.CV_32F 等）

在上一个示例中，输出数据类型是 cv2.CV_8U 或 np.uint8 。但是有一个小问题。黑到白的过渡被认为是正斜率(它有一个正值)，而白到黑的过渡被认为是负斜率(它有一个负值)。当你把数据转换成 np.uint8 ，所有负斜率都为 0 。简单地说，有一边缘不是很清晰。

解决方法：

如果希望同时检测这两条边，更好的选择是将输出数据类型保留为某些更高的形式，比如 cv2.CV_16S cv2.CV_64F 等，取其绝对值，然后转换回 cv2.CV_8U 。

import cv2

import numpy as np

# 创建一个示例图像

img = np.zeros((200, 200, 3), dtype=np.uint8)

cv2.rectangle(img, (50, 50), (150, 150), (255, 255, 255), -1)

# Output dtype = cv2.CV_8U

sobelx8u = cv2.Sobel(img, cv2.CV_8U, 1, 0, ksize=5)

# Output dtype = cv2.CV_64F. Then take its absolute and convert to cv2.CV_8U

sobelx64f = cv2.Sobel(img, cv2.CV_64F, 1, 0, ksize=5)

abs_sobel64f = np.absolute(sobelx64f)

sobel_8u = np.uint8(abs_sobel64f)

cv2.imshow("img", img)

cv2.imshow("sobelx8u", sobelx8u)

cv2.imshow("sobel_8u", sobel_8u)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

sobelx8u: 图像是经过 cv2.CV_8U 变换后的图像，一边的边缘消失了

sobel_8u: 图像经过 cv2.CV_64F 变换后再取绝对值

参考资料

Canny 边缘检测

学习目标：

Canny 边缘检测的概念

cv2.Canny()

基本概念

最优边缘检测的三个评价标准

低错误率：标识出尽可能多的实际边缘，同时减少噪声产生的误报。

高定位性：标识出的边缘要与图像中的实际边缘尽可能近。

最小响应：图像中的边缘只能标识一次，并且尽可能存在的图像噪声不应该标识为边缘。

Canny(image, threshold1, threshold2[, edges[, apertureSize[, L2gradient]]]) -> edges

image: 源图像

threshold1: 第一个滞后性阈值

threshold2: 第二个滞后性阈值

apertureSize: 表示应用 Sobel 算子的孔径大小

L2gradient: 计算图像梯度幅值的标识，布尔型，默认 False

初级用法

import cv2

import numpy as np

# 初级用法，直接调用函数

img = cv2.imread("./sample_img/messi5.jpg", 0)

canny_img = cv2.Canny(img, 100, 200)

cv2.imshow("img", img)

cv2.imshow("canny_img", canny_img)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

高级用法

# 高阶用法，灰度转化，降噪，使用 Canny ，得到的边缘作为掩码拷贝到原图上

img = cv2.imread("./sample_img/img.jpg")

img1 = img.copy()

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

blur_img = cv2.blur(gray, (5, 5))

canny_img = cv2.Canny(blur_img, 3, 9)

dst = cv2.bitwise_and(img1, img1, mask=canny_img)

cv2.imshow("img", img1)

cv2.imshow("blur_img", blur_img)

cv2.imshow("canny_img", canny_img)

cv2.imshow("dst", dst)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

轨迹条调节阈值例程

import cv2

import numpy as np

def nothing(x):

pass

cv2.namedWindow("dst")

cv2.createTrackbar("low", "dst", 0, 255, nothing)

cv2.createTrackbar("high", "dst", 0, 255, nothing)

while(1):

#img = cv2.imread("./sample_img/messi5.jpg")

img = cv2.imread("./sample_img/1.jpg")

low = cv2.getTrackbarPos("low", "dst")

high = cv2.getTrackbarPos("high", "dst")

img1 = img.copy()

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

blur_img = cv2.GaussianBlur(gray, (5, 5), 0)

canny_img = cv2.Canny(blur_img, low, high)

dst = cv2.bitwise_and(img1, img1, mask=canny_img)

cv2.imshow("img1", img1)

cv2.imshow("dst", dst)

k = cv2.waitKey(1) & 0xff

if k == 27:

break

cv2.destroyAllWindows()

image

拉普拉斯 Laplacian

Laplacian(src, ddepth[, dst[, ksize[, scale[, delta[, borderType]]]]]) -> dst

img = cv2.imread("./sample_img/Laplacian.jpg")

gaussian_blur = cv2.GaussianBlur(img, (3, 3), 0)

gray = cv2.cvtColor(gaussian_blur, cv2.COLOR_BGR2GRAY)

laplacian = cv2.Laplacian(gray, cv2.CV_64F)

dst = cv2.convertScaleAbs(laplacian)

cv2.imshow("img", img)

cv2.imshow("dst", dst)

cv2.waitKey(0)

cv2.destroyAllWindows()

image

你可能感兴趣的:(opencv,python教程简书)

利用 OpenCV 库进行实时目标物体检测欣然～ opencv 人工智能计算机视觉
一、代码概述此代码利用OpenCV库实现了基于特征匹配的实时物体检测系统。通过摄像头捕获实时视频帧，将其与预先加载的参考图像进行特征匹配，从而识别出视频帧中是否存在与参考图像匹配的物体。二、环境依赖OpenCV：用于图像处理、特征提取和匹配等操作。NumPy：用于数值计算，OpenCV依赖于NumPy进行数组操作。可以使用以下命令安装所需库：bashpipinstallopencv-pythonn
OpenCV | 图像读取与显示 ToBeCertain OpenCV opencv 人工智能计算机视觉
OpenCV对图像进行处理时，常用API如下：API描述cv.imread根据给定的磁盘路径加载对应的图像，默认使用BGR方式加载cv.imshow展示图像cv.imwrite将图像保存到磁盘中cv.waitKey暂停一段时间，接受键盘输出后，继续执行程序cv.destroyAllWindows释放所有资源目录一.OpenCV基本操作函数1.cv.imread()图像读取2.cv.imshow()
opencv图像视频的加载和显示 NDNPOMDFLR opencv python
opencv图像视频的加载和显示基于上篇文章，在开始之前需要在上级目录里打开jupyternotebook首先需要进入scrips目录里进行激活，然后如果在该目录下输入jupyternotebook的话，不太好所以需要进入上级目录创建和显示窗口需要牢记的命令namedWindow()创建命令窗口imshow()显示窗口destroyAllwindows()摧毁窗口resizeWindow()改变窗
cv2.imshow报错残影飞雪 Python python
pipinstallopencv-contrib-pythoncv2.error:OpenCV(4.1.0)C:\projects\opencv-python\opencv\modules\highgui\src\window.cpp:627:error:(-2:Unspecifiederror)Thefunctionisnotimplemented.RebuildthelibrarywithWi
解决OpenCV读取目标图像，cv2.imshow出现闪退的问题写python的鑫哥 OpenCV入门与进阶 opencv 人工智能计算机视觉 python 图像显示闪退
前言本文是该专栏的第17篇，后面将持续分享OpenCV计算机视觉的干货知识，记得关注。最近有粉丝朋友询问到OpenCV读取目标图像出现的一个问题，在基于python语言“使用OpenCV读取目标图像的时候，利用cv2.imshow函数出现闪退”的情况。而本文，笔者将详细介绍针对上述问题，给出一个详细的应对思路以及解决方法。废话不多说，具体的细节部分以及详细的解决方案，跟着笔者直接往下看正文详细内容
windows python opencv imshow图片报错解决热爱生活热爱你 python3 opencv 人工智能计算机视觉
importcv2#检查版本print(cv2.__version__)#加载一张图片（确保你有一个名为'test.jpg'的文件在当前目录）image=cv2.imread('C:\\test1.jpg')#显示图片cv2.imshow('image',image)cv2.waitKey(0)cv2.destroyAllWindows()cv2意思是opencvc++o(*￣︶￣*)o建议使用A
列表推导式_Python教程曹操贪慕小乔 python基础 python numpy 算法
内容摘要Python中存在一种特殊的表达式，名为推导式，它的作用是将一种数据结构作为输入，再经过过滤计算等处理，最后输出另一种数据结构。根据数据结构的不同会被分为列表推导式、文章正文Python中存在一种特殊的表达式，名为推导式，它的作用是将一种数据结构作为输入，再经过过滤计算等处理，最后输出另一种数据结构。根据数据结构的不同会被分为列表推导式、集合推导式和字典推导式。我们先着重来介绍最常使用的列
OpenCV 深度学习模块 cv2.dnn 与其他深度学习框架的优缺点对比及适用场景白.夜深度学习 opencv
OpenCV提供了一个深度学习模块cv2.dnn，让开发者能够在计算机视觉项目中轻松加载和推理深度学习模型。相比于TensorFlow、PyTorch等其他深度学习框架，cv2.dnn有其独特的优点与缺点，适用于不同的应用场景。在这篇文章中，我们将详细分析cv2.dnn的优缺点，并讨论它的适用场景。一、cv2.dnn的优点1.简单易用cv2.dnn提供了一个相对简单且易于使用的接口，适合已经在使用
深度学习中的 blob 格式：与普通 image 的区别及转换原因白.夜深度学习人工智能
在深度学习模型推理过程中，我们经常会用到cv2.dnn.blobFromImage函数将普通图像转换为blob格式。那么，blob格式到底是什么？它和普通image有什么区别？为什么在模型推理中需要这种转换？本文将用通俗的语言为你解答这些问题。1.什么是blob格式？blob是OpenCV中用于深度学习模型输入的一种特殊数据格式，全称为BinaryLargeObject。它本质上是一个多维数组（通
python opencv轮廓检测_python opencv中的不规则形状检测和测量 weixin_39584529 python opencv轮廓检测
正如我在评论中提到的那样,对于这个问题,分水岭似乎是一个很好的方法.但是当你回答时,定义标记的前景和背景是困难的部分！我的想法是使用形态梯度沿着冰晶获得良好的边缘并从那里开始工作;形态梯度似乎很有效.importnumpyasnpimportcv2img=cv2.imread('image.png')blur=cv2.GaussianBlur(img,(7,7),2)h,w=img.shape[:
OpenCV学习(二十一) ：计算图像连通分量:connectedComponents(),connectedComponentsWithStats() Leon_Chen0 OpenCV
OpenCV学习(二十一)：计算图像连通分量:connectedComponents(),connectedComponentsWithStats()1、connectedComponents()函数ConnectedComponents即连通体算法用id标注图中每个连通体，将连通体中序号最小的顶点的id作为连通体的id。如果在图G中，任意2个顶点之间都存在路径，那么称G为连通图，否则称该图为非连
OpenCV图像基础天行者@ opencv 人工智能计算机视觉
OpenCV其实就是一堆C和C++语言的源代码文件,这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV的全称是OpenSourceComputerVisionLibrary,是一个开放源代码的计算机视觉库OpenCV最初由英特尔公司发起并开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用,现在美国WillowGarage为OpenCV提供主要的支持OpenCV可用于开发实时的图
超详细Python教程——SQL详解之DDL 月流霜 python sql 数据库
SQL详解之DDL我们通常可以将SQL分为四类，分别是DDL（数据定义语言）、DML（数据操作语言）、DCL（数据控制语言）和TCL（事务控制语言）。DDL主要用于创建、删除、修改数据库中的对象，比如创建、删除和修改二维表，核心的关键字包括create、drop和alter；DML主要负责数据的插入、删除、更新和查询，关键词包括insert、delete、update和select；DCL用于授予
Python教程：一文了解如何让Python代码变成命令行工具旦莫 Python进阶 python 开发语言
目录1.什么是argparse？2.基本用法1.创建ArgumentParser对象2.添加参数3.解析参数4.使用解析后的参数5.一个简单的用户信息打印工具5.1示例代码5.2运行示例3.高级用法1.子命令2.互斥参数3.自定义类型和动作4.嵌套解析器4.复杂示例：数据库管理工具CLI，全称为Command-LineInterface，即命令行界面。它是一种与计算机程序进行交互的方式，用户通过输
android 基于OpenCV4.8微笑检测自动拍照 mmsx android 作业源码分享 android opencv
一，前言1、基于OpenCV4.8微笑检测自动拍照存储2、左侧有一个预览小框，有人脸时候会有红色框框。3、当真人入境时候，微笑。相机预览捕捉到了人的微笑，自动拍照保存。opencv库的编译就不说了。这篇有介绍：androidopencv导入进行编译_编译androidopencv-CSDN博客二、加载人脸特征和微笑特征文件faceCascade=loadCascade(R.raw.haarcasc
67-OpenCVSharp 创建实现Halcon的tile_images_offset算子（用于图像拼接，对每张图像设置偏移量）搬码驿站 #opencv 计算机视觉人工智能算法图像处理
以下是基于OpenCvSharp实现的Halcontile_images_offset算子的高性能函数。该函数不仅支持图像拼接，还允许对每张图像设置偏移量（offset），以灵活布局图像。代码中包含了详细注释和性能优化策略。为了优化运行时间和性能，我们可以从以下几个方面对代码进行改进：并行处理：利用多核CPU的能力，通过Parallel.For或其他并行技术加速图像复制操作。减少边界检查开销：在确
【Python教程】进阶篇 AI study Python系列 python 人工智能数据计算机工具
目录2.1函数2.1.1函数基础2.1.1.1函数的定义和调用2.1.1.2函数的作用2.1.1.3函数的参数2.1.1.4函数的返回值2.1.1.5函数的作用域-LEGB2.1.2闭包2.1.3装饰器2.1.4迭代器和生成器2.1.4.1可迭代对象2.1.4.2迭代器2.1.4.3生成器2.1.4.4三者之间的异同2.1.5四种函数2.1.5.1递归函数2.1.5.2匿名函数2.1.5.3普通函
python高级教程_Python高级进阶教程 weixin_39713335 python高级教程
这个系列的教程是在刘金玉编程的《零基础python教程》基础上的高级进阶应用。教程列表：Python高级进阶教程001期pycharm+anaconda3+pyqt5可视化界面开发环境搭建Python高级进阶教程002期第一个pyqt5程序Python高级进阶教程003期pyqt5与qtdesigner对照分析Python高级进阶教程004期pyqt5设置窗体图标Python高级进阶教程005期p
【视频】V4L2、ffmpeg、OpenCV中对YUV的定义郭老二视频音视频 ffmpeg opencv
1、常见的YUV格式1.1YUV420每像素16位IMC1：YYYYYYYYVV--UU–IMC3：YYYYYYYYUU--VV–每像素12位I420:YYYYYYYYUUVV=>YUV420PYV12:YYYYYYYYVVUU=>YUV420PNV12:YYYYYYYYUVUV=>YUV420SP（最受欢迎格式）NV21:YYYYYYYYVUVU=>YUV420SPIMC2：YYYYYYYYYY
20250310：OpenCV mat对象与base64互转微风❤水墨 AI模型部署 Mat转base64
代码：https://github.com/ReneNyffenegger/cpp-base64指南：https://renenyffenegger.ch/notes/development/Base64/Encoding-and-decoding-base-64-with-cpp/实操：
opencv python 光流法 weixin_34241036 人工智能 python
OpticalFlow光流法光流是由对象或相机的移动引起的两个连续帧之间的图像对象的明显运动的模式.它是2D矢量场，其中每个矢量是位移矢量，表示从第一帧到第二帧的点的移动.上图表示的是一个球在连续的5帧图像中的运动,箭头显示其位移矢量.光流法原理的基础：目标像素强度在连续帧之间不变相邻像素具有相似的运动第一帧的像素I(x,y,t),在dt时间之后的下一帧中移动距离(dx，dy),因为这些像素是相同
OpenCV-Python 光流 LeonDL168 Opencv-Python opencv python 人工智能
40.1光流由于目标对象或者摄像机的移动造成的图像对象在连续两帧图像中的移动被称为光流。它是一个2D向量场，可以用来显示一个点从第一帧图像到第二帧图像之间的移动。如下图所示（ImageCourtesy:WikipediaarticleonOpticalFlow）：OpticalFlow上图显示了一个点在连续的五帧图像间的移动。箭头表示光流场向量。光流在很多领域中都很有用：•由运动重建结构•视频压缩
【全流程】配置 Jetson Nano 摄像头使用 GStreamer 传输 RTSP 流到本地（整合版）咚叶大人 visual studio tcp/ip 硬件架构实时音视频计算机视觉
文末附录内容：【本地编译OpenCV支持GStreamer（Windows方案）】写在前面：为什么选择GStreamer？在JetsonNano这样的微机平台中，我们选择视频流传输工具时应该综合考虑硬件兼容性、延迟、资源占用和开发效率这几个方面。以下是GStreamer与其他常见几种工具做对比：工具/框架优势局限性适用场景GStreamer✅深度整合NVIDIA硬件编码（NVENC/NVDEC）✅
Python----计算机视觉处理（opencv：像素，RGB颜色，图像的存储，opencv安装，代码展示）蹦蹦跳跳真可爱589 Python opencv 图像处理计算机视觉 python opencv 人工智能
一、计算机眼中的图像像素像素是图像的基本单元，每个像素存储着图像的颜色、亮度和其他特征。一系列像素组合到一起就形成了完整的图像，在计算机中，图像以像素的形式存在并采用二进制格式进行存储。根据图像的颜色不同，每个像素可以用不同的二进制数表示。日常生活中常见的图像是RGB三原色图。RGB图上的每个点都是由红（R）、绿（G）、蓝（B）三个颜色按照一定比例混合而成的，几乎所有颜色都可以通过这三种颜色按照不
九点标定 opencv 方式实现手眼标定孙春泉 opencv 计算机视觉微信小程序
opencv获取中心点位置代码：MatSrcMat(nImgWidth,nImgHeight,CV_8UC3);UCharToMat(pSrcImg,nImgHeight,nImgWidth,24,SrcMat);MatgrayMat;cvtColor(SrcMat,grayMat,COLOR_BGR2GRAY);MatbinMat=cv::Mat::zeros(SrcMat.size(),CV_
alios是安卓吗_阿里云OS到底是国产系统还是安卓系统？ weixin_39806818 alios是安卓吗
图片发自简书App最近阿里云OS又经常出现在我们的眼前，上一年在阿里巴巴入股魅族后发布了搭载阿里云系统的手机，最近退居三线的手机品牌康佳又发布了搭载YUNOS的手机S3，据说锤子科技下半年也要发布搭载阿里云系统的新机。比起什么品牌要发布阿里云系统我想大家更想知道究竟阿里云系统和安卓的区别吧！今天我就跟大家说说其中的故事吧！图片发自简书App有人说阿里云OS就是盗版的安卓，与其说是国产的系统倒不如说
【Python+OpenCV实战】手把手教你打造自定义视频播放器 m0_54877156 计算机视觉 python opencv
随着计算机视觉技术的发展，Python作为其主要开发语言，搭配强大的OpenCV库，为我们提供了无比丰富的功能和可能性。今天，我们将一起踏入这个奇妙的世界，通过Python和cv2来实现一款自定义的视频播放器，让你在理解基础原理的同时，也能亲手打造出属于自己的酷炫工具。首先我们需要确保安装了必要的库pipinstallopencv-python安装完毕之后我们就可以正式开始了。1.导入OpenCV
用OpenCV写个视频播放器可还行？（Python版）程序员Linc 计算机视觉 opencv 音视频 python
引言提到OpenCV，大家首先想到的可能是图像处理、目标检测，但你是否想过——用OpenCV实现一个带进度条、倍速播放、暂停功能的视频播放器？本文将通过一个实战项目，带你深入掌握OpenCV的视频处理能力，并解锁以下功能：基础播放/暂停动态倍速调节（0.5x~4x）交互式进度条实时时间戳显示文末提供完整代码，可直接运行！一、环境准备安装OpenCVpipinstallopencv-python#P
常用图像增强算法原理及 OpenCV C++ 实现埃菲尔铁塔_CV算法 opencv 计算机视觉人工智能 c++算法机器学习
一、引言图像增强是数字图像处理中的一个重要分支，其目的是改善图像的视觉效果，突出图像中的重要信息，或者将图像转换为更适合人或机器分析处理的形式。在实际应用中，图像增强技术广泛应用于医学影像、遥感图像、安防监控等领域。本文将详细介绍常用的图像增强算法原理，并给出基于OpenCVC++库的实现代码。二、图像增强算法分类图像增强算法可以分为空间域增强和频域增强两大类。空间域增强是直接对图像的像素值进行操
opencv借助ffmpeg读取sdp文件进行rtp拉流 20231019 诗筱涵 rtsp 用简单代码实现功能 OpenCV rtp
20231019ffmpeg装起来很快编译命令g++rtp_ffmpeg_test.cpp-ooutput$(pkg-config--libsopencv4)代码如下#include#include#include#includeusingnamespacestd;usingnamespacecv;intmain(intargc,char**argv){cout>frame;if(frame.em
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement