iFlyAI

OpenCV计算机视觉学习（2）——图像算术运算 &图像阈值（数值计算，掩膜mask操作，边界填充，二值化）

人工智能学习离不开实践的验证，推荐大家可以多在FlyAI-AI竞赛服务平台多参加训练和竞赛，以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例，支持算法能力变现以及快速的迭代算法模型。

如果需要处理的原图及代码，请移步小编的GitHub地址

　　传送门：请点击我

　　如果点击有误：https://github.com/LeBron-Jian/ComputerVisionPractice

　　在OpenCV中我们经常会遇到一个名字：Mask（掩膜）。很多函数都使用到它，那么这个Mask到底是什么呢，下面我们从图像基本运算开始，一步一步学习掩膜。

1，图像算术运算

　　图像的算术运算有很多种，比如两幅图像可以相加，相减，相乘，相除，位运算，平方根，对数，绝对值等；图像也可以放大，缩小，旋转，还可以截取其中的一部分作为ROI（感兴趣区域）进行操作，各个颜色通道还可以分别提取对各个颜色通道进行各种运算操作。总之，对图像可以进行的算术运算非常的多。这里先学习图片间的数学运算，图像混合，按位运算。

1.1 图片加法

　　要叠加两张图片，可以用 cv2.add() 函数，相加两幅图片的形状（高度/宽度/通道数）必须相同， numpy中可以用 res = img1 + img2 相加，但这两者的结果并不相同。

x = np.uint8([250])

y = np.uint8([10])

print(cv2.add(x, y)) # 250+10 = 260 => 255

print(x + y) # 250+10 = 260 % 256 = 4

　　如果是二值化图片（只有0和255），两者结果是一样的（用 numpy的方式更简便一些）。

　　这里我们代入图像中看一下：

#encoding:utf-8

import cv2

import numpy as np

import matplotlib.pyplot as plt

# 举一个极端的例子，真的只是运气好，遇到了。。。。

img = cv2.imread('lena.jpg')

img_add = img + 10

img_add2 = cv2.add(img, img_add)

print(img[0:4, :, 0])

print(img_add[0:4, :, 0])

print(img_add2[0:4, :, 0])

'''

这个是 logo1.jpg 的效果

[[246 246 246 ... 246 246 246]

[246 246 246 ... 246 246 246]

[246 246 246 ... 246 246 246]]

[[0 0 0 ... 0 0 0]

[0 0 0 ... 0 0 0]

[0 0 0 ... 0 0 0]]

[[246 246 246 ... 246 246 246]

[246 246 246 ... 246 246 246]

[246 246 246 ... 246 246 246]]

这个是 lena.jpg 的效果

[[126 125 124 ... 128 120 90]

[127 126 124 ... 135 131 96]

[124 123 121 ... 144 138 96]

[116 119 116 ... 73 56 35]]

[[136 135 134 ... 138 130 100]

[137 136 134 ... 145 141 106]

[134 133 131 ... 154 148 106]

[126 129 126 ... 83 66 45]]

[[255 255 255 ... 255 250 190]

[255 255 255 ... 255 255 202]

[255 255 252 ... 255 255 202]

[242 248 242 ... 156 122 80]]

# 我们发现使用numpy库的加法，则运算结果取模

使用opencv的add()函数，则运算结果当大于255，则取255

'''

　　注意：OpenCV中的加法与Numpy的加法是有所不同的，OpenCV的加法是一种饱和操作，而Numpy的加法是一种模操作。

Numpy库的加法

　　其运算方法是：目标图像 = 图像1 + 图像2，运算结果进行取模运算

当像素值小于等于 255 时，结果为：“图像1 + 图像2”，例如：120+48=168
当像素值大于255 时，结果为：对255取模的结果，例如：（255 + 64） % 255 = 64

OpenCV的加法

　　其运算方法是：目标图像 = cv2.add（图像1，图像2）

当像素值小于等于 255 时，结果为：“图像1 + 图像2”，例如：120+48=168
当像素值大于255 时，结果为：255，例如：255 + 64 = 255

　　两种方法对应的代码如下：

# encoding:utf-8

import cv2

import numpy as np

import matplotlib.pyplot as plt

# 读取图片

img = cv2.imread('logo1.jpg')

test = img

# 方法一：Numpy加法运算

result1 = img + test

# 方法二：OpenCV加法运算

result2 = cv2.add(img, test)

all_pic = np.column_stack((img, result1, result2))

# 显示图像

cv2.imshow('img result1 result2', all_pic)

# cv2.imshow("original", img)

# cv2.imshow("result1", result1)

# cv2.imshow("result2", result2)

# 等待显示

cv2.waitKey(0)

cv2.destroyAllWindows()

　　原图及其效果图如下：

　　其中，result1为Numpy的方法，result2为OpenCV的方法。

1.2 图像混合

　　图像融合通常是指将2张或者两张以上的图像信息融合到1张图像上，融合的图像含有更多的信息，能够更方便人们观察或计算机处理。

　　图像融合是在图像加法的基础上增加了系数和亮度调节量。

　　图像融合：目标图像 = 图像1*系数1 + 图像2*系数2 + 亮度调节量

　　图像混合 cv2.addWeighted() 也是一种图片相加的操作，只不过两幅图片的权重不一样， y 相当于一个修正值：

dst = α*img1 + β*img2 + γ

　　PS：当 alpha 和 beta 都等于1，则相当于图片相加。

　　代码如下：

import cv2

import numpy as np

img1 = cv2.imread('lena_small.jpg')

img2 = cv2.imread('opencv_logo_white.jpg')

# print(img1.shape, img2.shape) # (187, 186, 3) (184, 193, 3)

img2 = cv2.resize(img2, (186, 187))

# print(img1.shape, img2.shape)

res = cv2.addWeighted(img1, 0.6, img2, 0.4, 0)

cv2.imshow("res", res)

cv2.waitKey(0)

cv2.destroyAllWindows()

　　注意这里，两张图片的尺寸必须一致。原图和结果图如下：

1.3 图像矩阵减法

　　图像矩阵减法与加法其实类似，我们这不多做说明，只贴函数：

函数原型：cv2.subtract(src1, src2, dst=None, mask=None, dtype=None)

src1：图像矩阵1

src1：图像矩阵2

dst：默认选项

mask：默认选项

dtype：默认选项

1.4 按位运算

　　按位操作有：AND ，OR， NOT，XOR 等。cv2.bitwise_and(), cv2.bitwise_not(), cv2.bitwise_or(), cv2.bitwise_xor()分别执行按位与/或/非/异或运算。下面我们贴一下opencv中的函数

bitwise_or—图像或运算

函数原型：cv2.bitwise_or(src1, src2, dst=None, mask=None)

src1：图像矩阵1

src1：图像矩阵2

dst：默认选项

mask：默认选项

bitwise_xor—图像异或运算

函数原型：bitwise_xor(src1, src2, dst=None, mask=None)

src1：图像矩阵1

src1：图像矩阵2

dst：默认选项

mask：默认选项

bitwise_not—图像非运算

函数原型：bitwise_not(src1, src2, dst=None, mask=None)

src1：图像矩阵1

src1：图像矩阵2

dst：默认选项

mask：默认选项

　　掩膜就是用来对图片进行全局或局部的遮挡，当我们提取图像的一部分，选择非矩阵ROI时这些操作会很有用，常用于Logo投射。

　　通过 threshold 函数将图片固定阈值二值化（图像二值化定义：将图像上的像素点的灰度值设置为0或255，也就是将整个图像呈现出明显的黑和白的视觉效果）

　　一幅图像包括目标物体，背景还有噪声，要想从多值的数字图像中直接提取出目标物体，常用的方法就是设定一个阈值T，用 T 将图像的数据分为两部分：大于 T 的像素群和小于 T 的像素群。这是研究灰度变换的最特殊的方法，称为图像二值化（Binarization）

　　下面做一个例子，关于Logo投射。（下面首先展示两张照片，一张原图，一张logo图，目的是投射logo到原图上）

　　思路如下：我们的目的是把 logo 放在左边，所以我们只关心这一块区域，下面我们的目的是创建掩码（这是在Logo图上），并且保留除了logo以外的背景（这是在原图），然后进行融合（这是在原图），最后融合放在原图。

　　代码如下：

# _*_coding:utf-8_*_

import cv2

import numpy as np

img_photo = cv2.imread('james.jpg')

img_logo = cv2.imread('logo1.jpg')

print(img_logo.shape, img_photo.shape)

# (615, 327, 3) (640, 1024, 3)

rows, cols, channels = img_logo.shape

photo_roi = img_photo[0:rows, 0:cols]

gray_logo = cv2.cvtColor(img_logo, cv2.COLOR_BGR2GRAY)

# 中值滤波

midian_logo = cv2.medianBlur(gray_logo, 5)

# mask_bin 是黑白掩膜

ret, mask_bin = cv2.threshold(gray_logo, 127, 255, cv2.THRESH_BINARY)

# mask_inv 是反色黑白掩膜

mask_inv = cv2.bitwise_not(mask_bin)

# 黑白掩膜和大图切割区域去取和

img_photo_bg_mask = cv2.bitwise_and(photo_roi, photo_roi, mask=mask_bin)

# 反色黑白掩膜和 logo 取和

img2_photo_fg_mask = cv2.bitwise_and(img_logo, img_logo, mask=mask_inv)

dst = cv2.add(img_photo_bg_mask, img2_photo_fg_mask)

img_photo[0:rows, 0:cols] = dst

cv2.imshow("mask_bin", mask_bin)

cv2.imshow("mask_inv", mask_inv)

cv2.imshow("img_photo_bg_mask", img_photo_bg_mask)

cv2.imshow("img2_photo_fg_mask", img2_photo_fg_mask)

cv2.imshow("img_photo", img_photo)

cv2.waitKey(0)

cv2.destroyAllWindows()

　　图示过程如下：

　　下面第一张是黑色是因为背景图中，左边就是黑色，所以这里不显示而已。

　　最终形态如下：

2，掩膜（mask）

　　在有些图像处理的函数中有的参数里面会有 mask 参数，即此函数支持掩膜操作。

　　首先我们要理解什么是掩膜？，其次掩膜有什么作用呢？

2.1 掩膜（mask）的概念

　　简单来说：掩膜是用一副二值化图片对另外一幅图片进行局部的遮挡。

　　首先我们从物理的角度来看看 mask 到底是什么过程。

　　数字图像处理中的掩膜的概念是借鉴于 PCB 制版的过程，在半导体制作中，许多芯片工艺步骤采用光刻技术，用于这些步骤的图形”底片”称为掩膜（也称为“掩模”），其作用是：在硅片上选定的区域中对一个不透明的图形模板遮盖，继而下面的腐蚀或扩散将只影响选定的区域意外的区域。

　　图形掩膜（Image mask）与其类似，用选定的图形，图形或物体，对处理的图像（全部或局部）进行遮挡，来控制图像处理的区域或处理过程。用于覆盖的特点图像或物体称为掩膜或模板。光学图像处理中，掩膜可以足胶片，滤光片等。掩膜是由0和1组成的一个二进制图像。当在某一功能中应用掩膜时，1值区域被处理，被屏蔽的0值区域不被包括在计算中。通过制定的数据值，数据范围，有限或无限值，感兴趣区和注释文件来定义图像掩膜，也可以应用上述选项的任意组合作为输入来建立掩膜。

2.2 掩膜的作用

　　数字图像处理中，掩膜为二维矩阵数组，有时也用多值图像，图像掩膜主要用于：

1，提取感兴趣区，用预先制作的感兴趣区掩膜与待处理图像相乘，得到感兴趣区图像，感兴趣区内图像值保持不变，而区外图像值都为零。
2，屏蔽作用，用掩膜对图像上某些区域做屏蔽，使其不参加处理或不参加处理参数的计算，或仅对屏蔽区做处理或统计。
3，结构特征提取，用相似性变量或图像匹配方法检测和提取图像中与掩膜相似的结构特征。
4，特殊性质图像的制作

　　掩膜是一种图像滤镜的模板，试用掩膜经常处理的是遥感图像。当提取道路或者河流，或者房屋时，通过一个 N*N 的矩阵来对图像进行像素过滤，然后将我们需要的地物或者标志突出显示出来，这个矩阵就是一种掩膜。在OpenCV中，掩膜操作时相对简单的。大致的意思是，通过一个掩膜矩阵，重新计算图像中的每一个像素值。掩膜矩阵控制了旧图像当前位置以及周围位置像素对新图像当前位置像素值的影响力度。用数学术语将，即我们自定义一个权重表。

　　在所有图像基本运算的操作函数中，凡是带有掩膜（mask）的处理函数，其掩膜都参与运算（输入图像运算完之后再与掩膜图像或矩阵运算）。

2.3 通过掩膜操作实现图像对比图的改变

　　矩阵的掩膜操作非常简单，根据掩膜来重新计算每个像素的像素值，掩膜（mask）也被称为内核。

什么是图和掩膜的与运算呢？

　　其实就是原图中的每个像素和掩膜中的每个对应像素进行与运算。比如1 & 1 = 1；1 & 0 = 0；

　　比如一个 3*3 的图像与 3*3 的掩膜进行运算，得到的结果图像就是：

　　说白了，mask就是位图，来选择哪个像素允许拷贝，哪个像素不允许拷贝，如果mask像素的值时非0的，我们就拷贝它，否则不拷贝。

2.4 mask小结

　　1，图像中，各种位运算，比如与，或，非运算与普通的位运算类似。

　　2，如果用一句话总结，掩膜就是两幅图像之间进行的各种位运算操作。

代码：

#_*_coding:utf-8_*_

import cv2

import numpy as np

def mask_processing(path):

image = cv2.imread(path) # 读图

# cv2.imshow("Oringinal", image) #显示原图

print(image.shape[:2]) # (613, 440)

# 输入图像是RGB图像，故构造一个三维数组，四个二维数组是mask四个点的坐标，

site = np.array([[[300, 280], [150, 280], [150, 50], [300, 50]]], dtype=np.int32)

im = np.zeros(image.shape[:2], dtype="uint8") # 生成image大小的全白图

cv2.polylines(im, site, 1, 255) # 在im上画site大小的线，1表示线段闭合，255表示线段颜色

cv2.fillPoly(im, site, 255) # 在im的site区域，填充颜色为255

mask = im

cv2.namedWindow('Mask', cv2.WINDOW_NORMAL) # 可调整窗口大小，不加这句不可调整

cv2.imshow("Mask", mask)

masked = cv2.bitwise_and(image, image, mask=mask) # 在模板mask上，将image和image做“与”操作

cv2.namedWindow('Mask to Image', cv2.WINDOW_NORMAL) # 同上

cv2.imshow("Mask to Image", masked)

cv2.waitKey(0) # 图像一直显示，键盘按任意键即可关闭窗口

cv2.destroyAllWindows()

if __name__ == '__main__':

path = 'irving.jpg'

mask_processing(path)

　　代码说明：

1，考虑到当图像尺寸太大，所以我们用 cv2.namedWindow() 函数可以指定窗口是否可以调整大小。在默认情况下，标志为 cv2.WINDOW_AUTOSIZE。但是，如果指定标志为 cv2.WINDOW_Normal，则可以调整窗口的大小，这些操作可以让我们的工作更方便一些。

2，对坐标轴的理解，上面代码中的四个坐标从第一个到最后一个分别对应下图中的 x1 x2 x4 x3。（我实际实验是这样的，如果有不同想法，可以交流）。

　　原图如下：

　　mask与处理后图的结果如下：

3，边界填充

　　在做深度学习的时候，难免遇到需要填充边界。边缘填充是什么呢？

　　因为对于图像的卷积操作，最边缘的像素一般无法处理，所以卷积核中心倒不了最边缘像素。这就需要先将图像的边界填充，再根据不同的填充算法进行卷积操作，得到的新图像就是填充后的图像。

　　如果你想在图像周围创建一个边，就像相框一样，你可以使用 cv2.copyMakeBorder() 函数，这经常在卷积运算或 0 填充时被用到，这个函数如下：

1	`def copyMakeBorder(src, top, bottom, left, right, borderType, dst=None, value=None):`

　　参数解释：

src：输入图像
top，buttom，left，right 对应边界的像素数目（分别为图像上面，下面，左面，右面填充边界的长度）
borderType 要添加哪种类型的边界，类型如下：

　　　　——cv2.BORDER_CONSTANT 添加有颜色的常数值边界，还需要下一个参数（value）

　　　　——cv2.BORDER_REFLECT 边界元素的镜像，反射法，即以最边缘的像素为对称轴。比如: fedcba|abcdefgh|hgfedcb

　　　　——cv2.BORDER_REFLECT_101 or cv2.BORDER_DEFAULT跟BORDER_REFLECT类似，但是由区别。例如: gfedcb|abcdefgh|gfedcba

　　　　——cv2.BORDER_REPLICATE 复制法，重复最后一个元素。例如: aaaaaa|abcdefgh|hhhhhhh

　　　　——cv2.BORDER_WRAP 不知道怎么说了, 就像这样: cdefgh|abcdefgh|abcdefg

value 边界颜色，通常用于常量法填充中，即边界的类型是 cv2.BORDER_CONSTANT，

　　为了更好的理解这几种类型，请看下面代码演示：

import cv2

import numpy as np

import matplotlib.pyplot as plt

# 读取图片

img = cv2.imread('kd1.jpg') # (221, 405, 3)

# img = cv2.imread('lena.jpg') # (263, 263, 3)

# print(img.shape)

# 各个边界需要填充的值, 为了展示效果，这里填充的大一些

top_size, bottom_size, left_size, right_size = (50, 50, 50, 50)

# 复制法重复边界，填充即复制最边缘像素

replicate = cv2.copyMakeBorder(img, top_size, bottom_size,

left_size, right_size,

borderType=cv2.BORDER_REPLICATE)

# 反射法反射边界，填充即对感兴趣的图像中的像素在两边进行复制，

# 例如 fedcba|abcdefgh|hgfedcb

reflect = cv2.copyMakeBorder(img, top_size, bottom_size,

left_size, right_size,

borderType=cv2.BORDER_REFLECT)

# 反射101边界法反射101边界，填充这个是以最边缘为轴，对称，

# 例如 gfedcb|abcdefg|gfedcba

reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size,

left_size, right_size,

borderType=cv2.BORDER_REFLECT_101)

# 外包装法填充

# 例如 cdefgh|abcdefgh|abcdegf

wrap = cv2.copyMakeBorder(img, top_size, bottom_size,

left_size, right_size,

borderType=cv2.BORDER_WRAP)

# 常量法，常数值填充，常量值可以自己设定 value=0

constant = cv2.copyMakeBorder(img, top_size, bottom_size,

left_size, right_size,

borderType=cv2.BORDER_CONSTANT,

value=(0, 255, 0))

plt.subplot(231)

plt.imshow(img, 'gray')

plt.title('origin')

plt.subplot(232)

plt.imshow(replicate, 'gray')

plt.title('replicate')

plt.subplot(233)

plt.imshow(reflect, 'gray')

plt.title('reflect')

plt.subplot(234)

plt.imshow(reflect101, 'gray')

plt.title('reflect101')

plt.subplot(235)

plt.imshow(wrap, 'gray')

plt.title('wrap')

plt.subplot(236)

plt.imshow(constant, 'gray')

plt.title('constant')

plt.show()

　　原图1如下：

　　处理的效果图如下：

　　效果2如下：

注意：plt.imshow() 显示图片色差问题

　　我们都知道 cv2.imshow() 显示的原始图片是BGR格式，即原图如下所示：

　　那通过opencv将BGR格式转换为RGB格式，图显示如下：

　　这就解释了为什么plt.imshow()显示图片色差问题，原因就是读取图片的通道不同。

3.1 细节函数

　　为了能快速对比出各个方法得出的图像的区别，可以使用np.vstack()或者np.hstack()对比，将图像放在同一个窗口。

1 2	`rec=np.hstack((replicate,reflect))` `cv_show("replicate_reflect",rec)`

　　注意：使用np.vstack()或者np.hstack()函数时，图像的大小必须一致，不然会报错。

　　　　使用np.vstack()或者np.hstack()函数时，可能会出现图像显示不完全情况

4，图像阈值（二值化）

4.1 图像二值化原理

　　二值化核心思想，设阈值，大于阈值的为0（黑色）或 255（白色），使图像称为黑白图。

　　阈值可固定，也可以自适应阈值。

　　自适应阈值一般为一点像素与这点为中序的区域像素平均值或者高斯分布加权和的比较，其中可以设置一个差值也可以不设置。

　　图像的阈值化旨在提取图像中的目标物体，将背景以及噪声区分开来。通常会设定一个阈值T，通过T将图像的像素分为两类：大于T的像素群和小于T的像素群。

　　灰度转换处理后的图像中，每个像素都只有一个灰度值，其大小表示明暗程度。所谓图像的二值化，就是将图像上的像素点的灰度值设置为0或255，也就是将整个图像呈现出明显的只有黑和白的视觉效果。一幅图像包括目标物体、背景还有噪声，要想从多值的数字图像中直接提取出目标物体。

　　常用的二值化算法下所示：

　　当灰度Gray小于阈值T的时候，其像素设置为0，表示黑色；当灰度Gray大于或等于阈值T时，其Y值为255，表示白色。

　　全局阈值就是一幅图像包括目标物体、背景还有噪声，要想从多值的数字图像中直接提取出目标物体；常用的方法就是设定一个阈值T，用T将图像的数据分成两部分：大于T的像素群和小于T的像素群。这是研究灰度变换的最特殊的方法，称为图像的二值化（Binarization）。

　　局部阈值就是当同一幅图像上的不同部分的具有不同亮度时。这种情况下我们需要采用自适应阈值。此时的阈值是根据图像上的每一个小区域计算与其对应的阈值。因此在同一幅图像上的不同区域采用的是不同的阈值，从而使我们能在亮度不同的情况下得到更好的结果。

　　二值化处理广泛应用于各行各业，比如生物学中的细胞图分割，交通领域的车牌设计等。在文化应用领域中，通过二值化处理将所需民族文物图像转换为黑白两色图，从而为后面的图像识别提供更好的支撑作用。

4.2 简单阈值处理（全局阈值）

　　Python-OpenCV中提供了阈值（threshold）函数：

1	`threshold(src, thresh, maxval, type, dst=None)`

　　变量的作用：

第一个参数 src 指原图像，原图像应该是灰度图，只能输入单通道图像
第二个参数 thresh 指用来对像素值进行分类的阈值
第三个参数 maxval 指当像素值高于（有时是小于，根据 type 来决定）阈值时应该被赋予的新的像素值，在二元阈值THRESH_BINARY和逆二元阈值THRESH_BINARY_INV中使用的最大值
第四个参数 dst 指不同的不同的阈值方法，这些方法包括以下五种类型：

　　　　cv2.THRESH_BINARY 超过阈值部分取 maxval（最大值），否则取 0

　　　　cv2.THRESH_BINARY_INV THRESH_BINARY 的反转

　　　　cv2.THRESH_TRUNC　　　　大于阈值部分设为阈值，否则不变

　　　　cv2.THRESH_TOZERO 大于阈值部分不改变，否则设为零

　　　　cv2.THRESH_TOZERO_INV THRESH_TOZERO 的反转

　　（盗图来自：https://blog.csdn.net/whl970831/article/details/98231314 https://blog.csdn.net/Eastmount/article/details/83548652）

　　详细解析如下：

　　用函数表示如下：

　　对应OpenCV提供的五张图如下，第一张为原图，后面依次为：二进制阈值化，反二进制阈值化，截断阈值化，反阈值化为0，阈值化为0.

　　代码如下：

# _*_coding:utf-8_*_

import cv2

import numpy as np

from matplotlib import pyplot as plt

def parse_thresh(path):

img = cv2.imread(path) # 读取原始照片

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

ret, thresh1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

ret, thresh2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)

ret, thresh3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)

ret, thresh4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)

ret, thresh5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)

titles = ['Origin Image', 'gray', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV'] # 标题

images = [img, gray, thresh1, thresh2, thresh3, thresh4, thresh5] # 对应的图

for i in range(7): # 画7次图

plt.subplot(2, 4, i + 1), plt.imshow(images[i], 'gray')

plt.title(titles[i])

plt.xticks([]), plt.yticks([])

plt.show()

if __name__ == '__main__':

path = 'durant.jpg'

parse_thresh(path)

　　结果如下：

4.3 自适应阈值处理（局部阈值）　　

　　Python-OpenCV提供了自适应阈值函数：

1	`cv2.adaptiveThreshold(src, maxValue, adaptiveMethod, thresholdType, blockSize, C, dst=None)`

　　参数意义：

第一个参数 src 指原图像，原图像应该是灰度图。
第二个参数 x 指当像素值高于（有时是小于）阈值时应该被赋予的新的像素值
第三个参数 adaptive_method 参数为：

　　　　CV_ADAPTIVE_THRESH_MEAN_C
　　　　CV_ADAPTIVE_THRESH_GAUSSIAN_C

第四个参数 threshold_type 指取阈值类型：必须是下者之一

　　　　CV_THRESH_BINARY
　　　　CV_THRESH_BINARY_INV

第五个参数 block_size 指用来计算阈值的象素邻域大小: 3, 5, 7, …
第六个参数 param1 指与方法有关的参数。

　　　　对方法CV_ADAPTIVE_THRESH_MEAN_C 和 CV_ADAPTIVE_THRESH_GAUSSIAN_C，它是一个从均值或加权均值提取的常数, 尽管它可以是负数。
　　　　对方法CV_ADAPTIVE_THRESH_MEAN_C，先求出块中的均值，再减掉param1。
　　　　对方法 CV_ADAPTIVE_THRESH_GAUSSIAN_C ，先求出块中的加权和(gaussian)，再减掉param1。

　　代码如下：

import cv2

from matplotlib import pyplot as plt

#详细说明参考上方例子

img = cv2.imread('sss.jpg',0)

img = cv2.medianBlur(img,5)

ret,th1 = cv2.threshold(img,127,255,cv2.THRESH_BINARY)

th2 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_MEAN_C,\

cv2.THRESH_BINARY,11,2)

th3 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,\

cv2.THRESH_BINARY,11,2)

titles = ['Original Image', 'Global Thresholding (v = 127)',

'Adaptive Mean Thresholding', 'Adaptive Gaussian Thresholding']

images = [img, th1, th2, th3]

for i in range(4):

plt.subplot(2,2,i+1),plt.imshow(images[i],'gray')

plt.title(titles[i])

plt.xticks([]),plt.yticks([])

plt.show()

　　综合代码：

import cv2 as cv

#全局阈值

def threshold_demo(image):

gray = cv.cvtColor(image, cv.COLOR_RGB2GRAY) #把输入图像灰度化

ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY | cv.THRESH_TRIANGLE) #直接阈值化是对输入的单通道矩阵逐像素进行阈值分割。

#print("threshold value %s"%ret)

cv.namedWindow("threshold", cv.WINDOW_NORMAL)

cv.imshow("threshold", binary)

#局部阈值

def local_threshold(image):

gray = cv.cvtColor(image, cv.COLOR_RGB2GRAY) #把输入图像灰度化

binary = cv.adaptiveThreshold(gray, 255, cv.ADAPTIVE_THRESH_GAUSSIAN_C,cv.THRESH_BINARY, 25, 10) #自适应阈值化能够根据图像不同区域亮度分布，改变阈值

cv.namedWindow("adaptiveThreshold", cv.WINDOW_NORMAL)

cv.imshow("adaptiveThreshold", binary)

src = cv.imread('sss.jpg')

cv.namedWindow('input_image', cv.WINDOW_NORMAL) #设置为WINDOW_NORMAL可以任意缩放

cv.imshow('input_image', src) #源图

threshold_demo(src) #全局

local_threshold(src) #局部

cv.waitKey(0)

cv.destroyAllWindows()

5， Otsu 二值化

　　在使用全局阈值时，我们就是随便给了一个数来做阈值，那我们怎么知道我们选取的这个数的好坏呢？答案就是不停的尝试。如果是一副双峰图像（简单来说双峰图像是指图像直方图中存在两个峰）呢？我们岂不是应该在两个峰之间的峰谷选一个值作为阈值？这就是 Otsu 二值化要做的。简单来说就是对一副双峰图像自动根据其直方图计算出一个阈值。（对于非双峰图像，这种方法得到的结果可能会不理想）。
　　这里用到到的函数还是 cv2.threshold()，但是需要多传入一个参数（flag）：cv2.THRESH_OTSU。
　　这时要把阈值设为 0。然后算法会找到最优阈值，这个最优阈值就是返回值 retVal。如果不使用 Otsu 二值化，返回的retVal 值与设定的阈值相等。
　　下面的例子中，输入图像是一副带有噪声的图像。第一种方法，设127 为全局阈值。第二种方法，直接使用 Otsu 二值化。第三种方法，先使用一个 5x5 的高斯核除去噪音，然后再使用 Otsu 二值化。

　　代码：

import cv2

from matplotlib import pyplot as plt

img = cv2.imread('sss.jpg',0)

# 设127 为全局阈值

ret1,th1 = cv2.threshold(img,127,255,cv2.THRESH_BINARY)

# 直接使用 Otsu 二值化

ret2,th2 = cv2.threshold(img,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)

# 先使用一个 5x5 的高斯核除去噪音，然后再使用 Otsu 二值化

blur = cv2.GaussianBlur(img,(5,5),0)

ret3,th3 = cv2.threshold(blur,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)

images = [img, 0, th1,

img, 0, th2,

blur, 0, th3]

titles = ['Original Noisy Image','Histogram','Global Thresholding (v=127)',

'Original Noisy Image','Histogram',"Otsu's Thresholding",

'Gaussian filtered Image','Histogram',"Otsu's Thresholding"]

for i in range(3):

plt.subplot(3,3,i*3+1),plt.imshow(images[i*3],'gray')

plt.title(titles[i*3]), plt.xticks([]), plt.yticks([])

plt.subplot(3,3,i*3+2),plt.hist(images[i*3].ravel(),256)

plt.title(titles[i*3+1]), plt.xticks([]), plt.yticks([])

plt.subplot(3,3,i*3+3),plt.imshow(images[i*3+2],'gray')

plt.title(titles[i*3+2]), plt.xticks([]), plt.yticks([])

plt.show()

5.1 Otsu 最大类间方差法原理

　　OTSU 算法是由日本学者 OTSU 于 1979 年提出的一种对图像进行二值化的高效算法。OTSU算法又叫大津算法，其本质是最大类间方差法。

　　它的原理是利用阈值将原图像分为前景，背景两个图像。

　　前景：用 n1，csum，m1 来表示在当前阈值下的前景的点数，质量距，平均灰度。

　　背景：用n2，sum-csum，m2 来表示在当前阈值下的背景的点数，质量距，平均灰度。

　　当取最佳阈值时，背景应该与前景差别最大，关键在于如何选择衡量差别的标准，而在otsu算法中这个衡量差别的标准就是最大类间方差。

5.2 Otsu 最大类间方差法的性能

　　类间方差法对噪音和目标大小十分敏感，它仅对类间方差为单峰的图像产生较好的分割效果。

　　当目标与背景的大小比例悬殊时，类间方差准则可能呈现双峰或多峰，此时效果不好，但是类间方差法是用时最少的。

5.3 Otsu 最大类间方差法的公式推导

　　记 t 为前景与背景的分割阈值，前景点数占图像比例为 w0，平均灰度为 u0；背景点数占图像比例为 w1，平均灰度为 u1.

　　则图像的总平均灰度为： u = w0 * u0 + w1 * u1

　　前景和背景图像的方差：g = w0 * (u0 - u) * (u0 - u) + w1 * (u1 - u) * (u1 - u) = w0 * w1 * (u0 - u1) * (u0 - u1)

　　当方差 g 最大时，可以认为此时前景和背景差异最大，此时的灰度 t 是最佳阈值 sb = w0 * w1*(u1 - u0)*(u0 - u1)

　　代码实现：

# _*_coding:utf-8_*_

import cv2

import numpy as np

def max_class_threshold_variance(origin_photo):

img = cv2.imread(origin_photo, -1)

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

retval, dst = cv2.threshold(gray, 0, 255, cv2.THRESH_OTSU)

cv2.imshow("src", img)

cv2.imshow("gray", gray)

cv2.imshow("dst", dst)

cv2.waitKey(0)

5.4 Otsu’ ’s 二值化是如何工作的？

　　在这一部分我们会演示怎样使用 Python 来实现 Otsu 二值化算法，从而告诉大家它是如何工作的。如果你不感兴趣的话可以跳过这一节。因为是双峰图，Otsu 算法就是要找到一个阈值（t）, 使得同一类加权方差最小，需要满足下列关系式：

　　其中：

　　其实就是在两个峰之间找到一个阈值 t，将这两个峰分开，并且使每一个峰内的方差最小。实现这个算法的 Python 代码如下：

img = cv2.imread('noisy2.png',0)

blur = cv2.GaussianBlur(img,(5,5),0)

# find normalized_histogram, and its cumulative distribution function

hist = cv2.calcHist([blur],[0],None,[256],[0,256])

hist_norm = hist.ravel()/hist.max()

Q = hist_norm.cumsum()

bins = np.arange(256)

fn_min = np.inf

thresh = -1

for i in xrange(1,256):

p1,p2 = np.hsplit(hist_norm,[i]) # probabilities

q1,q2 = Q[i],Q[255]-Q[i] # cum sum of classes

b1,b2 = np.hsplit(bins,[i]) # weights

# finding means and variances

m1,m2 = np.sum(p1*b1)/q1, np.sum(p2*b2)/q2

v1,v2 = np.sum(((b1-m1)**2)*p1)/q1,np.sum(((b2-m2)**2)*p2)/q2

# calculates the minimization function

fn = v1*q1 + v2*q2

if fn < fn_min:

fn_min = fn

thresh = i

# find otsu's threshold value with OpenCV function

ret, otsu = cv2.threshold(blur,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)

prin(thresh,ret)

参考文献：https://blog.csdn.net/weixin_42338058/article/details/88568704

按位运算参考：https://blog.51cto.com/devops2016/2088574

https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_core/py_image_arithmetics/py_image_arithmetics.html

更多精彩内容请访问FlyAI-AI竞赛服务平台；为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台；每周免费提供项目开源算法样例，支持算法能力变现以及快速的迭代算法模型。

挑战者，都在FlyAI！！！

华为OD机试2025B卷 - 返回矩阵中非1的元素、个数/数值同化（Java & Python& JS & C++ & C ）算法大师最新华为OD机试真题华为OD机试真题 (Java/JS/Py/C)java 华为od 矩阵 javascript c++python
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述存在一个m*n的二维数组，其成员取值范围为0，1，2。其中值为1的元素具备同化特性，每经过1S，将上下左右值为0的元素同化为1。而值为2的元素，免疫同化。将数组所有成员随机初始化为0或2，再将矩阵的[0,0]元素修改成1，在经过足够长的时间后求矩阵中有多少个元素是0或2（即0和2数量之和）。输入描述输入的前两个数字是矩
华为OD机试2025A卷 - 返回矩阵中非1的元素个数/数值同化（Java & Python& JS & C++ & C ）算法大师最新华为OD机试真题华为OD机试真题 (Java/JS/Py/C)java 华为od 矩阵 javascript c++python 华为OD2025A卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述存在一个m*n的二维数组，其成员取值范围为0，1，2。其中值为1的元素具备同化特性，每经过1S，将上下左右值为0的元素同化为1。而值为2的元素，免疫同化。将数组所有成员随机初始化为0或2，再将矩阵的[0,0]元素修改成1，在经过足够长的时间后求矩阵中有多少个元素是0或2（即0和2数量之和）。输入描述输入的前两个数字是矩
机器学习-K近邻算法 shy_snow python 机器学习机器学习近邻算法人工智能
k-近邻分类算法，即物以类聚的思想，通过已知分类中的点和未知分类的点距离最近的前k个点的分类来预测未知点的分类。kNN.pyfromnumpyimport*importoperatordefcreateDataSet():group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])labels=['A','A','B','B']returngroup,label
华为od 机试 2025 B卷 - 数值同化 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD2025B卷华为OD机试2025B卷华为OD机考2025B卷
数值同化华为OD机试真题目录:点击去查看华为OD2025B卷100分题型题目描述存在一个m*n的二维数组，其成员取值范围为0，1，2。其中值为1的元素具备同化特性，每经过1S，将上下左右值为0的元素同化为1，而值为2的元素，免疫同化。将数组所有成员随机初始化为0或2，再将矩阵的[0,0]元素修改为1，在经过足够长的时间后，求矩阵中有多少个元素是0或2（即0和2数量之和）。输入描述输入的前两个数字是
使用Python调用C++：简单易学的方法程序员杨弋 Python全栈工程师学习指南 python c++开发语言
Python是一种易于学习和理解的编程语言，而C++是强大的编程语言。Python代码可以在很短的时间内编写出来，但如果涉及到大量的计算或需要高性能，则需要使用更快、更高效的编程语言。在这种情况下，Python调用C++是一种常见的方法，因为它可以提供C++的高速性能和Python的便捷性。在本文中，我们将介绍如何使用Python调用C++。首先，需要创建C++函数库（DLL），并确保该库包含需要
python之vars函数使用介绍 yueguang8 python python 开发语言
在Python中,vars()是一个内置函数,它可以用来获取对象的属性字典。1.vars()函数的用法无参数调用vars()：当不带参数调用vars()时,它会返回当前本地作用域中的变量名和值组成的字典。带参数调用vars()：当传递一个对象作为参数时,vars()会返回该对象的属性字典。这等价于object.__dict__。下面是一些示例:#无参数调用x=10y=20print(vars())
从数据到智慧：AI原生知识库构建的完整技术栈解析 AI天才研究院 Agentic AI 实战 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native 大数据 ai
从数据到智慧：AI原生知识库构建的完整技术栈解析关键词AI原生知识库、知识图谱、向量数据库、大语言模型、RAG技术、知识工程、智能问答系统摘要在人工智能飞速发展的今天，构建能够真正理解、组织和应用知识的系统已成为企业数字化转型的核心竞争力。本文将深入剖析AI原生知识库的完整技术栈，从数据采集与预处理，到知识表示与建模，再到存储架构与检索增强生成技术，全方位解读如何将原始数据转化为可行动的智慧。我们
【人工智能】大比拼：文心一言 VS ChatGPT —— 禅与计算机程序设计艺术亲自测评 AI天才研究院 ChatGPT 人工智能文心一言 chatgpt
收到了百度“文心一言”的内测邀请，现在给大家亲身体验测评一下！禅与计算机程序设计艺术先说结论：文心一言表现基本符合预期。与ChatGPT有一定差距，应该在几个月左右。但是禅与计算机程序设计艺术，挺期待ChatGLM-130B版本的效果的。因为，ChatGLM-6B在本地测评的效果，还是非常不错的！目录文心一言写一篇论文介绍一下你自己，从技术原理、应用场景、未来发展、当前不足等方面，不少于3000字
python中vars()的作用 m0_45093979 python 开发语言
在Python中，vars()是一个内置函数，用于返回对象的属性和属性值的字典。它可以用于获取一个对象的命名空间中的所有变量和属性，然后以字典的形式返回这些变量和属性的名称及其对应的值。如果没有提供参数给vars()，它会返回当前作用域（scope）的变量和属性。通常在函数内部调用vars()，它将返回函数的局部命名空间中的所有变量和属性。在模块级别调用vars()，它将返回当前模块的全局命名空间
C++调用python的方法
一、C++中调用python接口在线手册：https://docs.python.org/3/c-api/intro.htmlWindows环境下python安装时提供了给C++调用的头文件及库文件。C++中引用头文件include，放在所有标准引用之前。将头文件目录、库文件目录添加到工程属性。调用python提供的API，传入模块名、函数名、函数参数（封装成PyObject的形式）获取返回值并解
在Windows系统中配置Python 3.11环境安装教程俊星学长 windows python3.11
在Windows系统中配置Python3.11环境安装教程是一个相对直接且简单的过程，但为了确保所有步骤都被详细覆盖，我将分步介绍，并提供必要的背景信息和注意事项。以下是详细的安装教程：一、下载Python3.11首先，需要从Python的官方网站下载Python3.11的安装包。请按照以下步骤操作：访问Python官方网站：打开浏览器，访问Python的官方网站。在网站首页，找到并点击“Down
python vars的作用 jjw_zyfx python python 开发语言后端
classMyDict:name="jjw"age=14result=vars(MyDict)print(result)print("*"*30)print(MyDict.__dict__)#说明vars的一个做用就是其等价于调用类的__dict__属性print(result==MyDict.__dict__)print('-'*30)print(vars())print('#'*30)#函数会
项目篇：加入Python程序之如何在Python中使用C++？ guangcheng0312q python c++windows 开发语言
项目篇：加速Python程序之如何在Python中使用C++？通常像一些耗时的操作，我们期望在C++中去实现，然后使用Python去调用对应的接口，或者因为底层库的原因，需要支持对外的PythonAPI，那么我们通常需要支持在Python中访问C++，如何实现呢？方法比较多，本节以pybind11为例，引入一个完整的项目工程模版，如果你后续有这种需求，可以基于模版去修改。注：(懒人版)本节的所有代
Python与c++互相调用（pybind11）欢迎下辈子光临 CPP Python python c++开发语言
1.安装pybind11看网上使用pipinstallpybind11,没有弄明白，因此下载源码编译。1.1下载pybind11gitclonehttps://github.com/pybind/pybind11.git1.2源码编译cd/pybind11mkdirbuildcdbuildcmake..make编译完成2.cpp样例//example.cpp#include#include"Abs
Python vars() 函数：探索对象的内部程序员喵哥 Python python 开发语言
更多Python学习内容：ipengtao.comPython是一门具有强大而灵活的编程语言，可以访问和探索对象的内部属性。vars()函数是Python标准库中的一个强大工具，它可以获取对象的属性和属性值，并以字典的形式返回它们。在本文中，将深入研究vars()函数，探讨它的用途、示例和适用场景。前言在Python中，对象是一切。对象可以是数字、字符串、列表、字典、函数、类实例等等。每个对象都可
python和C++相互调用使用妄想出头的工业炼药师 c++开发语言
结论：首选PyBind11：综合性能、易用性最佳（GitHub⭐48k+）优先考虑Cython：涉及大量科学计算或已有Cython代码避免Boost.Python（历史包袱重）和SWIG（配置复杂），除非维护旧项目。python调用C++接口C++调用python接口在C++中使用Python库，特别是使用pybind11，是一个非常强大的方法，可以让你在C++项目中轻松地利用Python的强大功
华为OD机试 2025B卷 - 士兵过河 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机考2025A卷华为OD2025B卷华为OD机试2025B卷华为OD机考2025B卷
士兵过河2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD2025B卷200分题型题目描述一支N个士兵的军队正在趁夜色逃亡，途中遇到一条湍急的大河。敌军在T的时长后到达河面，没到过对岸的士兵都会被消灭。现在军队只找到了1只小船，这船最多能同时坐上2个士兵。当1个士兵划船过河，用时为a[i]；0<=i
[论文阅读] 人工智能 + 软件工程 | 当 LLM 写代码时，它的 “思考过程” 靠谱吗？—— 揭秘 CoT 质量的那些事儿张较瘦_ 前沿技术论文阅读人工智能软件工程
当LLM写代码时，它的“思考过程”靠谱吗？——揭秘CoT质量的那些事儿论文标题：AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenerationarXiv:2507.06980[pdf,html,other]AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenera
大模型——什么是 Vibe Coding？从零开始学习 AI 辅助编程不二人生大模型学习人工智能大模型辅助编程
大模型——什么是VibeCoding？从零开始学习AI辅助编程VibeCoding：代码消失，直觉驱动的软件开发新浪潮？生成式人工智能的指数级增长正不断重塑各个行业，软件开发领域也不例外。大约在2025年初，一股源自美国硅谷的新思潮开始引起关注：开发者似乎可以借助AI工具，在几乎不直接编写代码的情况下构建产品。这种依赖直觉、跳脱传统编码苦役的开发方式，被赋予了一个颇具时代感的名字——VibeCod
【无标题】Python ---Day2 复合类型之序列类型、映射类型和集合类型的学习！！！
系列文章目录文章目录系列文章目录前言一、复合类型初识1.1列表类型1.1.1列表创建1.1.2列表运算1.1.3列表访问1.1.3.1索引1.1.3.2反向索引1.1.3.3切片1.1.4列表操作1.1.4.1添加数据1.1.4.2修改数据1.1.4.3删除数据1.2元组类型1.2.1元组创建1.2.2元组操作1.2.2.2查看元组1.2.2.3解包技能1.2.3元组运算1.2.4元组不可变二、映
脑电分析入门指南：信号处理、特征提取与机器学习 Ao000000 信号处理机器学习人工智能
脑电分析入门指南一、为什么要研究脑电1.课题目标（解决什么问题）2.输入与输出二、脑电分析的整体流程三、每一步详解1.数据采集2.预处理3.特征提取4.特征选择/降维5.分类与识别四、研究过程中遇到的挑战与解决方法五、学习感受一、为什么要研究脑电1.课题目标（解决什么问题）本课题旨在通过对脑电（EEG）的采集与分析，提取有用的神经信息，实现对某类脑状或行为的识别/预测/评估。例如：情绪识别、疾病诊
Python数据分析案例｜从模拟数据到可视化：零售门店客流量差异分析全流程
1.依赖库导入importmatplotlib.pyplotaspltimportnumpyasnpimportpandasaspdfrommatplotlibimportfont_managerfromdatetimeimportdatetimematplotlib.pyplot：用于绘制图表。numpy：numpy：pandas：虽然代码中未font_manager：设置datetime：生成
【动手学深度学习】4.10 实战Kaggle比赛：预测房价 XiaoJ1234567 《动手学深度学习》深度学习人工智能
目录4.10实战Kaggle比赛：预测房价1）数据预处理2）模型定义与训练3）模型评估与预测4）模型训练与预测提交5）示例超参数（可调）4.10实战Kaggle比赛：预测房价数据来源：Kaggle房价预测比赛.1）数据预处理读取数据importpandasaspdtrain_data=pd.read_csv('../data/kaggle_house_pred_train.csv')test_da
【机器学习-08】参数调优宝典：网格搜索与贝叶斯搜索等攻略云天徽上机器学习机器学习人工智能
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
Python中字符串的操作方法幻鸩605 python java 开发语言
字符串拼接使用+运算符将多个字符串连接起来。例如：s1="Hello"s2="World"result=s1+""+s2print(result)#输出：HelloWorld字符串重复使用*运算符重复字符串。例如：s="abc"result=s*3print(result)#输出：abcabcabc字符串长度使用len()函数获取字符串长度。例如：s="Python"length=len(s)pr
NLP-D7-李宏毅机器学习---X-Attention&&GAN&BERT&GPT 甄小胖机器学习自然语言处理机器学习 bert
—0521今天4:30就起床了！真的是迫不及待想看新的课程！！！昨天做人脸识别系统的demo查资料的时候，发现一个北理的大四做cv的同学，差距好大！！！我也要努力呀！！不是比较，只是别人可以做到这个程度，我也一定可以！！！要向他学习！！！开始看课程啦！-----0753看完了各种attention，由于attention自己计算的限制，当N很大的时候会产生计算速度问题，从各种不同角度（人工知识输入
【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od python javascript 华为OD机试 2025B卷
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
后端领域的自然语言处理技术应用大厂资深架构师 Spring Boot 开发实战自然语言处理 easyui 人工智能 ai
后端领域的自然语言处理技术应用关键词：后端领域、自然语言处理、技术应用、算法原理、实际案例摘要：本文聚焦于后端领域中自然语言处理技术的应用。首先介绍了相关背景，包括目的范围、预期读者等。接着阐述核心概念与联系，通过文本示意图和Mermaid流程图展示其原理和架构。详细讲解了核心算法原理并给出Python源代码示例，同时介绍了数学模型和公式。通过项目实战，展示代码实际案例并进行详细解释。分析了自然语
【图像处理基石】如何检测到画面中的ppt并对其进行增强？
1.入门版ppt检测增强工具我们介绍一个使用Python进行PPT检测并校正画面的实现方案。这个方案主要利用OpenCV进行图像处理，通过边缘检测和透视变换技术来识别并校正PPT画面。importcv2importnumpyasnpfromPILimportImageimportmatplotlib.pyplotaspltclassPPTDetector:def__init__(self):#初始
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

OpenCV计算机视觉学习（2）——图像算术运算 &图像阈值（数值计算，掩膜mask操作，边界填充，二值化）

如果需要处理的原图及代码，请移步小编的GitHub地址

1，图像算术运算

2，掩膜（mask）

3，边界填充

4，图像阈值（二值化）

5， Otsu 二值化

你可能感兴趣的:(人工智能竞赛,OpenCV,人工智能,python,计算机视觉,opencv,机器学习,深度学习)