A-L-Kun

Python中OpenCV库（一）

文章目录

OpenCV库（一）
- 一、简介
- - 1、简介
  - 2、环境配置
  - - 2.1 第一种
    - 2.2 第二种
  - 3、运行原理
  - - 3.1 灰度图像数字化
    - 3.2 色彩深度和色阶
    - 3.3 彩色图像数字化
- 二、基本操作
- - 1、图像IO操作
  - - 1.1 读取图像
    - 1.2 显示图像
    - 1.3 保存图像
  - 2、绘制几何图形
  - - 2.1 绘制直线
    - 2.2 绘制圆形
    - 2.3 绘制矩形
    - 2.4 添加文字
    - 2.5 效果展示
  - 3、操作图片
  - - 3.1 修改像素点
    - 3.2 获取图像属性
    - 3.3 拆分合并
    - 3.4 色道改变
  - 4、算术操作
  - - 4.1 图像加法
    - 4.2 图像混合
    - 4.3 图像位运算
- 三、滤波器
- - 1、卷积
  - - 1.1 什么是图片卷积
    - 1.2 padding
    - 1.3 卷积核大小
    - 1.4 卷积语法
  - 2、滤波器
  - - 2.1 方盒滤波和均值滤波
    - 2.2 高斯滤波
    - 2.3 中值滤波
    - 2.4 双边滤波
  - 3、算子
  - - 3.1 索贝尔算子
    - 3.2 沙尔算子
    - 3.3 拉普拉斯算子
    - 3.4 Canny 边缘检测
- 四、图像处理
- - 1、几何变换
  - - 1.1 图像缩放
    - 1.2 图像平移
    - 1.3 图像旋转
    - 1.4 仿射变换
    - 1.5 透射变换
    - 1.6 图像金字塔
  - 2、形态学操作
  - - 2.1 图像全局二值化
    - 2.2 自适应阈值
    - 2.3 连通性
    - 2.4 膨胀和腐蚀
    - 2.5 获取形态学卷积核
    - 2.6 开闭运算
    - 2.7 形态学梯度
    - 2.8 顶帽运算
    - 2.9 黑帽操作
  - 3、图像轮廓
  - - 3.1 查找轮廓
    - 3.2 绘制轮廓
    - 3.3 计算面积和周长
    - 3.4 多边形逼近与凸包
    - - 3.4.1 多边形逼近
      - 3.4.2 凸包
    - 3.5 外接矩形

OpenCV库（一）

一、简介

1、简介

Opencv（Open Source Computer Vision Library）是一个基于开源发行的跨平台计算机视觉库，它实现了图像处理和计算机视觉方面的很多通用算法，已成为计算机视觉领域最有力的研究工具。在这里我们要区分两个概念：图像处理和计算机视觉的区别：图像处理侧重于“处理”图像–如增强，还原，去噪，分割等等；而计算机视觉重点在于使用计算机来模拟人的视觉，因此模拟才是计算机视觉领域的最终目标

图是物体反射或透射光的分布，像是人的视觉系统所接受的图在人脑中所形成的印象或认识

OpenCV用C++语言编写，它具有C ++，Python，Java和MATLAB接口，并支持Windows，Linux，Android和Mac OS，如今也提供对于C#、Ch、Ruby，GO的支持

2、环境配置

2.1 第一种

下载OpenCV：【https://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv】

找到对应版本的OpenCV，下载下来

复制文件的地址：【“D:\Documents\opencv_python-4.5.5-cp39-cp39-win_amd64.whl”】

然后打开终端输入：【pip install "D:\Documents\opencv_python-4.5.5-cp39-cp39-win_amd64.whl"】

安装完成后

创建一个python文件，在文件中输入

import cv2
print(cv2.__version__)

成功运行代表安装成功

2.2 第二种

直接在终端输入：pip install opencv-python

这种方式安装较慢哦！

注意：运行OpenCV还要有依赖库 numpy

安装 numpy

pip install numpy

3、运行原理

一般的图像（模拟图像）不能直接用计算机来处理，必须先将图像转化为数字图像。把模拟图像分割成一个个像素，每个像素的亮度或灰度值用一个整数表示——图像的数字化

3.1 灰度图像数字化

所谓的数字化，其实就是化成同行同列的二维数组，而每个坐标存的就是相关的灰度值（0-255）(为什么是0-255？一个字节存放8bit，而图的储存一般都是以uint8类型存放，同时计算机时按照二进制存放数值，也就是2的8次方，也就是256）

3.2 色彩深度和色阶

色彩深度	灰阶
色彩深度（Depth of Color），色彩深度又叫色彩位数。视频画面中红、绿、蓝三个颜色通道中每种颜色为N位，总的色彩位数则为3N，色彩深度也就是视频设备所能辨析的色彩范围。目前有18bit、24bit、30bit、36bit、42bit和48bit位等多种。24位色被称为真彩色，R、G、B各8bit，常说的8bit，色彩总数为1670万，如手机参数，多少万色素就这个概念	通常来说，液晶屏幕上人们肉眼所见的一个点，即一个像素，它是由红、绿、蓝（RGB）三原色组成的。每一个基色，其背后的光源都可以显现出不同的亮度级别。而灰阶代表了由最暗到最亮之间不同亮度的层次级别。把三基色每一个颜色从纯色（如纯红）不断变暗到黑的过程中的变化级别划分成为色彩的灰阶，并用数字表示，就是最常见的色彩存储原理。这中间层级越多，所能够呈现的画面效果也就越细腻。以8bit 为例，我们就称之为256灰阶

色彩深度

灰阶

色彩深度（Depth of Color），色彩深度又叫色彩位数。视频画面中红、绿、蓝三个颜色通道中每种颜色为N位，总的色彩位数则为3N，色彩深度也就是视频设备所能辨析的色彩范围。目前有18bit、24bit、30bit、36bit、42bit和48bit位等多种。24位色被称为真彩色，R、G、B各8bit，常说的8bit，色彩总数为1670万，如手机参数，多少万色素就这个概念

通常来说，液晶屏幕上人们肉眼所见的一个点，即一个像素，它是由红、绿、蓝（RGB）三原色组成的。每一个基色，其背后的光源都可以显现出不同的亮度级别。而灰阶代表了由最暗到最亮之间不同亮度的层次级别。把三基色每一个颜色从纯色（如纯红）不断变暗到黑的过程中的变化级别划分成为色彩的灰阶，并用数字表示，就是最常见的色彩存储原理。这中间层级越多，所能够呈现的画面效果也就越细腻。以8bit 为例，我们就称之为256灰阶

3.3 彩色图像数字化

彩色像数字化原理同灰度图像数字化，只不过彩色图像为三通道图像且可以拆分成三张同等像素的灰度图，由下图可知，每三个BGR就组成了一张图片的一列

数字图像处理的实质就是通过对数字图像中像素数据的判断，依据处理或识别要求，最后逐个像素修改像素的灰度值

二、基本操作

学习目标：

掌握图像的读取和保存方法
能够使用OpenCV在图像上绘制几何图像
能够访问图像的像素
能够获取图像的属性，并进行通道的分离和合并
能够实现颜色空间的变换

1、图像IO操作

1.1 读取图像

语法：cv2.imread(path, mode)

参数：

path：要读取的图像
mode：读取方式的标志
- cv2.IMREAD_COLOR\1：以彩色模式加载图像，任何图像的透明度都将忽略，这个默认参数
- cv2.IMREAD_GRAYSCALE\0：以灰度模式加载图像
- cv2.IMREAD_UNCHANGED\-1：包括alpha通道的加载图像模式
  
  注意：
  - 可以使用数字代替这些标志，数字在源码中可以查看

实例：

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo01.py"
__time__ = "2022/7/15 19:30"
import cv2.cv2 as cv2

img = cv2.imread("./img/1.jpg", 0)  # 以灰度模式读取图像
cv2.imshow("image", img)
cv2.waitKey(0)

如果图像读取错误，其不会报错，而是会使图像为空值

1.2 显示图像

语法：cv2.imshow(winname, mat)

参数：

winname：显示图像窗口名称，以字符串类型显示
mat：要加载的图像

要注意：在调用显示图像API后，要调用cv2.waitKey()给绘制图像留下时间，否则窗口会出现无响应的情况，并且图像无法显示出来

另外，我们也可以使用matplotlib对图像进行展示

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo01.py"
__time__ = "2022/7/15 19:30"
import cv2.cv2 as cv2
from matplotlib import pyplot as plt


img = cv2.imread("./img/1.jpg")
cv2.imshow("image", img)
cv2.waitKey(0)  # 0代表等待足够的时间
cv2.destroyAllWindows()  # 摧毁窗口

# 使用matplotlib显示图片
plt.imshow(img[:, :, ::-1])  # 将rgb转换为bgr，数组逆置
# 灰度图的读取模式：plt.imshow(img, cmap=plt.cm.gray)
plt.show()

1.3 保存图像

语法：cv2.imwrite(fielname, img)

参数：

filename：文件名，路径
img：要保存的图像

代码：

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo01.py"
__time__ = "2022/7/15 19:30"
import cv2.cv2 as cv2
import numpy as np

img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)  # 声明图像数据为numpy的数组
cv2.imwrite("test.jpg", img)

2、绘制几何图形

2.1 绘制直线

语法：cv2.line(img, start, end, color, thickness)

参数：

img：要绘制直线的图像
Start, End：起始点、终点
color：直线的颜色
thickness：线条的宽度，为-1时生成闭合图案，并填充颜色

2.2 绘制圆形

语法：cv2.circle(img, centerpoint, r, color, thickness)

参数：

centerpiont：圆形的坐标
r：圆的半径
其它参数和绘制直线的参数意义相同

2.3 绘制矩形

语法：cv2.rectangle(img, leftupper, rightdown, color, thickness)

参数：

leftupper：矩形左上角坐标
rightdown：矩形右下角坐标

2.4 添加文字

语法：cv2.putText(img, text, station, font, fontsize, color, thickness, cv.Line_AA)

参数：

station：文本放置位置
text：要写入的文本数据
font：字体
fontsize：字体大小

2.5 效果展示

我们生成一个全黑的图像，然后再里面绘制图像并添加文字

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo02.py"
__time__ = "2022/7/15 21:36"

import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

# 创建一个空白的图像 1920x1080
img = np.zeros([1080, 1920, 3], np.uint8)  # 并且设置数据类型为uint8
# 绘制图形
cv2.line(img, (0, 0), (502, 502), (255, 255, 255), 4)
cv2.rectangle(img, (502, 502), (900, 900), (255, 0, 0), 4)
cv2.circle(img, (800, 700), 100, (0, 255, 0), 4)

# 写入文字
cv2.putText(img, "hello world", (10, 500), cv2.FONT_HERSHEY_COMPLEX_SMALL, 4, (255, 255, 0), 4)  # 使用cv2内置的字体

plt.imshow(img[:, :, ::-1])  # 逆置图像
plt.title("test")  
plt.show()

3、操作图片

3.1 修改像素点

我们可以通过行和列的坐标值获取像素值，对于RGB图像，它返回一个rgb的数组，对于灰度图像，仅返回相应的强度值，使用相同的方法对像素值进行修改

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo02.py"
__time__ = "2022/7/15 21:36"

import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread("./img/1.jpg")
# 声明img的类型
assert isinstance(img, np.ndarray)

# 获取对应点的像素强度值
print(img[100, 200])

# 修改某个点的像素值
img[100, 100] = [255, 255, 255]
plt.imshow(img[:, :, ::-1])
plt.show()

3.2 获取图像属性

图像属性包括行数、列数和通道，图像数据类型，像素值等

属性	API
形状	`img.shape`
图像大小	`img.size`
数据类型	`img.dtype`

3.3 拆分合并

有时需要在B、G、R通道图像上单独工作。在这种情况下，需要将BGR图像分割为单个通道，或者在其他情况下，可能需要将这些单独的通道合并到BGR图像，你可以通过以下方式完成：

# 通道分离
b, g, r = cv2.split(img)

# 通道合并
img = cv2.merge(b, g, r)

实例：

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo02.py"
__time__ = "2022/7/15 21:36"

import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)

plt.imshow(img[:, :, ::-1])  # 进行色道的逆置，转换为bgr
b, g, r = cv2.split(img)  # 分离
plt.imshow(b, cmap=plt.cm.gray)
plt.show()

img2 = cv2.merge((b, g, r))  # 返回rgb图像
plt.imshow(img2[:, :, ::-1])  
plt.show()

3.4 色道改变

OpenCV中有150多种颜色空间转换方法，最广泛的转换方法有两种，BGR->Gray和BGR->HSV

语法：cv2.cvtColor(input_image, flag)

参数：

input_image：进行颜色空间转换的图像
flag：转换类型
- cv2.COLOR_BGR2GRAY：BGR->GRAY
- cv2.COLOR_BGR2HSV：BGR->HSV

4、算术操作

学习目标：

了解图像的加法，混合操作

4.1 图像加法

你可以使用OpenCV的cv2.add()函数把两幅图像相加，或者可以简单通过numpy操作添加两个图像，如：res = img1 + img2，两个图像应该具有相同大小和类型，或者第二个图像可以是标量值

注意：OpenCV加法和Numpy加法之间存在差异，OpenCV的加法的饱和操作，而Numpy添加时模运算操作

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "logic.py"
__time__ = "2022/7/16 10:52"

import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

x = np.uint8([250])
y = np.uint8([10])  # unsigned int-8

print(cv2.add(x, y))  # 250 + 10 = 260 -> 255
print(x + y)  # 250 + 10 = 260 % 256 = 4

# 实例
# 导入图像
img1 = cv2.imread("./img/1.jpg")
assert isinstance(img1, np.ndarray) 

img2 = cv2.imread("./img/2.jpg")
assert isinstance(img2, np.ndarray)

# 对图像进行相加
img3 = cv2.add(img1, img2)
plt.imshow(img3[:, :, ::-1])
plt.show()
img4 = img1 + img2
plt.imshow(img4[:, :, ::-1])
plt.show()

推荐使用OpenCV里面的加法cv2.add()和减法cv2.subtract()

4.2 图像混合

图像混合其实也是加法，但是不同的是两幅图像的权重不同，这就会给人一种混合或者透明的感觉，图像混合的计算公式如下：

$g(x)=(1-\alpha) \cdot f_0(x) + \alpha \cdot f(x)$

通过修改阿尔法的值，可以实现非常酷的操作

现在我们把两幅图混合在一起，第一幅图的权重是0.7，第二幅图的权重是0.3，函数cv2.addWeight(img1, alpha, img2, beta, gamma)可以按下面公式对图片进行混合操作

$\alpha \cdot img_1 + \beta \cdot img_2 + \gamma$

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "logic.py"
__time__ = "2022/7/16 10:52"

import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

img1 = cv2.imread("./img/1.jpg")
assert isinstance(img1, np.ndarray)

img2 = cv2.imread("./img/2.jpg")
assert isinstance(img2, np.ndarray)

img3 = cv2.addWeighted(img1, 0.7, img2, 0.3, 0)  # 根据权重混合
plt.imshow(img3[:, :, ::-1])
plt.show()

4.3 图像位运算

OpenCV的逻辑运算——与、或、非、异或

OpenCV中的非：0 反过来是 255

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo9.py"
__time__ = "2022/7/18 18:09"
import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg")  # 读取黑白效果
assert isinstance(img, np.ndarray)

img_ = np.zeros(img.shape, np.uint8)
# 非操作
img_not = cv2.bitwise_not(img)

# 或操作
img_or = cv2.bitwise_or(img, img_)

# 与操作
img_and = cv2.bitwise_and(img, img_)

# 展示图片
cv2.namedWindow("not", cv2.WINDOW_NORMAL)
cv2.resizeWindow("not", 640, 480)
cv2.imshow("not", np.hstack((img[:640, :480], img_not[:640, :480])))
cv2.namedWindow("and", cv2.WINDOW_NORMAL)
cv2.resizeWindow("and", 640, 480)
cv2.imshow("and", np.hstack((img[:640, :480], img_and[:640, :480])))
cv2.namedWindow("or", cv2.WINDOW_NORMAL)
cv2.resizeWindow("or", 640, 480)
cv2.imshow("or", np.hstack((img[:640, :480], img_or[:640, :480])))
cv2.waitKey(0)
cv2.destroyAllWindows()

三、滤波器

1、卷积

1.1 什么是图片卷积

图像卷积就是卷积核在图像上按行滑动遍历像素时不断在相乘求和的过程

基本概念

步长

步长就是卷积核在图像上移动的步幅，卷积核可以每次移动一个像素步长或者两个像素步长等

步长一般为1
padding

从上面图片中，我们可以看出，卷积之后图片的长宽会变小，如果要保持图片大小不变。我们需要在原始图片周围填充0。padding指的就是填充0的圈数。

1.2 padding

我们如何判断需要补0的圈数呢？

我们可以通过公式计算出需要填充的0的圈数：

输入体积大小： $H_1 \cdot W_1 \cdot D_1$
四个超参数：
- Filter数量K
- Filter大小F
- 步长S
- 零填充大小P
输出体积大小： $H_2 \cdot W_2 \cdot D_2$
$\begin{matrix} H_2 = (H_1 - F + 2P) / S + 1\\ W_2 = (W_1 - F + 2P) / S + 1 \\ D_2 = K \end{matrix}$
```
3 x 3 的卷积核 结果 -2
5 x 5 的卷积核 结果 -4
7 x 7 的卷积核 结果 -6
```
求圈数：

$H_1 - F + 2P) / S + 1 = H_1$

通过这个式子可以求出补0的圈数

如果步长为1，则可以推导出 $P=\frac{F-1}{2}$

1.3 卷积核大小

图片卷积中，卷积核一般为奇数，比如 3 x 3，5 x 5，7 x 7。为什么一般是奇数呢？

根据上面padding的计算公式，如果要保持图片大小不变，采用偶数卷积核的话，将会出现奇数圈0的情况
奇数维度的过滤有中心，便于指出过滤器的位置，即OpenCV卷积中的锚点

1.4 卷积语法

语法：cv2.filter2D(src, ddepth, kernel, [, dest[, anchor[, delta[, borderType]]]])

参数：

ddpeth：其为卷积之后图像的位深，即卷积之后图片的数据类型，一般为-1，表示和原图类型一致
kernel：卷积和大小，用元组或者ndarray表示，要求数据类型必须是float32类型
anchor：锚点，即卷积核的中心点，是可选参数，默认是(-1, -1)
delta：可选参数，表示卷积之后额外加一个值，相当于线性方程中的偏差，默认是0
borderType：边界类型，一般不设

案例：

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo04.py"
__time__ = "2022/7/17 9:52"
import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

# 读取图像
img = cv2.imread("./img/1.jpg", cv2.IMREAD_GRAYSCALE)  # 读取灰度图
assert isinstance(img, np.ndarray)

# 创建核结构，kernel必须是float32类型
kernel = np.array([
    [-1, -1, -1],
    [-1, 8, -1],
    [-1, -1, -1]
], np.float32)  # 轮廓效果

# 进行卷积
img_ = cv2.filter2D(img, -1, kernel)

# 图片展示
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 1920, 1080)

cv2.imshow("img", img_)
cv2.waitKey(0)
cv2.destroyAllWindows()

卷积核可以在网上查找

2、滤波器

2.1 方盒滤波和均值滤波

方盒滤波

语法：cv2.boxFilter(src, ddepth, ksize[, dist[, anchor[, normalize[, borderType]]]])

方盒滤波的卷积核形式如下：
$a\cdot \begin{matrix} 1 & 1 & \cdots& 1\\ 1& 1 &\cdots & 1 \\ \cdots &\cdots &\cdots &\cdots\\ 1& 1 &\cdots & 1 \end{matrix}$
参数：

nomalize：
- 其为True时， $a=\frac{1}{W \cdot H}$
- 其为False时，a = 1
一般情况下，我们都使用nomalize=True的情况，这时，方盒滤波等价于均值滤波
ksize：卷积核大小

均值滤波

语法：cv2.blur(src, ksize[, dest[, anchor[, borderType]]])

代码演示：

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo04.py"
__time__ = "2022/7/17 9:52"
import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg")  
assert isinstance(img, np.ndarray)


# 使用滤波器
img_ = cv2.boxFilter(img, -1, (5, 5), normalize=True)  # 模糊处理
img_1 = cv2.blur(img, (5, 5))  # 模糊处理


# 图片展示
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 1920, 1080)

cv2.imshow("img", img_)
cv2.waitKey(0)
cv2.destroyAllWindows()

2.2 高斯滤波

要理解高斯滤波，首先要知道什么是高斯函数，高斯函数是在符合高斯分布（也叫正态分布）的数据的概率密度函数

高斯函数的特点：以x轴某一点（这一点称为均值）为对称轴，越靠近中心数据发生的概率越高，最终形成一个两边平缓，中间陡峭的钟型图形

高斯函数的一般形式为：

一维高斯分布： $G(x)=\frac{1}{\sqrt{2\pi \sigma}}e^{-\frac{(x-\mu)^2}{2\sigma ^2}}$

二维高斯分布： $y)=\frac{1}{\sqrt{2\pi \sigma ^ 2}}e^{-\frac{x^2 + y^2}{2\sigma ^2}}$

高斯滤波就是使用符合高斯分布的卷积核对图片进行卷积操作，所以高斯滤波的重点就是如何计算符合高斯分布的卷积核，即高斯模板

通过高斯函数计算出来的是概率密度函数，所以我们还要确保这九个点加起来为1，我们需要将这九个点求和，再分别求权重，得到最终的高斯模板

语法：cv2.GaussianBlur(src, ksize, sigmaX[, dist[, sigmaY[, borderType]]])

参数：

ksize：高斯核的大小
sigmaX：X轴的标准差
sigmaY：Y轴的标准差，默认为0，这时：sigmaX = sigmaY
如果指定sigma值为0，会分别从ksize的宽度和高度中计算sigma

选择不同的sigma值会得到不同的平滑效果，sigma越大，平滑效果越明显

高斯滤波可以去除噪点

2.3 中值滤波

中值滤波原理非常简单，假设有一个数组，取其中的中间值（即中位数）作为卷积后的结果值即可，中值滤波对胡椒噪点效果明显

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo04.py"
__time__ = "2022/7/17 9:52"
import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)

# 使用滤波器
img_ = cv2.medianBlur(img, 5)  #注意，中值滤波这里的ksize就是一个数字

# 图片展示
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 1920, 1080)

cv2.imshow("img", img_)
cv2.waitKey(0)
cv2.destroyAllWindows()

2.4 双边滤波

双边滤波对于图像的边缘信息能够更好的保存，其原理为一个与空间距离相关的高斯函数与一个灰度距离相关的高斯函数相乘

空间距离：指的是当前点与中心点的欧式距离。空间域高斯函数其数学形式为：
$e^{-\frac{(x_i-x_c)^2 + (y_i - y_c)^2}{2\sigma ^2}}$
其中，( $x_i$ , $y_i$ )为当前位置，( $x_c$ , $y_c$ )为中心点的位置，sigma为空间域标准差
灰度距离：指的是当前点灰度与中心点灰度的差的绝对值，值域高斯函数其数学形式为：
$e^{-\frac{(gray(x_i, y_i) -gray(x_c, y_c))^2}{2\sigma ^2}}$

双边滤波本质上是高斯滤波，双边滤波和高斯滤波不同的是：双边滤波既利用了位置信息，又利用了像素信息来定义滤波窗口的权重，而高斯滤波只利用了位置信息

双边滤波中加入了对灰度信息的权重，即在邻域内，灰度值越接近中心点灰度值权重更大，灰度值相差大的权重点权重越小，此权重大小，则有高斯函数确定

两者权重系数相乘，得到最终的卷积模板，由于双边滤波需要每个中心点邻域的灰度信息来确定其系数，所以其速度比一般滤波慢得多，而且计算量增长速度为核大小的平方

双边滤波可以保留边缘，同时可以对边缘内的区域进行平滑处理，相当于做了美颜

语法：bilateralFilter(src, ksize, sigmaColor, sigmaSpace[, dst[, borderType]])

参数：

ksize：卷积核大小，传入数字
sigmaColor：计算像素信息使用的sigma
sigmaSpace：计算空间信息使用的sigma

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo04.py"
__time__ = "2022/7/17 9:52"
import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

# 读取图像
img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)


# 使用滤波器
img_ = cv2.bilateralFilter(img, 7, 20, 50)

# 图片展示
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)

cv2.imshow("img", img_)
cv2.waitKey(0)
cv2.destroyAllWindows()

3、算子

边缘是像素值发生跃迁的位置，是图像的显著特征之一，在图像特征提取，对象检测，模式识别等方面都有重要作用

人眼如何识别图像边缘？

比如有一副图，图里面有一条线，左边很亮，右边很暗，那人眼就很容易识别这条线作为边缘，也就是像素的灰度值快速变化的地方

3.1 索贝尔算子

索贝尔算子对图像求一阶导数，一阶导数越大，说明像素在该方向作为边缘，也就是像素灰度值快速变换的地方

因为图像的灰度值都是离散的数字，索贝尔算子采用离散差分算子计算图像像素点亮度值的近似梯度

图像是二维的，即沿着宽度/高度这两个方向

我们可以得到两个新的矩阵，分别反映了每一点像素在水平方向上的亮度变化情况和在垂直方向上的亮度变换情况

综合考虑这两个方向的拜年话，我们可以使用平方和相加的方式 $G=\sqrt{G_x^2 + G_y^2}$ 反映某个像素的梯度变化情况，有时候为了简单起见，也直接使用绝对值相加替代 $G=|G_x|+|G_y|$

语法：Sobel(src, ddepth, dx, dy, dst=None, ksize=None, scale=None, delta=None, borderType=None)

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo5.py"
__time__ = "2022/7/18 11:20"
import cv2.cv2 as cv2
import numpy as np

img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)

# 注意sobel算子要分开计算x，y的梯度女
# 计算X轴方向的梯度
dx = cv2.Sobel(img, -1, 1, 0, None, 3)
# 计算Y轴方向的梯度
dy = cv2.Sobel(img, -1, 0, 1, None, 3)

# 计算和梯度
img_ = cv2.add(dx, dy)

cv2.namedWindow("img", cv2.WINDOW_AUTOSIZE)

# cv2.imshow("img", dx)
# cv2.imshow("img", dy)
cv2.imshow("img", np.hstack((img_, dx, dy)))
cv2.waitKey(0)
cv2.destroyAllWindows()

3.2 沙尔算子

当内核大小为3时，以上的索贝尔内核可能产生比较明显的误差（其值求取了导数的近似值）

为了解决这一问题，OpenCV提供了Scharr函数，但该函数仅作用于大小为三的内核，该函数的运算与索贝尔函数一样快，但是结果更加精确

沙尔算子和索贝尔算子很类似，只不过使用不同的内核值，放大了像素变换的情况

语法：Scharr(src, ddepth, dx, dy, dst=None, scale=None, delta=None, borderType=None)

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo5.py"
__time__ = "2022/7/18 11:20"
import cv2.cv2 as cv2
import numpy as np

img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)

# 注意sobel算子要分开计算x，y的梯度女
# 计算X轴方向的梯度
dx = cv2.Scharr(img, -1, 1, 0)
# 计算Y轴方向的梯度
dy = cv2.Scharr(img, -1, 0, 1)
# 计算和梯度
img_ = cv2.add(dx, dy)

cv2.namedWindow("img", cv2.WINDOW_AUTOSIZE)

# cv2.imshow("img", dx)
# cv2.imshow("img", dy)
cv2.imshow("img", np.hstack((img_, dx, dy)))
cv2.waitKey(0)
cv2.destroyAllWindows()

3.3 拉普拉斯算子

索贝尔算子是模拟一阶求导，导数越大的地方说明变换越剧烈，越有可能是边缘，那么如果继续对导数求导呢？可以发现边缘处的二阶导数为0，我们可以利用这一特性去寻找图像的边缘（二阶导数为0的位置也可能是无意义的位置）

拉普拉斯算子推导过程：

以x方向求解为例：
$一阶差分：f^{'}x = f(x) - f(x-1)\\ 二阶差分：f^{"}(x) = f^{'}(x+1) - f^{'}(x)=(f(x+1) - f(x))-((f(x) - f(x-1))\\ 化简后：f^{"}(x) = f(x-1)-2f(x)+f(x+1)\\ 同理可得：f^{"}(y) = f(y-1)-2f(y)+f(y+1)\\ 把x, y方向的梯度叠加到一起：\\ f^{"}(x, y) = f^{"}_x(x, y)+f^{"}_y(x, y)\\ =f(x-1, y)+f(x+1, y) + f(x, y-1) + f(x, y+1)-4f(x, y)\\ 这个等式可以用矩阵写成：\\ f^{"}(x, y) = \begin{matrix} 0&1&0\\ 1&-4&1\\ 0&1&0 \end{matrix} \odot \begin{matrix} f(x-1, y-1)&f(x, y-1)&f(x+1, y-1)\\ f(x-1, y)&f(x,y)&f(x+1, y)\\ f(x-1, y+1)&f(x, y+1)&f(x+1, y+1) \end{matrix}\\ 这样就得到了拉普拉斯算子的卷积核即卷积模板$
语法：cv2.Laplacian(src, ddepth, dst=None, ksize=None, scale=None, delta=None, borderType=None)

可以同时求两个方向的边缘

对噪音敏感，需要先进行去噪，再调用拉普拉斯算子

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo5.py"
__time__ = "2022/7/18 11:20"
import cv2.cv2 as cv2
import numpy as np

img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)

img = cv2.medianBlur(img, 7)  # 进行去噪
# 计算梯度
img_ = cv2.Laplacian(img, cv2.CV_64F)  # 设置位深

cv2.namedWindow("img", cv2.WINDOW_AUTOSIZE)

# cv2.imshow("img", dx)
# cv2.imshow("img", dy)
cv2.imshow("img", np.hstack((img_, dx, dy)))
cv2.waitKey(0)
cv2.destroyAllWindows()

3.4 Canny 边缘检测

Canny 边缘检测算法是用来进行多级边缘检测算法，也被很多人认为是边缘检测的最优算法，最优边缘检测的三个主要评价标准是：

低错误率：标识出尽可能多的实际边缘，同时尽可能的减少噪声产生的误报
高定位性：标识出的边缘要与图像中的实际边缘尽可能接近
最小响应：图像中的边缘只能标识一次

Canny边缘检测的一般步骤：

去噪，边缘检测容易受到噪声影响，在进行边缘检测前通常需要先进行去噪，一般用高斯滤波去除噪声
计算梯度：对平滑后的图像采用sobel算子计算梯度和方向
- $G=\sqrt{G_x^2+G_y^2}$ ，为了方便一般可以改用绝对值相加
- $\theta =\arctan {(\frac{G_y}{G_x} )}$
- 梯度的方向被归为四类，垂直、水平和两条对角线
非极大值抑制
- 在获取了梯度和方向后，遍历图像，去掉所有不是边界的点
- 实现方法：逐个遍历像素点，判断当前像素点周围像素点中是否具有相同方向梯度的最大值
- 滞后阈值

语法：Canny(img, minVal, maxVal, ...)

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo5.py"
__time__ = "2022/7/18 11:20"
import cv2.cv2 as cv2
import numpy as np

img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)


# 阈值越小，细节越丰富
lena1 = cv2.Canny(img, 100, 200)  # 设置阈值范围
lena2 = cv2.Canny(img, 64, 128)

cv2.imshow("img", np.hstack((lena1, lena2)))
cv2.waitKey(0)
cv2.destroyAllWindows()

四、图像处理

1、几何变换

学习目标

掌握图像的缩放、平移、旋转等
了解数字图像的仿射变换和透射变换

1.1 图像缩放

缩放是对图像大小进行调整，即使图像放大或缩小

语法：cv2.resize(src, dsize, fx=0, fy=0, interpolation=cv2.INTER_LINEAR)

参数：

src：输入图像
dsize：绝对尺寸，直接指定调整后图像的大小
fx, fy：相对尺寸，将dsize设置为None，然后将fx和fy设置为比例因子即可

interpolation：差值方法

差值	含义
`cv2.INTER_LINEAR`	双线性插值法
`cv2.INTER_NEAREST`	最近邻插值
`cv2.INTER_AREA`	像素区域重采样（默认）
`cv2.INTER_CUBIC`	双三次插值

1.2 图像平移

图像平移将图像按照指定方向和距离，移动到相应的位置

语法：cv2.warpAffine(img, M, dsize)

参数：

img：输入图像
M：2*3移动矩阵

对于（x, y）处的像素点，要把它移动到( $x + t_x$ , $y + t_y$ )，M矩阵应如下设置：

$\begin{matrix} 1 & 0 & t_x \\ 0& 1&t_y \end{matrix}$

注意：将M设置为np.float32类型的Numpy数组
dsize：输出图像的大小

注意：输出图像的大小，它应该是（宽度/列，高度/行）的形式

实例：

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo3.py"
__time__ = "2022/7/16 11:32"
import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)

img = cv2.warpAffine(img, np.float32([
    [1, 0, 100],
    [0, 1, 50]
]), img.shape[1:: -1])  # 根据原图像大小进行平移，不进行缩放，img.shape(row, col, color)
plt.imshow(img[:, :, ::-1])
plt.show()

1.3 图像旋转

图像旋转是指图像按照某个位置移动一定角度的过程，旋转中图像仍然保持这原始尺寸。图像旋转后图像的水平对称轴、垂直对称轴及中心坐标原点都可能发生变换，因此需要对图像旋转中的坐标进行相应转换

在OpenCV中，图像旋转首先根据旋转角度和旋转中心获取旋转矩阵，然后根据旋转矩阵进行变换，即可实现任意角度和任意中心的旋转效果

语法：cv2.getRotationMatrix2D(center, angle, scale)

参数：

center：旋转中心
angle：旋转角度
scale：缩放比例

M：旋转矩阵

调用img = cv2.warpAffine(img, M, img.shape[1:: -1])完成图像的旋转

实例：

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo3.py"
__time__ = "2022/7/16 11:32"
import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)

# 规定逆时针旋转
M = cv2.getRotationMatrix2D((0, 0), 30, 1)  # 获取旋转矩阵

img = cv2.warpAffine(img, M, img.shape[1:: -1])  # 进行图像旋转

plt.imshow(img[:, :, ::-1])
plt.show()

1.4 仿射变换

图像的仿射变换涉及到图像的形状位置角度的变化，是深度学习预处理中常用到的功能，仿射变换主要是对图像的缩放、旋转，翻转和平移等操作的组合那什么是仿射变换？仿射变换，是指在几何中，对一个向量空间进行一次线性变换并接上一个平移，变换为另一个向量空间。

在OpenCV中，仿射变换的矩阵是一个2*3的矩阵：

需要注意的是，对于图像而言，宽度方向是x，高度方向是y，坐标的顺序和图像像素对应下标一致，所以原点的位置不是左下角而是左上角，y的方向也不是向上，而是向下

在仿射变换中，原图中所有的平行线在结果图像中同样平行，为了创建这个矩阵，我们需要从原图像中找到三个点以及他们在输出图像中的位置，然后cv2.getAffineTransform()会创建一个2x3的矩阵，最后这个矩阵会被传给函数cv2.warpAffine(img, M, dsize)

实例：

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo3.py"
__time__ = "2022/7/16 11:32"
import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)

# 创建变换矩阵
src = np.float32([
    [50, 50],
    [200, 50],
    [50, 200]
])  # 原始位置的点
dest = np.float32([
    [100, 100],
    [200, 50],
    [100, 250]
])  # 变换后的点

M = cv2.getAffineTransform(src, dest)  # 完成仿射变换


img = cv2.warpAffine(img, M, img.shape[1:: -1])  # 根据原图像大小进行平移，不进行缩放，img.shape(row, col, color)
plt.imshow(img[:, :, ::-1])
plt.show()

1.5 透射变换

透射变换是视角变换的结果，是指利用透视中心、像点、目标点散点共线的条件，按透视旋转定律使承影面（透视面）绕轨迹线（透视轴）旋转某一角度，破坏原有的投影光线束，仍能保持承影面上投影几何图形不变的变换，透视变换是将图片投影到一个新的视平面，也称作投影映射．它是二维（x,y）到三维(X,Y,Z)，再到另一个二维(x’,y’)空间的映射

变换公式：

透射变换矩阵为：

其中，T1代表对图像进行线性变换，T2对图像进行平移，T3表示对图像进行投射变换，a33一般设为1

在OpenCV中，我们要找到四个点，其中任意三个不共线，然后获取变换矩阵T，再进行透射变换，通过函数cv2.getPerspectiveTransform()找到变换矩阵，将cv2.warpPerspective()应用于此3x3变换矩阵

示例：

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo3.py"
__time__ = "2022/7/16 11:32"
import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)

# 创建变换矩阵
src = np.float32([
    [56, 65],
    [368, 52],
    [28, 387],
    [389, 390],
])  # 原始位置的点
dest = np.float32([
    [100, 145],
    [300, 100],
    [80, 290],
    [310, 300]
])  # 变换后的点

M = cv2.getPerspectiveTransform(src, dest)  # 进行透射变换


img = cv2.warpPerspective(img, M, img.shape[1:: -1])  # 根据原图像大小进行平移，不进行缩放，img.shape(row, col, color)
plt.imshow(img[:, :, ::-1])
plt.show()

1.6 图像金字塔

图像金字塔是图像多尺度表达的一种，最主要用于图像的分割，是一种以多分辨率来解释图像的有效但概念简单的结构

图像金字塔用于及其视觉和图像压缩，一副图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低，但来源于同一张原始图的图像集合，其通过梯次向下采样获得，直到达到某个终止条件才停止采样

金字塔的底部是待处理图像的高分辨率表示，而顶部是低分辨率的近似，层级越高，图像越小，分辨率越低

语法：

cv2.pyrUp(img)  # 对图像进行向上采样
cv2.pyrDown(img)  # 对图像进行向下采样

2、形态学操作

形态学的基本思想是利用一种特殊的结构元（本质上就是卷积核）来测量或提取输入图像中相应的形状或特征，以便进一步进行图像分析和目标识别

这些处理方法基本是对二进制图像进行处理，即黑白图像

卷积核决定着图像处理后的效果

学习目标:

理解图像的邻域、连通性
了解不同的形态学操作：腐蚀、膨胀、开闭运算、礼帽和黑帽等，及其不同操作之间的关系

2.1 图像全局二值化

二值化：将图像的每个像素变成两种值：比如0,255

语法：cv2.threshold(src, thresh, maxval, type[, dest])

参数：

thresh：阈值
maxval：最大值，最大值不一定是255
type：操作类型，常见操作类型如下：

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo6.py"
__time__ = "2022/7/18 14:31"
import cv2.cv2 as cv2
import numpy as np

# 导入图片
img = cv2.imread("./img/1.jpg", cv2.IMREAD_GRAYSCALE)  # 以灰度图的形式导入

# 二值化操作是对灰度图像操作，注意，这个函数会返回两个值，一个是阈值，一个是原图像
thresh, img_ = cv2.threshold(img, 100, 255, cv2.THRESH_BINARY)

print(thresh)

cv2.imshow("img", img_)
cv2.waitKey(0)
cv2.destroyAllWindows()

2.2 自适应阈值

在前面的部分，我们使用是全局阈值，整副图像采用同一个数作为阈值。当时这种方法并不适应与所有情况，尤其是在当同一副图像上的不同部分具有不同亮度时。这种情况下，我们需要采用自适应阈值。此时的阈值是根据图像上每一个小区域计算与其对应的阈值。因此在同一副图像上的不同区域采用不同的阈值，从而使我们能在亮度不同的情况下得到更好的结果

语法：cv2.adaptiveThreshold(src, maxValue, adpativeMethod, type, blockSize, C, dest=None)

参数：

adaptiveThreshold：指定计算阈值的方法
- cv2.ADAPTIVE_THRESH_MEAN_C：阈值取自相邻区域的平均值
- cv2.ADAPTIVE_THRESH_GAUSSIAN_C：阈值取值相邻区域的加权和，权重为一个高斯窗口
- blockSize：邻域大小（用来计算阈值的区域大小）
- C：这是一个常数，阈值等于的平均值或者加权平均值减去这个常数

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo6.py"
__time__ = "2022/7/18 14:31"
import cv2.cv2 as cv2
import numpy as np

# 导入图片
img = cv2.imread("./img/1.jpg", cv2.IMREAD_GRAYSCALE)  # 以灰度图的形式导入

# 自适应阈值二值化只有一个返回值
img_ = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 21, 0)

cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)

cv2.imshow("img", np.hstack([img[:640, :480], img_[:640, :480]]))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

2.3 连通性

在图像中，最小的单位是像素，每个像素周围有8个邻接像素，常见的邻接关系有3中：4邻接、D邻接和8邻接。

4邻接：像素p(x, y)的4邻域是：(x+1, y), (x-1, y), (x, y+1), (x, y-1)
D邻域：像素p(x,y)的D邻域是：对角上的点，(x+1, y+1), (x+1, y-1), (x-1, y+1), (x-1, y-1)
8邻域：像素P(x,y)的8邻域是：4邻域的点 + D邻域的点，用 $N_8(p)$ 表示像素p的8邻域

连通性是描述区域和边界的重要概念，两个像素连通的两个必要条件是：

两个像素的位置是否相邻
两个像素的灰度值是否满足特定的相似性准则（或者是否相等）

根据连通性的定义，有4连通、8连通和m连通：

4连通：对于具有值V的像素p和q，如果q在集合 $N_4(p)$ 中，则称这两个像素是4连通
8连通：对于具有值V的像素p和q，如果q在集合 $N_8(p)$ 中，则称这两个像素是8连通
m连通：对于具有值V的像素p和q，如果：
- q在集合 $N_4(p)$ 中，
- 或
- q在集合 $N_D(p)$ 中，
- 并且 $N_4(p)$ 和 $N_4(q)$ 的交集为空（没有值V的像素）
则称这两个像素是m连通的，即4连通和D连通是混合连通

2.4 膨胀和腐蚀

形态学转换是基于图像形状的一些简单操作，它通常在二进制图像上执行。腐蚀和膨胀是两个基本的形态学运算符，然后它的变形形式如运算、闭运算、礼帽黑帽等

腐蚀和膨胀是最基本的形态学操作，腐蚀和膨胀都是针对白色部分（高亮部分）而言的

膨胀就是使图像中高亮部分扩展，效果图拥有比原图更大的高亮区域；腐蚀是原图中高亮区域被蚕食，效果图拥有比原图更小的高亮区域。膨胀是求局部最大值的操作，腐蚀是求局部最小值的操作

腐蚀：

具体操作时：用一个结构单元扫描图像中的每一个像素，用结构元素中的每一个像素与其覆盖的像素做“与”操作，如果为1，则该像素为1，否则为0。

作用：腐蚀的作用是消除物体边界点，使目标缩小，可以消除小于结构元素的噪声点

语法：cv2.erode(img, kernel, iteration)

参数：
- img：要处理的图像
- kernel：内核结构
- iteration：腐蚀次数，默认是1
膨胀：

具体操作是：用一个结构元素（卷积核）扫描图像中的每一个像素，用结构单元中的每一个像素与其覆盖的像素做“与”操作，如果都为0，则该像素为0，否则为1,

作用：膨胀的作用是将与接触物体的所有背景点合并到物体中，使目标增大，可添补目标中的孔洞

语法：cv2.dilate(img, kernel, iterator)

示例：

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo04.py"
__time__ = "2022/7/17 9:52"
import cv2.cv2 as cv2
import numpy as np
import matplotlib.pyplot as plt

# 读取图像
img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)

# 创建核结构
kernel = np.ones((5, 5), np.uint8)

# 图像腐蚀和膨胀
erode_ = cv2.erode(img, kernel)
dilate_ = cv2.dilate(img, kernel)

# 展示图像
plt.imshow(erode_[:, :, ::-1])
plt.show()
plt.imshow(dilate_[:, :, ::-1])
plt.show()

2.5 获取形态学卷积核

OpenCV提供了获取卷积核的接口，不需要我们手动创建卷积核

语法：getStructuringElement(shape, ksize[, anchaor])

参数：

shape：只卷积核的形状，注意不是指长度，是指卷积核中1形成的形状
- cv2.MORPH_RECT：卷积核中的1是矩形
- cv2.MORPH_ELLIPSE：椭圆
- cv2.MORPH_CROSS：十字

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo7.py"
__time__ = "2022/7/18 15:17"
import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg", cv2.IMREAD_GRAYSCALE)
assert isinstance(img, np.ndarray)

# 获取内核形状
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))

# 图像腐蚀和膨胀
erode_ = cv2.erode(img, kernel)
dilate_ = cv2.dilate(img, kernel)

# 显示图像
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)
cv2.imshow("img", np.hstack((erode_[:640, :480], dilate_[:640, :480])))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

2.6 开闭运算

开运算和闭运算是将腐蚀和膨胀按照一定的次序进行处理，但这两者并不是可逆的，即先开后闭并不能得到原来的图像

开运算是先腐蚀后膨胀，其作用是，消除小区域。特点：消除噪点，去除小的干扰块，而不影响原来的图像

语法：cv2.morphologyEx(img, cv2.MORPH_OPEN, kernel)
参数：
- MORPH_OPEN：表示进行开运算
- kernel：如果噪点比较多，会选择大一点的kernel，如果噪点比较小，可以选择小点的kernel

闭运算是先膨胀后腐蚀，其作用是，消除内部的小部分噪点

语法：cv2.morphologyEx(img, cv2.MORPH_CLOSE, kernel)

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo7.py"
__time__ = "2022/7/18 15:17"
import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg", cv2.IMREAD_GRAYSCALE)
assert isinstance(img, np.ndarray)

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))

open_ = cv2.morphologyEx(img, cv2.MORPH_OPEN, kernel)  # 开运算 = 腐蚀 + 膨胀
close_ = cv2.morphologyEx(img, cv2.MORPH_CLOSE, kernel)  # 闭运算 = 膨胀 + 腐蚀

# 显示图像
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)
cv2.imshow("img", np.hstack((open_[:640, :480], close_[:640, :480])))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

2.7 形态学梯度

梯度 = 原图 - 腐蚀

腐蚀之后原图边缘变小了，原图 - 腐蚀就可以得到腐蚀的部分，即边缘

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo7.py"
__time__ = "2022/7/18 15:17"
import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg", cv2.IMREAD_GRAYSCALE)
assert isinstance(img, np.ndarray)

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9, 9))  # 注意调节kernel大小，以获得更清晰的边缘

img_ = cv2.morphologyEx(img, cv2.MORPH_GRADIENT, kernel)  # 得到图像的梯度

# 显示图像
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)
cv2.imshow("img", np.hstack((img[:640, :480], img_[:640, :480])))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

2.8 顶帽运算

顶帽 = 原图 - 开运算

开运算的效果是去除图像外的噪点，原图 - 开运算就得到了去掉的噪点

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo7.py"
__time__ = "2022/7/18 15:17"

import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg", cv2.IMREAD_GRAYSCALE)
assert isinstance(img, np.ndarray)

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))  # 注意调节kernel大小，以获得更清晰的边缘

img_ = cv2.morphologyEx(img, cv2.MORPH_TOPHAT, kernel)  # 顶帽操作，得到去掉的噪点

# 显示图像
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)
cv2.imshow("img", np.hstack((img[:640, :480], img_[:640, :480])))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

2.9 黑帽操作

黑帽 = 原图 - 闭运算

闭运算可以将图形内部的噪点去掉，那么原图 - 闭运算的结果就是图形内部的噪点

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo7.py"
__time__ = "2022/7/18 15:17"

import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg", cv2.IMREAD_GRAYSCALE)
assert isinstance(img, np.ndarray)

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9, 9))  # 注意调节kernel大小，以获得更清晰的边缘

img_ = cv2.morphologyEx(img, cv2.MORPH_BLACKHAT, kernel)  # 顶帽操作，得到去掉的噪点

# 显示图像
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)
cv2.imshow("img", np.hstack((img[:640, :480], img_[:640, :480])))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

3、图像轮廓

图像轮廓是具有相同颜色或灰度的连续点的曲线，轮廓在形状分析和物体的检测和识别中很有用

轮廓的作用：

图形分析
物体的识别和检测

注意点：

为了检测物体的准确性，需要先对图像进行二值化或Canny操作
画轮廓时会修改输入的图像，如果之后想继续使用原始图像，应该先将图像存储到其他变量中

3.1 查找轮廓

语法：findContous(img, mode, method[, contous[, hierachy[, offset]]])

参数：

mode：查找模式
- cv2.RETR_EXTERNAL=0：表示只检测外围轮廓
- cv2.RETR_LIST=1：检测的轮廓不建立等级关系，即检测所有轮廓，较为常用
- cv2.RETR_CCOMP=2：每层最多两级，从小到大，从里到外
- cv2.RETR_TREE=3：按照树形存储轮廓，从大到小，从右到左
method：轮廓近似方法
- cv2.CHAIN_APPROX_NONE：保存所有轮廓上的点
- cv2.CHAIN_APPROX_SIMPLE：只保存角点，比如四边形，只保留四边形的4个角，存储信息较少，比较常用
返回contours和hierachy，即轮廓和层级

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo8.py"
__time__ = "2022/7/18 16:04"

import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg", cv2.IMREAD_GRAYSCALE)  # 转换为灰度图
assert isinstance(img, np.ndarray)

# 图片二值化处理
img_ = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 21, 0)

# 查找轮廓，返回轮廓和层级，注意，要传入二值化后的图像
contr, hiera = cv2.findContours(img_, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
print(contr, hiera)

# 显示图像
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)
cv2.imshow("img", np.hstack((img[:640, :480], img_[:640, :480])))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

3.2 绘制轮廓

语法：drawConturs(img, contours, contoursIdx, color[, thick[, lineType[, hierarchy[, maxLeve[, offset]]]]])

参数：

img：要绘制的轮廓图像
contours：轮廓点
contourIdx：要绘制的轮廓编号，-1表示绘制所有轮廓
color：轮廓样式，传入三元组
thickness：线框，-1表示全部填充

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo8.py"
__time__ = "2022/7/18 16:04"
import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)
img_ = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)  # 转化为RGB色道


# 图片二值化处理
img_ = cv2.adaptiveThreshold(img_, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 21, 0)

# 查找轮廓
contr, hiera = cv2.findContours(img_, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)

# 绘制轮廓
img_copy = img.copy()
cv2.drawContours(img_copy, contr, -1, (0, 0, 255), 2)

# 显示图像
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)
cv2.imshow("img", np.hstack((img[:640, :480], img_copy[:640, :480])))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

3.3 计算面积和周长

轮廓面积是指每个轮廓中所有的像素点围成区域的面积，单位为像素

轮廓面积是轮廓重要的统计特性之一，通过轮廓面积的大小可以进一步分析每一个轮廓隐含的信息，例如：通过轮廓面积区分物体大小，识别不同物体

在查找到轮廓后，可能会有很多细小的轮廓，我们可以通过轮廓的面积进行过滤

语法：

contourArea(contour)：计算面积
arcLength(curve, closed)：计算周长

参数：

curve：轮廓
closed：是否是闭合的轮廓

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo8.py"
__time__ = "2022/7/18 16:04"

import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)
img_ = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)  # 转化为RGB色道


# 图片二值化处理
img_ = cv2.adaptiveThreshold(img_, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 21, 0)

# 查找轮廓
contr, hiera = cv2.findContours(img_, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
# 绘制轮廓
img_copy = img.copy()
cv2.drawContours(img_copy, contr, 1, (0, 0, 255), 2)


# 计算面积和周长
area = cv2.contourArea(contr[1])
length = cv2.arcLength(contr[1], False)
print(area, length)

# 显示图像
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)
cv2.imshow("img", np.hstack((img[:640, :480], img_copy[:640, :480])))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

3.4 多边形逼近与凸包

3.4.1 多边形逼近

findContours后的轮廓信息contours可能过于复杂不平滑，可以用approxPolyDP函数对该多边形曲线做适当近似，这就是轮廓的多边形逼近

approxPolyDP就是以多边形去逼近轮廓，采用的是Douglas-Peucker算法

DP算法原理比较简单，核心就是不断找多边形最远的点加入形成新的多边形，直到最短距离小于指定的精度

语法：approxPolyDP(curve, epsilon, closed[, approxCurve])

参数：

epsilon：即DP算法使用的阈值
closed：轮廓是否闭合

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo8.py"
__time__ = "2022/7/18 16:04"
import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)
img_ = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)  # 转化为RGB色道


# 图片二值化处理
img_ = cv2.adaptiveThreshold(img_, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 21, 0)

# 查找轮廓
contr, hiera = cv2.findContours(img_, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)

# 绘制轮廓
img_copy = img.copy()
cv2.drawContours(img_copy, contr, -1, (0, 0, 255), 1)

# 使用多边形逼近，近似模拟手的轮廓
approx = cv2.approxPolyDP(contr[0], 10, True)  # type: np.ndarry

# 再次绘制轮廓
cv2.drawContours(img_copy, [approx], -1, (0, 255, 0), 2)


# 显示图像
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)
cv2.imshow("img", np.hstack((img[:640, :480], img_copy[:640, :480])))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

3.4.2 凸包

逼近多边形是轮廓的高度近似，但是有时候，我们希望使用一个多边形的凸包来简化它，凸包跟逼近多边形很像，只不过它是物体最外层的凸多边形，凸包指的是完全包含含有轮廓，并且仅有轮廓上的点所构成的多边形，凸包的每一个都是凸的，即在凸包内连接任意两点的直线都在凸包的内部。在凸包内，任意连续的三个点的内角小于180

语法：convexHull(points[, hull, clockwise[, returnPoints]])

参数：

points：轮廓
clockwise：顺时针绘制

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo8.py"
__time__ = "2022/7/18 16:04"
import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)
img_ = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)  # 转化为RGB色道


# 图片二值化处理
thersh, img_ = cv2.threshold(img_, 150, 255, cv2.THRESH_BINARY)

# 查找轮廓
contr, hiera = cv2.findContours(img_, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
# 绘制轮廓
img_copy = np.zeros(img.shape, np.uint8)
cv2.drawContours(img_copy, contr, -1, (0, 0, 255), 2)

# 使用多边形逼近，近似模拟手的轮廓
hull = cv2.convexHull(contr[1])
print(hull)

# 再次绘制轮廓
cv2.drawContours(img_copy, [hull], 0, (0, 255, 0), 2)

# 显示图像
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)
cv2.imshow("img", np.hstack((img[:640, :480], img_copy[:640, :480])))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

3.5 外接矩形

外接矩形分为最小外接矩形和最大外接矩形

# ！/usr/bin/python3
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo8.py"
__time__ = "2022/7/18 16:04"
import cv2.cv2 as cv2
import numpy as np

# 读取图像
img = cv2.imread("./img/1.jpg")
assert isinstance(img, np.ndarray)
img_ = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)  # 转化为RGB色道


# 图片二值化处理
thersh, img_ = cv2.threshold(img_, 150, 255, cv2.THRESH_BINARY)

# 查找轮廓
contr, hiera = cv2.findContours(img_, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
img_copy = np.zeros(img.shape, np.int8)
cv2.drawContours(img_copy, contr, 1, (0, 0, 255), 2)
# 最小外接矩形

# rect是一个Rotated Rect 旋转的矩形，矩形的真实坐标，矩形的长宽，矩形的旋转角度
rect = cv2.minAreaRect(contr[1])  # 绘制第二个轮廓下的，最小面积内接矩形
# 其实就是帮我们把旋转矩阵的4个坐标点计算出来了，注意坐标必须是整数的坐标，所以需要转换一下
box = cv2.boxPoints(rect)  # 绘制旋转矩形
box = np.round(box).astype(np.int32)  # 将浮点数转换为整型数据，四舍五入来转换
cv2.drawContours(img_copy, [box], 0, (0, 255, 0), 2)

# 最大外接矩形，返回最大外接矩形的参数(x, y), (w, h)
x, y, w, h = cv2.boundingRect(contr[1])  # 绘制第二个轮廓下的，最大外接矩形
cv2.rectangle(img_copy, (x, y), (x + w, y + h), (255, 0, 0), 2)

# 显示图像
cv2.namedWindow("img", cv2.WINDOW_NORMAL)
cv2.resizeWindow("img", 640, 480)
cv2.imshow("img", np.hstack([img[:640, :480], img_copy[:640, :480]]))  # 对图片进行截取一部分
cv2.waitKey(0)
cv2.destroyAllWindows()

你可能感兴趣的:(python,#,机器学习,opencv,python,计算机视觉)

Python 实现海康机器人工业相机 MV-CS050-10GC 的实时显示视频流及拍照功能(实时显示视频流同时可以进行拍照) 恋上钢琴的虫数码相机
参考链接：https://www.cnblogs.com/HanYork/p/17388506.htmlhttps://www.cnblogs.com/miracle-luna/p/16960556.html#5138211Flask搭建流媒体服务器：使用Flask搭建一个流媒体服务器_multipart/x-mixed-replace;boundary=frame-CSDN博客
python:数据类构建器愚戏师 python基础与机器学习 python windows 开发语言
在Python中，数据类（DataClasses）用于快速创建主要目的是存储数据的类，自动生成__init__,__repr__,__eq__等方法。“Python提供了几种构建简单类的方式，这些类只是字段的容器，几乎没有额外功能。这种模式称为“数据类”（dataclass），dataclasses包就支持该模式。”引用自《流畅的python（第二版）》1.基础数据类使用@dataclass装饰器
还不会构建MindIE镜像？一篇文章搞定 Zain Lau vim 编辑器 linux MindIE 昇腾
MindIE镜像构建工程项目简介用于构建多平台/架构的MindiE镜像的脚本。用户可以根据需要准备好所需的软件包，修改相关配置并构建镜像。前提条件网络连接在整个构建过程中，必须保持稳定的网络连接。此构建工程依赖于在线下载多个资源，包括但不限于Python源码、编译工具以及各种依赖，无法离线构建。Docker推荐版本：Docker20.10.x及以上最低版本要求：Docker19.03.x安装方式：
使用 certbot 在centos7 搭建ssl证书自动并且续约 TwoSs110 ssl https
第一步，确定服务器适合安装的certbot版本sudoyuminstallpython27如果上述方法不起作用，你可以尝试编译安装。首先，你需要安装编译Python所需的依赖包。sudoyuminstallgccmakeopenssl-develsqlite-develreadline-develzlib-develbzip2-devel接下来，下载Python2.7.5的源代码，并进行编译安装。
Assembly语言的自然语言处理花韵婷包罗万象 golang 开发语言后端
Assembly语言在自然语言处理中的应用引言自然语言处理（NaturalLanguageProcessing,NLP）作为人工智能的一个重要分支，致力于实现计算机与人类语言之间的互动。随着计算能力的提升以及大数据的蓬勃发展，NLP在各个领域的应用如火如荼。从语音识别、机器翻译到情感分析等，NLP正在改变我们与信息之间的互动方式。不过，当前主流的NLP研究通常是用高级编程语言（如Python、Ja
Groovy语言的漏洞扫描花韵婷包罗万象 golang 开发语言后端
Groovy语言漏洞扫描：深入分析与实践引言Groovy是一种基于Java虚拟机（JVM）的动态编程语言，它结合了Python、Ruby和Smalltalk等语言的特性，提供了简洁的语法和强大的功能。Groovy广泛应用于脚本编写、自动化测试、构建工具（如Gradle）以及Web开发等领域。然而，随着Groovy的广泛应用，其安全性问题也逐渐显现出来。本文将深入探讨Groovy语言中的常见漏洞类型
Julia语言的学习路线樟松包罗万象 golang 开发语言后端
Julia语言学习路线指南引言在编程语言层出不穷的今天，Julia作为一门新兴的高级编程语言，以其出色的性能和易用性逐渐获得了越来越多的关注。特别是在科学计算、数据分析和机器学习等领域，Julia的表现十分出色，成为研究人员和开发者的热门选择。本文将为希望学习Julia语言的读者提供一条详细的学习路线，包括基础知识、工具、库、项目和实践经验等，帮助大家有效地掌握这门语言。一、了解Julia语言在开
大模型的webui Zain Lau 人工智能 python 昇腾 Ascend 天数
exportXXX_LLM_C=~/xcore-llm/build/ReleaseexportCUDA_VISIBLE_DEVICES=2,3exportCUDACXX=/usr/local/cuda-12.3/bin/nvccnohup/usr/bin/python3/home/src/api_server/api_server.py--modelLLama2:7b-chat-hf_A800--
Tornado 初识 Wu_Candy Web服务器
一、什么是tornadoTornado是使用Python编写的一个强大的、可扩展的Web服务器。它在处理严峻的网络流量时表现得足够强健，但却在创建和编写时有着足够的轻量级，并能够被用在大量的应用和工具中。二、tornado有什么优势Tornado和现在的主流baiduWeb服务器框架（包括大多数Python的框架）有着明显的区别：它是非阻塞式服务器，而且速度相当快，得利于其非阻塞的方式和对epol
python高并发访问mysql_Python访问MySQL 阿廖林诺
Python访问数据库作为Python开发工程师，选择哪个数据库呢？当然是MySQL。因为MySQL不仅免费，普及率最高，出了错，可以很容易找到解决方法。而且，围绕MySQL有一大堆监控和运维的工具，安装和使用很方便。使用MySQLMySQL是Web世界中使用最广泛的数据库服务器。SQLite的特点是轻量级、可嵌入，但不能承受高并发访问，适合桌面和移动应用。而MySQL是为服务器端设计的数据库，能
Python 爬取大量数据如何并发抓取与性能优化 chusheng1840 Python 教程 python 性能优化开发语言
Python并发抓取与性能优化在进行网络爬虫开发时，爬取大量数据可能非常耗时。尤其是在处理许多网页或API请求时，逐个请求速度会非常慢。为了解决这个问题，我们可以通过并发抓取提高爬取效率。同时，通过性能优化来进一步减少耗时和资源占用，使爬虫更高效。本篇文章将带大家了解Python中常用的并发抓取方法，并介绍如何进行性能优化。1.并发抓取的基本概念并发抓取指的是同时发出多个请求的技术，而不是顺序地等
【机器学习】基于t-SNE数据可视化工程无水先生 AI原理和python实现人工智能综合人工智能算法
一、说明t-SNE(t-DistributedStochasticNeighborEmbedding)是一种常用的非线性降维技术。它可以将高维数据映射到一个低维空间（通常是2D或3D）来便于可视化。Scikit-learnAPI提供TSNE类，以使用T-SNE方法可视化数据。在本教程中，我们将简要学习如何在Python中使用TSNE拟合和可视化数据。二、t-SNE是个什么？2.1什么是t-SNE？
数据处理和分析之数据降维：t-SNE：使用t-SNE进行数据可视化实践 kkchenkx 数据挖掘信息可视化算法聚类均值算法数据挖掘机器学习
数据处理和分析之数据降维：t-SNE：使用t-SNE进行数据可视化实践数据降维简介降维技术的重要性在数据科学和机器学习领域，数据降维是一种关键的技术，用于减少数据集的维度，同时保留数据的结构和重要信息。降维不仅可以帮助我们更有效地存储和处理数据，还能在高维数据中发现潜在的模式和结构，这对于数据可视化和模型训练尤为重要。高维数据往往难以直观理解，通过降维，我们可以将其转换为二维或三维空间，便于可视化
Conda报错解决：ProxyError: Conda cannot proceed due to an error in your proxy configuration. 三采 Linux Conda 代理
目录原因一：源配置有误原因二：代理配置有误原因三：路由配置有误在需要使用代理的服务器下，创建新conda环境时报错：condacreate-nopencompasspython=3.8/usr/lib/python3/dist-packages/requests/__init__.py:89:RequestsDependencyWarning:urllib3(1.26.9)orchardet(3.
基于asp.NET的病历管理系统 (源码+net+vue+部署文档+讲解等) qq_1406299528 计算机毕业设计 asp asp.net vue.js 后端
收藏关注不迷路！！文末获取源码+数据库感兴趣的可以先收藏起来，还有大家在毕设选题（免费咨询指导选题），项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录前言程序资料获取一、项目技术二、项目内容和功能介绍三、核心代码数据库参考四、效果图五、资料获取前言博主介绍：✨全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师，专注于Java/Python/小程序app/深度学
爬取电影标题、评论、评分（21-11-4）穆桥 Python爬虫 XPath解析 MySQL数据库电影信息疾病数据
功能描述：1、爬取网页1中的电影名称、评分、简介到mysql数据库中。2、爬取网页2中的标题、时间、正文、采集时间到mysql数据库中。使用的技术:requests请求、xpath解析、mysqlxpath解析语法//子孙节点/直接子节点.选取当前节点…选取当前节点的父节点@选取属性通过Python的lxml库，利用XPath进行HTML的解析。scrapy封装了lxml也可以导入scrapy任务
Python 爬虫实战：电影评论数据抓取与自然语言处理西攻城狮北 python 爬虫开发语言
引言作为一名对电影数据和自然语言处理感兴趣的内容创作者，我决定利用Python爬虫技术抓取IMDb上的电影评论数据，并进行自然语言处理分析。这不仅可以帮助我们了解观众对电影的反馈，还能为电影制作方提供有价值的参考。一、项目背景IMDb（互联网电影数据库）是全球最大的电影数据库，用户可以在上面查看电影信息和用户评论。本项目旨在爬取IMDb上的电影评论，并对评论进行自然语言处理（NLP），以提取情感、
linux（ubuntu）中Conda、CUDA安装Xinference报错ERROR: Failed to build (llama-cpp-python) 小胡说技书杂谈/设计模式/报错 Data/Python/大模型 linux ubuntu conda 大模型 python Xinference
文章目录一、常规办法二、继续三、继续四、缺少libgomp库（最终解决）在Conda环境中安装libgomp如果符合标题情况执行的：pipinstall"xinference[all]"大概率是最终解决的情况。一、常规办法llama-cpp-python依赖CMake、Make和g++来编译，所以可能是缺少依赖或者环境配置不对。按照以下步骤排查问题并解决：1.确保Python版本符合要求llama
基于Asp.net的汽车租赁管理系统计算机学姐 Asp精选实战项目源码 asp.net 汽车后端 mysql sqlserver vue.js c#
作者：计算机学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等，“文末源码”。专栏推荐：前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码精品专栏：Java精选实战项目源码、Python精选实战项目源码、大数据精选实战项目源码系统展示【2025最新】基于Asp.net的汽车租赁管理系统开发
使用yolo训练自己的模型数据遇到的问题次次皮 YOLO 深度学习人工智能
1、报错：NolabelsfoundinD:\xxx\valid\labels.cache查找网上的文章大多都是说文件目录没按规定创建，但我检查了我的目录没问题，后来发现是labels文件夹里的txt文件和images文件夹的图片没有一一对应，对应好之后问题解决2、解决完上个问题之后还是不报上面的错了但还是FatalPythonerror:Aborted；Restartingkernel...检查
Python——文件读取一颗小松松 python 开发语言
Python可以读取不同格式的文件，下面简单来介绍一下：1、使用read_excel或read_csv读取文件，若在路径前加r，使用“\”importpandasaspd#在路径前加r,使用“\”df=pd.read_excel(r'C:\Users\merit\Desktop\测试.xlsx')#导入.csv文件，以“，”为分隔符data=pd.read_csv(r'C:\Users\merit
给接口自动化测试框架增色，实现企业微信测试报告编程简单学软件测试 python python 单元测试压力测试 postman 功能测试
作者在新项目中搭建了python+requests+unittest+HTMLTestRunner接口自动化测试框架，通过修改配置文件实现环境隔离，一份脚本即可在不同的环境执行接口测试用例。但是没有实现任何形式的消息通知，也没有集成到jenkins，原因很简单，因为还没做到很大，而且用户活跃不够，问题也相对较少，只在上线前后执行一次uat和prod环境。那这几天想完善一下消息通知功能，让它具备发送
轻松管理CSV数据，Python csv库全解析嘎啦AGI实验室 Python python android 数据库 Python csv
文章目录轻松管理CSV数据，Pythoncsv库全解析背景介绍csv库是什么？如何安装csv库？五个简单的库函数使用方法1.读取CSV文件2.写入CSV文件3.使用DictReader读取CSV4.使用DictWriter写入CSV5.指定分隔符五个场景使用代码说明场景1：读取CSV并统计数据场景2：将查询结果写入CSV场景3：读取CSV并过滤数据场景4：读取CSV并排序数据场景5：读取CSV并合
#PyCharm 2024.1新增功能 Dingdangr pycharm ide python
PyCharm2024.1作为JetBrains专为Python开发者设计的集成开发环境（IDE）的最新版本，带来了众多令人兴奋的新增功能，旨在提升开发者的编程效率和体验。以下是对这些新增功能的详细解析：一、智能编码辅助HuggingFace模型和数据集文档预览PyCharm2024.1引入了HuggingFace模型和数据集的快速文档预览功能。开发者可以直接在PyCharm内部快速获取Huggi
2025年Python生态全景：从AI霸主到量子计算，揭秘其不可替代的技术魅力南玖yy python 人工智能量子计算
在2025年的技术浪潮中，Python凭借其极简的语法、庞大的生态系统以及跨领域融合能力，依然稳坐编程语言界的“头把交椅”。尽管Java等语言在AI领域发起挑战，但Python通过持续的技术革新和生态扩展，展现出不可撼动的生命力。本文将从技术趋势、行业应用与未来挑战三个维度，解析Python的“常青”密码。一、AI领域的持续主导：生态优势与工具革新Python在AI领域的统治地位仍未动摇。尽管有观
使用Python爬取豆瓣用户信息：从入门到实战 Python爬虫项目 2025年爬虫实战项目 python 开发语言人工智能爬虫大数据
引言豆瓣作为一个知名的社交平台，拥有丰富的用户信息。对于数据分析师、研究人员或普通用户来说，获取豆瓣用户信息具有重要的价值。本文将详细介绍如何使用Python及其相关库来爬取豆瓣用户信息，并展示如何利用最新的技术手段来实现这一目标。1.准备工作在开始编写爬虫之前，我们需要准备一些工具和环境：Python3.x：确保你已经安装了Python3.x版本。Requests库：用于发送HTTP请求。Bea
深入 Python 网络爬虫开发：从入门到实战南玖yy python python爬虫
一、为什么需要爬虫？在数据驱动的时代，网络爬虫是获取公开数据的重要工具。它可以帮助我们：监控电商价格变化抓取学术文献构建数据分析样本自动化信息收集二、基础环境搭建1.核心库安装pipinstallrequestsbeautifulsoup4lxmlseleniumscrapy2.开发工具推荐PyCharm（专业版）VSCode+Python扩展JupyterNotebook（适合调试）三、爬虫开发
python中三元运算符使用总结上趣工作室 python python 开发语言
在Python中，三元运算符通常被称为条件表达式，它的语法为：value_if_trueifconditionelsevalue_if_false这个条件表达式的含义是：如果condition为True，则返回value_if_true，否则返回value_if_false。示例以下是一些使用三元运算符的示例：1、基本使用:x=10result="Greaterthan5"ifx>5else"5o
python中将字符串转换成数字，并且保留两位小数上趣工作室 python python 后端
在Python中，你可以使用float()函数将字符串转换为数字，并使用字符串格式化来保留小数点后两位。下面是一个示例代码：defconvert_to_float(string):try:number=float(string)formatted_number="{:.2f}".format(number)returnformatted_numberexceptValueError:return"
使用 Python 编写网络爬虫：从入门到实战 Manaaaaaaa python 爬虫开发语言
网络爬虫是一种自动化获取网页信息的程序，通常用于数据采集、信息监控等领域。Python是一种广泛应用于网络爬虫开发的编程语言，具有丰富的库和框架来简化爬虫的编写和执行过程。本文将介绍如何使用Python编写网络爬虫，包括基本原理、常用库和实战案例。一、原理介绍网络爬虫是一种自动化程序，通过模拟浏览器的行为向网络服务器发送HTTP请求，获取网页内容并进一步提取所需信息的过程。网络爬虫主要用于数据采集
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl