柏拉图工作室-AI学科

图像滤波与边缘检测

图像滤波

滤波起源于信号和系统理论，这里不做过多解释，感兴趣的可以查看《信号与系统》这本书。【不建议花太多时间取研究信号与系统，在我们的学习中知道这样的概念就可以了；当然你特别感兴趣，也可以看哦】

在图像处理中，滤波是一个必不可少的概念，它可以去除图像中的噪声，提取图像中特征等等。

当我们看一幅图像时，图像中图案是由不同的灰度组成的，图像之间的区别就是他们具有不同的灰度级分布方式。

我们可以从图像中灰度的变化来解释。在一幅图像中，某个区域的灰度值几乎不变，例如下图中红色框圈出的部分；绿色框圈出的部分，红色线就是灰度值变化大的地方。因此，可以根据上述灰度变化的频率来描述图像的特征，这就叫做频域；通过灰度分布来描述图像特征称为空域。

频域把图像分为低频和高频，图像灰度值变化慢的区域我们认为他是低频，变化快的区域认为是高频。傅里叶变换和余弦变化算法可以清楚的显示图像的频率，这里不做过多解释，感兴趣的可以自己百度，因为这部分对咱们后续课程没有太多作用。

图像是二维的，所以频率分为垂直频率（垂直方向的变化）和水平频率（水平方向的变化）。

滤波器

滤波器分为低通滤波器和高通滤波器，高通滤波器就是通过图像中的高频信息，消除图像的低频信息，从而消除图像中的噪点。低通正好相反，使图像变的平滑。

卷积的原理：应用一个滤波器，也叫做内核，我们针对原始图像的每个像素点，利用滤波器进行处理，得到一个结果图像。如下图所示：

补充知识中又详细的卷积介绍。

白色的大框就是我们的图像矩阵为 $9$ 行 $7$ 列，蓝色部分就是我们的滤波器，提取出来就是 $1 / 25$ 那部分【后面会解释】，大小为 $5$ 行 $5$ 列，让滤波器中心点对应在图像上的每个像素格移动，直到最后一个像素格，最后的图的红色部分就是我们得到的结果图像。

在第一个像素格的时候，我们把滤波器的中心对应到第一个像素格，这时就会有多出来的部分没有图像像素对应，我们就需要在图像的最外围填充0，跟滤波器能够对应上。如下如所示：

常见的滤波器

均值滤波

均值滤波将每个像素的值用该像素邻域的平均值替换，如下图所示：

红色点的新得像素值：
$(197 + 25 + 106 + 156 + 159 + 149 + 40 + 107 + 5 + 71 + 163 + 198 + 226 + 223 + 156 + + 222 + 37 + 68 + 193 + 157 + 42 + 72 + 250 + 41 + 75) / 25$
从以上公式中，我们可以看出，给源图像的每个像素值乘1，累加后在除以滤波器的大小，这里称1为权值，我们把这个1（权值）单拿出来，也就形成了一个模板，也就是上述所说的滤波器。如下图所示：

均值滤波在opencv官网中的函数API：

dst = cv2.blur(src, ksize[, dst[, anchor[, borderType]]])

src：原始图像

ksize：滤波器的大小，元组形式，例如 $(3, 3)$ ，

[] 中括号表示可选参数，实际应用中，我们后三个参数不用管，用默认值即可。

ksize大小必须是奇数

所以用的时候如下代码：
dst = cv2.blur(img, (3,3))

高斯滤波

在均值滤波中，我们把滤波器中的值都设为了1，那么高斯滤波与均值滤波的区别就是：高斯滤波的的滤波器的值离中心点像素近的值就大一点，离中心像素点远得值就小一点。滤波器得值如下图所示：

下面来解释一下为什么这样操作，首先看一下高斯函数的图像

从上图中可以看到，距离均值较远的地方，已经接近0了，所以对于函数没有什么意义了，这就是高斯滤波权值设置的原因。

高斯滤波在opencv官网中的函数API：

dst = cv2.GaussianBlur(src, ksize, sigmaX[, dst[, sigmaY[, borderType]]])

src：原始图像

ksize：滤波器的大小，元组形式，例如 $(3, 3)$

sigmaX：X反向得方差

sigmaX这个参数我们一般设为0，让程序根据我们设置的滤波器的大小自动计算出方差

Y方向的方差与X方向保持一致

计算公式为 $s i g m a X = 0 时， s i g m a = 0.3 * ((k s i z e - 1) * 0.5 - 1) + 0.8$
gaussian = cv2.GaussianBlur(img, (3, 3), 0)

中值滤波

中值滤波是把当前像素和它的邻域组成一个集合，然后计算这个集合的中间值，以此作为当前像素的值。

因为这样的形式，中值滤波就不能进行卷积操作了，如下图，图中布满了白色点点，我们称这种为噪声。

某个像素领域有这种噪声，在一幅灰度图中，像素值最大为255，也就是白色，所以白色的像素值永远不可能是中值，这样我们用邻域的中间值替换这个像素，那么白噪声就会被去掉，这就是中值滤波的优点，对于去除椒盐噪声非常有用。

以上图为例：

$197 、 25 、 106 、 156 、 159 、 149 、 40 、 107 、 5 、 71 、 163 、 198 、 226 、 223 、 156 、 222 、 37 、 68 、 193 、 157 、 42 、 72 、 250 、 41 、 75$ 对这些数进行排序（从大到小，从小到大都可以），找到中值：149，我们就用149作为新得像素值。

中值滤波在opencv官网中的函数API：

dst = medianBlur(src, ksize[, dst])

src：原始图像

ksize：滤波器的大小，这里是整形数字

边缘检测

边缘检测可以说是一种定向滤波，我们最开始介绍了图像分为垂直频率（垂直方向的变化）和水平频率（水平方向的变化）两个方向，总体来说就是用后一个像素点的值减去前一个像素点的值得到的结果，我们称之为梯度，就是我们最后要求得边缘。也就是说用下图中第3列减去第二列得值，但是我们怎么实现这种操作呢，我们就用图像滤波方式来实现，区别在于滤波器得值我们在这里指定了大小，正负。

以一个 $3 * 3$ 大小的为例，中心点为 $f (x, y)$ ，如图：

常见的边缘检测算子

Robert算子

我们首先定义Robert算子得卷积核，如下图：

得到的X，Y方向的梯度就是：
$E_x = f(x,y) - f(x-1,y-1) \\ E_y = f(x-1,y) - f(x,y-1)$
上述公式是怎么计算出来的呢？我们看一幅图：

我们计算X方向的梯度：
$E_x = 0*f(x,y-1) + (-1)*f(x-1,y-1) + 1*f(x,y) + 0*f(x-1,y) \\ E_x = f(x,y) - f(x-1,y-1)$

Y方向同理。

卷积核要翻转 $180^o$ 之后再参与计算的。

Robert算子没有相应的函数，其实在实际中也不怎么用。

感兴趣的话，可以研究一下自己写的Robert算子实现的代码。这里将算子定义为[[-1,-1],[1,1]]了，知道原理即可。

#coding=utf-8
import cv2

# robert 算子[[-1,-1],[1,1]]
def robert_suanzi(img):
 r, c = img.shape
 r_sunnzi = [[-1, -1], [1, 1]]
 for x in range(r):
     for y in range(c):
         if (y + 2 <= c) and (x + 2 <= r):
             imgChild = img[x:x + 2, y:y + 2]
             list_robert = r_sunnzi * imgChild
             img[x, y] = abs(list_robert.sum())  # 求和加绝对值
 return img

img = cv2.imread('images/robert.png',0)
dst = robert_suanzi(img)
cv2.imshow('dst',dst)
cv2.waitKey()

Sobel算子

原理与上述Robert算子一致，我们分别计算X和Y方向的梯度，但是整幅图像的梯度是什么呢？
$\sqrt{E_x^{2} + E_y^{2}} = |E_x|+|E_y|$
sobel算子opencv已经给我们写好了函数，我们直接调用即可。

函数API：

dst = cv2.Sobel(src, ddepth, dx, dy[, dst[, ksize[, scale[, delta[, borderType]]]]])

参数解释：

src：原始图像

ddepth：处理结果图像的深度

dx：X方向的梯度

dy：Y方向的梯度

ksize：滤波器大小

我们来具体讲解一下ddepth参数，通常情况来说我们会设为-1，代表处理结果与原始图像保持一致；但是一般不用，因为会存在溢出问题。

下面有这样一幅图：

B这条边，我们用右面白色部分减去黑色部分，得到的是一个正数

A这条边，我们用右面黑色部分减去白色部分，得到的是一个负数

但是在灰度图中，像素值的范围是0-255，那么小于0的数值，我们就会自动赋值为0，称为截断。那么这条边就不会显示了，所以我们就需要把ddepth参数的深度调大一点，即cv2.CV_64F，代表64位的浮点数，之后再转换到正常图像的类型为cv2.CV_8U，也就是np.uint8类型，8位整型。

转换方法就是我们取A计算出来的绝对值，用到的函数API：

dst = cv2.convertScaleAbs(src[, dst[, alpha[, beta]]])

虽然这个函数有很多参数，但是我们用的时候，只填第一个参数即可。

目标函数 = cv2.convertScaleAbs(原始图像)

在灰度图像中，也就是256色位图中，白色的像素值位255，黑色为0。

垂直边界的与水平原理一样。

当我们计算最后的结果时，我们需要把两个方向的梯度都加起来，有两种方式：

```
sobel_xY = cv2.Sobel(img, -1, 1, 1, ksize =3)
```
但是这样的效果并不是很好，同时求导对于精度的要求太高，使得有些边缘并没有计算出来。

单独对X方向和Y方向求导，再相加，需要用到cv2.addWeighted函数

# Sobel算子边缘检测,分别对x，和y方向计算梯度
sobel_x = cv2.Sobel(img, cv2.CV_64F, 1, 0, ksize =3)
sobel_y = cv2.Sobel(img, cv2.CV_64F, 0, 1, ksize =3)
#经过卷积之后，会出现溢出的问题，需要转换
abs_x = cv2.convertScaleAbs(sobel_x)
abs_y = cv2.convertScaleAbs(sobel_y)
#第一个参数：第一幅图像
#第二个参数：第一幅图像的权重
#第三个参数：第二幅图像
#第四个参数：第二幅图像的权重
#第五个参数：修正值，一般为0
sobel_show = cv2.addWeighted(abs_x, 0.5, abs_y, 0.5, 0)

拉普拉斯算子

其实原理都是一样的，拉普拉斯就是需要减两次就可以了。

减几次就对应的求函数的几阶导数，因为图像也是一个函数嘛。

一阶导：sobel算子 |右-左| + |下-上|

二阶导：laplacian算子 |右-左| + |下-上| + |右-左| + |下-上|

它的卷积核长这个样子：

函数API：

dst = Laplacian(src, ddepth[, dst[, ksize[, scale[, delta[, borderType]]]]])

src：原始图像

ddepth：处理结果图像的深度，与Sobel算子的一样

ksize：滤波器大小

代码演示：

laplacian = cv2.Laplacian(img, cv2.CV_64F)
lap_show = cv2.convertScaleAbs(laplacian)

Canny算子

canny算子的计算步骤：

去除噪声

边缘检测容易受到噪声的影响，所以先使用高斯滤波去除噪声
梯度计算

canny算子的梯度不仅有值还有方向，梯度计算上面已经说过了，一个像素点的梯度方向计算方式： $tan^{-1}(\frac{E_y}{E_x})$ ，因为这个方向是任意的，所以我们归为4个大类：水平，垂直和两个对角线。
非极大值抑制

得到梯度值和方向后，我们去除不是边界的点。

因为一个梯度方向上，有好多点，我们就判断当前像素点的梯度值是否是周围像素点中最大值，最大值就保留下来，否则就赋值为0。
双阈值

双阈值就是判断边缘的两个阈值，一个高阈值，一个低阈值，边缘点大于高阈值我们就认为他肯定是边缘，叫做强边缘点，小于低阈值，肯定不是边缘，我们可以忽略这部分边缘点；重要的是处于高低阈值中间的点的处理：需要判断这个点的8邻域中，是否有强边缘点，有就留下，没有就被忽略。

Canny算子的函数API：

edges = Canny(image, threshold1, threshold2[, edges[, apertureSize[, L2gradient]]])

image：原始图像

threshold1：阈值1

threshold2：阈值2

实验表明：高低阈值的比率最好为 $2 : 1$ 或者 $3 : 1$ 。

例如：

canny = cv2.Canny(img, 50, 150)

如果想要图像边缘的细节信息多一些，那么阈值就设置小一些。

补充知识：

什么是数字图像处理？

一幅图像可以定义为一个二维函数 $f (x, y)$ ，其中 $x$ 和 $y$ 是空间（平面坐标），二再任何一对空间坐标 $(x, y)$ 处的值 $f (x, y)$ 叫做该坐标处的灰度值。

图像的坐标跟我们以前学的平面坐标系有所差别，在图像中，我们以图像左上角为原点 $(0, 0)$ ，从左到右为 $x$ 轴，从上到下为 $y$ 轴。如下图所示：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3FVF7Ona-1607939104708)(图像滤波与边缘检测.assets/无标题.png)]

相关操作与卷积操作

在图像滤波中，我们有两个重要的概念，一个是相关，一个是卷积。相关是滤波器模板移过图像并计算每个位置乘积之和的处理。卷积与相关类似，区别在于要先将滤波器模板翻转 $180^o$ 。

翻转的原因：跟信号系统只是相关了，其实没有什么具体意义，就是为了得到某种效果而想到的一种运算。

参考链接：https://blog.csdn.net/weixin_39123145/article/details/82969261

https://blog.csdn.net/qq_26638113/article/details/98390833?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.nonecase

参考资料：《opencv计算机视觉编程攻略》第三章

《数字图像处理第三版》第 $1$ 页和 $89 - 90$ 页

【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
初始OpenCV 指尖下的技术 OpenCV opencv 人工智能计算机视觉
OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
AI时代个人财富增长实战指南：从零基础到精通变现的完整路径 A达峰绮人工智能
（本文基于人工智能技术发展规律，结合互联网经济底层逻辑，为普通从业者构建系统性AI应用框架）一、建立AI认知基础：技术理解与工具掌握技术分类认知人工智能工具分为四大功能模块：自然语言处理（文本生成、对话交互）、计算机视觉（图像视频处理）、数据分析（预测建模）、自动化控制（流程优化）。建议新手首先掌握语言类工具的基础操作，逐步扩展到其他领域。工具操作逻辑通用AI工具通常包含三大核心功能模块：输入界面
【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？努力毕业的小土博^_^ AI算法题库人工智能算法计算机视觉深度学习神经网络
【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？文章目录【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？前言数据级别的多尺度模型架构上的多尺度表示FPN代码示例（PyTorch）说明其他多尺度处理方法总结欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校
计算机视觉技术探索：美颜SDK如何利用深度学习优化美颜、滤镜功能？美狐美颜sdk 美颜SDK 美颜API 直播美颜SDK 计算机视觉深度学习直播美颜SDK 美颜sdk 第三方美颜sdk 美颜api
时下，计算机视觉+深度学习正在重塑美颜技术，通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式，让美颜效果更加自然、精准、个性化。那么，美颜SDK如何结合深度学习来优化美颜和滤镜功能？本文将深入解析AI在美颜技术中的应用，并探讨其未来发展趋势。一、深度学习如何赋能美颜SDK？1.AI人脸检测与关键点识别：精准捕捉五官在美颜过程中，首先需要精准检测人脸位置和五官特征点，确保美颜效果不会失真。深度学
车牌识别技术揭秘：如何用 C# 实现自动车牌识别系统威哥说编程 c#开发语言
车牌识别（LicensePlateRecognition，LPR）是一项计算机视觉技术，用于自动识别车辆的车牌号码。在实际应用中，车牌识别技术被广泛用于停车场管理、交通监控和安防系统等领域。实现车牌识别系统的关键步骤包括图像预处理、车牌检测、字符分割、字符识别等。C#中可以通过结合OpenCV、EmguCV、TesseractOCR等工具来实现车牌识别系统。一、所需工具和库EmguCV：这是一个封
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
探索Sfm-python: 一款强大的计算机视觉库缪昱锨Hunter
探索Sfm-python:一款强大的计算机视觉库去发现同类优质开源项目:https://gitcode.com/在计算机视觉领域，Sfm-python是一个值得关注的开源项目，它以简洁高效的Python接口提供结构化从运动（StructurefromMotion,SfM）算法。如果你对3D重建、图像匹配或地理定位有兴趣，那么这个项目将是你不可或缺的工具。让我们一起深入了解一下它的技术细节、应用场景
常见经典目标检测算法 109702008 人工智能 #深度学习目标检测人工智能
ChatGPT目标检测（ObjectDetection）是计算机视觉领域的一个重要分支，其目的是识别数字图像中的不同对象，并给出它们的位置和类别。近年来，许多经典的目标检测算法被提出并广泛应用。以下是一些常见的经典目标检测算法：1.R-CNN（RegionswithCNNfeatures）:R-CNN通过使用区域提议方法（如选择性搜索）首先生成潜在的边界框，然后使用卷积神经网络(CNN)提取特征，
AI 大模型应用数据中心的数据迁移架构 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、数据迁移、架构设计、迁移策略、性能优化、安全保障1.背景介绍随着人工智能（AI）技术的飞速发展，大规模AI模型的应用日益广泛，涵盖了自然语言处理、计算机视觉、语音识别等多个领域。这些AI模型通常需要海量的数据进行训练和推理，因此数据中心作为AI应用的基础设施，显得尤为重要。然而，随着AI模型规模的不断扩大，数据中心面临着新的挑战：数据规模庞大:AI模型的训练和推理需要海量数据
暗光增强技术研究进展与产品落地综合分析（2023-2025） AndrewHZ 深度学习新浪潮图像处理算法动态范围计算机视觉深度学习 transformer 暗光增强
一、引言暗光增强技术作为计算机视觉与移动影像领域的核心研究方向之一，近年来在算法创新、硬件适配及产品落地方面取得了显著进展。本文从技术研究与产业应用两个维度，系统梳理近三年（2023-2025）该领域的关键突破，并对比分析主流手机厂商的影像技术优劣势。二、暗光增强技术研究进展1.算法创新：从传统模型到深度学习（1）Retinex理论的深度结合清华与ETH联合提出的Retinexformer（202
TypeScript语言的计算机视觉苏墨瀚包罗万象 golang 开发语言后端
使用TypeScript进行计算机视觉：一个现代化的探索引言随着人工智能和机器学习的快速发展，计算机视觉（ComputerVision）成为了一个极具活力的研究领域。计算机视觉旨在使计算机能够“看”和“理解”数字图像或视频中的内容。近年来，TypeScript作为一种现代化的编程语言，因其类型安全和更好的开发体验，逐渐在前端和后端开发中得到了广泛应用。本文将探讨如何使用TypeScript进行计算
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
计算机视觉毕业设计选题推荐：选题技巧建议收藏 HaiLang_IT 毕业设计人工智能计算机视觉
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了人工智能专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
Python 的 ultralytics 库详解白.夜人工智能
ultralytics是一个专注于计算机视觉任务的Python库，尤其以YOLO（YouOnlyLookOnce）系列模型为核心，提供了简单易用的接口，支持目标检测、实例分割、姿态估计等任务。本文将详细介绍ultralytics库的功能、安装方法、核心模块以及使用示例。1.ultralytics库简介ultralytics库由Ultralytics团队开发，旨在为YOLO系列模型提供高效、灵活且易
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
Opencv计算机视觉编程攻略-第一节图像读取与基本处理 weixin_44242403 深度学习 opencv 计算机视觉
1.图像读取导入依赖项的h文件#include#include#include#include项目Valuecore.hpp基础数据结构和操作（图像存储、矩阵运算、文件I/O）highgui.hpp图像显示、窗口管理、用户交互（图像/视频显示、用户输入处理、结果保存）imgproc.hpp图像处理算法（图像滤波、几何变换、边缘检测、形态学操作）二读取图片Matimage;//图像矩阵std::co
Halcon 和 opencv比有什么区别与优劣 yuanpan opencv 人工智能计算机视觉
Halcon和OpenCV都是机器视觉领域的重要工具，但它们的设计目标、功能特点和适用场景有所不同。以下是两者的详细对比：1.定位与目标用户Halcon：定位：商业机器视觉软件，专注于工业应用。目标用户：工业自动化、质量控制、机器人引导等领域的专业开发者。OpenCV：定位：开源计算机视觉库，适用于通用图像处理和计算机视觉任务。目标用户：学术研究、教育、初创公司以及需要低成本解决方案的开发者。2.
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
基于PyTorch和ResNet18的花卉识别实战（附完整代码）意.远 pytorch 人工智能 python 深度学习
一、项目背景与效果花卉分类是计算机视觉的经典任务。本文使用PyTorch框架，基于ResNet18模型实现了102种花卉的分类任务。完整代码可直接复制运行，最终验证集准确率达8.2%，文中同步分析性能瓶颈与优化方案。二、环境配置与数据准备1.环境要求#主要依赖库importtorchfromtorchimportnn,optimfromtorchvisionimporttransforms,dat
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

图像滤波与边缘检测

图像滤波

滤波器

常见的滤波器

均值滤波

高斯滤波

中值滤波

边缘检测

常见的边缘检测算子

Robert算子

Sobel算子

拉普拉斯算子

Canny算子

补充知识：

什么是数字图像处理？

相关操作与卷积操作

你可能感兴趣的:(计算机视觉)