Mayphyr

计算机视觉（OpenCV+TensorFlow）

文章目录

计算机视觉（OpenCV+TensorFlow）
前言
六.图像特征检测
- 1.特征的理解
- 2.Harris 角点检测
- - 原始思想：
  - Harris角点检测思想
  - Harris角点算法的基本步骤
- 3.SIFT算法
- - SIFT算法特点
  - SIFT算法的流程
  - SIFT算法原理
  - - 图像金字塔
    - 高斯图像金字塔
    - 高斯图像金字塔总图
    - 高斯差分金子塔
    - 极值点(Key points)的精确定位
    - 确定关键点（极值点）方向
    - 关键点描述
    - 关键点匹配
总结

前言

本系列文章是继银行卡号实战项目后的图像高级操作教程的第一篇，在银行卡号之前所学的图像操作可以满足大部分场景，但是有一些特殊场景就需要一些高级操作进行处理了

六.图像特征检测

1.特征的理解

在讲图像特征检测的时候，我们先来聊聊什么是特征，以及特征为什么那么重要，以至于在计算机视觉，机器学习，深度学习中都反复的提到。

百度的解释是：特征为一事物异于其他事物的特点。那我们再来简单的说明一下
特征是于己而言，特征是某些突出性质的表现，于他而言，特征是区分事物的关键
很难说，人类是如何找到这些特征的，这个能力在我们大脑中早已根深蒂固。对于计算机如何找到这些特征我们还要深入研究，这里我们主要研究图片的特征。

上图非常简单，在图像的顶部，给出了六个小图像补丁。如果现在有一个问题是如何在原始图像中找到这些补丁的确切位置，能找到多少个正确的结果？

A和B是平坦的表明，他们分布在很多区域中。找到这些补丁的确切位置是很难的
C和D要简单很多，他们是建筑物的边缘。我们可以找到一个大概的位置，但确切的位置仍然很困难。
最后 E和F是建筑物的一些角落，它们很容易找到，因为在角落，无论你移动这个补丁，它都会有所不同。所以它们可以是很好的特征。而且我们看 E 和 F 也符合特征的描述很容易区分，也很用它来区分其他事物。
我们在来看一下这个模型

蓝色方块是平坦的区域，很难找到和追踪。只要我们在这个绿色矩形中移动蓝色方块，它看起来好像都一样。
而黑色方块有边缘。如果沿垂直方向（即沿着渐变方向）移动它会改变。沿边缘移动（平行于边缘），看起来都一样。
对于红色方块，它是角落，无论我们怎么移动这个红色方块，它看起来都不同，那意味着他说独一无二的，所以基本上，角点被认为是图像中的好特征（不仅仅是交流，在某些情况下，blob(斑点)也被认为是很好的特征）
但是接下来又会出现一个问题，我们如何找到它们，其实刚才我们已经回答了这一点，即在图像中寻找在起周围的所有区域中移动时具有最大变化的区域。在接下来的章节中，这些将被投射到计算机语言中。因此我们也可以称查找这些图像为特征检测。
我们在图像中找到了这些特征，一旦找到它，我们应该就能够在其他图像中找到相同的内容。这是如何做到的？我们在这个特征周围区域，用中文将就是，“上面是蓝天，下面是建筑物，建筑物上有玻璃”当我们可以这么描述的时候，我们也可以在另一个地方寻找相同的图片。类似的，如果计算机也可以描述特征周围的区域，以便可以在其他图像找到它。那我们称这种描述为特征描述，获得这些特征及其描述后，我们可以在所有图像中找到相同的功能并对齐它们，将它们拼接在一起或做任何我们想做的事情。
讲到这，大家感觉这个特征匹配是不是有一点很像模板匹配，只是这里模板换成了特征，更加的灵活

2.Harris 角点检测

角点检测：https://blog.csdn.net/SESESssss/article/details/106774854

原始思想：

我们可以从角点具有的特征触发：
即选取一个局部窗口，将这个窗口沿着各个方向移动，计算移动前后窗口内像素的差异的多少进而判断窗口对应的区域是否是较低
有了思想后，我们进一步把它转化为数学描述：

通过公式，我们可以解释为
但事实上，如果我们此时用以上公式进行角点检测，会发现其中的参数 u 和 v 也就是窗口的方向并没有明确的规定。
所以我们也可以人为规定 u 和 v，但是这样一来，指定方向的话，窗口滑动又可能导致检测出来的角点其实是边缘点
既然这样，我们可以指定若干组的 u 和 v，即通过的窗口滑动方向，然后对所以的 u 和 v求得 E后再进行加权平均
然而，Harris角点检测并没有这么做
Harris可能在像，我应该如何优化原始的这个检测函数呢，如何提高精度，降低算法的复杂度

Harris角点检测思想

这时候就要用到数学工具：
对E(u，v)表达式进一步演化：

对于不同区域的图像灰度梯度：

平坦区域：两个特征值都小，且近似相等，能量函数在各个方向上都较小；
边缘区域：一个特征值大，另一个特征值小，能量函数在某一方向上增大，其他方向较小；
角点区域：两个特征值都大，且近似相等，能量函数在所有方向上都增大。

这样一来，我们就可以仅通过矩阵M的特征值，来评估图像是否存在角点
但Harris角点的计算方法甚至不需要用到特征值，只需要计算一个Harris响应值R：

到此，通过求出R，我们便可以进行角点检测。(你会发现最后根本不需要代入u，v进行计算)
是不是很神奇，感觉学这样不仅仅是去学习这个技术，更多的是别人处理问题，转化问题的思路

Harris角点算法的基本步骤

计算窗口中各像素点在x和y方向的梯度
计算两个方向梯度的成绩，即Ix^2,Iy2,Ix^iy
使用滤波核对窗口的每一个像素进行加强，生成矩阵M和元素A,B,C
计算每个像素的Harris响应值R，并对小于某阈值T的R置0
由于角点所在区域的一定领域内都有可能被检测为角点，所以为了防止角点矩阵，最后在一个卷积核中进行非极大值抑制，局部最大值点即为角点

在OpenCV中，我们用 cv2.cornerHarris()进行Harris角点检测。参数如下：

img：数据类型为 floar32的输入图像
blockSize：角点检测中要考虑的邻域大小
ksize：Sobel 求导中使用的窗口大小
k：Harris 角点检测方程中的自由参数，范围为[0.04,0.06]

import cv2 
import numpy as np
# 导入图片
img = cv2.imread('test_1.jpg')
print ('img.shape:',img.shape)
# 转灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray = np.float32(gray)
# 进行Harris角点检测，dst是结果矩阵，保存了最后的结果
dst = cv2.cornerHarris(gray, 2, 3, 0.04)
print ('dst.shape:',dst.shape)
# 　这里是设定一个阈值　当大于这个阈值分数的都可以判定为角点
# 这里是如果R>最大的R的0.01倍就认为他是一个角点
img[dst>0.01*dst.max()]=[0,0,255]
cv2.imshow('dst',img) 
cv2.waitKey(0) 
cv2.destroyAllWindows(

3.SIFT算法

https://blog.csdn.net/weixin_48167570/article/details/123704075

** 在上一章中，我们学习了角点检测器，如Harris角点检测算法。它们具有旋转不变性，这意味着，即使图像旋转，我们也可以找到相同的角点，因为很明显，角点在旋转图像中也是角点。但是对应缩放呢？如果图像缩放，角点就可以不再是角点。以下图为例，在小图像中使用一个小窗口能够检测出角点，然而将图像放大后，在同一窗口中的图像变得平坦，无法检测出角点。所以 Harris 角点不具有尺度不变性。**

因此，就有了SIFT(Scale Invariant Feature Transform) 尺度不变特征转换算法。
SIFT 算法不仅只有尺度不变性，当旋转图像，改变图像亮度，移动拍摄位置时，仍可以有较好的检测效果
其实，在我们的生活中，SIFT算法已经有所应用，比如，我们手机上的全景拍摄：当我们拿着手机旋转拍摄时，就可以得到一副全景图，其实原理就是我们在旋转拍摄时，拍摄了很多的图像，这些图像相邻之间有重叠部分，把这些图像合在一起，去除重叠部分，就可以得到一幅全景图。

SIFT算法特点

具有较好的**稳定性和不变性，**能够适当旋转，尺度缩放，便高度的变化，能在一定程度上不受视角变化，仿射变换，噪声的干扰
**区分型好，**能够在海量特征数据库中进行快速准确的区分信息进行匹配
多属性：就算只有单个物体，也能产生大量特征向量
高速性：能够快速的进行特征向量匹配。
可拓展性：能够与其他形式的特征向量进行联合

SIFT算法的流程

提取关键点：关键点是一些十分突出的不会因光照，尺度，旋转等因素而消失的点，比如角点，边缘点，暗区越的暗点。此步骤是搜索所有尺度空间上的图像位置。通过高斯微分函数来识别潜在的具有尺度和旋转不变的兴趣点。
定位关键点并确定特征方向：在每个候选的位置上，通过一个拟合精细的模型来确定位置和尺度。关键点的选择依据于它们的稳定程度。然后基于图像局部的梯度方向，分配给每个关键点位置一个或多个方向。所有后面的对图像数据操作都相对于关键点的方向，尺度和位置进行变换，从而提高对于这些变换的不变性
通过各关键点的特征向量，进行两两比较找出相互匹配的若干对特征点，建立景物间的对应关系。

看完步骤后，相信大家还是有点懵，我们接下去带着这些步骤看原理就会理解很多。

SIFT算法原理

图像金字塔

我们前几章已经讲述过图像金字塔的概念，在这里我们把图像金字塔与尺度空间相结合

图像金字塔是一种以多分辨率来解释图像的结构，通过对原始图像进行多尺度像素采样的方式，生成N个不同分辨率的图像。把具有最高级别的图像放在底部，以金字塔形状排列，往上是一系列像素逐渐降低的图像，一直到金字塔的顶部只包含一个像素点的图像。

高斯图像金字塔

前几章中我们也学习了高斯图像金字塔，这次我们更加深入的了解一下原理

我们先来说一下人的眼睛，我们人眼对世界的感知有两种特性：一是近大远小：同一物体，近处看时感觉比较大，远处看时感觉比较小；二是模糊：更准确说应该是 ‘粗细’。我们看近处，可以看到物体的细节（人会感觉看的比较清晰）。比如一片树叶，近看可以看到树叶的纹理，远处看只能看到树叶的大概轮廓（人会觉得比较模糊）。从频率的角度出发，图像的细节（比如纹理，轮廓等）代表了图像的高频成分，图像较平滑区域标识了图像的低频成分
高斯图像金字塔实际上是一种图像的尺度空间（分线性和非线性空间，此处仅讨论线性空间），尺度的概念用来模拟观察者距物体的远近程度，在模拟物体远近的同时还要考虑物体的粗细程度。
简而言之：图像的尺度就是模拟人眼看到物体的远近程度以及模糊程度。
图像金字塔就考虑了这两个方面：图像的远近程度，图像的模糊程度
如何模拟远近程度
就像我们讲过的，去除掉偶数行和偶数列。
如何模拟模糊程度
采用高斯核对图像进行平滑处理，这也是我们讲过的，高斯卷积核是实现尺度变换的唯一线性核
其实高斯金字塔并不是一个金字塔，而是有很多组（Octave）金字塔构成，并且每组金字塔都包含若干层(Interval)
高斯金字塔构建过程：

先将原图像扩大一倍之后作为高斯金字塔的第 1 组第 1 层，将第1组第1层图像经过高斯卷积之后作为第1组金字塔的第2层，高斯卷积函数为：对于参数在SIFT中取的是固定值 1.6
将乘以一个比例系数k,等到一个新的平滑因子=k*，用它来平滑第 1组第2层图像，结果图像作为第3层
如此这般凡物，最后得到 L 层图像，在同一组中，每一层图像的尺存都是一样的，只是平滑系数不一样，它们对应的平滑系数分别为：
将第 1 组倒数第三层图像作为比例因子为 2 的降采样，得到的图像作为第2组的第1层，然后对第 2 组的第 1 层图像做平滑因子为的高斯平滑，得到第2组的第2层，就像步骤2中一样，如此得到第2组的 L 层图像，同组内它们的尺寸是一样的，对应的平滑系数分别为。但是在尺寸方面第 2 组是第1组图像的一半。

这样反复执行，就可以得到一共O组，每组L层，共计O*L个图像，这些图像一起就构成了高斯金字塔，结构如下：

在同一组内，不同层图像的尺寸是一样的，后一层图像的高斯平滑因子是前一层图像平滑因子的k倍；
在不同组内，后一组第一个图像是前一组倒数第三个图像的二分之一采样，图像大小是前一组的一半
高斯金字塔图像效果如下，分别是第 1 组的4层和第2组的 4 层：

高斯图像金字塔总图

高斯差分金子塔

创建好高斯图像金字塔后，每一组内的相邻层相减可以得到高斯差分金字塔(DoG，Difference of Gaussian)，是后期检测图像极值点的前途，如下图所示：
DOG金字塔的第1组第1层，是由高斯金字塔的第1组第2层减去第1组第1层得到的。以此类推，逐组逐层生成每一个差分图像，所有差分图像构成差分金字塔。
概况为 DOG金字塔的第o组第I层图像是由高斯金字塔的第o组第l+1层减去第o层第I层得到的

每一组在层数上，DOG金字塔比高斯金字塔少一层，后续SIFT特征点的提取都是在DOG金字塔上进行的
DOG金字塔的显示效果如下：
下边对这些DOG图像进行归一化，可以很明显的看到差分图像所蕴含的特征，并且由一些特征是在不同尺度下都存在，这些特征正是SIFT所要提取的稳定特征

极值点(Key points)的精确定位

其中，T=0.04，可人为设定其值；n为待提取的图像数，abs(val) 为图像的像素值，设点像素阈值，是为了去除一些噪音点或其他一些不稳定像素点。
在高斯差分金字塔中寻找极值点
特征点是由DOG空间的局部极值点组成的，为了寻找DOG函数的极值点，每一个像素点要和它所有的相邻点比较，看其是否比它的图像域和尺度域的相邻点大或者小
如下图所示：在高斯差分金字塔中寻找极值点，处理x,y方向的点，还要考虑方向的点，所以要判断一个像素点是否为极值点，要与周围26个点进行比较

注意：

如果高斯差分金字塔每组有3层，则只能在中间1层图像寻找极值点，两端的图像不连续，没有极值点
如果高斯差分金字塔每组有5层，则只能在中间3层图像寻找极值点

依次类推。。。。。。。。。
当我们检测到极值点之后，会发现一个问题，高斯差分金字塔是离散的(因为尺度空间和像素点是离散的)，所以找到的极值点是不太准确，真正的极值点很有可能在其附近，如下图所示，为了找到更高精度的极值点，需要用到泰勒展开式

确定关键点（极值点）方向

通过尺度不变性求极值点，需要利用图像的局部特征为每一个关键点分配一共基准方向，使描述子对图像旋转具有不变性，对于在DOG金字塔中检测出的关键点，采集其所在高斯金字塔图像邻域窗口内像素的梯度和方向分布特征。梯度的模值和方向如下：
采用梯度直方图统计法，统计以关键点为原点，一定区域内的图像像素点确定关键点方向。在完成关键点的梯度计算后，使用直方图统计邻域内像素的梯度和方向。梯度直方图将0~360度的方向范围分为36个柱，其中每柱10度。如下图所示，直方图的峰值方向代表了关键点的主方向，方向直方图的峰值则代表了该特征点处邻域梯度的方向，以直方图中最大值作为该关键点的主方向。为了增强匹配的鲁棒性，只保留峰值大于主方向峰值80％的方向作为该关键点的辅方向。统计以特征点为圆心，以该特征点所在的高斯图像的尺度的1.5倍为半径的圆内的所有的像素的梯度方向及其梯度幅值，并做1.5σ的高斯滤波(高斯加权，离圆心也就是关键点近的幅值所占权重较高).

关键点描述

上述过程，只是找到关键点并确定了其方向，但SIFT算法核心用途在于图像的匹配，我们需要对关键点进行数学层面的特征描述，也就是构建关键点描述符.
1、确定计算描述子所需的图像区域
描述子梯度方向直方图由关键点所在尺度的高斯图像计算产生. 图像区域的半径通过下式计算
d=4，代表划分4x4个子块
2、将坐标移到关键点方向
关键点所在的半径区域，移至关键点方向，如下图所示

3、生成关键点描述符

将区域划分为4x4的子块，对每一个子块进行8个方向的直方图统计操作，获得每个方向的梯度幅值，总共可以组成128维描述向量。
对于每一个关键点，都拥有位置、尺度以及方向三个信息。为每个关键点建立一个描述符，用一组向量将这个关键点描述出来，使其不随各种变化而改变，比如光照变化、视角变化等等。这个描述子不但包括关键点，也包含关键点周围对其有贡献的像素点，并且描述符应该有较高的独特性，以便于提高特征点正确匹配的概率。

关键点匹配

1、分别对模板图（参考图，reference image）和实时图（观测图，observation image）建立关键点描述子集合。目标的识别是通过两点集内关键点描述子的比对来完成。具有128维的关键点描述子的相似性度量采用欧式距离。
2、匹配可采取穷举法完成，但所花费的时间太多。所以一般采用kd树的数据结构来完成搜索。搜索的内容是以目标图像的关键点为基准，搜索与目标图像的特征点最邻近的原图像特征点和次邻近的原图像特征点。
Kd树如下如所示，是个平衡二叉树

Opencv中使用SIFT算法

import cv2
import numpy as np

img = cv2.imread('test_1.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 这里因为4以上的版本SIFT因为专利的原因收费了，所以我们要用SIFT的话，版本是3.4.1到3.4.3
cv2.__version__ 
# 创建一共SIFT对象
sift = cv2.xfeatures2d.SIFT_create()
# 关键点检测，这个None是掩膜，如果想只检测一部分图像时可以使用
kp = sift.detect(gray, None)
# 2.3在图像上绘制关键点的检测结果，img参数是要把特征点画在img上
img = cv2.drawKeypoints(gray, kp, img)
 # 根据关键点计算周围区域的特征向量描述
keypoints, descriptor = sift.compute(gray, keypoints) 
cv2.imshow('drawKeypoints', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

总结

本篇文章主要讲述的是图像特征的检测，从这里开始之后，就会大量地涉及到高等数学，线性代数，概率论等数学知识，如果那个小伙伴这些基础的数学功底还没打好的话，建议先去巩固一下数学基础

我是Mayphry，从一点点到亿点点，我们下次再见

使用OpenCV在Visual Studio上编译x86或x64平台的应用程序程序世界航海 opencv visual studio 人工智能编程
OpenCV是一个广泛使用的计算机视觉库，它提供了丰富的图像处理和计算机视觉算法。如果你想在VisualStudio上编译一个使用OpenCV的应用程序，并且需要针对特定的x86或x64平台进行优化，那么本文将为你提供一些指导。以下是在VisualStudio中编译x86或x64平台上的OpenCV应用程序的步骤：步骤1：安装VisualStudio和OpenCV首先，确保你已经安装了最新版本的V
用realsense d435i传感器在实际环境中跑ORB_SLAM3，顺带解决一部分编译问题睫力上爬 SLAM 日常折腾传感器 ORB_SLAM3
是的ORB_SLAM3来了，时隔五年，它来带的惊喜到底是啥呢？一个完全依赖于最大后验估计（MAP）的单/双目惯导融合系统高回召的地点识别功能（High-recallplacerecognition）第一个完整的多地图系统（multi-map）一个抽象的相机模型表示论文地址论文细节今天不说，今天主要先拿到代码，并且用自己的传感器试试实际效果编译终端拉代码记得提前安装好OpenCV，Eigen，和Pa
ROS教程（六）：Rviz显示USB摄像头（详细图文） Leslie___Cheung ROS ROS rviz usb摄像头
目录前言一、RVIZ介绍1.数据类型介绍2.界面介绍二、配置RVIZ1.打开RVIZ2.添加模块三、启动总结（最重要的）前言上一章讲解了如何使用OpenCV调用电脑摄像头或USB摄像头，本章Leslie就讲解如何使用rviz来显示摄像头的画面。一、RVIZ介绍1.数据类型介绍参考ROS教程（四）->数据类型介绍2.界面介绍二、配置RVIZ1.打开RVIZ打开终端，输入rvi
【ORB_SLAM系列3】—— 如何在Ubuntu18.04中使用自己的单目摄像头运行ORB_SLAM3（亲测有效，踩坑记录）啥也不会的研究僧 SLAM算法安装与实践记录 ubuntu 计算机视觉人工智能自动驾驶
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、ORB_SLAM3源码编译二、ORB_SLAM3实时单目相机测试1.查看摄像头的话题2.运行测试三.运行测试可能的报错1.报错一(1)问题描述(2)原因分析(3)解决2.报错二(1)问题描述(2)解决前言本次教程运行ORB_SLAM3，所需的环境如下：Ubuntu18.04、ros版本：melodicOpencv4.5
奥比中光3D机器视觉相机能连接halcon吗？视觉人机器视觉机器视觉3D 3d 数码相机视觉检测 c#
奥比中光的设备与Halcon的兼容性可以通过以下方式实现：数据接口的通用性奥比中光的相机（如AstroPro、大白等）支持通过UVC协议获取彩色图像，深度数据则通过OpenNI或ROS2接口传输105。若Halcon支持这些协议或标准接口（如ROS消息、OpenCV图像流），则可通过直接调用或二次开发实现连接。例如，通过Python或C#脚本将图像数据从相机传输至Halcon的处理流程中。SDK与
探秘 DeepSeek R1 模型：跨越多领域的科技奇迹，引领智能应用新浪潮羑悻的小杀马特. AI学习科技 deepseek AI大模型
DeepSeekR1模型功能强大，应用广泛。在自然语言处理、计算机视觉、推荐系统和医疗等领域都能发挥作用。本文介绍了其在各领域的应用场景和代码示例，助你深入了解它。目录编辑一、本篇背景：二、DeepSeekR1模型概述：2.1模型特点：2.2技术原理：三、自然语言处理领域的应用：3.1文本分类：3.1.1应用场景：3.1.2代码演示：3.2情感分析：3.2.1应用场景：3.2.2代码演示：3.3机
Ubuntu 安装 OpenCV (C++) LegendBIT 程序开发--基本工具 ubuntu opencv c++
版本详情：Ubuntu:22.04+5.15.0-133-genericgcc:11.4.0g++:11.4.0OpenCV:4.7.01.卸载OpenCV进入原先编译opencv的build目录，在该目录下打开终端，执行以下代码（如果build已经删除了，可以重新编译一遍该版本的opencv，然后在最后一步执行sudomakeuninstall）sudomakeuninstallcd..sudo
QT5在windows下调用OpenCV库出现: undefined reference to `xxxxx' 错误解决办法（适用MinGW编译器）。 DS小龙哥 QT(C++)应用软件开发 AI人工智能 opencv
一、环境介绍window系统：win10X64QT版本:5.12QT5.12自带的MinGW编译器版本：mingw730_32与mingw730_64在QT的安装目录下，可以查看MinGW编译器的版本:二、使用OpenCV出现的问题在QT框架代码里使用老版本的分类器(cvLoad、cvHaarDetectObjects)处理图像时，正常编译没有问题，当使用新版本级联分类器(CascadeClass
使用opencv实现深度学习的图片与视频的超分辨率人工智能研究所人工智能之计算机视觉 opencv 深度学习视频超分辨率图片超分辨率
图片超分辨率什么是视频与图片的超分辨率，总结一下便是给一张分辨率比较低的图片，进行超分辨率的处理后，生成比较清晰的高分辨率的图片，上图图片完美解释了超分辨率的过程，由于不同的算法不同，处理的结果也不相同，本期我们介绍一下如何进行图片的超分辨率的处理。·EDSR模型图像超分辨率EDSR：EnhancedDeepResidualNetworksforSingleImageSuper-Resolutio
OpenCV 简介奇点创客 OpenCV
OpenCV（OpenSourceComputerVisionLibrary，开源计算机视觉库：http://opencv.org）是一个开放源代码库，其中包含数百种计算机视觉算法。本文档介绍所谓的OpenCV2.xAPI，与基于C的OpenCV1.xAPI相比，该API本质上是一套C++API（自OpenCV2.4发行以来，不推荐再使用CAPI，并且不使用“C”编译器进行测试）。OpenCV具有
OpenCV机器学习（1）人工神经网络 - 多层感知器类cv::ml::ANN_MLP 村北头的码农 OpenCV opencv 机器学习人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::ml::ANN_MLP是OpenCV库中的一部分，用于实现人工神经网络-多层感知器（ArtificialNeuralNetwork-Multi-LayerPerceptron,ANN-MLP）。它提供了一种方式来创建和训练多层感知器模型，以解决分类、回归等
本地部署DeepSeek模型技术指南 Evaporator Core apache Doris 人工智能 deepseek
DeepSeek模型是一种先进的深度学习模型，广泛应用于自然语言处理、计算机视觉等领域。为了充分利用DeepSeek模型的强大功能，许多开发者和研究人员选择在本地环境中部署该模型。本文将详细介绍如何在本地环境中部署DeepSeek模型，包括环境准备、模型下载、配置、优化以及代码实现等内容。通过本文的指导，您将能够在本地成功部署并运行DeepSeek模型。1.环境准备在部署DeepSeek模型之前，
计算机视觉如何快速入门? Frunze软件开发日常问题回答开发语言计算机视觉工业异常检测论文
目录1.明确研究方向2.学习基础知识3.掌握核心算法4.实践项目5.阅读文献6.复现经典论文7.改进与创新总结计算机视觉（ComputerVision）是一个复杂且广泛的领域，尤其是工业异常检测这种特定方向，需要结合理论知识和实践技能。以下是一些具体的、可操作的建议，也是个人实际路径的一个总结，希望可以帮助到你快速入门并完成一篇论文。1.明确研究方向-工业异常检测的核心是识别图像或视频中的异常区域
[C#]C#使用yolov8的目标检测tensorrt模型+bytetrack实现目标追踪 FL1623863129 深度学习 c#YOLO 目标检测
【测试通过环境】win10x64vs2019cuda11.7+cudnn8.8.0TensorRT-8.6.1.6opencvsharp==4.9.0.NETFramework4.7.2NVIDIAGeForceRTX2070Super版本和上述环境版本不一样的需要重新编译TensorRtExtern.dll，TensorRtExtern源码地址：TensorRT-CSharp-API/src/T
树莓派通过手机热点，无线连接PC端电脑，进行远程操作 Epiphany_ZZW 树莓派智能手机
树莓派通过手机热点实现无线连接具有以下几点优势：1.该方式能够联网，方便在项目开发时下载一些数据包。2.该方式能够通过手机端查看树莓派IP地址(有些情况树莓派ip地址会发生改变)借鉴链接如下：树莓派的使用网线及无线连接方法及手机连接树莓派_opencv镜像具体操作方式如下：打开终端：pi@raspberrypi:~$sudonano/etc/wpa_supplicant/wpa_supplican
YOLO系列版本迭代：从YOLOv1到YOLOv11的技术演进金外飞176 技术前沿目标跟踪人工智能计算机视觉
YOLO系列版本迭代：从YOLOv1到YOLOv11的技术演进YOLO（YouOnlyLookOnce）系列目标检测算法自2016年首次发布以来，凭借其高效的实时检测能力，迅速成为计算机视觉领域的热门研究方向之一。本文将详细回顾YOLO系列从v1到v11的版本迭代过程，分析每个版本的技术改进、性能提升以及应用场景。1.YOLOv1：开创性的单阶段检测算法YOLOv1是目标检测领域的一个重要里程碑，
推荐学习图像处理的入门书：《Python图像处理实战》天飓学习感悟学习图像处理 python
《Python图像处理实战》是一本全面介绍Python图像处理技术的实用指南，是由人民邮电出版社于2020年12月出版。这本书的作者桑迪潘·戴伊是一位兴趣广泛的数据科学家，主要研究机器学习、深度学习、图像处理和计算机视觉。在《Python图像处理实战》一书中，作者主要介绍了如何用Python图像处理库（如PIL、python-opencv、Scipy等），机器学习库（scikit-learn）和深
RK3588+昇腾AI｜40TOPS算力AI盒子设计方案 ARM+FPGA+AI工业主板定制专家 AI盒子瑞芯微人工智能
综合视频智能AI分析系统介绍以计算机视觉技术为基础，AI赋能千行百业，依托人工智能视觉分析技术以及强大的“端+边”算力支撑，实时分析烟火，入侵等事件，同时结合云上预警业务平台，实现事件发现、预警、处置全流程闭环。设计架构系统架构视频智能识别系统自下而上分为“感知层、网络层、支撑层、应用层”四层，系统逻辑架构如下图所示：感知层对接前端感知设备，如视频监控、NVR、和其他物联感知设备，对重要通道和场所
使用 OpenCV 和 Python 对图像进行卡通化无水先生 AI原理和python实现人工智能综合 opencv python 人工智能
关键词：OpenCVlibrarytoconvertimagestocartoons目录一、说明二、OpenCV2.1要求支持库2.2方法2.3实施和执行三、定义卡通化函数3.1添加按钮3.2保存图像四、结论一、说明在本文中，我们将构建一个有趣的应用程序，将提供给它的图像卡通化。为了构建这个卡通化应用程序，我们将使用python和OpenCV。这是机器学习令人兴奋和激动的应用程序之一。在构建此应用
使用Qt+opencv实现游戏辅助点击工具-以阴阳师为例虎式坦克我最爱游戏
注：本文章技术交流使用，不侵犯任何著作权。一.阴阳师辅助软件需要实现哪些功能?1.首先，对于肝绘卷拿角色而言，需要打困难28副本和结界突破循环刷绘卷碎片。这一功能让你每月免费悠闲地拿到最新角色，即使你是较新的玩家！2.有人喜欢打阴阳寮突破，因为结界卡可以合成勾玉，另外寮突破后给的寮勋章可以维持寮正常运转。3.御魂等副本，这款游戏的御魂是核心玩法。而且这只是一个辅助工具，不修改游戏内存，用来解放双手
ORB-SLAM3源码的学习：GeometricTools文件 PaLu-LvL 计算机视觉 #ORB-SLAM3 c++计算机视觉 ubuntu 人工智能学习
前言GeometricTools提供了两种几何计算功能：1.计算两个关键帧之间的基础矩阵、2.通过三角化算法从两个视角恢复三维点。这部分功能在ORB-SLAM2中就已经介绍过了，这里不过多赘述。1.头文件GeometricTools.h除了计算基础矩阵和三角化恢复三维点外，头文件中还提供了两种用于比较矩阵的模板函数。第一个函数用于比较一个OpenCV矩阵和一个Eigen矩阵，第二个函数用于比较两个
计算机视觉中图像的基础认知全栈你个大西瓜人工智能计算机视觉人工智能图像基本属性 RGB 三通道彩色单通道灰度图像 OpenCV Matplotlib
第一章：计算机视觉中图像的基础认知第二章：计算机视觉：卷积神经网络(CNN)基本概念(一)第三章：计算机视觉：卷积神经网络(CNN)基本概念(二)第四章：搭建一个经典的LeNet5神经网络一、图像/视频的基本属性在计算机视觉中，图像和视频的本质是多维数值矩阵。图像或视频数据的一些基本属性。宽度（W）和高度（H）定义了图像的像素分辨率，单位通常是像素。例如，一张1920x1080的图像有1920列（
【深度学习】计算机视觉（CV）-图像分类-ResNet（Residual Network，残差网络） IT古董深度学习人工智能深度学习计算机视觉分类
ResNet（ResidualNetwork，残差网络）是一种深度卷积神经网络（CNN）架构，由何恺明（KaimingHe）等人在2015年提出，最初用于ImageNet竞赛，并在分类任务上取得了冠军。ResNet的核心思想是残差学习（ResidualLearning），它通过跳跃连接（SkipConnections）解决了深度神经网络训练中的梯度消失和梯度爆炸问题，使得非常深的网络（如50层、1
基于深度学习YOLOv10的PCB板缺陷检测系统（附完整资源+PySide6界面+训练代码）人工智能_SYBH 深度学习 YOLO 人工智能目标检测 python
引言：在现代制造业中，电子元件和PCB（印刷电路板）是非常重要的基础设施。PCB缺陷检测是生产过程中至关重要的一步。传统的缺陷检测方法主要依靠人工检查，这不仅效率低，而且容易受到人眼疲劳的影响。随着深度学习技术的不断发展，基于深度学习的自动化缺陷检测已成为研究的热点，尤其是在计算机视觉领域。YOLO（YouOnlyLookOnce）系列算法凭借其高速和高精度的优势，成为了目标检测领域的佼佼者。本文
深入理解TensorFlow中的形状处理函数 SEVEN-YEARS tensorflow 人工智能 python
摘要在深度学习模型的构建过程中，张量（Tensor）的形状管理是一项至关重要的任务。特别是在使用TensorFlow等框架时，确保张量的形状符合预期是保证模型正确运行的基础。本文将详细介绍几个常用的形状处理函数，包括get_shape_list、reshape_to_matrix、reshape_from_matrix和assert_rank，并通过具体的代码示例来展示它们的使用方法。1.引言在深
OpenCV：人脸检测与Haar级联分类器（十三） WHCIS opencv opencv 数学建模人工智能计算机视觉音视频算法
一、Haar级联检测深度解析1.1Haar特征数学建模Haar特征的本质是通过矩形区域对比捕捉局部特征，其数学形式可扩展为四元组表示：特征定义：Haar(f)=(t,x,y,w,h)×s\text{Haar}(f)=(t,x,y,w,h)\timessHaar(f)=(t,x,y,w,h)×s其中：ttt表示特征类型（共14种基础变体）(x,y)(x,y)(x,y)为特征锚点坐标(w,h)(w,h
Python 爬虫验证码识别 acheding python python 爬虫 ocr
在我们进行爬虫的过程中，经常会碰到有些网站会时不时弹出来验证码识别。我们该如何解决呢？这里分享2种我尝试过的方法。0.验证码示例1.OpenCV+pytesseract使用Python中的OpenCV库进行图像预处理（边缘保留滤波、灰度化、二值化、形态学操作和逻辑运算），然后结合pytesseract进行文字识别。pytesseract需要配合安装在本地的tesseract-ocr.exe文件一起
深度学习框架探秘｜TensorFlow vs PyTorch：AI 框架的巅峰对决紫雾凌寒智启前沿：AI 洞察・创未来人工智能深度学习 tensorflow pytorch ai
在深度学习框架中，TensorFlow和PyTorch无疑是两大明星框架。前面两篇文章我们分别介绍了TensorFlow（点击查看）和PyTorch（点击查看）。它们引领着AI开发的潮流，吸引着无数开发者投身其中。但这两大框架究竟谁更胜一筹？是TensorFlow的全面与稳健，还是PyTorch的灵活与便捷？让我们一同深入剖析，探寻答案。在深度学习框架中，TensorFlow和PyTorch无疑是
景联文科技数据处理平台：支持高质量图像标注服务景联文科技人工智能科技计算机视觉
图像标注是计算机视觉领域中不可或缺的一环，它通过为图像添加标签来帮助机器学习算法理解图像内容。这一过程对于创建高质量的训练数据集至关重要，使得AI模型能够准确地识别和分类现实世界中的物体。常见的图像标注类型：边界框标注：这是最常用的标注方式之一，通常用于物体检测任务。通过绘制矩形框来确定图像中目标物体的位置，可以是二维或三维形式。分割标注：包括语义分割（同一类别的所有实例被视为整体）和实例分割（每
三种方式实现人车流统计（yolov5+opencv+deepsort+bytetrack+iou） Jayson God 人工智能 c++yolov5 opencv 算法人工智能
一、运行环境1、项目运行环境如下2、CPU配置3、GPU配置如果没有GPUyolov5目标检测时间会比较久二、编程语言与使用库版本项目编程语言使用c++，使用的第三方库，onnxruntime-linux-x64-1.12.1，opencv-4.6.0opencv官方地址Releases-OpenCVopencvgithub地址https://github.com/opencv/opencv/tr
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author cngolon@126.com * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

计算机视觉（OpenCV+TensorFlow）