一把木剑

视觉伺服控制完整解析

视觉伺服控制简介
相关符号及概念的说明

坐标变换
刚体运动
相机模型

视觉伺服控制理论

基于位置的视觉伺服控制
基于图像的视觉伺服控制

参考文献

视觉伺服控制简介

视觉伺服控制（Visual servo control）简单来说，就是利用计算机视觉得到的数据来控制机器人的移动。一般来说，根据相机的位置不同又分为两种，一种是直接将相机放置在机器人或者机械臂上，另一种是将相机固定在工作空间的某个位置，前者也被称作eye-in-hand。

记号	对应参考系
$e$	机器人末端执行机构（end-effector）
$t$	目标物体（target）
$c_i$	第 $i$ 个相机（camera）

视觉伺服控制理论

关于视觉伺服控制主要有两个问题

控制结构是否分层，即视觉系统提供设定点作为机器人控制器的输入，还是视觉控制器直接计算机器人控制器输入。
误差是定义在3D参考系下还是2D参考系下

如果控制结构是分层的，则称为dynamic look-and-move，否则称为direct visual servo。如果误差定义在3D参考系，则称为基于位置（position-based），否则称为基于图像（image-based）。因此根据上述两个问题，视觉伺服控制可以分为四大类。

Dynamic position-based look-and-move
Dynamic image-based look-and-move
Direct position-based visual servo
Direct image-based visual servo

下图展示了Dynamic position-based look-and-move的框架，如果是非分层的，则没有Joint controllers这一层，如果是image-based，则没有Pose estimation这一项。

虽然分层控制看上去多了一个处理步骤，但实际中的视觉伺服大都采用分层控制，主要有以下几个原因

一般来说，控制器的频率大于1KHZ是很常见的，但是图像采样频率达到1KHZ是比较难的，因此直接控制没法满足高频的控制要求。
对许多机器人来说，在3D空间下的姿态和位移甚至速度加速度都很容易通过自身或附加的传感器得到，而且精度较图像高。
对于单纯的机器人定点运动，有许多成熟的方法可以直接运用。

关于基于位置和基于图像，简单来讲，基于图像，误差就是当前特征在图像的位置和在目标图像的位置，而基于位置，则要先将图像特征转换到工作空间三维坐标系，然后计算在三维空间下当前位置和目标位置的误差。

考虑一个例子，用机器手去抓一个杯子。假设，我们的相机就在机器手上，什么意思呢？就是这个相机没法捕捉到完整的机器手，只能捕捉到目标。那这个时候怎么判断杯子是否抓稳了呢？比如说，我们以杯子的中心在视野中央当作抓稳的判断条件。这样可能会出现什么问题呢？当相机有误差时，也就是说，杯子实际上并不在机器手中央，但是由于相机的偏移或者其他误差导致杯子显示在捕捉到的图像中央。注意，这时候，无论是基于图像还是基于位置，都无法自己发现这个误差并纠正。那什么样的做法比较合理呢？对，把相机换个位置，换到能同时观察到机器手和杯子的位置，这样就算有偏移，也能知道是否抓稳。

这个例子不一定恰当，有点像控制中引入反馈的意思？我们为了区分这两种情况，将能同时观察到执行机构和目标的系统称为终点闭环（endpoint closed-loop，ECL）系统，反之，称为终点开环（endpoint open-loop，EOL）系统。理论上闭环效果更好，但是闭环意味着引入了更多的计算量（需要同时识别并追踪更多的特征），所以这也是一个trade off。

基于位置的视觉伺服控制

基于位置的视觉伺服控制，首先从图像中提取特征，然后基于这些特征估计目标相对于相机的位姿，将该位姿与预期的目标位姿进行对比，当误差为0或者小于 $\delta$ 时，认为控制任务完成。简单起见，下述讨论时我们默认采用比例控制。考虑将末端执行机构上的某个点 $^e \mathbf{P}$ 移动到固定参考系下的另一个点 $\mathbf{S}$ ，称该过程为点到点（point-to-point）。我们先考虑只有平动的情况，即 $\mathcal{T} = \Re^3$ ，如果相机是固定的话，则可以定义如下误差函数
$\mathbf{E}_{pp}\mathbf{(x_e;S,{^eP})=x_e(^eP)-S}$ 当然，很多时候并不是能够轻易地获得目标的全局位置，更多是知道相对于相机的位置，因此，我们的控制律可以写为
$\mathbf{u}_3=-k \mathbf{E}_{pp}(\mathbf{\hat{x}}_e;\mathbf{\hat{x}}_c(^c\mathbf{\hat{S}}),{^e\mathbf{P}})=-k(\mathbf{\hat{x}}_e(^e\mathbf{P})-\mathbf{\hat{x}}_c(^c\mathbf{\hat{S}}))$ 实际相机都需要事先进行标定，但误差不可避免，因此这里的 $\mathbf{\hat{x}}$ 表示对应的估计值。如果相机是固定在机器人上的某个位置，则相机相对末端执行机构的变换是已知的，有
$\mathbf{u}_3=-k\mathbf{\hat{x}}_c(^c\mathbf{\hat{P}}-{^c\mathbf{\hat{S}})}$ $^e\mathbf{u}_3=-k^e\mathbf{\hat{x}}_c(^c\mathbf{\hat{P}}-{^c\mathbf{\hat{S}})}$ 注意，上述两个式子等于0的条件时一样的。 $(^c\mathbf{\hat{P}}-{^c\mathbf{\hat{S}})}=0$ 。也就是说，这个收敛条件并不依赖于机器人执行机构的准确性或者相机标定结果。
更进一步地，考虑平动+转动的情况，即 $\mathcal{T} \subseteq SE^3$ ，此时的控制输入 $\mathbf{u} \in \Re^6$ 。但是我们上面定义的误差函数是3维的，怎么解决维数不一致的问题呢？在刚体运动那一小节中，我们得到了一个式子 $\mathbf{\dot{P}}=\mathbf{A(P)}\dot{\mathbf{r}}$ ，结合该式可以得到
$\mathbf{\dot{P}}=\mathbf{u}_3=\mathbf{A(P)}\mathbf{u}$ 为了得到 $\mathbf{u}$ ，理论上，我们只需要解上述这个方程即可，那么问题来了，如果 $\mathbf{A(P)}$ 是方阵当然万事大吉，但是很显然这里不是。不要慌，伟大的数学家早已经看穿了一切，这里就要引进一个重要的概念，PM广义逆，具体定义感兴趣的朋友可以去找本矩阵论看看。这里主要用到如下结论
矩阵 $\in \mathbb{C}^{m \times n}$ 且 $r a n k (A) = r$ ，则

上面的 $A^+$ 就是广义逆，而且注意到 $\mathbf{A(P)}$ 的定义中含有一个单位阵，因此它一定是行满秩的。
那刚才的那个问题就很好解答了
$\mathbf{u}=\mathbf{A(P)}^+\mathbf{u}_3$ 在刚才的基础上更进一步，假设现在不是把末端执行机构移动到某个位姿，而是把他移到某两个点的连线上。首先要重新定义一个误差函数，这个误差函数必须满足三点共线时值为0，且偏离角度越大值越大。那我们自然就会想到向量积。
$\mathbf{E}_{pl}\mathbf{(x_e;S_1,S_2,{^eP})}=(\mathbf{S}_2-\mathbf{S}_1)\times (\mathbf{x}_e(^e\mathbf{P})-\mathbf{S}_1) \times (\mathbf{S}_2-\mathbf{S}_1)$ 我们刚才考虑的是把末端执行机构的一个点移动到一条线上，这个动作即使不考虑旋转，单纯的平动就可以做到。如果同时考虑把两个点移动到同一条线上，那么很显然，除非一开始这两条线就是平行的，否则无法通过单纯的平动实现该目标。
令 $\mathbf{u=(T,\Omega)}$ ，利用向量积很容易表述两个向量之间的差异
$\mathbf{k}=(\mathbf{S}_2-\mathbf{S}_1) \times \mathbf{R_e}(^e\mathbf{P}_2-\mathbf{P}_1)$ 这里 $\mathbf{k}$ 的方向表示旋转轴，模长正比于夹角， $\mathbf{R_e}$ 表示旋转矩阵。此时
$\mathbf{\Omega}=-k_1\mathbf{k}$ 此时的平动肯定不是简单的 $-k_2\mathbf{E}_{pl}$ ，因为发生了旋转，结合我们在刚体运动小节介绍的结果，很容易得到
$\mathbf{T}=-k_2(\mathbf{S}_2-\mathbf{S}_1)\times (\mathbf{x}_e(^e\mathbf{P}_1)-\mathbf{S}_1) \times (\mathbf{S}_2-\mathbf{S}_1)-\mathbf{\Omega}\times(\mathbf{x}_e(^e\mathbf{P}_1))$ 上述讨论都是基于单相机的情况，实际上，在进行估计时，采用多传感器是很常见的减小误差的方法，下面我们简单讨论一下多相机的情况。令 $^a\mathbf{x}_{c1}$ 表示相机相对于任意一个参考系 $a$ 的位姿， $^a\mathbf{P}=[x,y,z]^T$ ，则有
$\mathbf{p}_1=\begin{bmatrix} u_1 \\ v_1\end{bmatrix}=\frac{\lambda}{\mathbf{z}{^a\mathbf{P}}+t_z} \begin{bmatrix} \mathbf{x}{^a\mathbf{P}}+t_x \\ \mathbf{y}{^a\mathbf{P}}+t_y\end{bmatrix}$ 其中， $\mathbf{x},\mathbf{y},\mathbf{z}$ 是旋转矩阵 $^{c1}\mathbf{R}_a$ 的对应行向量， $t_x,t_y,t_z$ 同理。简单化简可得
$A_1(\mathbf{p}_1)^a\mathbf{P}=b_1(\mathbf{p}_1)$ 其中
$A_1(\mathbf{p}_1)=\begin{bmatrix} \lambda \mathbf{x}-u_1 \mathbf{z} \\ \lambda \mathbf{y}-v_1 \mathbf{z}\end{bmatrix},b_1(\mathbf{p}_1)=\begin{bmatrix} u_1 \mathbf{t}_z-\lambda t_x \\ v_1 \mathbf{t}_z-\lambda t_y\end{bmatrix}$ 同理，对另一个相机 $^a\mathbf{x}_{c2}$ 我们也有如上结果，写成矩阵形式
$\begin{bmatrix}A_1(\mathbf{p}_1) \\ A_2(\mathbf{p}_2)\end{bmatrix}{^a\mathbf{P}}=\begin{bmatrix}b_1(\mathbf{p}_1) \\ b_2(\mathbf{p}_2)\end{bmatrix}$ 很显然，当多个相机方程联立的时候，方程个数会大于未知数个数，当然引入多个相机的目的就是为了防止某个相机的误差对结果影响过大，上述方程通过最小二乘的方法很容易得到一个解，这里不加赘述。
基于位置的视觉伺服控制的基本理论主要都介绍了，总的来说，基于位置控制的优点就是将目标从二维图像转换到三维空间，对机器手来说，从（1,2,3）到（3,4,5）显然比从图上的（1,2）到（3,4）更好理解一些。缺点的话，引进从图像到空间的变换自然也引进了新的误差，因此，基于位置的方法都对相机的标定结果比较敏感。另一个问题就是在重复计算坐标变换的过程，需要许多额外的计算量。

基于图像的视觉伺服控制

首先引入图像雅可比矩阵的概念，定义 $\mathbf{r}$ 和 $\mathbf{\dot{r}}$ 分别表示末端执行机构的位姿和速度， $\mathbf{f}$ 和 $\mathbf{\dot{f}}$ 表示图像特征的参数和这些参数的变化率。定义
$\mathbf{\dot{f}}=\mathbf{J}_v(\mathbf{r})\mathbf{\dot{r}}$ 其中，

$\mathbf{J}_v$ 称为图像雅克比矩阵。举个例子来说明如何求解图像雅可比矩阵。利用前面的运动学公式，有
$\mathbf{\dot{P}}=\Omega\times \mathbf{P}+\mathbf{T}$ 结合
$\begin{bmatrix} u \\ v\end{bmatrix}=\frac{\lambda}{z} \begin{bmatrix} x \\ y\end{bmatrix}$ 有
$\dot{x}=z\omega_y -\frac{uz}{\lambda}\omega_z +T_x$ $\dot{y}=\frac{uz}{\lambda}\omega_z -z\omega_w +T_y$ $\dot{z}=\frac{z}{\lambda}(v\omega_x -u\omega_y )+T_z$ 把上述结果代入
$\dot{u}=\lambda \frac{z\dot{x}-x\dot{z}}{z^2}$ 化简得
$\dot{u}=\frac{\lambda}{z}T_x-\frac{u}{z}T_z-\frac{uv}{\lambda}\omega_x+\frac{\lambda^2+u^2}{\lambda}\omega_y-v\omega_z$ 同理有
$\dot{v}=\frac{\lambda}{z}T_y-\frac{v}{z}T_z+\frac{uv}{\lambda}\omega_y-\frac{\lambda^2+v^2}{\lambda}\omega_x+u\omega_z$ 写成矩阵形式

需要注意的是，雅克比矩阵是同深度 $z$ 相关的。
现在我们知道了雅克比矩阵，理论上只要知道 $\dot{r}$ 就能知道 $\dot{f}$ ，知道 $\dot{f}$ 就能知道 $\dot{r}$ ，那这里又回到了之前的问题，雅克比矩阵是否一定可逆？如果同时有多组特征怎么办？还是老办法，利用最小二乘和广义逆，这里给出通解
$\mathbf{\dot{r}}=\mathbf{J}_v^+\mathbf{\dot{f}}+(\mathbf{I}-\mathbf{J}_v^+\mathbf{J}_v)\mathbf{b}$ 现在我们回到实践中去，基于图像的最大问题是什么呢？少了一个维度，这是很致命的，三维空间从一个点到另一个点是唯一的，但是我们都知道，相机平面上的一个点实际对应三维的一条线，举个例子

怎么解决呢？很简单，没有什么是加一个相机解决不了的，如果有

假设点 $\mathbf{P}$ 和 $\mathbf{S}$ 在左右相机平面的投影分别为 $u^l,v^l]^T$ ， $u^r,v^r]^T$ ， $[u^l_s,v^l_s]^T$ ， $[u^r_s,v^r_s]^T$ ， $f=[u^l,v^l,u^r,v^r]^T$ ， $f_d=[u^l_s,v^l_s,u^r_s,v^r_s]^T$ ，则误差函数可定义为
$\mathbf{e}_{pp}(\mathbf{f})=\mathbf{f}-\mathbf{f}_d$ 同样的，上述讨论的是点对点的运动，如果基于图像来考虑点到线的运动呢？我们刚才提到点对点会出现二维一致三维不一致的情况，同样的，由于缺少深度信息，将点移动到一条线上也会出现这个问题，因此同样需要在两个或者多个平面内达到共线。回忆我们前面利用空间向量积来判断共线，类似的

上式为0当且仅当共线的时候。
从而构造误差函数如下
$\mathbf{e(f)}=\begin{bmatrix} e^l_{pl}([u^l,v^l]^T) \\ e^r_{pl}([u^r,v^r]^T)\end{bmatrix}$
我们前面也提到了，基于位置的方法很多时候对相机标定参数比较敏感，反过来讲，基于图像的优点就是不依赖于相机标定参数。因为只要误差是收敛到0的，说明在不同相机视野里都是趋近目标位置的，即使标定参数有误差也没有关系。值得注意的是，假设我们要完全控制六个自由度，那么我们至少需要选取三组特征 $u_1,v_1],[u_2,v_2],[u_3,v_3]$ ，对应的图像雅克比为 $\mathbf{J}_{v1},\mathbf{J}_{v2},\mathbf{J}_{v3}$ ，记 $\mathbf{J}_{v}=[\mathbf{J}_{v1},\mathbf{J}_{v2},\mathbf{J}_{v3}]^T$ ，那么可能会出现该矩阵为奇异的情况，因此，更多情况下，选取图像特征的维数都大于所要控制的自由度。

关于图像雅可比矩阵，我们上述解方程默认都是已知的，但是前面也提到了，雅可比矩阵需要知道深度，那么最理想的情况当然每个时刻都能获取到深度信息。假设，为了减少计算量，只选择若干个点，事先计算好对应相机的雅可比矩阵，那么应该怎么选取？其中一种常见的方法是选取 $\mathbf{e=0}$ 的位置。¹

参考文献

Seth Hutchinson, “A Tutorial on Visual Servo Control,” IEEE TRANSACTIONS O N ROROTLCS AND AUTOMATION, VOL. 12, NO. 5 , OCTOBER 1996
Seth Hutchinson,“Visual Servo Control Part I: Basic Approaches”,IEEE Robotics & Automation Magazine,DECEMBER 2006

B. Espiau, F. Chaumette, and P. Rives, “A new approach to visual servoing in robotics,” IEEE Trans. Robotics and Automation, vol. 8, pp.313–326, June 1992 ↩︎

必看！C# 与 HALCON 构建基于轮廓模板匹配实战宝典 AI_DL_CODE 机器视觉 c#人工智能机器视觉 HALCON 模板匹配特征点匹配
摘要：本文专注于利用C#与HALCON实现基于轮廓的模板匹配技术。从环境搭建，即HALCON安装、C#项目创建及库引用配置，到核心步骤如初始化HALCON环境、读取图像、提取轮廓、创建模板、执行匹配及显示结果等，结合详尽代码示例进行阐述。还深入探讨在实际应用中的优化策略，包括图像预处理、参数精细调整、多模板匹配及实时匹配实现等。旨在助力读者全方位掌握技术，为机器视觉相关项目开发提供有力支撑，高效解
计算机视觉深度学习入门（4） yyc_audio 计算机视觉人工智能计算机视觉深度学习神经网络
在小型数据集上从头开始训练一个卷积神经网络利用少量数据来训练图像分类模型，这是一种很常见的情况。如果你从事与计算机视觉相关的职业，那么很可能会在实践中遇到这种情况。“少量”样本既可能是几百张图片，也可能是上万张图片。我们来看一个实例——猫狗图片分类，数据集包含5000张猫和狗的图片（2500张猫的图片，2500张狗的图片）。我们将2000张图片用于训练，1000张用于验证，2000张用于测试。将介
ECCV2024｜底层视觉(超分辨率，图像恢复，去雨，去雾，去模糊，去噪等)相关论文汇总（附论文链接/开源代码）【持续更新】 Kobaayyy 论文相关图像处理与计算机视觉底层视觉算法计算机视觉 ECCV2024 图像超分图像复原图像增强
ECCV2024｜底层视觉相关论文汇总（如果觉得有帮助，欢迎点赞和收藏）相关整理(RelatedCollections)**参考或转载请注明出处**1.超分辨率(Super-Resolution)AcceleratingImageSuper-ResolutionNetworkswithPixel-LevelClassificationAdaDiffSR:AdaptiveRegion-awareDy
Accord.NET框架功能介绍绀目澄清 Accord.NET Accord.NET
机器学习组件Accord.NET框架功能介绍1.基本功能与介绍Accord.NET为.NET应用程序提供了统计分析、机器学习、图像处理、计算机视觉相关的算法。Accord.NET框架扩展了AForge.NET框架，提供了一些新功能。同时为.NET环境下的科学计算提供了一个完整的开发环境。该框架被分成了多个程序集，可以直接从官网下载安装文件或者使用NuGet得到。可以参考以下链接:https://g
【深度学习实战】行人检测追踪与双向流量计数系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、双向计数、行人检测追踪、过线计数阿_旭 AI应用软件开发实战深度学习实战深度学习 python 行人检测行人追踪过线计数
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【激活函数总结】Pytorch中的激活函数详解： ReLU、Leaky ReLU、Sigmoid、Tanh 以及 Softmax 阿_旭深度学习知识点 pytorch 人工智能 python 激活函数深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.
【保姆级教程|YOLOv8改进】【7】多尺度空洞注意力（MSDA），DilateFormer实现暴力涨点阿_旭 YOLOv8网络结构改进 YOLO YOLOv8改进 MSDA
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【保姆级教程|YOLOv8改进】【6】快速涨点，SPD-Conv助力低分辨率与小目标检测阿_旭 YOLOv8网络结构改进 YOLO 目标检测人工智能 YOLOv8改进
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
基于YOLOv8与ByteTrack的车辆行人多目标检测与追踪系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标追踪、运动物体追踪阿_旭深度学习实战 AI应用软件开发实战计算机视觉 python 行人车辆追踪目标追踪 YOLOv8 深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【保姆级教程|YOLOv8改进】【5】精度与速度双提升，使用FasterNet替换主干网络阿_旭 YOLOv8网络结构改进 YOLO YOLOv8改进 FasterNet 深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
基于YOLOv8深度学习的100种中草药智能识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战阿_旭深度学习实战 AI应用软件开发实战计算机视觉深度学习 python YOLOv8 中草药识别深度学习实战
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
基于YOLOv8深度学习的智能车牌检测与识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战阿_旭深度学习实战 AI应用软件开发实战计算机视觉深度学习 python 车牌识别 YOLOv8 深度学习实战
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
Win10TF2.4，对利用TIF影像训练报错：OSError： Too many open files SatVision炼金士报错 tensorflow 计算机视觉深度学习
问题情境：计算机视觉的火爆研究，使许多遥感影像方面研究大量借鉴计算机视觉领域的方法，但在利用遥感影像进行深度学习研究中，往往采用tif影像作为数据源，而计算机视觉相关的采用的是jpg和png影像。最近将网上开源代码的数据切换成tiff影时出想了tif影像时出现了bug，问题描述：我用的是这位博主的代码：[PSPnet](https://blog.csdn.net/weixin_44791964)T
PCIe-6328 八口USB3.0图像采集卡：专为工业自动化和机器视觉设计 qq_52609913 自动化运维图像处理
PCIe-6328一块8口USB3.0主控卡，专为工业自动化和机器视觉相关应用设计。USB3.0或称作高速USB，是一项新兴总线技术，10倍于USB2.0的传输速度，尤其适用于高速数据存储和图像设备。绝大多数现有USB3.0卡兼用多个接口于一个USB3.0控制核心上，如此操作将会使得性能显著下降。为最大化每个端口的性能，PCIe-6328拥有4颗独立Renesasupd720202USB3.0控制
基于YOLOv8深度学习的水稻叶片病害智能诊断系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战阿_旭深度学习实战 AI应用软件开发实战计算机视觉深度学习 python YOLOv8 水稻病害检测深度学习实战
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【目标检测】不同结构的感受野对CNN网络的影响牧世
一、什么是感受野？1、生物学的感受野万物能见于人，依靠的是人类的视觉系统，其中视网膜起到了关键作用，在视网膜上有许多光感受器细胞，这些光感受器把光信号转换为神经信号（电脉冲），从而刺激大脑皮层中与视觉相关的特定神经细胞，从而在人脑中显现出万物的影像。我们把所有刺激了某一特定神经细胞的光感受器称为该特定神经细胞的感受野(receptivefield)。2、卷积神经网络的感受野感受野用来表示网络内部的
【深度视觉】第二章：卷积网络的数据宝贝儿好深度学习人工智能计算机视觉卷积神经网络
四、卷积网络的数据上个系列我们详细讲解了pytorch框架下的全连接层神经网络DNN。本系列我们开始讲卷积神经网络CNN,ConvolutionalNeuralNetworks。上一章我截取了鲁鹏老师课件里面的一张图，详细展示了和计算机视觉相关的领域，显而易见，这门学科是一门交叉学科，所以尽管扩展你的知识域吧，比如，摄像设备性能，成像原理，图像数据的生成与获取，视频特效，3D，图像复原、图像分割、
基于YOLOv8深度学习的100种蝴蝶智能识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战阿_旭计算机视觉深度学习实战 AI应用软件开发实战深度学习 python 蝴蝶识别 YOLOv8 深度学习实战
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
基于YOLOv8深度学习的102种花卉智能识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战阿_旭深度学习实战 AI应用软件开发实战计算机视觉深度学习 python 花卉识别 YOLOv8 深度学习实战
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
基于YOLOv8深度学习的葡萄簇目标检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战阿_旭 AI应用软件开发实战计算机视觉深度学习实战深度学习目标检测 YOLOv8 深度学习实战葡萄簇检测
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
基于YOLOv8深度学习的苹果叶片病害智能诊断系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战阿_旭 AI应用软件开发实战计算机视觉深度学习实战深度学习 python YOLOv8 苹果病害检测深度学习实战
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【保姆级教程|YOLOv8添加注意力机制】【2】在C2f结构中添加ShuffleAttention注意力机制并训练阿_旭 YOLOv8网络结构改进 YOLO C2f YOLOv8改进深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【保姆级教程|YOLOv8改进】【3】使用FasterBlock替换C2f中的Bottleneck 阿_旭 YOLOv8网络结构改进 YOLO
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
基于YOLOv8深度学习的智能肺炎诊断系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战阿_旭深度学习实战 AI应用软件开发实战计算机视觉深度学习 python 肺炎诊断 YOLOv8 深度学习实战
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
[晓理紫]每日论文推送(有中文摘要，源码或项目地址)--机器人、视觉相关晓理紫每日论文机器人
专属领域论文订阅VX关注{晓理紫}，每日更新论文，如感兴趣，请转发给有需要的同学，谢谢支持VX关注晓理紫，并留下邮箱可免费获取每日论文推送服务分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能，机器人强化学习开放词汇，检测分割晓理紫今日论文推送==具身智能，机器人==标题:AugmentedRealityUserInterfaceforCommand,Control,andSupervi
工业相机相关概念词介绍：ISP算法、线阵相机、常用术语明月醉窗台应用工具使用介绍图像处理相关算法数码相机接口隔离原则算法计算机视觉图像处理
工业相机相关概念词介绍：ISP算法、线阵相机、常用术语ISP基本框架及算法介绍相机的常用设置50个常用术语关于立体视觉相关算法，可参考我的专栏：https://blog.csdn.net/yohnyang/category_11720857.html0.ISP基本框架及算法介绍ISP(ImageSignalProcessor)，即图像处理，主要作用是对前端图像传感器输出的信号做后期处理，主要功能有
【保姆级教程】【YOLOv8替换主干网络】【1】使用efficientViT替换YOLOV8主干网络结构阿_旭 YOLOv8网络结构改进 YOLO efficientVIT YOLOv8替换主干网络 TOLOv8
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
yolov8在进行目标追踪时，model.track()中persist参数的含义阿_旭相关问题 YOLO YOLOv8 目标追踪
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
【保姆级教程|YOLOv8添加注意力机制】【1】添加SEAttention注意力机制步骤详解、训练及推理使用阿_旭 YOLOv8网络结构改进 YOLO SEAttention 注意力机制 YOLOv8 深度学习
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
六、计算机视觉相关内容穆_清深度学习计算机视觉人工智能
文章目录前言一、图像增广1.1常用的图像增广1.1.1翻转和裁剪1.1.2变换颜色1.1.3结合多种图像增广方法二、微调2.1微调的步骤2.2具体案例三、目标检测和边界框3.1边界框四、锚框五、多尺度目标检测六、目标检测数据集七、单发多框检测(SSD)八、区域卷积神经网络(R-CNN)系列8.1R-CNN8.2FastR-CNN8.3FasterR-CNN8.4MaskR-CNN九、语义分割和数据
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

视觉伺服控制完整解析