sakurabishop

直线检测论文（霍夫变换，LSD，DWP，L-CNN，AFM，HAWP，PPGNet，TP-LSD，M-LSD，LETR）

记录一手最近看的直线检测论文。

直线检测

线段和连接点是低级视觉中的重要视觉特征，为高级视觉任务提供基本信息，如姿势估计、运动结构、3D重建，图像匹配、线框到图像的转换和图像校正。

传统方法

霍夫变换

LSD

LSD直线检测方法首先计算每个像素点的水平线（level-Line）角度，从而形成了一个水平线场，即单位矢量场，这里像素点的水平线角度就是该点梯度方向的垂直角度，如下图所示，而水平线场就是一个与图像中的点一一对应的矩阵，矩阵中元素的值即为对应到图像中点的水平线角度。

算法首先计算每个像素的水平线角度，以构成一个水平线场。该场被分割为连通的若干个部分，它们方向近似相同并且在容忍度τ内，这样可以得到一系列区域，这些区域被称为 line support regions（支持域）。

整体算法的过程图

基于深度学习的LSD

随着深度神经网络的出现，基于深度学习的LSD体系结构已经采用模型来学习线段的各种几何线索，并证明其性能有所提高。

LSD数据集

York Urban Line Segment Database Information

wireframe

[DWP](Learning to Parse Wireframes in Images of Man-Made Environments (thecvf.com))

连接点检测

网络将输入图像划分为一个 $H\times W$ 网格。如果连接点的中心落入网格单元，该单元负责检测它。因此，每个第 $i j$ 单元预测置信度得分 $c_{ij}$ ，反映模型认为该单元中存在连接点的置信度。为了进一步定位连接点，每个第 $i j$ 单元还预测其到单元中心的相对位移 $x_{ij}$ 。

分支检测

将圆（即从0到360度）划分为 $K$ 个相等的bin，每个bin跨越 $\frac{360}{K}$ 度。设第 $k$ 个bin的中心为 $b_k$ ，然后将角度 $θ$ 表示为 $（ k ， ∆ k ）$ ，如果 $θ$ 落入第 $k$ 个bin，其中 $∆ k$ 是从中心bk沿顺时针方向的剩余角度。因此，对于每个bin，我们回归到这个局部方向 $∆ k$ 。

网络架构由一个编码器和两组解码器组成。编码器将整个图像作为输入，通过卷积网络生成高级描述符的 $H \times W$ 网格。然后，解码器使用特征描述符进行连接点预测。每个连接点由 $p_{ij}=(x_{ij}，c_{ij}，{θ_{ij}，c^θ_{ijk}}^K_{k=1})$ 描述，其中， $x_{ij}$ 是连接中心的坐标， $c_{ij}∈ [0，1]$ 是第 $i j$ 个网格单元中存在连接的置信度得分， $θ_{ijk}$ 是第 $k$ 个bin中分支的角度， $c_{ijk}$ 是bin的置信度得分。这两组解码器分别预测连接中心和分支。每个FCN解码器是一个卷积层+回归器。

连接点Loss
$L=\lambda_{conf}^cL^c_{conf}+\lambda^c_{loc}L^c_{loc}+\lambda^b_{conf}L^b_{conf}+\lambda^b_{loc}L^b_{loc}$

编码器基于Google的Inception-v2模型,只使用网络中的前几层，每个解码器由一个 $3 \times 3 \times 256$ 卷积层、一个ReLU层和一个回归器组成。

直线检测

该网络为每个像素 $p$ 预测其是否落在线 $l$ 上。为了抑制局部边缘、短线和曲线，将像素 $p$ 处的预测值 $h （ p ）$ 设置为其所属线的长度。给定具有GT线 $L$ 的图像， $h （ p ）$ 的目标值定义为：
$\begin{cases} d(l) &\text{$p$is on a line l in L}\\ 0 &\text{$p$is not on any line in L} \end{cases}$
直线Loss
$L=\sum_{i,j}||\hat{h}(p_{ij})-h(p_{ij})||^2_2$
以一幅 $320 \times 320 \times 3$ 的RGB图像作为输入，通过三个金字塔残差模块（PRM）提取一幅 $80 \times 80 \times 256$ 的特征地图。然后，特征图经过五个堆叠的沙漏模块，然后是两个完全卷积和ReLU层（ $5 \times 5 \times 32 和 5 \times 5 \times 16$ ）和一个 $5 \times 5 \times 1$ 卷积层，以输出 $320 \times 320 \times 1$ 像素级的heatmap。

连接点与直线结合

首先应用阈值 $w$ 将线heatmap $h$ 转换为二值图 $M$ 。一对检测到的连接点 $p$ 和 $q \in P$ ，如果它们在（或接近于）彼此的分支上，通过线段 $l = （ p ， q ）$ 连接，则将该线段 $l$ 添加到 $L$ 。如果在连接点 $p$ 的同一分支上有多个检测到的连接，只保留最短的线段，以避免重叠。

对于连接点 $p$ 的未连接分支，首先查找位于分支射线上的最远线像素 $q_M$ ，再找线段 $p，q_M）$ 与L中线段的交点 ${q_1，q_2...q_S}$ ，计算每个段的线支撑比 $k$ （线像素数与线段总长度比例）， $k$ 大于0.6则将该段放入 $L$ ，其端点放入 $P$ 。

L-CNN

一种自下而上的直线检测方法。

所解决的问题

结构复杂，存在多个相互独立的阶段（DWP）

L-CNN包含了四个模块：

一个用来进行特征提取的主干网络将一个图片作为输入并为后续的模块提供了共享卷积特征图；

连接点预测模块，输出候选连接点；

线段采样模块，从连接点预测模块输出的连接点预测出线段；

线段校正模块，分类出预测的线段。

主干网络

主干网络选择SHN，首先通过两个步长为2的卷积层进行下采样，然后通过堆叠的沙漏模块进行特征细化。Loss为各模块Loss之和。

连接点预测

一个 $W\times H$ 的图片首先被划分成 $W_b\times H_b$ 个区域。对于每个区域，网络预测该区域是否存在一个连接点，如果存在，网络继续预测连接点在该区域的相对位置。在数学上，网络输出一个连接点似然概率特征图 $J$ 和一个偏移特征图 $O$ 。
$\begin{cases} 1 &\exists i\in V:p_i\in b\\ 0 &otherwise \end{cases}$

$\begin{cases} (b-p_i)/W_b &\exists i\in V:p_i\in b\\ 0 &otherwise \end{cases}$

将预测J视作一个分类问题并使用平均的二分类交差熵损失作为损失函数。使用L2回归来预测偏移量特征图 $O$ 。为了预测 $J$ 和 $O$ ，L-CNN设计了一个包含两个 $1\times 1$ 卷积层的网络来将特征图转化为 $J$ 和 $O$ 。由于偏移量 $O (b)$ 的范围在 $[- 1 / 2, 1 / 2) \times [- 1 / 2, 1 / 2)$ ，我们在网络的输出后面追加一个带-0.5的偏移量的sigmoid激活函数用来归一化输出。

使用非极大值抑制矫正得到 $J^{'} (b)$ ,利用max-pooling实现。

线采样模块

线段采样模块的目的是在训练阶段生成一个线段列表 ${L_j}^M_{j=1}={(\tilde{p}^1_j,\tilde{p}^2_j)}^M_{j=1}$ ，这样线段校正模块就可以进行线段预测的学习。在这个任务中，正负样本及其不平衡，L-CNN通过设计采样机制来定位这个问题。

静态采样器：对于每张图片，静态线段采样直接从真实标注中提取出 $N_s+$ 个正样本和 $N_s-$ 个负样本。负线段样本的总量相比正线段样本十分巨大。为了缓解这个问题，我们对负线段样本S-进行采样，一组负线段样本的集合可能难以分类，使用以下的启发式算法来计算S-：首先我们将所有的真实线段映射到一个 $64\times 64$ 的低分辨率二值图上。然后，对于每个可能的由一对儿连接点构成而实际上却不是真实线段的连接，我们定义它的hard分数为该线段的二值图上的平均像素密度。对每张图片，S-被设置为具有最高hard分数的2000个线段。
动态采样器：采样器首先将所有的预测连接点匹配到真实连接点上。 $m_i=arg min_j||\hat{p}_i-p_i||_2$ ,如果 $p_i$ 和 $p_{mi}$ 之间的l2距离小于阈值 $η$ ，我们认为候选连接点 $p_i$ 完成了匹配。对每个候选线段 $(\hat{p}_{i1},\hat{p}_{i2})$ ,根据如下准则将它放入D+,D-和D*：

如果 $p_{i1}$ 和 $p_{i2}$ 都被匹配了，且 $m_{i1}, m_{i2}) ∈ E$ ，我们添加该条线段到正样本集合D+中；

如果 $p_{i1}$ 和 $p_{i2}$ 都被匹配了，且 $m_{i1}, m_{i2}) ∈ S-$ ，我们添加该线段到负向样本集合D-中；

随机样本集合D*包含所有候选连接点预测出的线段，不管匹配结果是什么。

线验证模块

线段验证模块接收到一个候选线段的列表和特征图，并预测每个线段是否正确。在训练阶段，L由线采样模块训练得出，在推理阶段，L是每个预测连接点对的集合。

对每个候选线段，将两个端点的坐标送入LoI池化层，并返回一个固定长度的特征向量。然后，将合并后的特征向量输入到一个由两个全连接层构成的网络并取log值返回。线段的损失函数是sigmoid二元交叉熵损失，loss计算单元是该log值和该线段的真实标签，可以是正样本或负样本。为了保持正负样本之间的损失平衡，修正网络中每张图片的损失是两个互相独立的损失的和，分别是正样本线段和负样本线段的平均。

[AFM](IEEE Xplore Full-Text PDF:)

AFM提出了一种基于区域划分的线段地图吸引场对偶表示方法，并将线段检测问题归结为区域着色问题。后者则通过学习深度卷积神经网络来解决。是一种自上而下的直线检测方法。

所解决的问题

线段heatmap中线/非线不平衡性问题，需要额外的启发式搜索算法（L-CNN）。

区域分割图

根据一个点到线的距离函数，将每个像素分配给一个且仅一个线段来计算。与一条线段相关联的像素形成一个区域。

吸引力场图

在吸引场图中，分区区域中的每个像素由其在像素和线段上的投影点之间的吸引/投影向量表示。

挤压模块

给定一个吸引场图A，首先通过计算晶格中每个像素p的实值投影点来反转它，并进行离散化，然后计算线图。利用了区域生长思想。

HAWP

L-CNN中线采样器阶段计算效率低，AFM并非严格端到端，性能低于L-CNN。

所提出的方法由三个部分组成：

初始化：线段检测和连接点检测。给定输入图像，它首先通过共享特征主干来提取深层特征。主干网络选择SHN。

细化：线段和连接点匹配。在细化过程中，如果线段的两个端点由两个连接点支持，则保留线段。如果连接点未找到任何支持线段，则将其删除。

验证：线段和连接点分类。验证过程是对细化阶段的线段和连接点进行分类（双重检查）。采用L-CNN中的LoI

HAFM

AFM方法中基于位移向量的几何重参数化方案只能提供投影点不在线段外的像素投影向量的完整信息。如果不仅使用p与其投影点之间的位移向量，还包括p与线段两端点之间的两个位移向量，我们可以通过其6-D位移向量重新参数化p，该向量可以完全确定线段。有些像素（例如，任何线段上的点）不应重新参数化，以避免退化，并被视为背景。由于6-D编码训练效果差，作者改用改进的4-D编码方式。

改进的编码方式

平移：将点p用作新的坐标原点。

旋转：然后将线段与垂直 $y$ 轴对齐，端点 $x_1$ 在顶部，点 $p$ （新原点）在左侧。旋转角度用 $θ$ 表示。

缩放：距离 $d$ 作为单位长度，在新坐标系中归一化 $x$ 轴/ $y$ 轴。

在仿射变换后的新坐标系中，设 $θ_1$ 和 $θ_2$ 为图所示的两个角度， $p(\ddot{l})$ 被重新参数化为
$p(\ddot{l})=(d,\theta,\theta_1,\theta_2)$
对于没有被任何线段吸引的“背景”点，我们使用虚拟4-D向量对其进行编码(−1, 0, 0, 0)。

仿射变换后进行规范化。 $d/d_{max}$ ， $\frac{\theta}{2\pi}+\frac{1}{2}$ 。

线段预测

设 $\hat{A}$ 为4-D预测图， $\Delta d$ 为距离残差图，总损失为 $l_1$ 计算的 $L_{LS}=L(A,\hat{A})+L(\Delta d,\hat{\Delta d})$ 。

连接点预测

与L-CNN相同使用 $J$ ， $O$ 。

线段与连接点匹配

当且仅当其两个端点可以与基于欧几里德距离的两个连接点相匹配且具有预定义阈值 $τ$ 时，才保留来自初始集的线段。如果在细化后与任何线段方案不匹配，则将删除连接点。匹配后，将线段和连接点耦合在一起，并使用轻型分类器进一步验证。

线段与连接点验证

采用与L-CNN相同的LoI，此外采用了与L-CNN中静态采样器类似的方法进行了样本扩充，验证阶段采用二值交叉熵损失。

[PPGNet](ppgnet-cvpr19.pdf (aiyoggle.me))

采用图的方法进行线段预测。在第一阶段检测连接点，然后识别所有点之间的连接性。包括四部分

1、用于在整个输入图像上进行特征提取的卷积主干架构

2、连接检测模块（JDM）

3、线段对齐模块（LSAM），用于提取由一对检测到的连接定义的线段候选的特征张量

4、邻接矩阵推理模块（AMIM），用于检测每个连接对之间的连接

给定一幅图像，网络预测两个连接点的位置及其由邻接矩阵表示的连接度。

主干网络

使用CSAIL网络作为主干网络，对于大小为 $H \times W$ 的输入图像，骨干网络提取大小为 $H / 4 \times W / 4$ 的256通道特征图。

连接检测模块

JDM首先通过卷积结构从主干网络提取的特征中回归点heatmap，卷积结构包括两个conv3x3-bn-relu块，然后是一个带有sigmoid激活的conv1x1层。然后确定heatmap中的所有点，其中点响应高于阈值 $τ$ ，并且在8个相邻点中最高。然后对检测到的点进行分组，分组内任意两点之间的距离不大于 $\epsilon$ ，预测各组中连接响应最高的点为连接点。

线段对齐模块

给定两个连接点和一个特征映射，LSAM沿着连接对定义的线段候选对特征映射进行采样，并从特征映射中提取固定长度的特征向量。

邻接矩阵推理模块

LSAM提取对应于不同连接顺序的线段的两个特征向量，然后将其馈送到三个级联的conv2d-gn-relu块中。然后，使用单个conv2d-sigmoid块以不同的顺序获得连接对的连通性置信度，其中最低的为连接对的最终置信度。

损失函数

（实在是懒得打公式了，直接截图了）

TP-LSD

问题

自上而下的方法没有对端点的明确定义，自下而上的方法受连接点预测的影响，且计算速度低。

方法

提出了三点（TP）表示法，它使用一个根点作为唯一恒等式来定位线段，并且相应的两个端点用其相对于根点的位移来表示。此外，受人类根据直线感知线段的启发，我们通过嵌入特征聚合模块，将直线分割图与TP相关特征融合，利用直线分割图作为结构化先验来指导TP的推理。该检测器由三部分组成：特征提取主干、TP提取分支和线段分支。

U形网络用于生成共享特征，然后将其馈送到两个分支：1、TP提取分支，其中包含根点检测任务和偏移回归任务；2、线条分割分支，生成像素级线图。这两个分支由特征聚合模块（FAM）连接。最后，经过点滤波模块处理后，通过TP Generat将过滤后的TPs转换为矢量化的线段实例。

TP提取分支

根点检测部分：每个像素都被分类以区分它是否是根点。输出激活函数为sigmoid函数。

偏移回归：回归连续域中起点和终点相对于根点的两个位移。

线段分支

不精确的确定端点，为线段检测提供先验知识。输出激活函数是sigmoid函数。

FAM：由 $tanh(w\times P(L+b))$ 获得直线激活映射 $A_l$ ，共享特征首先与 $A_l$ 聚合，送入根点检测部分。偏移回归部分类似。

PFM：利用线图过滤线外的噪声根点。
$\tilde{P}(R)=\tilde{P}(R|L)\times \tilde{P}(L)^\alpha$

损失

$L_{total}=\lambda_{root}L_{root}+\lambda_{disp}L_{disp}+\lambda_{line}L_{line}$

根点置信度图由GT在零值图上标记根点位置，进行二维高斯平滑并使用 $5\times 5$ 窗口截断。对于偏移图，计算根点附近 $5\times5$ 窗口到端点的距离，赋予这些像素。

LMS评估指标

$LMS=Score_{\theta}\times Score_{l}$

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tOrDxS4i-1656553781312)(C:\Users\Dell\AppData\Roaming\Typora\typora-user-images\image-20220617110844714.png)]$

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4wY2jZrz-1656553781312)(C:\Users\Dell\AppData\Roaming\Typora\typora-user-images\image-20220617110901681.png)]$

M-LSD

改进

使用轻量化的Mobile-V2网络，直接从特征图生成线段。

匹配损失

TP损失

$L_{TP}=L_{center}+L_{disp}+L_{match}$

SoL损失同理

几何损失

从中心点和位移向量导出的端点应为连接点。学习连接点和线段的分割图可以作为LSD的空间注意线索。总分段损失定义为 $L_{seg}=L_{junc}+L_{line}$

由于偏移向量可以从线段的长度和度数中导出，因此它们可以作为额外的几何线索。我们根据GT计算长度和度数，并在每个GT图的线段中心标记该值。接下来，将这些值外推到 $3 \times 3$ 窗口，以便给定像素的所有相邻像素包含相同的值。总回归损失可表示为 $L_{reg}=L_{lenth}+L_{degree}$

几何损失函数定义为分段损失和回归损失之和：
$L_{Geo}=L_{seg}+L_{reg}$
总损失函数如下：
$L_{total}=L_{TP}+L_{SoL}+L_{Geo}$

[LETR](2101.01909.pdf (arxiv.org))

算法流程

1、图像特征提取：给定图片首先基于 ResNet 提取图片特征 $x\in R^{H\times W\times C}$
2、图像特征编码：将特征 $x\in R^{H\times W\times C}$ 拉平编码 $x'\in R^{HW\times C}$ ，使用标准Transformer框架的多头自注意力模块和前馈网络。
3、Transformer解码器： $N$ 个可学习的线实体通过SA，CA，与编码器输出交互。
4、线段预测：线实体使用Transformer解码器顶部的两个预测头进行线段预测。

创新

设计了多尺度的编解码器

设计了直线检测Loss

粗编码

在粗解码阶段，我们将图像特征和线实体传递到编码器-解码器-转换器架构中。编码器从ResNet的Conv5（C5）输出中接收原始分辨率为 $\frac{1}{32}$ 的粗略特征。

细编码

细解码器从粗解码器继承线实体，从细编码器继承高分辨率特征。编码器的输入来自ResNet的Conv4（C4）输出，原始分辨率为 $\frac{1}{16}$ 。

线段损失

TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
MATLAB在工业缺陷检测中的应用
本文还有配套的精品资源，点击获取简介：缺陷检测、伤痕检测、瑕疵检测和划痕检测是工业自动化和质量控制中至关重要的环节，MATLAB作为一种高级编程环境，在图像处理和计算机视觉任务中扮演了重要角色。本文详细介绍了如何使用MATLAB实现这些检测过程，包括图像采集、预处理、特征提取和决策制定等步骤。通过介绍内置图像处理工具箱中的应用，色彩转换技术、边缘检测算法以及形态学操作等方法，我们阐述了如何识别和处
【缺陷检测】基于计算机视觉实现电路板智能检测系统附Matlab代码 matlab科研助手计算机视觉 matlab 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍随着信息技术的飞速发展和电子产品的日益普及，印刷电路板（PCB）作为电子产品的核心组件，其质量直接关系到整个系统的性能和可靠性。传统的电路板检测主要依赖人工目检，存在效率低下
Orange3实战教程：图像分析---图像嵌入 err2008 Orange3 实战教程数据挖掘神经网络自然语言处理机器学习计算机视觉深度学习 orange3中文版
图像嵌入通过深度神经网络实现图像嵌入。输入图像：图像列表。输出嵌入向量：用数字向量表示的图像。跳过的图像：未计算嵌入向量的图像列表。图像嵌入功能读取图像并将其上传至远程服务器或本地计算。深度学习模型用于为每张图像计算特征向量。该功能返回一个增强的数据表，包含额外的列（图像描述符）。图像可以通过导入图像小部件导入，也可以通过电子表格中的图像路径导入。在这种情况下，包含图像路径的列需要一个三行表头，第
【人工智能99问】卷积神经网络（CNN）的结构和原理是什么？(10/99)
文章目录卷积神经网络（CNN）的结构及原理一、CNN的核心结构1.输入层（InputLayer）2.卷积层（ConvolutionalLayer）2.卷积层的核心机制：局部感受野与权值共享3.池化层（PoolingLayer）4.全连接层（FullyConnectedLayer）5.输出层（OutputLayer）6.辅助层二、CNN的工作原理三、CNN的使用场景1.计算机视觉（最核心场景）2.其
【CNN】卷积神经网络池化- part2
1.池化降采样，减少参数数量，避免过拟合，提高鲁棒性2.池化操作池化操作(也称为下采样，Subsampling)类似卷积操作，使用的也是一个很小的矩阵，叫做池化核，但是池化核本身没有参数，只是通过对输入特征矩阵本身进行运算，它的大小通常是2x2、3x3、4x4等，其中2x2使用频率最高。然后将池化核在卷积得到的输出特征图中进行池化操作，需要注意的是，池化的过程中也有Padding方式以及步长的概念
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
基于深度学习的手写数字和符号识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成 YOLO实战营深度学习 YOLO ui 人工智能目标检测计算机视觉
1.引言随着人工智能和深度学习技术的发展，手写数字和符号识别已经成为计算机视觉领域的重要研究方向。手写识别在很多实际应用中扮演着关键角色，例如邮政编码识别、表单自动处理和智能教育系统等。传统的手写识别方法通常依赖于复杂的特征工程，而深度学习则能够自动从数据中学习到特征，极大地提高了识别精度和速度。本文将介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、Y
AI作画：AI人工智能激发艺术创作灵感 AGI大模型与大数据研究院 AI作画人工智能 ai
AI作画：AI人工智能激发艺术创作灵感关键词：AI作画、生成艺术、深度学习、神经网络、艺术创作、人工智能、创意工具摘要：本文深入探讨AI作画技术如何激发艺术创作灵感。我们将从基础概念出发，解释AI如何"学习"艺术风格并生成新作品，分析核心技术原理，提供实际应用案例，并展望这一领域的未来发展趋势。通过通俗易懂的讲解和实际代码示例，帮助读者理解这项融合科技与艺术的创新技术。背景介绍目的和范围本文旨在向
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
深度学习篇---矩阵 Atticus-Orion 嵌入式知识篇上位机知识篇嵌入式硬件篇深度学习矩阵人工智能
在机械臂解算、深度学习网络等硬件和软件领域中，矩阵运算作为核心数学工具，承担着数据表示、变换、映射和优化的关键作用。以下从具体领域出发，详细总结涉及的矩阵运算及对应的核心知识：一、机械臂解算领域机械臂解算（运动学、动力学分析）的核心是描述“关节空间”与“操作空间”的映射关系，矩阵运算用于精准刻画坐标系转换、运动传递和力/力矩分析。1.运动学解算（正/逆运动学）核心目标：通过矩阵描述关节角度与末端执
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）格林威工业相机机器视觉数码相机 YOLO 深度学习计算机视觉人工智能
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）工业相机使用YoloV8模型实现打架检测工业相机通过YoloV8模型实现打架检测的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实现
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人脸识别检测（C#代码，UI界面版）格林威机器视觉工业相机数码相机 YOLO 深度学习人工智能视觉检测 c#
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人脸识别检测（C#代码，UI界面版）工业相机使用YoloV8模型实现人脸的检测工业相机通过YoloV8模型实现人脸识别检测的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人物识别（C#代码，UI界面版）格林威工业相机机器视觉数码相机 YOLO c#人工智能计算机视觉开发语言
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人物识别（C#代码，UI界面版）工业相机使用YoloV8模型实现人物识别工业相机实现YoloV8模型实现人物识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实现
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现动物分类（C#源码，UI界面版）格林威机器视觉工业相机数码相机 YOLO 深度学习计算机视觉人工智能视觉检测 c#
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现动物分类（C#源码，UI界面版））工业相机使用YoloV8模型实现动物分类工业相机实现YoloV8模型实现动物分类的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实
AI 大模型重塑软件开发流程万花丛中一抹绿人工智能
一、AI大模型的定义与发展历史AI大模型是基于海量数据训练的深度学习模型，具备强大的自然语言理解、逻辑推理和知识生成能力。在软件开发领域，以GPT-4、CodeLlama、GitHubCopilotX为代表的大模型，能理解代码语法、语义及业务逻辑，实现代码生成、漏洞检测等复杂任务。其发展可追溯至2017年，谷歌提出Transformer架构，为大模型奠定了核心基础。2018年，GPT-1问世，参数
在 Conda 中删除环境及所有安装的库 Studying 开龙wu conda
注意事项1.删除环境前确保你没有在该环境中运行任何程序。2.删除操作是不可逆的，所有该环境中的包和配置都会被永久删除。3.如果你想保留环境的配置信息，可以在删除前使用condaenvexport>environment.yml导出环境配置。关于requirements.txt和environment.yaml文件使用介绍详情可参考以往文章，争对机器学习和深度学习里Python项目开发管理项目依赖的
OpenCV学习（二）-二维、三维识别香蕉可乐荷包蛋 #OpenCV opencv 学习人工智能
OpenCV是一个功能强大的计算机视觉库，可以用于识别和处理二维图像和三维图像。以下是关于二维图像和三维图像识别的基础知识和示例代码。1.二维图像识别二维图像识别通常包括图像分类、对象检测、特征提取等任务。以下是一些常见的操作：1.1图像分类使用预训练模型对图像进行分类，例如使用深度学习模型（如ResNet、MobileNet等）。importcv2#加载预训练的深度学习模型net=cv2.dnn
【人工智能之深度学习】6. 卷积核工作原理：从边缘检测到特征抽象的逐层演进（附可视化工具与行业实战代码） AI_DL_CODE 人工智能深度学习卷积核特征提取卷积神经网络边缘检测特征可视化
摘要：卷积核是卷积神经网络（CNN）的核心组件，其通过局部感受野与参数共享机制实现高效特征提取。本文从数学本质出发，揭示卷积操作的空域-频域对偶性：空域卷积等价于频域乘积（F{f∗g}=F{f}⋅F{g}F\{f*g\}=F\{f\}⋅F\{g\}F{f∗g}=F{f}⋅F{g}），解释边缘检测核（Sobel、Laplacian）的频域响应特性。通过特征可视化实验表明，CNN特征呈现逐层抽象规律：
颠覆未来：创新代码引领人工智能与量子计算深度融合金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能量子计算
摘要在信息时代飞速演进的背景下，人工智能与量子计算正以前所未有的速度互相融合，推动着科技边界的不断拓展。本文回顾了经典算法的智慧，展示了前沿深度学习模型的构建，并通过量子电路设计探讨了创新代码的可能性，为探索未来科技变革提供了全新视角。1.引言当前，科技创新正处于高速迭代的关键阶段，传统计算方法与新型技术的交汇处正成为研究热点。人工智能的发展已渗透到各行各业，而量子计算的崛起则为解决复杂计算问题提
使用UV管理PyTorch项目
PyTorch是深度学习研究和开发的流行选择。可以使用uv管理PyTorch项目，包括不同Python版本依赖、管理环境、甚至加速器选择等。安装Pytorch从打包角度来看，PyTorch有几个不常见的特点：许多PyTorchwheel托管在专门的索引上，而非Python包索引（PyPI）。因此，安装PyTorch通常需要配置项目使用PyTorch专属索引。PyTorch为每种加速器生成不同的构建
AI新纪元：2025年深度学习技术突破与行业应用全景像素笔记杂谈人工智能深度学习 ai 自动驾驶工业数字化转型未来趋势技术创新
2025年，人工智能技术迎来爆发式增长，大模型、生成式AI和多模态技术持续突破，人形机器人量产元年正式开启，自动驾驶商业化进程加速，工业数字化转型全面铺开。这些进展不仅重塑了技术边界，更在多个行业创造了实际价值，推动AI从实验室走向产业化。本文将深入剖析2025年深度学习与AI领域的核心技术突破、行业应用案例及未来发展趋势，为技术从业者提供全面视角。一、深度学习核心技术突破：大模型、生成式AI与多
模型移植实战：从PyTorch到ONNX完整指南慕婉0307 神经网络 pytorch 人工智能 python
一、认识ONNXONNX（OpenNeuralNetworkExchange）是一种开放的模型表示格式，由微软和Facebook（现Meta）在2017年共同推出，旨在解决深度学习模型在不同框架之间的互操作性问题。ONNX的主要优势包括：跨框架兼容性：支持主流深度学习框架间的模型转换，包括PyTorch、TensorFlow、MXNet、CNTK等例如，可以将PyTorch训练的ResNet模型导
TensorFlow GPU 2.10.1 for Python 3.9快速安装指南疑样
本文还有配套的精品资源，点击获取简介：TensorFlowGPU2.10.1是专为Windowsx64和Python3.9设计的TensorFlow版本，它集成了GPU支持以加快深度学习模型的训练。本指南提供了该版本的概述、安装步骤及注意事项，旨在帮助开发者利用其性能优势提升机器学习项目的效率。1.TensorFlowGPU介绍1.1TensorFlow的起源与功能TensorFlow是由Goog
计算机视觉产品推荐,个性化推荐:人工智能中的计算机视觉、NLP自然语言处理和个性化推荐系统哪个前景更好一些？...
这个问题直接回答的话可能还是有着很强的个人观点，所以不如先向你介绍一些这几个领域目前的研究现状和应用情况(不再具体介绍其中原理)你自己可以斟酌一下哪方面更适合自己个性化推荐。一．所谓计算机视觉，是指使用计算机及相关设备对生物视觉的一种模拟个性化推荐。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息，就像人类和许多其他类生物每天所做的那样[1]。现在人工智能的计算机视觉主要研究
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

直线检测论文（霍夫变换，LSD，DWP，L-CNN，AFM，HAWP，PPGNet，TP-LSD，M-LSD，LETR）

直线检测

传统方法

霍夫变换

LSD

基于深度学习的LSD

LSD数据集

[DWP](Learning to Parse Wireframes in Images of Man-Made Environments (thecvf.com))

连接点检测

直线检测

连接点与直线结合

L-CNN

所解决的问题

主干网络

连接点预测

线采样模块

线验证模块

[AFM](IEEE Xplore Full-Text PDF:)

所解决的问题

区域分割图

吸引力场图

挤压模块

HAWP

HAFM

改进的编码方式

线段预测

连接点预测

线段与连接点匹配

线段与连接点验证

[PPGNet](ppgnet-cvpr19.pdf (aiyoggle.me))

主干网络

连接检测模块

线段对齐模块

邻接矩阵推理模块

损失函数

TP-LSD

问题

方法

TP提取分支

线段分支

损失

LMS评估指标

M-LSD

改进

匹配损失

TP损失

几何损失

[LETR](2101.01909.pdf (arxiv.org))

算法流程

创新

粗编码

细编码

线段损失

分类损失

距离损失

总损失

你可能感兴趣的:(cnn,计算机视觉,深度学习)