学渣在路上

Key Points Estimation and Point InstanceSegmentation Approach for Lane Detection 论文精读

用于车道检测的关键点估计和点实例分割方法

摘要

一、介绍

二、相关工作

三、方法

个人总结

论文地址

代码复现

参考链接

SGPN

用于车道检测的关键点估计和点实例分割方法

摘要

自动驾驶的感知技术应该适应各种环境。在交通线检测作为一个重要的感知模块的情况下，需要考虑许多条件，如道路线的数量和目标系统的计算能力。为了解决这些问题，本文提出了一种道路线检测方法，称为点实例网络（PINet）；该方法基于关键点估计和实例分割方法。PINet包括几个同时训练的堆叠沙漏网络。因此，可以根据目标环境的计算能力来选择训练模型的大小。我们将预测关键点的聚类问题作为实例分割问题；可以对PINet进行训练，而与业务线的数量无关。PINet在 TuSimple 和 Culane 数据集（用于车道检测的流行公共数据集）上实现了具有竞争力的准确性和假阳性。

我们的代码可在GitHub - koyeongmin/PINet_new

一、介绍

真正的自动驾驶需要了解车辆周围的环境。为了实现这一理解，各种感知模块被融合在一起，许多模式识别和计算机视觉技术被应用于这些感知模块[1]，[2]。车道检测是一种主要的感知技术，它可以定位道路上的可行驶区域。有很多方法可以识别车道，但大多数技术都使用交通线检测[3]、[4]或道路区域分割[5]、[6]。在本文中，我们主要研究用于识别车道的交通线检测。图1显示了我们提出的方法的目的，该方法从输入RGB图像中预测车道的精确关键点，并使用所提出的网络提取的嵌入特征，将关键点区分为各个实例。此外，所提出的网络是端到端训练的，并且可以根据目标系统的计算能力来修改网络大小，而无需改变网络架构或进行额外的训练。

图1. 系统概述。所提出的框架预测道路线上的关键点，并区分各个实例，而不考虑道路线的数量。此外，如果用户想在计算能力较弱的系统（如嵌入式板）上运行经过训练的模型，则可以在没有额外训练的情况下对网络进行裁剪和传输。

大多数传统的交通线检测方法使用各种手工特征（如颜色[7]、[8]或边缘[9]、[10]）来提取低级交通线特征。这些低级特征可以使用霍夫变换[11]、[12]或卡尔曼滤波器[13]进行组合；组合的特征生成交通线段信息。这些方法很简单，可以适应各种环境，而无需进行重大修改。尽管如此，这些方法的性能取决于测试环境的条件，如照明和遮挡。

深度学习方法在复杂场景中表现出卓越的性能。在深度学习方法中，卷积神经网络（CNN）方法主要应用于计算机视觉中的特征提取[14]，[15]。语义分割方法[16]，[17]，[18]是计算机视觉的主要研究领域，经常应用于交通线检测问题，以推断形状和位置[19]，[20]，[21]，[22]。一些方法使用多类方法来区分各个道路线实例。因此，尽管这些方法可以获得出色的性能，但它们只能应用于由固定数量的道路线组成的场景。为了解决这个问题，应用实例分割方法来区分单个实例。这些基于语义分割的交通线检测方法需要一些后处理来估计预测交通线的确切位置值。为了避免语义分割方法的这种后处理，其他几种方法直接预测交通线位置[23]，[24]。

现有的方法有一定的局限性。语义分割方法需要在像素级进行标记或预处理以进行训练，这很麻烦。这些方法还预测了许多不必要的点，因为即使只需要几个点来识别交通线，尾数分割也会生成大小与给定输入图像相同的分类像素图像。此外，根据可用的计算能力，现有的方法不能适应各种环境。为了将它们应用于嵌入式板等照明系统，整个架构应该重新进行修改和训练。

为了克服这些限制，我们提出的方法使用了一个受堆叠沙漏网络启发的深度学习模型来预测交通线上的几个关键点。堆叠沙漏网络[25]通常应用于关键点估计领域，如姿态估计[26]和物体检测[27]，[28]。利用下采样和上采样的顺序，堆叠沙漏网络可以提取各种尺度的信息。由于堆叠沙漏网络包括由相同损失函数训练的几个沙漏模块，因此我们可以通过从整个结构中剪裁一些间隔来同时获得具有不同参数大小的各种模型。使用受点云实例分割启发的简单方法，将每个关键点区分为单个实例[29]。

基于摄像头的交通线检测已经得到了积极的发展，许多最先进的方法[30]、[24]对于公共数据集几乎完全有效。然而，有些方法的假阳性率更高。假阴性，模块未能检测到的道路线，不会突然改变控制值，并且可以根据其他检测到的通信线路或先前的结果预测正确的控制值。然而，假阳性可能会导致严重的风险；模块对道路线的错误识别可能导致控制值的快速变化。然而，假阳性可能会导致严重的风险；模块对道路线的错误识别可能导致控制值的快速变化。

图2. 提议的框架包括三个主要部分。512×256大小的输入数据通过大小调整网络进行压缩；压缩的输入被馈送到预测网络，该预测网络包括四个沙漏模块。在每个沙漏块的末端应用三个输出分支；它们预测置信度、偏移和嵌入特征。损失函数可以根据每个沙漏块的输出进行计算。通过剪裁几个沙漏模块，可以调整所需的计算资源。

总之，图2显示了我们提出的道路线检测框架。它有三个输出分支，并预测交通线上点的确切位置和实例特征。第三节介绍了更多细节。这些是本研究的主要贡献：

1、利用关键点估计方法，我们提出了一种新的道路线检测方法。与其他基于语义分割的方法相比，它产生了更紧凑的大小预测输出。

2、该框架由几个沙漏模块组成，因此我们可以通过简单的剪裁获得不同大小的各种模型，因为每个沙漏模块都是使用相同的损失函数同时训练的。

3、所提出的方法可应用于各种场景，包括任何方向的交通线，如垂直或水平交通线，以及任意数量的交通线。

4、所提出的方法具有较低的误报率和值得注意的准确性性能。它保证了自动驾驶汽车的稳定性。

二、相关工作

A. 道路线检测

车道线检测是自动驾驶的一个重要研究领域。车道线检测模块根据输入数据识别道路上的可行驶区域。道路线检测被认为是车道线检测的主要方法。道路线检测通常定位区分道路上可行驶区域的标线。特别是关于RGB图像作为输入数据，已经提出了各种手工制作的特征来检测道路线[31]、[32]、[33]、[34]、[35]。然而，这些方法在复杂的场景中显示出局限性。

近年来，深度学习已成为计算机视觉研究的主流方法。语义分割[16]，[17]，[18]，[36]是感知研究中的一个主要课题；它可以将输入图像的像素分类为单独的类。生成方法[37]、[38]也可以执行类似的功能。因此，语义分割方法和生成方法适用于表示复杂形状的线条。[20] ，[30]，[39]和[40]显示了语义分割和生成模型在道路线检测中的应用。有些方法使用多类方法来区分每个实例；然而，多类方法只能对固定数量的实例进行分类。针对这一限制，提出了实例分割方法。Neven等人[41]试图通过实例分割来解决多类方法的这个问题。他们提出的LaneNet有一个共享编码器和两个解码器。这些解码器中的一个执行二进制车道分割；另一个预测嵌入特征，例如分割。

尽管语义分割方法可以预测形状复杂的线条，但在训练和测试过程中，它们需要像素级标记数据和后处理来提取线条上的精确点。一些直接方法[23]，[24]直接生成直线上的精确点。[23] 预测每条交通线的确切起点和终点，以及固定y轴值的x轴值。[24]介绍了受Faster R CNN[42]的地区提案网络（RPN）启发的线路提案单元（LPU）。LPU预测沿某些预定义线路方案的固定y轴值的水平偏移。

这些方法，语义分割方法、生成方法和直接方法，产生了许多不必要的输出值。在语义分割和生成方法中，并不是所有的像素都需要识别交通线；可以根据几个关键点来预测精确的直线。直接方法也有一些不必要的预测，比如未知的给定目标交通线的长度、起点和终点。

B. 关键点估算

关键点估计技术根据输入信息预测称为关键点的某些重要点。人体姿态估计[26]是关键点估计领域的一个主要研究课题。堆叠沙漏网络[25]由几个同时训练的沙漏模块组成。沙漏模块可以将各种尺度的信息传递到更深的层次，帮助整个网络获得全局和局部特征。由于这种特性，沙漏网络经常用于检测对象检测区域中对象的中心或角。针对关键点估计，不仅开发了网络结构或损失函数，还开发了适用于现有网络的细化方法。[43]提出了一种可以应用于其他多阶段方法的特征聚合和从粗到细的监督方法。[44]提出了改进其他现有模型结果的细化网络。在本文中，这些细化方法并没有用于指示我们提出的框架的性能；然而，它们可以用于提高性能。

三、方法

对于车道检测，我们训练一个由几个沙漏模块组成的神经网络。该网络，我们将其称为点实例网络（PINet），在车道上生成点，并将预测点区分为单个实例。为了实现这些任务，我们提出的神经网络包括三个输出分支，一个置信分支、偏移分支和嵌入分支。置信度和偏移分支预测道路线的精确点；应用了YOLO[45]启发的损失函数。嵌入分支生成每个预测点的嵌入特征；嵌入特征被馈送到聚类过程以区分每个实例。嵌入分支的损失函数受到实例分割方法的启发。相似性组建议网络（SPGN）[29]是一种用于3D点云的实例分割框架，它引入了一种简单的技术和用于实例分割的损失函数。基于SPGN提出的内容，我们设计了一个损失函数拟合来区分预测交通线路的每个实例。第II-A节介绍了主要建筑的细节；第II-B节包括关于损失函数的细节；并且第II-C节详细地示出了实现。

A. 架构

图2显示了所提出的网络框架。输入RGB图像大小为512×256；它被馈送到调整大小的网络。该图像被调整大小网络中的卷积层序列压缩到较小的大小（64×32）；将调整大小网络的输出馈送到预测网络。预测网络中可以包括任意数量的沙漏模块；本研究使用了四个沙漏模块。所有沙漏模块都由相同的损失函数同时训练。在训练步骤之后，用户可以根据计算能力选择使用多少沙漏模块，而无需任何额外的训练。以下各节提供了有关每个网络的详细信息。

1）调整网络大小

调整网络大小可以减少输入图像的大小，以节省内存和推理时间。首先，输入的RGB图像大小为512×256。该网络由三个卷积层组成。所有卷积层应用的滤波器大小为3×3，步长为2，填充大小为1。在每个卷积层之后使用Prelu[46]和批量归一化[47]。最后，该网络生成大小为64×32的调整大小的输出。表I显示了组成层的细节。

图3. 沙漏块的细节由三种类型的瓶颈层组成：相同的瓶颈、向下的瓶颈和向上的瓶颈。输出分支应用于沙漏层的末端；置信度输出被转发到下一个块。

2）预测网络

调整大小的网络输出被馈送到预测部分，这将在本节中描述。该部分预测了交通线上的精确点和嵌入特征，例如分割。该网络由几个沙漏模块组成，每个模块包括一个编码器、解码器和三个输出分支，如图3所示。一些跳跃连接将各种尺度的信息传输到更深的层。图3中的每个彩色块都是一个瓶颈模块；这些瓶颈模块如图4所示。瓶颈有三种：相同的、向下的和向上的。同一个瓶颈会生成与输入大小相同的输出。下瓶颈用于编码器中的下采样；下瓶颈的第一层由具有滤波器尺寸3、步长2和衬垫1的卷积层代替。具有滤波器大小3、步长2和填充1的转置卷积层被应用于上采样层中的上瓶颈。每个输出分支有三个卷积层，并生成一个64×32的网格。输出分支预测输出网格中每个单元的关键点存在、偏移和嵌入特征的置信度值。表二显示了预测网络的详细信息。因为更深的网络具有更好的性能[25]，它可以充当教师网络。因此，使用知识提取技术，我们可以期待剪辑短网络具有更好的性能。每个输出分支的通道是不同的（置信度：1，偏移量：2，嵌入：4），并且根据各个输出分支的目标应用相应的损失函数。

图4. 瓶颈细节。这三种瓶颈根据其用途有不同的第一层

B. 损失函数

对于训练，将四个损失函数应用于沙漏网络的每个输出分支。以下各节提供了每个损失函数的详细信息。如表II所示，输出分支生成64个网格，输出网格中的每个单元由7个通道的预测值组成，包括置信度值（1个通道）、偏移量（2个通道）值和嵌入特征（4个通道）。置信度值决定交通线路的关键点是否存在；偏移值定位了置信值预测的关键点的准确位置，并利用嵌入特征将关键点区分为单个实例。因此，除了蒸馏损失函数外，三个损失函数被应用于输出网格的每个单元。提取教师网络知识的蒸馏损失函数适用于每个编码器的蒸馏层，如表II所示。以下各节包括每个预测值和特征的详细信息。

1）置信度损失

置信度输出分支预测每个单元格的置信度值。如果单元格中存在关键点，则置信度值接近1，否则为0。置信度分支的输出有1个通道，它被馈送到下一个沙漏模块。置信度损失由存在损失和不存在损失两部分组成。存在损失适用于包括关键点的单元；利用不存在损失来降低每个背景小区的置信度值。不存在损失是在预测置信值高于0.01的单元处计算的。由于远离关键点的细胞快速收敛，这项技术有助于训练集中在更靠近关键点的单元上。以下显示了置信度分支的损失函数：

其中，Ne表示包括关键点的单元的数量，Nn表示不包括任何关键点的细胞的数量，Ge表示由关键点组成的细胞的集合，Gn表示由点组成的单元的集合，cc表示置信度输出分支中每个细胞的预测值，c*c表示基本真值。具有关键点的小区的地面真值为1；否则为0。在推断时，如果置信度值大于预定义的阈值，我们认为关键点存在于单元处。不存在的第二项是正则化项。

2）偏移损失

从偏移分支，PINet预测每个输出单元格的关键点的确切位置。每个单元格的输出具有一个介于0和1之间的值；该值指示与对应单元格相关的位置。在本文中，一个单元被匹配到输入图像的8个像素。例如，如果预测的偏移值为0.5，则关键点的实际位置距离单元边缘4个像素。偏移分支有两个通道用于预测x轴和y轴偏移。方程2显示了损失函数：

因为在不包括关键点的单元格中不存在基本事实，所以在计算偏移损失时会忽略这些单元格。

3）嵌入特征损失

该分支的损失函数受到SGPN的启发，SGPN是一种3D点云实例分割方法[29]。如果在这种情况下嵌入特征相同，则训练分支以使每个单元的嵌入特征更接近。方程3和4示出了特征分支的损失函数：

其中Fi表示小区i的预测嵌入特征，Iij表示小区i和小区j是否是相同实例，并且K是常数，使得K＞0。如果Iij=1，则这些单元是相同的实例，如果Iij=0，则这些单元格是不同的实例。当网络被训练时，当每个小区属于同一实例时，损失函数使特征更接近；当细胞属于不同的实例时，它会分布特征。我们可以使用简单的基于距离的聚类技术将关键点区分为单个实例。在本研究中，如果某些预测关键点的嵌入特征在一定距离内，我们认为它们是相同的实例。在本研究中，特征大小设置为4，但观察到该大小对性能没有重大影响。

4）蒸馏损失

根据Newell等人[25]，当堆叠更多沙漏模块时，可以观察到更好的性能。因此，最深的沙漏模块可以是教师网络，并且我们期望，如果应用知识提取方法，那么比教师网络更轻的裁剪短网络将显示出更好的性能。Zagoruyko和Komodakis[48]提出了一种简单的知识提取方法，可以应用于CNN模型。这种方法允许学生网络模仿教师网络；侯等人[30]表明，该方法可以提高整个框架的性能。方程式5。显示了蒸馏的损失函数：

其中，D表示平方和，Am表示第m个沙漏模块处的失真层输出，如表II所示，m表示沙漏模块的数量，Ami表示Am的第i个通道，并且所有运算符如和、幂和绝对值（|·|）都是元素式的。

总损失Ltotal等于上述四个损失项的加权和，并且使用具有以下总损失的端到端过程来训练整个网络：

在训练步骤中，我们将γo设置为0.2，将γf设置为0.5，将γd设置为0.1。γe和γn在第四节中进行了描述。所提出的损失函数适用于每个沙漏模块的输出分支；这有助于稳定地训练整个网络。

C. 实施细节

在训练和测试中将数据馈送到所提出的网络之前，所有输入图像的大小都被调整为512×256，并且没有从0～255的RGB值到0～1的值进行归一化。用于评估所提出方法的两个公共数据集TuSimple[49]和CULane[20]根据固定的y轴值提供了交通线的x轴值。由于注释方法的原因，一些靠近水平线的交通线路注释稀疏。为了解决这个问题，我们通过对原始数据的线性回归，对x轴的每10个像素进行额外的注释。还应用了各种数据增强方法，如阴影、添加噪声、翻转、平移、旋转和强度变化；这些方法如图5所示。

图5. 数据扩充方法。（a）是原始图像，（b）、（c）、（d）、（e）、（f）和（g）显示了应用的数据增强方法的示例

此外，这两个公共数据集包括大量的图像帧；然而，数据是不平衡的。例如，CULane数据集的测试集由各种类别组成，如正常、夜间和十字路口；类别框的数量变化很大。CULane类别的确切比率可在第IV-B节结果部分找到。为了解决这个问题，我们对在训练步骤中显示较差损失值的硬数据进行采样，并提高硬数据的选择率。这个概念类似于硬负性挖掘技术。

我们使用一个GPU（GTX 2080ti 11GB）进行训练和测试；源代码是用 Pytorch 编写的。在训练步骤中，每个批次包含六个图像；阈值和系数等超参数是通过实验确定的。超参数的精确值如下所示。PINet预测交通线上关键点的准确位置，并采用样条曲线拟合方法获得更光滑的曲线。

个人总结

PINET: Key Points Estimation and Point Instance Segmentation Approach for Lane Detection

这篇论文没有什么让人眼前一亮的创新点，但是论文整体读起来挺简单的，结构也严谨，思路很清晰，没有什么模糊不清的技术点，图像输入，网络结构，损失函数，数据增强都进行了描述

本文对车道线进行实例分割，但只是进行了实例分割，并没有区分车道线的类别

论文整体看图一，整体网络结构看图二，详细的调整大小网络结构看表一，沙漏块的网络结构看图三，数据增强看图五

输入图像尺寸是512×256，首先进入调整大小的网络，出来之后是64×32；在64×32特征图上做语义分割，backbone使用若干个沙漏网络，最多是4个，具体用多少个，需要看情况，在每一个沙漏网络出来都出损失；backbone之后出三个头，分别对应置信度，偏置和嵌入式特征，其中嵌入式特征是参考SGPN给出的，这个位置个人没有深入地调研；网络结构太大了，因此本文做了蒸馏。总共有四个损失函数，置信度损失，偏置损失、嵌入式特征损失、蒸馏损失。

后处理的位置论文中没有提到，有一个博客里说是论文讲了后处理相关的东西，但是个人没有看到

不清晰

后处理的位置个人没理解清晰，出来三个头之后是如何出车道线的

论文地址

https://arxiv.org/abs/2002.06604

代码复现

GitHub - koyeongmin/PINet_new

参考链接

说实话没啥玩应，看不看都行

车道线检测-PINet - 知乎

Lane Detection (六) PINet - 知乎

SGPN

https://arxiv.org/pdf/1711.08588.pdf

大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵 Ronin-Lotus 程序代码篇深度学习篇深度学习矩阵人工智能线性代数
文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
探索AI模型的巅峰之战：ChatGPT、DeepSeek与Grok 3，谁才是最强？温暖阳光阿斌人工智能 chatgpt
近年来，人工智能领域正处于一场高速迭代的革命中。大型语言模型（LLMs）如ChatGPT、DeepSeek和Grok3纷纷亮相，各展所长，为人们带来了前所未有的体验。在这场"谁是最强"的竞争中，每一方都展现出了令人惊叹的能力和独特的优势。然而，这些模型之间的差异和特点，究竟是什么？它们各自的优势在哪里？又有哪些隐藏的短板？本文将带您深入了解这三位AI巨头的亮点与争议，共同探讨它们在AI领域的位置，
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
介于YOLOv5的裂缝识别系统程序员～小强 YOLO
介于YOLOv5的裂缝识别系统在现代工业中，裂缝监测是的保障设施安全的重要环节。我们公司的新项目——基于YOLOv5的裂缝识别系统，将为您提供高效、精准的解决方案，助力各类工程项目的质量管理。系统优势我们的裂缝识别系统借助YOLOv5进行深度学习，经过精心训练，拥有强大的图像识别能力。只需简单的步骤，您就能将复杂的裂缝检测转化为轻松的操作，让分析变得更加简单、高效。核心功能图片上传与场景选择用户可
使用DeepSeek R1大模型编写迅投 QMT 的量化交易 Python 代码 wtsolutions qmt量化交易 python qmt deepseek 量化交易代码生成
随着人工智能技术的迅猛发展，利用AI工具提升工作效率已成为现代开发者的重要手段。在使用deepseek官方网页生成迅投QMT代码的时候，deepseek给出的代码是xtquant代码，也就是miniqmt代码，并不是我们传统意义上说的大QMT可用的代码。因此，我们需要自建一个知识库，让deepseek根据我的知识库里面的知识，去帮我生成大QMT可用的交易代码。一、建立迅投QMT的知识库建立迅投QM
GPU架构分类大明者省架构
一、NVIDIA的GPU架构NVIDIA是全球领先的GPU生产商，其GPU架构在图形渲染、高性能计算和人工智能等领域具有广泛应用。NVIDIA的GPU架构经历了多次迭代，以下是一些重要的架构：1.Tesla（特斯拉）架构（2006年发布）特点：NVIDIA推出的首个通用GPU计算架构，支持使用C语言进行GPU编程，标志着GPU开始从专用图形处理器转变为通用数据并行处理器。性能：具有128个流处理器
芯片的未来发展趋势 iccnewer
2024年，该行业将专注于AI/ML、RISC-V、量子、安全等发展趋势。今年年初，大多数人从未听说过生成式人工智能。现在整个世界都在竞相利用它，而这仅仅是个开始。量子计算、6G、智能基础设施等新市场领域专用处理正在加速对更快、更高效、更多数据的需求。与每隔几年等待下一个工艺节点的日子相比，未来几年的事件将与电话或汽车的引入一样重要。但可能不会只有一种创新技术，将会有很多技术一起以一种将让科技界惊
Python程序设计（入门） xyyykx python 开发语言
目录一丶Python概述二丶Python数据类型三丶常用的进制四丶字符串型五丶程序控制结构六丶组合数据类型一丶Python概述Python是一种高级编程语言，由GuidovanRossum于1991年开发并发布。它具有简洁、易读、易学的语法特点，被广泛应用于多个领域，包括软件开发、数据科学、人工智能、网络编程等。以下是Python的一些主要特点和优势：简单易学：Python的语法简洁明了，易于理解
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。 985小水博一枚呀深度学习人工智能
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。文章目录【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。1.滑坡灾害早期隐患的概念与特征概念主要特征2.通过光学
【人工智能之大模型】阐述生成式语言模型的工作机理...（二） 985小水博一枚呀大大大模型知识点人工智能语言模型自然语言处理机器学习神经网络
【人工智能之大模型】阐述生成式语言模型的工作机理…（二）【人工智能之大模型】阐述生成式语言模型的工作机理…（二）文章目录【人工智能之大模型】阐述生成式语言模型的工作机理...（二）前言4.代码逐行解释TransformerBlock类初始化前向传播GenerativeLM类初始化前向传播推理示例测试生成5.总结欢迎宝子们点赞、关注、收藏！欢迎宝子们批评指正！祝所有的硕博生都能遇到好的导师！好的审稿
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

Key Points Estimation and Point InstanceSegmentation Approach for Lane Detection 论文精读

用于车道检测的关键点估计和点实例分割方法

摘要

一、介绍

二、相关工作

三、方法

个人总结

论文地址

代码复现

参考链接

SGPN

你可能感兴趣的:(论文精读,计算机视觉,深度学习,人工智能)