杀生丸变大叔了

【3D点云】PersFormer：基于透视Transformer的3D车道检测（ECCV2022）

文章目录

前言
一、引言
- 三点贡献：
二、相关工作
三、方法论
- 0.问题公式
- 1.方法概述
- 2.透视Transformer
- 3.同时进行二维和三维车道检测
- 4.预测损失
四. OpenLane 数据集
五、实验结果
- 3D结果对比（在OpenLane 数据集）
- 2D结果对比（在OpenLane 数据集）
- Apollo 3D Lane Synthetic 数据集评估
appendix（实现细节）

前言

摘要：

题目：PersFormer: 3D Lane Detection via Perspective Transformer and the OpenLane Benchmark
链接：https://arxiv.org/abs/2203.11089
代码：https://github.com/OpenPerceptionX/PersFormer_3DLane
OpenLane数据集：https://github.com/OpenPerceptionX/OpenLane

PersFormer：一种端到端单目3D车道检测器，利用透视Transformer实现前视（front view）图到BEV（鸟瞰）图的转换。
解决自主驾驶场景（上坡/下坡、颠簸等）中车道布局不准确的问题。使用相机参数关注相关的前视图局部区域，生成BEV特征：PersFormer采用统一的2D/3D锚定设计和同时检测2D/3D车道的辅助任务
除此之外，我们还发布了第一批大规模真实世界3D车道数据集：OpenLane，具有高质量的注释和场景多样性。开放式车道包含200000帧、超过880000个实例级车道和14个车道类别，以及场景标记和封闭路径对象注释。

一、引言

规划和控制中的下游模块通常要求车道位置采用正交鸟瞰图（BEV）的形式，而不是前视图表示。
我们将透视车道投影到BEV空间时，必须考虑车道线的高度。如图所示，如果忽略高度，在上坡/下坡情况下，车道将分叉/会聚，导致规划和控制模块中的不当行动决策。

1.首先，我们将空间特征转换建模为一个学习过程，该过程具有注意机制，以捕获前视图特征中局部区域之间以及两个视图（前视图到BEV）之间的交互，从而能够生成细粒度的BEV特征表示。
2.构建了一个基于Transformer的模块来实现这一点，采用可变形注意机制显著降低计算内存需求，并通过交叉注意模块动态调整关键点，以捕获局部区域中的显著特征。与通过逆透视映射（IPM）的直接1-1变换相比，生成的特征更具代表性和鲁棒性，因为它关注周围的局部环境并聚合相关信息。

三点贡献：

1.一种新的基于Transformer的架构，用于实现特征的空间变换；
2.同时统一2D和3D车道检测的架构(结果SOTA)；
3.OpenLane数据集，第一个具有高质量标记和巨大多样性的大规模真实3D车道数据集

二、相关工作

先前的工作将BEV原理引入管道，但他们没有考虑注意力机制和/或3D视觉几何（在这种情况下，是相机参数）。例如，3D LaneNet是用相机内/外矩阵建立的；IPM过程根据前视图特征生成虚拟BEV表示。DETR3D还考虑了摄像机的几何结构，并制定了一个可学习的3D到2D查询搜索注意方案。然而，没有用于鲁棒特征表示的显式BEV建模；聚集的特征可能无法在3D空间中正确表示。

如前所述，在某些情况下（上/下坡）平面假设并不总是保留凹凸。有些方法利用多模态或多视图传感器，如立体相机或激光雷达，获得三维地面拓扑。然而，这些传感器在硬件和计算资源方面存在高成本的不足，限制了它们的实际应用。最近，一些单目方法拍摄单个图像，并使用IPM预测三维空间中的车道。3D LaneNet是该领域的开创性工作，它使用一个简单的端到端神经网络，采用STN完成特征的空间投影。Gen LaneNet建立在3D LaneNet的基础上，设计了一个两级网络，用于解耦segmentation编码器和3D车道预测头。这两种方法在弯曲或挤压转弯情况下存在不正确的特征变换和不令人满意的性能。面对上述问题，我们引入PersFormer来提供更好的特征表示并优化锚定设计，以同时统一二维和三维车道检测。

三、方法论

0.问题公式

给定输入图像PersFormer的目标是预测一组3D和2D车道：其中N_3D，N_2D分别是预定义BEV范围内的3D车道总数和原始图像空间（前视图）中的2D车道总数。从数学上讲，每个3D车道l_d由三维坐标的有序集：
其中d是车道索引，Nd是该车道的最大采样点数。每个车道都有一个分类属性c(3D/2D)，指示该车道的类型（例如，一条白色虚线）。此外，对于单个2D/3D车道中的每个点，都存在一个属性，指示该点是否可见.

1.方法概述

如图所示，整体结构由三部分组成：主干、透视Transformer和车道检测头。主干输入为固定大小图片，生成多尺度前视图特征（利用ResNet变体），前视图空间特征可能存在比例变化、遮挡等缺陷。透视Transformer将特征作为输入，并借助相机的内部和外部参数生成BEV特征，而不是简单地一对一地投影。

图释：PersFormer核心是学习从前视图到BEV空间的空间特征转换，以便通过关注参考点周围的局部上下文，在目标点生成的BEV特征将更具代表性。PersFormer由自注意力模块（用于与自己的BEV查询交互）和交叉关注模块（从基于IPM的前视图特征中提取键值对，以生成细粒度的BEV特征）组成。

2.透视Transformer

PersFormer的总体思想是：使用IPM中的坐标变换矩阵作为参考，通过关注前视图特征中的相关区域（局部上下文）来生成BEV特征表示。 PersFormer是一种空间变换方法（使用相机参数和数据驱动）

经典的IPM方法假设地面是平坦的，利用摄像机参数计算一组从前视图到BEV的坐标映射（BEV空间是在平面上定义的）。在前视特征图中的点p_fv及其坐标(u，v)，IPM将点p_fv映射到BEV中对应的点p_bev，其中(x，y)是BEV中的坐标。该变换是通过内/外部摄像机实现的，在数学上可以表示为：

α表示前视图和BEV之间的比例因子，R_θ表示外参旋转矩阵，K表示内参矩阵，h表示摄像机高度。这样的转换对 PerFormer中的注意单元进行了很强的先验框架，以产生更有代表性的BEV特征。

PersForme的体系结构受到了 DETR 等流行方法的启发，由自注意模块和交叉注意模块组成。我们的查询没有隐式更新，而是被一个明确的含义所操纵——在BEV中检测物体或车道的物理位置。在自注意模块中，输出Q_bev通过（键、值、查询）输入的交互,可以描述为：

K、Q、V∈R(H_bev×W_bev×C)是在BEV中预定义的相同查询。在交叉注意力模块中，输入查询Q’_bev是几个附加层的结果，这些附加层将自我注意力输出Q_bev作为输入。Q′bev是一种明确的特征表示，因为bev中查询的生成是位置敏感的，因此应更加关注bev中的哪个部分。

下图描述了 交叉注意过程 中的特征转换过程和关键值对的生成。具体来说，给定目标BEV映射Q‘_bev中的一个查询点(x，y)，我们将其投影到通过上述公式在前视图中对应的点(u，v)。根据点(u，v)学习一些偏移，以生成一组最相关的点。这些习得的点，以及(u，v)被定义为参考点。它们对bev空间中定义为目标点的查询点(x，y)贡献最大。参考点作为周围的上下文从透视图到BEV空间，对特征表示贡献最大的局部区域。它们是我们试图找到的期望键，它们的特征是交叉注意的值（value）模块。请注意，IPM中参考点的初始位置被用作坐标映射的初步位置；在学习过程中逐步调整该位置，这是可变形注意的核心作用。

生成交叉注意力中的key。BEV空间中的点（x、y）通过中间状态（x’、y’）投射前方对应的点（u、v）；通过学习偏移，网络学习目标参考点从绿色矩形映射到黄色和相关的蓝色矩形作为transformer的key。交叉注意模块的输出可表述为：

其中F_bev∈R(H_bev×W_bev×C)是最终期望特征，用于后续3D车道检测头，Q‘bev表示输入查询，F_fv∈R(H_fv×W_fv×C)表示前视图特征，p_fv2bev是从前视图到BEV空间的IPM初始化的坐标映射。考虑了具有可变形单元的F_fv和p_fv2bev，得到了显式变换的BEV特征F_bev。

PersForme在 参考点中提取前视图特征，构建具有代表性的BEV特征。这种特征转换在一个通过Transformer的聚合精神被证明比基于IPM的跨视图投影性能更好。

3.同时进行二维和三维车道检测

一方面，在透视图中进行2D车道检测，是一般的高级视觉问题的一部分；另一方面，统一二维和3D任务自然是可行的，因为 the BEV features to predict 3D outputs descend from the counterpart in the 2D branch.（这块不太理解）
端到端统一框架将利用特性并从协同学习优化过程中获益，这在大多数多任务文献[33,59,28]中得到了证明。

统一anchor设计：实现统一框架的核心问题是在二维和三维结构中同时集成anchor。不幸的是，anchor在这两个域上通常不共享类似的分布。例如，流行的2D方法LaneATT解决了太多的锚点，跨越了图像中不同的方向；而最近的3D工作Gen-LaneNet放置的锚太少，在BEV中是平行和稀疏的。我们从几组锚点（这里组数设置为7）开始，在BEV空间中以不同的倾斜角度采样，然后投影到前视图中。下图阐述了二维和三维anchor的integrate：

首先将规划的anchor（红色）放在BEV空间（左），然后将它们投射到前视图（右）。
偏移量x_ik和u_ik（虚线）被预测为匹配GT（黄色和绿色）到anchor。这样就建立了对应关系，特性也一起优化。

每个anchor i 的视角位置的初始线（等距）用Xi_bev表示。与目标检测中的anchor回归类似，该网络预测了相对偏差x_i到初始位置Xi_bev；因此，沿x轴的合成车道预测为(x_i+Xi_bev)。每个车道用N_d个点表示。预测头部生成三个与车道形状相关的向量，如下：

Z_i是三维意义上的车道高度，二进制vis(i，k)_bev表示车道线 i 中每个位置 k 是否可见（控制着车道的端点或长度）。注意，不需要预测沿y轴的车道位置，因为车道中N_d样本的每个y值都是预定义的-我们预测相应（固定）y位置的x（i，k）值。总之，车道在世界坐标系中的位置描述表示为（x_i + xi_bev，y，zi）。

2D anchor设计
anchor的描述和预测与三维视图中定义的相似，只是（u，v）为二维空间，没有高度。每个倾斜角度φ的3D锚Xi_bev对应一个倾斜角度θ的特定2D anchor Ui_fv；连接是通过上述公式（2）形成映射。我们通过设置同一组锚点，实现了同时统一二维和三维任务的目标。这样的设计将同时优化特特征，并使特征跨视图地对齐且具有代表性。

4.预测损失

在BEV条件下的二进制分割
与之前的许多工作一样，训练中增加更多的中间监督将提高网络的性能。车道检测属于图像分割，需要一般的大分辨率，我们将一个U-Net结构的头连接到生成的BEV特征之上。这一辅助任务是预测BEV的车道GT S_gt是一个二值图（从三维车道GT投影到BEV空间）。预测输出S_pred与S_gt相大小相同。

总体损失：给定一个图像输入及其GT，它最终计算出所有锚点的和“损失；损失是二维车道检测、三维车道检测和中间分割的可学习权重（α，β，γ）的结合：

式中，c_i 分别为二维和三维域内的预测车道类别。上式输入的损失仅显示了预测部分（简洁起见，省略了GT）。二维/三维任务的分类损失是交叉熵；车道形状回归的损失是L1范数；车道能见度预测的损失是二元交叉熵；辅助头的损失是两个分割映射之间的二值交叉熵损失。

四. OpenLane 数据集

14个车道类别涵盖了广泛的车道类型，包括道路边缘。双黄色实心车道、单白色实心车道和虚线车道 （Double yellow solid lanes, single white solid and dash lanes）占近90条占总车道的百分比（可能导致长尾分布问题）。除车道外，还标注了：(a)场景标签，如天气和位置；(b)路径中最近的对象(CIPO)，它被定义为最相关的目标w.r.t.也就是自车辆（ego vehicle）,对于后续的模块非常实用。下图5(d)中给出了一个注释示例，以及图5(a-c)中现有的2D车道数据集中的一些典型样本。

五、实验结果

3D结果对比（在OpenLane 数据集）

下图为不同指标下的综合三维车道评估。在统一锚定设计的强度上，PersFrorr在远误差指标上优于以前的3D方法，同时保留了类似的误差在接近误差(m)。∗表示使用IPM投影从CondLaneNet[35]到BEV的二维车道结果：

2D结果对比（在OpenLane 数据集）

Apollo 3D Lane Synthetic 数据集评估

并与以往的阿波罗三维车道合成技术上的三维方法进行了比较。Persfrer在每个场景上获得最好的F分数，具有相当的X/Z误差(m)

下图在通常的自动驾驶场景中，presFormer善于捕捉密集和不明显的车道。

appendix（实现细节）

backbone

backbone与之前的工作略有不同，因为需要同时考虑2D/3D分支。采用 EfficientNet 提取一个特定的图层作为后续模块的输入。稍后提供了两种设计（是否使用FPN）。在使用了几个卷积层后，主干模块输出了4个不同比例的前视图特征图。他们的分辨率是180×240,90×120,45×60,22×30。然后利用PresFormer将每个前视图特征图转换为bev空间特征图，结果得到了4个BEV特征图。

Anchor 细节
我们首先在BEV空间中设置锚点。按照Gen-LaneNet的顺序，起始位置Xi_bev沿x轴均匀放置，间距为8个像素。
Gen-LaneNet只设置直向(平行于y轴)，这使得很难预测具有大曲率或垂直车道的车道。针对这个问题，我们在每个Xi_bev上以不同的角度放置7个锚，即φ∈{π/2、arctan（±0.5）、arctan（±1）、arctan（±2）)。此外，我们将所有的BEV锚点投影到具有数据集的平均摄像机高度和螺距角的图像空间中，从而得到相应的二维锚点。

GT 与 anchor 匹配： Y_ref的设置非常接近ego-vehiche，即Gen-LaneNet的5米，这使得它能更好地预测近区域的车道，而在远距离的表现不令人满意。在我们的实验中，我们在二维和三维任务中以最小的编辑距离将锚分配到地面真实车道。该距离是在固定的y位置上计算的：(5、10、15、20、30、40、50、60、802D锚的72个等采样高度。

3D标注过程

《探秘人工智能与鸿蒙系统集成开发的硬件基石》程序猿阿伟人工智能 harmonyos 华为
在科技飞速发展的当下，人工智能与鸿蒙系统的集成开发开辟了创新的前沿领域。这一融合不仅代表着技术的演进，更预示着智能设备生态的全新变革。而在这场技术盛宴的背后，坚实的硬件配置是确保开发顺利进行的关键，它就像一座大厦的基石，决定了上层建筑的高度和稳定性。处理器：运算核心的澎湃动力处理器作为硬件系统的核心，在人工智能与鸿蒙系统集成开发中扮演着至关重要的角色。对于模型训练任务，尤其是深度学习模型，其复杂的
webgl threejs 云渲染(服务器渲染、后端渲染)解决方案 allenjiao Threejs webgl threejs 云渲染后端渲染服务器渲染云流化三维云渲染
云渲染和流式传输共享三维模型场景1、本地无需高端GPU设备即可提供三维项目渲染云渲染和云流化媒体都可以让3D模型共享变得简单便捷。配备强大GPU的远程服务器早就可以处理密集的处理工作，而专有应用程序，用户也可以从任何个人设备查看全保真模型并与之交互。2、云流媒体实现多终端联动共享价值更高在项目应用场景中，在大屏、电脑、平板、手机和其它移动终端，可以实现多屏联动、远程协助，三维云流化让客户访问时可以
【3DMAX插件】3DMAX建筑大师插件MasterBuilder使用方法沐风老师 3DMAX 3dmax 3dmax插件 3dmax建筑大师 MasterBuilder
3DMAX建筑大师插件是一款专为3DMAX设计的程序化（参数化）建筑建模工具，其最大特点是能够一键生成建筑模型，极大地提升了工作效率。该插件配备了多种结构控制选项，涵盖阳台、门窗、栏杆、楼顶水塔等附属建筑元素，丰富的参数设置允许用户精细调整每个细节，确保每栋建筑都独具特色。更令人赞叹的是，其随机生成功能能在不设定具体参数的情况下，每次生成外观各异的建筑，为设计工作增添无限创意与可能性。【适用版本】
嵌入式AI必备技能2-模型的压缩与加速奥德彪123 嵌入式AI 人工智能嵌入式
嵌入式AI必备技能2-模型的压缩与加速引言随着嵌入式AI设备的广泛应用，模型的计算效率和存储需求成为核心挑战。由于嵌入式系统通常资源受限，传统的深度学习模型往往难以直接部署。因此，模型压缩和加速技术应运而生，旨在减少计算量、降低存储需求，同时尽可能保持模型的准确性。本文介绍几种常见的模型压缩与加速方法，包括剪枝、低秩分解、量化、权值共享、知识蒸馏等，并探讨如何综合应用这些技术来优化AI模型。1.常
HarmonyNext实战：基于ArkTS的跨平台3D图形渲染应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的跨平台3D图形渲染应用开发引言3D图形渲染是现代应用开发中的一个重要领域，尤其在游戏、虚拟现实和增强现实等场景中。HarmonyOSNext作为新一代操作系统，提供了强大的图形渲染能力，而ArkTS作为其核心开发语言，为开发者提供了高效、简洁的开发体验。本文将深入探讨如何在HarmonyNext平台上使用ArkTS开发一个跨平台的3D图形渲染应用，涵盖3
HarmonyNext实战：基于ArkTS的跨设备3D游戏开发 harmonyos-next
HarmonyNext实战：基于ArkTS的跨设备3D游戏开发引言随着移动设备和智能终端的普及，3D游戏开发已成为开发者关注的热点领域。HarmonyNext作为新一代操作系统，提供了强大的分布式能力和高效的图形渲染支持，结合ArkTS语言的灵活性和性能优势，为开发跨设备3D游戏提供了全新的可能性。本文将详细讲解如何基于HarmonyNext和ArkTS开发一款跨设备的3D游戏，涵盖从项目搭建到核
UNet 改进：添加Transformer注意力机制增强捕捉长距离依赖关系的能力听风吹等浪起 AI 改进系列 transformer 深度学习人工智能
目录1.Transformer注意力机制2.Unet改进3.代码1.Transformer注意力机制TransformerBlock是Transformer模型架构的基本组件，广泛应用于机器翻译、文本摘要和情感分析等自然语言处理任务。TransformerBlock是一个由两个子组件组成的构建块：多头注意力机制和前馈神经网络。这两个组件协同工作，处理和转换输入序列。多头注意力机制负责从输入序列中捕
NVIDIA显卡型号有哪些？怎么知道自己电脑的型号？可靠的豆包蟹同志杂烩积累经验分享
NVIDIA显卡型号显卡分N卡和A卡，这个N卡指的是英伟达（NVIDIA），A卡之前是ATI（后来被AMD收购），现在的A卡指的就是AMD显卡。如果是为了玩游戏或者是学深度学习，选显卡肯定是要选N卡，因为A卡对于游戏优化的没有N卡好。（1）图中的GTX表示是英伟达的一个系列名称，全称叫GeForceGTX，GTX定位高端显卡系列，从低到高排名：GS/GT/GTS/GTX/RTX/Ultra，从20
英伟达系列显卡大解析B100、H200、L40S、A100 2301_78234743 java
家里有了变故。。。快手数分秋招一面面经我发现算法岗也不很难进啊(深度学习)算法想转数开…Java零基础校招学习路线突击版（吐血整理）等的花都谢了的华子最后给开了22k，武汉，应该是14a。不过在这几个月里我坚定了搞几年快钱回家和np朋友因骂了hr，boos被封了哈哈哈在央企想被开除需要做什么？2024小米分布式存储研发急招华为2012被毁意向我发现算法岗也不很难进啊(深度学习)在央企想被开除需要做
eBest AI Hub全场景接入Deepseek eBest数字化转型方案人工智能
一、技术赋能，智创未来Deepseek的强大基因将为eBest产品注入新的活力即时智能响应：融合海量行业智慧与互联网搜索精华，提供秒级智能建议；多模态理解能力：突破界限，无缝融合文本、代码与图像理解，精准解析用户的需求；进化式深度学习：不断学习，持续进化，为用户提供日益完善、超越期待的服务体验。二、全场景赋能，体验再次跃升1.智能报表-数据洞察，指尖掌控升级后的智能报表功能，能够根据查询和检
a16z Speedrun：加速科技与娱乐的未来花生糖@ 技术创业之路：从创意到企业科技娱乐 AI
引言a16z（AndreessenHorowitz）作为硅谷最具影响力的风投公司之一，一直致力于支持那些打破常规、创造新可能性的创始人。随着科技和娱乐领域的融合日益加深，a16z推出了Speedrun计划，旨在帮助前沿科技和娱乐领域的初创公司快速成长。专注于推动游戏、AI、3D、流媒体、平台、游戏技术、XR等领域的创新。a16z联合创始人马克·安德森（MarcAndreessen）在speedru
Prompt工程：大模型沟通指南（人工智能到大模型） Harry技术 AI prompt 人工智能
文章目录人工智能到大模型机器学习深度学习大模型Prompt工程：大模型沟通的桥梁在人工智能的广袤领域中，大模型无疑是最为璀璨的明珠之一。它仿佛是一座连接人类与人工智能的桥梁，让我们能够更加深入地探索和利用人工智能的强大能力。而要实现与大模型的高效沟通，Prompt工程扮演着至关重要的角色。让我们一起走进Prompt工程的奇妙世界，探寻大模型沟通的奥秘。人工智能到大模型“人工智能是一种模拟人类智能的
CCF CSP 第30次（2023.05）（2_矩阵运算_C++）（暴力破解）(矩阵相乘) Dream it possible！ CCF CSP认证矩阵 c++算法
CCFCSP第30次（2023.05）（2_矩阵运算_C++）题目背景：题目描述：输入格式：输出格式：样例输入样例输出：样例解释：子任务：提示：解题思路：思路一（暴力破解）：代码实现代码实现：部分代码解读时间限制：5.0s空间限制：512.0MB题目背景：Softmax(Q×KT/√d)×V是Transformer中注意力模块的核心算式，其中Q、K和V均是n行d列的矩阵，KT表示矩阵K的转置，×表
java实现国密加解密分享心得 Java java vue
1.pom依赖org.bouncycastlebcprov-jdk15to181.662.SM3封装packagecom.yl.encrypt.sm;importorg.bouncycastle.crypto.digests.SM3Digest;importorg.bouncycastle.crypto.macs.HMac;importorg.bouncycastle.crypto.params.
Threejs 实现 VR 看房完结多喜乐长安宁 threejs vue vr vue.js three
效果：threejs3dVr看房gitee地址：threejs-3d-map:1、threejs实现3d地图效果链接：https://blog.csdn.net/qq_57952018/article/details/1430539902、threejs实现vr看房主要代码：src/views/PanoramicView/index.vueimport{computed,onMounted,onU
Threejs 实现3D 地图（07）3d 地图完结多喜乐长安宁 vue threejs three vue.js
ps：本案例主要对省级做了很多操作对于市级还有区级没有进一步完成。大家可以根据自己的需求来调整。目前已经完成了开发但是代码质量不是很好（没时间优化了）后续有空会继续更新，如果你有想做的但是没有实现可以留言给我我会尽量而为。代码又不懂的可以问我我会尽力解答。当然项目中也有我不懂的（借鉴其他博主的思路强行实现）3d地图完结gitee地址：threejs-3d-map:threejs实现3d地图效果包含
大模型生成人物关系思维导图的实战教程 herosunly 大模型生成人物关系生成思维导图实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了大模型生成人物关系思维导图的实战教程，希望对使用大语言模型的同学们有所帮
pytorch实现cifar10多分类总结 L_pyu 人工智能 pytorch 分类
cifar-10简介：CIFAR-10是一个常用的图像分类数据集，每张图片都是3×32×32，3通道彩色图片，分辨率32×32。它包含了10个不同类别，每个类别有6000张图像，其中5000张用于训练，1000张用于测试。这10个类别分别为：飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。CIFAR-10分类任务是将这些图像正确地分类到它们所属的类别中。对于这个任务，可以使用深度学习模型，如卷积
数据挖掘技术介绍柒柒钏数据挖掘数据挖掘人工智能
数据挖掘技术介绍分类聚类关联规则挖掘预测异常检测特征选择与降维文本挖掘序列模式挖掘深度学习集成学习数据挖掘（DataMining）是一种从大量数据中提取有用信息和模式的技术，旨在从数据中发现隐藏的规律、趋势或关系，从而为决策提供支持。分类定义：是一种监督学习方法，用于将数据分为不同的类别。功能：根据已标记的训练数据，学习一个模型，用于预测新数据的类别。方法：决策树、支持向量机、神经网络、逻辑回归、
深度学习在医疗影像诊断中的应用与实现 Evaporator Core #DeepSeek快速入门人工智能 #深度学习深度学习人工智能
引言随着人工智能技术的快速发展，深度学习在医疗领域的应用日益广泛，尤其是在医疗影像诊断方面。医疗影像数据量大、复杂度高，传统的诊断方法往往依赖于医生的经验，容易受到主观因素的影响。而深度学习通过自动学习特征，能够从海量数据中提取出有用的信息，辅助医生进行更精准的诊断。本文将探讨深度学习在医疗影像诊断中的应用，并通过代码示例展示如何实现一个简单的医疗影像分类模型。深度学习在医疗影像诊断中的应用1.图
TPAMI 2025 | Glissando-Net: 基于单视图的类别级姿态估计与3D重建小白学视觉论文解读 IEEE TPAMI 3d 深度学习论文解读顶刊论文 IEEE TPAMI
论文信息Glissando-Net:DeepSinglevIewCategoryLevelPoseeStimationANd3DReconstructionGlissando-Net:基于单视图的类别级姿态估计与3D重建作者：BoSun;HaoKang;LiGuan;HaoxiangLi;PhilipposMordohai;GangHua论文创新点联合估计3D形状和6D姿态：Glissando-N
图神经网络学习笔记—高级小批量处理（专题十四） AI专题精讲图神经网络入门到精通人工智能
小批量（mini-batch）的创建对于让深度学习模型的训练扩展到海量数据至关重要。与逐条处理样本不同，小批量将一组样本组合成一个统一的表示形式，从而可以高效地并行处理。在图像或语言领域，这一过程通常通过将每个样本缩放或填充为相同大小的形状来实现，然后将样本在一个额外的维度中分组。该维度的长度等于小批量中分组的样本数量，通常称为batch_size。由于图是能够容纳任意数量节点或边的最通用的数据结
每天五分钟玩转深度学习PyTorch：基于GoogLeNet完成CAFIR10分类每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch 分类 GoogLeNet 人工智能 CAFIR10
本文重点前面我们终于使用pytorch搭建了GoogLeNet，本文我们使用该网络模型解决一个实际问题，也就是使用它完成CAFIR10分类，其实就这些任务而言，我们只要搭建好模型，然后把数据喂进去就行了，其它的地方都是一样的，就是网络模型不一样。代码
Deepseek:物理神经网络PINN入门教程天一生水water 神经网络人工智能深度学习
一、物理信息网络（PINN）的概念与原理1.定义与来源物理信息网络（Physics-InformedNeuralNetworks,PINN）是一种将物理定律（如偏微分方程、守恒定律等）嵌入神经网络训练过程的深度学习方法。其核心思想是通过神经网络同时拟合观测数据并满足物理约束，从而解决传统数值方法难以处理的高维、噪声数据或复杂边界条件问题。来源：PINN起源于对传统数值方法局限性的改进需求（如网格生
基于Transformer的医学文本分类：从BERT到BioBERT Evaporator Core 人工智能 #深度学习 #DeepSeek快速入门 transformer 分类 bert
随着自然语言处理（NLP）技术的快速发展，Transformer模型在文本分类、情感分析、机器翻译等任务中取得了显著成果。在医学领域，文本数据（如电子病历、医学文献、临床报告）具有高度的专业性和复杂性，传统的NLP方法往往难以处理。Transformer模型，尤其是BERT及其变体，通过预训练和微调的方式，能够有效捕捉医学文本中的语义信息，为医学文本分类提供了强大的工具。本文将探讨Transfor
RTX4090性能释放与优化全攻略智能计算研究中心其他
内容概要作为NVIDIAAdaLovelace架构的巅峰之作，RTX4090凭借24GBGDDR6X显存与16384个CUDA核心，重新定义了4K光追游戏的性能边界。本文将从硬件特性与软件优化双重视角切入，系统解析其性能释放路径：首先通过3DMarkTimeSpyExtreme压力测试数据（99.3%稳定性得分）验证基础算力；其次结合DLSS3.0帧生成技术与Reflex低延迟模式，实测《赛博朋克
echarts实现3d饼图 qq_45600165 echarts 前端 javascript
import*asechartsfrom'echarts'import'echarts-gl'//import{ref}from'vue';import{onMounted,onUnmounted,toRefs,ref,reactive,watch}from'vue'exportdefault{props:{//定义prop的名称和类型data:Object},setup(props){letst
深度学习项目--基于DenseNet网络的“乳腺癌图像识别”，准确率90%+，pytorch复现羊小猪~~ 深度学习网络 pytorch 人工智能 python 机器学习分类
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊前言如果说最经典的神经网络，ResNet肯定是一个，从ResNet发布后，很多人做了修改，denseNet网络无疑是最成功的一个，它采用密集型连接，将通道数连接在一起；本文是基于上一篇复现DenseNet121模型，做一个乳腺癌图像识别，效果还行，准确率0.9+;CNN经典网络之“DenseNet”简介，源码研究与复现(pytorch)：
从零到一：Transformer模型的原理与实战之旅樽酒ﻬق AI transformer 深度学习人工智能
目录从零到一：Transformer模型的原理与实战之旅1.Transformer原理简介1.1什么是Transformer？1.2自注意力机制的核心1.3Transformer的结构2.实战：构建Transformer模型2.1任务目标2.2环境准备2.3数据准备2.4模型构建2.5模型训练3.推理实战：完整示例与输出结果3.1完整推理代码3.2代码解析4.原理与代码的结合4.1自注意力机制的实
谈为什么KLA和Camtech公司为什么可以做到，半导体那边，晶圆，键合可以做到不管哪款新产品进来。编程2小时，上线后准确率可以直接做到99.9%、 *Major* 机器视觉
谈为什么KLA和Camtech公司为什么可以做到，半导体那边，晶圆，键合可以做到不管哪款新产品进来。编程2小时，上线后准确率可以直接做到99.9%、这么里面的AI原理没什么，还是这些公司把AI技术层面用出花了，一是他们有公司可能比较成立时间长，数据丰富。二是像AI深度学习网络冻结，或者自适应调参，都是一些AI技巧，他们用的比较好。三什么跨层特征解耦，实现的基础是他们对半导体理解比较深刻KLA和Ca
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http