I"ll carry you

【论文翻译】【2007.10985】PointContrast： Unsupervised Pre-training for 3D Point Cloud Understanding

文章目录

Abstract
1 Introduction
2 Related work
3 PointContrast Pre-training
- 3.1 Pilot Study: is Pre-training on ShapeNet Useful?
- 3.2 Revisiting Fully Convolutional Geometric Features (FCGF)
- 3.3 PointContrast as a Pretext Task
- 3.4 Contrastive Learning Loss Design
- 3.5 A Sparse Residual U-Net as Shared Backbone
- 3.6 Dataset for Pre-training
4 Fine-tuning on Downstream Tasks
- 4.1 ShapeNet: Classification and Part Segmentation
- 4.2 S3DIS Segmentation
- 4.3 SUN RGB-D Detection
- 4.4 Synthia4D Segmentation
- 4.5 ScanNet: Segmentation and Detection
- 4.6 Analysis Experiments and Discussions
5 Conclusions

Abstract

可以说，深度学习最成功的案例之一就是迁移学习。在丰富的源集（例如 ImageNet）上预训练网络可以帮助提高性能，一旦在通常小得多的目标集上进行微调，这一发现对语言和视觉领域的许多应用程序都有帮助
然而，人们对其在 3D 点云理解中的有用性知之甚少。考虑到在 3D 中注释数据所需的工作量，我们认为这是一个机会
在这项工作中，我们旨在促进对 3D 表示学习的研究。与之前的工作不同，我们专注于高级场景理解任务（high-level scene understanding tasks）
为此，我们选择了一套不同的数据集和任务来衡量无监督预训练对大量 3D 场景源集的影响
我们的发现非常令人鼓舞：使用统一的三元组架构、源数据集和对比损失进行预训练，我们在室内和室外、真实和合成数据集的 6 个不同基准上实现了最近在分割和检测方面的最佳结果——证明学习的表示可以跨域泛化
此外，这种改进类似于有监督的预训练，这表明未来的努力应该有利于扩展数据收集而不是更详细的注释。
我们希望这些发现将鼓励对 3D 深度学习的无监督代理任务设计进行更多研究。我们的代码在 https://github.com/facebookresearch/PointContrast 上公开可用

Keywords: Unsupervised Learning, Point Cloud Recognition, Representation Learning, 3D Scene Understanding

1 Introduction

表征学习是深度学习研究的主要驱动力之一
在 2D 视觉中，在丰富的源集（例如 ImageNet 分类）上预训练网络可以帮助提高性能，一旦在通常小得多的目标集上进行微调，这一发现是许多应用程序成功的关键。
一个特别重要的设置是预训练阶段是无监督的，因为这开辟了利用实际上无限的训练集大小的可能性
无监督预训练在自然语言处理方面取得了显着的成功 [49, 13]，并且最近在 2D 视觉中引起了越来越多的关注 [42, 3, 27, 63, 23, 42, 3, 40, 27, 69, 28, 87, 8]
在过去的几年里，随着 3D 表示学习方案数量的不断增加，3D 深度学习领域取得了长足的进步 [1, 16, 74, 21, 36, 67, 22, 15, 81, 12, 9]
然而，与 2D 相比，它仍然落后，显然，在所有 3D 场景理解任务中，从头开始对目标数据进行临时训练仍然是占主导地位的方法。值得注意的是，所有现有的表示学习方案都在单个对象或低级任务（例如配准）上进行了测试。
这种现状可以归因于多种原因：1）缺乏大规模和高质量的数据：与 2D 图像相比，3D 数据更难收集，标记成本更高，并且传感设备的多样性可能会引入剧烈的域差距（domain gaps）； 2) 缺乏统一的骨干架构：与 2D 视觉相比，ResNets 等架构已被证明成功地作为用于预训练和微调的骨干网络，点云网络架构设计仍在不断发展； 3）缺乏一套全面的数据集和高层次的评估任务（high-level tasks）
具体来说，我们选择== ScanNet [11] 作为我们进行预训练的源集==，并在我们所有的实验中利用稀疏残差 U-Net （sparse residual U-Net ）[51, 9] 作为主干架构，并专注于 3D 数据的点云表示
对于预训练目标，我们评估了两种不同的对比损失：Hardest-contrastive loss [10] 和 PointInfoNCE——InfoNCE 损失 [42] 的扩展，用于 2D 视觉的预训练。接下来，我们选择一组广泛的目标数据集和下游任务，包括：S3DIS [2]、ScanNetV2 [11]、ShapeNetPart [77] 和 Synthia 4D [52] 上的语义分割； SUN RGB-D [57, 55, 32, 70] 和 ScanNetV2 上的目标检测
值得注意的是，我们的结果表明所有数据集和任务的性能都有所提高（有关结果的总结，请参见表 1）。此外，我们发现在监督下进行预训练的优势相对较小。这意味着未来为预训练收集数据的努力应该有利于规模化而不是精确的注释
我们的贡献可以总结如下：
- 我们首次评估了 3D 点云中学习表示到高级场景理解的可迁移性。
- 我们的结果表明，无监督预训练提高了下游任务和数据集的性能，同时使用单一的统一架构、源集和目标函数
- 在无监督预训练的支持下，我们在 6 个不同的基准上实现了新的最先进的性能。
- 我们相信这些发现将鼓励我们改变处理 3D 识别的范式，并推动对 3D 表示学习的更多研究

2 Related work

Representation learning in 3D
- 众所周知，深度神经网络需要大量数据。这使得在数据集和任务之间迁移学习表示的能力非常强大。
- 在 2D 视觉中，人们对寻找最佳代理无监督任务的兴趣激增 [43, 83, 84, 14, 41, 18, 5, 42, 3, 40, 27, 69, 28, 87, 8, 10] .
- 我们注意到，虽然其中许多任务是低级的（例如像素或补丁级重建），但它们是根据它们对高级任务（如对象检测）的可迁移性进行评估的。
- 由于难以注释，3D 任务可能是无监督和迁移学习的最大受益者。这在一些关于单对象任务的工作中得到了展示，例如重建、分类和部分分割（reconstruction, classification and part segmentation） [1, 16, 74, 21, 36, 67, 22, 53]。
- 然而，通常很少关注超出单对象级别的 3D 表示学习。此外，在少数研究它的案例中，重点是配准（registration）等低级任务[15,81,12]。
- 相比之下，在这里我们希望通过关注可迁移性到更复杂场景的更高级任务来推动 3D 表示学习的研究。
Deep architectures for point cloud processing
- 在这项工作中，我们专注于学习点云数据的有用表示。
- 受 2D 领域成功的启发，我们推测实现这种进步的一个重要因素是神经架构的明显标准化。典型的例子包括 VGGNet [56] 和 ResNet/ResNeXt [26, 71]。
- 相比之下，点云神经网络设计还不够成熟，最近提出的大量新架构就可以看出这一点
- 这有多种原因。首先，是处理无序集的挑战 [47, 50, 80, 39]。其次，邻域聚合机制的选择可以是分层（hierarchical）的 [48, 33, 82, 16, 35]，类似空间 CNN （spatial CNN-like）的 [30, 73, 37, 85, 59]，光谱（spectral） [78, 62, 65]或基于图（graph-based）的 [72, 64, 68, 54]。最后，由于这些点是潜在表面的离散样本，因此还考虑了连续卷积（continuous convolutions） [66,4,75]。
- 最近 Choy 等人。提出了 Minkowski Engine [9]，这是子流形稀疏卷积网络 [20] 向更高维度的扩展。特别是，稀疏卷积网络有助于采用来自 2D 视觉的常见深度架构，这反过来又有助于标准化点云的深度学习。
- 在这项工作中，我们在所有实验中使用以 Minkowski Engine作为骨干网络构建的统一 U-Net [51] 架构，并证明它可以在任务和数据集之间优雅地传输

3 PointContrast Pre-training

在本节中，我们将介绍我们的无监督预训练流程(pipeline)。
首先，为了激发新的预训练方案的必要性，我们进行了一项试点研究，以了解 3D 深度学习中现有实践（ShapeNet 上的预训练）的局限性（第 3.1 节）。
在简要回顾了一个鼓舞人心的局部特征学习工作 - 完全卷积几何特征（Fully Convolutional Geometric Features）（FCGF）（第 3.2 节）之后，
我们介绍了我们的无监督预训练解决方案 PointContrast，在代理任务（第 3.3 节）、损失函数（第 3.4 节）、网络方面架构（第 3.5 节）和预训练数据集（第 3.6 节）。

3.1 Pilot Study: is Pre-training on ShapeNet Useful?

以前关于无监督 3D 表示学习的工作 [1, 16, 74, 21, 36, 67, 22, 53] 主要集中在 ShapeNet [7]，这是一个单对象 CAD 模型的数据集。
一个基本假设是，通过采用 ShapeNet 作为 3D 中的 ImageNet 对应物，在合成单个对象上学习的特征可以转移到其他现实世界的应用程序
在这里，我们退后一步，通过研究一个简单的监督预训练设置来重新评估这个假设：我们只需在完全监督的 ShapeNet 上预训练一个编码器网络，然后在下游任务上使用 U-Net 对其进行微调（S3DIS语义分割）。
遵循 2D 表示学习的实践，我们在这里使用完全监督作为可以从预训练中获得的上限
我们训练了 200 个 epoch 的稀疏 ResNet-34 模型（详见第 3.5 节）。该模型在 ShapeNet 分类任务上实现了 85.4% 的高验证准确率
在图 1 中，我们展示了 (a) 从头开始训练和 (b) 使用 ShapeNet 预训练权重进行微调的下游任务训练曲线。至关重要的是，可以观察到 ShapeNet 预训练，即使是在监督方式下，也会阻碍下游任务学习。在许多潜在的解释中，我们强调了两个主要问题：
- Domain gap between source and target data：ShapeNet 中的对象是合成的、尺度归一化的、姿势对齐的，并且缺乏场景上下文（synthetic, normalized in scale, aligned in pose, and lack scene context）。这使得预训练和微调==数据分布（ data distributions）截然不同 ==
- Point-level representation matters：在 3D 深度学习中，局部几何特征，例如那些由一个点及其邻居编码的，已被证明对 3D 任务具有区分性和关键性 [47, 48]。直接对对象实例进行训练以获得全局表示可能是不够的

这让我们重新思考了这个问题：如果预训练的目标是提高许多现实世界任务的性能，那么探索单个对象的预训练策略可能会提供有限的潜力。 (1) 为了解决域差距（domain gap）问题，直接在具有多个对象的复杂场景上预训练网络可能是有益的，以更好地匹配目标域分布（to better match the target distributions）；（2）为了捕获点级信息（point-level information），我们需要设计一个代理任务和相应的网络架构，它不仅基于实例级/全局表示，而是可以在点级捕获密集/局部特征（not only based on instance-level/global representations, but instead can capture dense/local features at the point level）

3.2 Revisiting Fully Convolutional Geometric Features (FCGF)

3.3 PointContrast as a Pretext Task

FCGF 只关注低级任务的局部描述符学习。相比之下，一个好的预训练代理任务旨在学习对许多高级 3D 理解任务普遍适用和有用的网络权重。
为了获得 FCGF 的灵感并创建这样的代理任务，需要重新审视几个设计选择
- 在架构方面，由于推理速度是配准（registration）任务的主要关注点，因此 FCGF 中使用的网络非常轻量级；==相反，预训练的成功依赖于过度参数化的网络（over-parameterized networks），这在其他领域 [13, 8] 中得到了清楚的证明。 ==
- 在数据集方面，FCGF 使用特定领域的注册（registration）数据集，例如 3DMatch [81] 和 KITTI odometry [17]，这些数据集缺乏规模和通用性。
- 最后，在损失设计方面，FCGF 中探索的对比损失是为注册（registration）量身定制的，探索其他替代方案很有趣。
在算法 1 中，我们总结了这项工作中探索的整体代理任务框架。我们将框架命名为 PointContrast，因为这个代理任务的高级策略是在点级别上对比两个转换后的点云
在这项工作中，我们主要考虑刚性变换，包括旋转、平移和缩放。附录中提供了更多详细信息。
最后，在两个视图中的点上定义对比损失：我们最小化匹配点的距离并最大化不匹配点的距离。
这个框架虽然来自一个非常不同的动机（几何局部描述符的度量学习），但与最近基于对比的2D无监督视觉表示学习方法有着惊人相似的管道[69,23,8]。
关键区别在于，大多数 2D 工作都集中在对比实例/图像上，而在我们的工作中，对比学习是在点级别（point level）密集完成的

3.4 Contrastive Learning Loss Design

Hardest-Contrastive Loss

PointInfoNCE Loss

个人备注：为什么在算法1有Mapping ? 因为点太多了，只考虑配对的点

3.5 A Sparse Residual U-Net as Shared Backbone

backbone 是 SR-UNet 是在[9]提出来的

3.6 Dataset for Pre-training

4 Fine-tuning on Downstream Tasks

4.1 ShapeNet: Classification and Part Segmentation

4.2 S3DIS Segmentation

4.3 SUN RGB-D Detection

4.4 Synthia4D Segmentation

4.5 ScanNet: Segmentation and Detection

4.6 Analysis Experiments and Discussions

在本节中，我们展示了额外的实验，以提供对我们的预训练框架的更多见解。我们在下面的实验中使用 S3DIS 分割。

Supervised pre-training
- 虽然这项工作的重点是无监督预训练，但自然基线是与监督预训练进行比较。
- 为此，我们在 ScanNetV2 上使用从头开始训练的基线进行分割任务，并在 S3DIS 上微调网络。这产生了 71.2% 的 mIoU，仅比 PointContrast 无监督预训练好 0.3%。
- 我们认为这是一个非常令人鼓舞的信号，表明 3D 中监督和非监督表示学习之间的差距已基本缩小（参见 2D 中的多年努力）。
- 有人可能会争辩说，这是由于 ScanNet 的质量和规模有限，但即使在这种规模下，注释数千个房间所涉及的劳动力量也很大。
- 这一结果补充了我们迄今为止的结论：我们不仅应该将资源用于创建用于预训练的大规模 3D 数据集；但是如果要在扩展数据大小和注释数据之间进行权衡，我们应该倾向于前者
Fine-tuning vs from-scratch under longer training schedule
- 最近一项关于 2D 视觉的研究 [24] 表明，简单地从头开始训练更多的 epoch 可能会缩小与 ImageNet 预训练的差距。
- 我们进行了额外的实验，以在 S3DIS 上使用 2× 和 3× 调度从头开始训练网络，相对于我们默认设置的 1× 调度（10K 迭代，批量大小为 48）。
- 我们发现验证 mIoU 不会随着训练时间的延长而改善。
- 事实上，由于数据集规模较小，该模型表现出过拟合，在 20K 和 30K 迭代时分别实现了 66.7% 和 66.1% 的 mIoU。这表明许多 3D 数据集可能会落入“故障状态”[24]，其中网络预训练对于良好的性能至关重要。
Holistic scene as a single view for PointContrast（整体场景作为 PointContrast 的单一视图）
- 为了表明 PointContrast 中的多视图设计很重要，我们尝试了一个不同的变体，
- 我们直接使用重建的点云 x（ScanNet 中的完整场景）PointContrast，而不是部分视图 x1 和 x2 。我们仍然对同一个 x 应用独立的变换 T1 和 T2。我们尝试了不同的变体和增强功能，例如随机裁剪、点抖动和丢失。
- 我们还尝试了不同自由度的 T1 和 T2 的不同变换。但是，使用最佳配置，我们可以在 S3DIS 上获得 68.35 的验证 mIoU，这仅比从头开始训练的基线 68.17 略好。这表明 PointContrast 中的多视图设置至关重要。
- 潜在原因包括：更加丰富多样的训练样本；由于相机不稳定性导致的自然噪声作为良好的正则化，如 [81] 中所观察到的

5 Conclusions

我们已经展示了对 3D 点云中学习表示到高级 3D 理解任务的可迁移性的广泛评估。
在我们的无监督预训练框架 PointContrast 的帮助下，我们在 6 个不同的基准测试中取得了最先进的结果，并证明了学习的表示可以跨域泛化。
我们希望这些发现将鼓励更多关于 3D 表示学习的研究
*

[0948]基于JAVA的城市路网智慧管理系统的设计与实现阿鑫学长【毕设工场】 java python 人工智能毕业设计课程设计
毕业设计（论文）开题报告表姓名学院专业班级题目基于JAVA的城市路网智慧管理系统的设计与实现指导老师（一）选题的背景和意义开题报告背景与意义：随着我国城市化进程的加快，城市路网系统日益庞大复杂，交通管理面临的挑战愈发严峻。传统的路网管理模式由于信息更新不及时、数据处理效率低下、智能化程度不足等问题，已无法满足现代城市管理对高效、精准、智能交通管理的需求。因此，设计并实现一套基于Java的城市路网智
基于JAVA中的spring框架和jsp实现自然灾害论坛平台项目【附项目源码+论文说明】大雄是个程序员项目实践自然灾害论坛平台 java 项目源码 spring 毕业设计课程设计网页设计
摘要在上个世纪末期，也就是20世纪末，随着计算机技术的发展与进步和数据库方面的知识在互联网的大力运用，互联网技术以及网站技术在网上的大力推广，网上论坛（自然灾害论坛）也逐渐在网兴起，它的出现帮助了网上各种特定的群体进行一个在线的知识传递与信息的交流。本计算机自然灾害论坛设计，采用了JSP（JAVA）技术和MYSQL数据库开发，尝试实现了自然灾害论坛的基本功能以及帮助我们掌握了论坛技术的核心特点。该
穴位按摩培训系统Django-SpringBoot-php-Node.js-flask QQ188083800 django spring boot php
目录具体实现截图技术栈介绍系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示具体实现截图技术栈介绍本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。研究的选题立意明确，结构合理，研究内容充实，研究方法准确有
【读点论文】Chain Replication for Supporting High Throughput and Availability 寻雾&启示分布式系统论文阅读
在分布式系统中，强一致性往往和高可用、高吞吐是矛盾的。比如传统的关系型数据库，其保证了强一致性，但往往牺牲了可用性和吞吐量。而像NoSQL数据库，虽然其吞吐量、和扩展性很高，但往往只支持最终一致性，无法保证强一致性。由此ChainReplicationforSupportingHighThroughputandAvailability提出了链式复制协议，旨在保证高吞吐、高可用的同时，支持数据的强一
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
【软考论文】论软件系统架构评估罗小爬EX 软考（系统架构师）软考系统架构师论文
目录一、题目二、论文2.1摘要2.2正文三、扩展3.1基础知识3.2评估方式综合对比3.3SAAM基于场景的架构分析方法3.4ATAM架构权衡分析方法3.5质量属性一、题目对于软件系统，尤其是大规模的复杂软件系统来说，软件的系统架构对于确保最终系统的质量具有十分重要的意义，不恰当的系统架构将给项目带来高昂的代价和难以避免的灾难。对一个系统架构进行评估，是为了：分析现有架构存在的风险，检验设计中提出
论文阅读：2023 arxiv Multiscale Positive-Unlabeled Detection of AI-Generated Texts CSPhD-winston-杨帆论文阅读论文阅读人工智能
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328MultiscalePositive-UnlabeledDetectionofAI-GeneratedTextshttps://arxiv.org/abs/2305.18149https://www.doubao.com/chat/211427064915225
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROL 寻丶幽风论文阅读笔记论文阅读笔记 3d 人工智能自动驾驶
MagicDrive论文MagicDrive通过对3D数据和文本数据的多模态条件融合和隐式视角转换，实现了高质量、多视角一致的3D场景生成。几何条件编码Cross-attention：针对顺序数据，适合处理文本标记和边界框等可变长度输入。Additiveencoderbranch：对于地图等网络状规则数据，能够有效保留空间结构。对于文本按照模版构建：“Adrivingsceneat{locatio
【笔记】扩散模型（五）：Classifier-Free Guidance 理论推导与代码实现 LittleNyima Diffusion Models 笔记机器学习深度学习
论文链接：Classifier-FreeDiffusionGuidance上一篇文章我们学习了ClassifierGuidance，这种方法通过引入一个额外的分类器，使用梯度引导的方式成功地实现了条件生成。虽然ClassifierGuidance可以直接复用训练好的diffusionmodels，不过这种方法的问题是很明显的，首先需要额外训练一个分类器，而且这个分类器不仅仅分类一般的图像，还需要分
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
三维点云重建的原理及代码晚风微凉～ matlab 图像处理
点云重建是将来自各种传感器（如激光雷达、相机等）采集的离散点云数据转换为具有结构和几何形状的物体模型的过程。在这个过程中，算法的核心任务是从大量的离散点中提取出具有几何意义的特征，并将这些特征组合成相应的物体模型。在实际应用中，无法获得物体所有表面的三维坐标数据，因此点云重建算法必须处理部分点云数据，尽可能准确地还原物体的几何结构。点云重建的目标是通过对描述物体表面形状的点数据进行处理，根据它们的
Transposed convolution（2016 IEEE）刘若里论文阅读人工智能计算机视觉学习网络笔记
论文标题FullyConvolutionalNetworksforSemanticSegmentation论文作者EvanShelhamer,JonathanLong,TrevorDarrell发表日期2016年05月01日GB引用>ShelhamerEvan,LongJonathan,DarrellTrevor.FullyConvolutionalNetworksforSemanticSegme
【论文复现】——基于SIFT特征点结合ICP的点云配准方法点云侠点云配准专题开发语言计算机视觉算法 3d c++
目录一、论文概述二、代码实现三、结果展示1、初始位置2、配准结果四、实验心得一、论文概述在点云配准过程中，针对迭代最近点(ICP)算法对点云初始位置依赖性强且迭代速度慢的问题，提出一种基于尺度不变特征变换(SIFT)特征点结合ICP的点云配准方法。首先利用SIFT算法提取待配准点云和目标点云的特征点;接着计算出特征点的快速点特征直方图(FPFH)特征;然后依据该特征使用采样一致性初始配准(SA
Description of a Poisson Imagery Super Resolution Algorithm 论文阅读青铜锁00 论文阅读 Radar 论文阅读
DescriptionofaPoissonImagerySuperResolutionAlgorithm1.研究目标与意义1.1研究目标1.2实际意义2.创新方法与模型2.1核心思路2.2关键公式与推导2.2.1贝叶斯框架与概率模型2.2.2MAP估计的优化目标2.2.3超分辨率参数α2.3对比传统方法的优势3.实验验证与结果3.1实验设计3.2关键结果4.未来研究方向（实波束雷达领域）4.1挑战
《基于自适应正负样本对比学习的特征提取框架》-核心公式提炼简洁版 2022年neural networks 阳光明媚大男孩学习深度学习人工智能论文笔记
论文源地址以下是从文档中提取的关于“基于对比学习的特征提取框架（CL-FEFA）”中正负样本对比学习实现的技术细节，包括详细的数学公式、特征提取过程以及特征表示方式的说明。1.正负样本的定义与构造在CL-FEFA框架中，正负样本的定义是动态且自适应的，基于特征提取的结果，而不是预先固定的。这种自适应性是CL-FEFA区别于传统对比学习（如SimCLR、SupCon）的一个关键点。定义方式：指示矩阵
【图像去噪】论文精读：CVPR 2025 | DnLUT: Ultra-Efficient Color Image Denoising via Channel-Aware Lookup Tables 十小大图像去噪深度学习计算机视觉人工智能图像处理论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言Abstract1.Introduction2.Relatedworks2.1.ColorImagedenoising2.2.ReplacingCNNwithLUT3
QHDBO基于量子计算和多策略融合的蜣螂优化算法算法小狂人算法改进智能优化算法量子计算算法
2.DBO基本的蜣螂算法通过模拟蜣螂在自然界中的四种行为（滚动、产卵、觅食和偷窃）来执行种群位置更新。2.1滚动蜣螂在自然界中，蜣螂必须通过太阳导航，使其球滚动的路线尽可能直线。方程(1)用于原始论文中更新滚动蜣螂的位置：xi(t+1)=xi(t)+α⋅k⋅xi(t−1)+b⋅Δx(1)x_i(t+1)=x_i(t)+\alpha\cdotk\cdotx_i(t-1)+b\cdot\Deltax\
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
维普AIGC降重方法有哪些？ hjehheje AIGC
在学术写作和论文创作中，重复率过高是许多人面临的一大难题。随着科技的发展，维普AIGC为我们提供了一系列有效的降重方法。那么，维普AIGC降重方法有哪些呢？接下来就为大家详细介绍。语义理解与改写维普AIGC具备强大的语义理解能力。例如，当我们面对一段论述市场趋势的文字时，它能精准把握核心含义。假设原文是“当前智能手机市场呈现出快速增长的趋势，消费者对高性能手机的需求日益旺盛”，维普AIGC可能会将
统一的视频动作模型三谷秋水计算机视觉机器学习人工智能计算机视觉深度学习机器学习人工智能
25年3月来自斯坦福大学的论文“UnifiedVideoActionModel”。统一的视频和动作模型对机器人技术具有重大意义，其中视频为动作预测提供丰富的场景信息，而动作为视频预测提供动态信息。然而，有效地结合视频生成和动作预测仍然具有挑战性，当前基于视频生成的方法在动作准确性和推理速度方面难以与直接策略学习的性能相匹配。为了弥补这一差距，引入统一的视频动作模型（UVA），它联合优化视频和动作预
Ubuntu和Windows系统之Mamba_ssm安装 Netceor Python ubuntu windows linux
Mamba的论文：https://arxiv.org/abs/2312.00752Mamba的github：https://github.com/state-spaces/mamba一、Ubuntu安装直接新建一个环境是最好的，不然很容易产生各种冲突#创建环境和相关包condacreate-nmambapython=3.10.13condaactivatemambacondainstallcuda
计算机毕业设计指南晴天毕设课程设计毕业设计 java 毕设开发语言
毕业设计是计算机专业学生展示综合能力的重要环节，不仅是对所学知识的总结，也是进入职场或深造前的实战演练。本文将从选题、需求分析、系统设计、编码实现、测试优化、论文撰写、答辩准备等方面，为你提供一份详细的毕业设计指南。如果有其他问题，可以点击文章末尾名片咨询，可免费分享源码1.选题阶段选题是毕业设计的起点，直接影响后续工作的难度和完成质量。选题原则兴趣驱动：选择自己感兴趣的方向，能够激发研究动力。创
PCL基础：pcl::SACSegmentation＜PointXYZRGBN＞函数全面说明，一遍文章精通平面分割算法多宝Kim #PCL点云库使用笔记 c++算法 windows visual studio
创作不易，如果本篇文章能够给你提供帮助，请点赞鼓励+收藏备查+关注获取最新技术动态，支持作者输出高质量干货！（一般在周末更新技术干货）`pcl::SACSegmentation`是PointCloudLibrary(PCL)中用于进行随机抽样一致性（RandomSampleConsensus，RANSAC）平面分割的类模板，模板参数`PointXYZRGBN`表示点云中点的类型，该类型包含三维坐标
01年实习生被曝负责字节RL核心算法！系字节LLM攻坚小组成员量子位
一个超越DeepSeekGRPO的关键RL算法出现了！用上该算法后，Qwen2.5-32B模型只经过RL训练，不引入蒸馏等其他技术，在AIME2024基准上拿下50分，优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-Qwen，且DAPO使用的训练步数还减少了50%。这个算法名为DAPO，字节、清华AIR联合实验室SIALab出品，现已开源。论文通讯作者和开源项目负责人都
重塑家用机器人大脑！云鲸旗舰机型逍遥002搭载旭日5正式开售量子位
2025年3月20日，全球家庭清洁机器人明星品牌云鲸智能携最新一代旗舰机型——云鲸逍遥002，亮相中国家电及消费电子博览会（AWE）。该产品以”AI智能深度清洁“为核心，基于地瓜机器人全新一代旭日5智能计算芯片，推出首创的双目AI视觉感知自适应系统，以10TOPs的端侧算力与180万点/秒的3D稠密深度点云生成能力，为家庭场景带来毫米级障碍测距精度与语义级环境理解，是家庭清洁机器人智能化演进的又一
量子位招聘 | DeepSeek帮我们改的招聘启事量子位
关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具；拥有解读论文的能力，能深入浅出讲解原理；有写代码能力；量子位长期读者。加入我们，你可以获得：
CBNetV2: A Composite Backbone Network Architecture for Object Detection论文阅读 Laughing-q 论文阅读深度学习人工智能目标检测实例分割 transformer
CBNetV2:ACompositeBackboneNetworkArchitectureforObjectDetection论文阅读介绍方法CBNetV2融合方式对Assistant的监督实验与SOTA的比较在主流backbone架构上的通用性与更宽更深的网络比较与可变形卷积的兼容在主流检测器上的模型适用性在SwinTransformer上的模型适用性消融实验paper：https://arxi
毕业论文代码实验（Python\MATLAB）基于K-means聚类的EMD-BiLSTM-Attention光伏功率预测模型清风AI 毕业设计代码实现 python lstm 深度学习神经网络人工智能 matlab pytorch
一、项目背景1.1光伏功率预测意义在能源结构转型背景下（国家能源局2025规划），光伏发电渗透率已超过18%。但受天气突变、云层遮挡等因素影响，光伏出力具有显著波动性，导致：电网调度难度增加（±15%功率波动）电力市场交易风险提升光储协同控制效率降低1.2技术挑战多尺度特征耦合：分钟级辐照度变化与小时级天气模式共存非线性映射关系：气象因素与发电功率呈高阶非线性关系数据模态差异：数值天气预报(NWP
YOLO算法全面改进指南（二） niuTaylor YOLO改进 YOLO 算法
以下是为YOLO系列算法设计的系统性改进框架，结合前沿技术与多领域创新，提供可支持高水平论文发表的详细改进思路。本方案整合了轻量化设计、多模态融合、动态特征优化等创新点，并给出可验证的实验方向。一、多模态提示驱动的开放场景检测系统1.核心创新三模态提示机制：文本提示编码器：基于RepRTA（可重参数化区域文本对齐）构建轻量级文本编码网络，将自然语言描述映射为128维语义向量。视觉提示编码器：采用S
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理