Darren_pty

《论文阅读13》Efficient Urban-scale Point Clouds Segmentationwith BEV Projection

一、论文

研究领域：城市级3D语义分割
论文：Efficient Urban-scale Point Clouds Segmentationwith BEV Projection
论文链接

注： BEV： Bird's Eye View

BEV投影是指鸟瞰视角(Bird's Eye View,简称BEV)的一种从上方观看对象或场景的视角，就像鸟在空中俯视地面一样。在自动驾驶和机器人领域，通过传感器(如LiDAR和摄像头)获取的数据通常会被转换成BEV表示，以便更好地进行物体检测、路径规划等。

二、论文概要

与其他已发表方法的比较结果。我们使用ResNet-34和HRNet实现了我们的模型，这两个模型都在SensatUrban数据集上实现了具有竞争力的平均IoU和整体准确性。请注意，由于无法访问测试集标签，我们的结果是在验证集上计算的，而其他模型的结果由数据集发布者提供，并使用测试数据进行评估。

图二.3D-2D任务转移过程概述。

1、城市规模的点云地图被预先划分成边长小于400米的网格。

2、我们进一步生成了25× 25 m2的正方形，放大倍数为20倍。

3、2D分割输出将根据其x/y坐标重新映射到大型3D标测图。

空间重叠率统计结果。x轴表示滑动窗口（1m×1m）的点数排名，前0%表示点数最多的窗口。y轴指示投影到BEV图像上的点的重叠比。

三、论文全文

基于BEV投影的城市尺度点云高效分割

摘要：近年来，点云分析已经吸引了研究人员的目光，而3D语义分割仍然是一个问题。大多数深度点云模型直接在3D点云上进行学习，这将受到城市规模数据严重稀疏和极端数据处理负载的影响。为了解决这一挑战，我们建议将三维点云转移到密集的鸟瞰图投影。在这种情况下，由于类不平衡减少和利用各种2D分割方法的可行性，分割任务被简化。我们进一步设计了一个基于注意力的融合网络，可以对投影图像进行多模态学习。最后，2D输出被重新映射以生成3D语义分割结果。为了证明我们的方法的好处，我们在SensatUrban数据集上进行了各种实验，其中我们的模型呈现出竞争力的评估结果（61.17% mIoU和91.37% OverallAccuracy）。我们希望我们的工作可以启发进一步探索点云分析。

介绍

3D语义分割是点云学习的关键技术，其目的是为每个单独的点数据分配语义标签，已广泛应用于自动驾驶[1]，虚拟现实[2]，3D重建[3]等。虽然深度学习在2D语义分割任务中表现突出，但它无法直接处理不规则，无序和非结构化的点数据[4]。因此，目前有几种方法[5]-[11]将非结构化点转换为某些有效的中间表示，例如体素[7]，[12]和多视图[10]，[13]，[14]，以利用经典CNN模型处理点云。随着对三维场景理解需求的不断增加，提出了越来越多的三维点云数据集。从室内数据集（例如，S3DIS [15]和ScanNet [16]）到道路级数据集（例如，SemanticKITTI [17]），数据集的空间大小也更大。最近的工作[3]，[18]提出了城市级数据集，为大规模数据集的语义分割带来了一些新的挑战。

室内数据集（例如，S3DIS [15]和ScanNet [16]）

道路级数据集（例如，SemanticKITTI [17]），数据集的空间大小也更大

[3]，[18]提出了城市级数据集

与基于LiDAR的数据集不同，这些城市规模的点云大多是从无人机摄影测量中获得的，这可能导致数据集中的以下特征。首先，无人机摄影测量的扫描不均匀，扫描区域不集中，捕获的图像边缘有散乱的区域。其次，重建的点云部分缺失。我们在SensatUrban [3]数据集中观察到这种现象，一个典型的例子是，在对点云进行可视化后，屋顶下没有对应的墙点，这使得屋顶似乎悬浮在空中。有趣的是，我们发现基于无人机的点云中垂直点的类别重叠率较低，例如，SensatUrban为2.3%，这意味着鸟瞰图是一种合适的投影方法，它更简单，更有效，并且能够最大限度地保留点细节。

此外，对于投影图像，具有更丰富标记的2D像素级数据集可以用于预训练。因此，在本文中，我们提出了一个BEV投影分割方法来处理城市规模的三维分割问题。

我们的主要贡献是：

1）对城市规模的点云进行点级分析;

2）提出了一种基于BEV投影算法的多模态融合分割模型;

3)我们在SensatUrban数据集上对我们的方法进行了评估，我们的竞争结果证明了我们设计的有效性。

相关工作

A.语义分割

通常，根据输入网络的点云数据的形式，现有的大多数3D语义分割方法可以分为三类：基于点、基于3D表示和基于投影。

基于点的方法直接处理原始点云，其代表方法是PointNet，计算开销大。虽然[19]，[20]对PointNet进行了一些有益的改进，但由于这些方法直接处理sprase数据，因此仍然难以加速。最近的RandLA-Net [2]引入了随机采样和轻型网络架构，大大加快了模型的速度。然而，如[21]中所提到的，基于点的方法中不可忽视的问题是，由低效的随机存储器访问引起的处理sprase数据的大量时间浪费（80%），这意味着实际上只有少量的时间用于提取特征。此外，大的存储器开销也是一个严重的问题。

基于3D表示的方法将原始点云数据变换成某些3D表示（例如，体素和晶格），然后利用3D卷积[5]-[8]。然而，很难平衡分辨率和内存之间的关系[21]，[22]。分辨率越低，同一网格中的点融合在一起，导致点云信息丢失越严重。分辨率越高，计算开销和内存使用量越大。此外，预处理和后处理步骤需要大量时间[23]。

分辨率越低，同一网格中的点融合在一起，导致点云信息丢失越严重。

分辨率越高，计算开销和内存使用量越大

基于投影的方法利用成熟的2D卷积模型来处理从3D点云投影的图像，而不是直接处理点。基于投影的方法包括几个特定的类别，如多视图，基于球面的方法。多视图方法[10]，[13]，[14]将点云投影到多个虚拟相机视图中。例如，[10]利用多流CNN来处理从每个视图生成的图像，然后融合每个点的不同图像的预测分数，[13]定义了旋转相机并提出了Katz投影来选择每个相机角度中的点，[14]在不同的相机位置生成深度图像和RGB图像。[24]利用球面投影方法将三维点云转换为图像，利用SqueezeSeg网络进行分割，并应用条件随机场（CRF）对分割结果进行优化。[11]提出了基于SqueezeSeg的上下文聚合模块（CAM）来扩展感受野，并且[4]引入了空间自适应卷积（SAC）来进一步提高分割精度。

基于投影的方法包括几个特定的类别:

多视图方法[10]，[13]，[14]将点云投影到多个虚拟相机视图中。

利用球面投影方法将三维点云转换为图像

B 大规模场景的语义分割

在最近的工作中，已经提出了几个由无人机拍摄的城市尺度3D点云数据集[3]，[18]，[25]，其中最大的是SensatUrban [3]数据集，其覆盖面积为7.64×106 m2，具有30亿个注释点。然而，这些大而密集的数据集给语义分割带来了新的挑战。

城市尺度3D点云数据集:

最大的是SensatUrban

首先，面对海量数据，预处理方法的选择，例如，数据分区、下采样等。意义重大。其次，城市规模点云存在类分布不均衡的问题。第三，基于无人机的数据集和基于激光雷达的数据集之间的一个显着差异是，前者包含RGB特征。对于大规模数据集，是否将RGB特征纳入网络以及如何有效地利用RGB特征值得考虑。最近的工作，例如RandLA-Net [2]和BAAF-Net [23]利用RGB颜色并取得了积极的分割结果。对于BEV投影生成的图像，我们设计了一个基于注意力的多模型融合网络，有效地融合了RGB和几何细节。与单模态网络相比，分割效果取得了一定的提高，进一步验证了RGB颜色对分割的意义。

海量数据预处理方法:

数据分区

下采样等

近年来，已经提出了几种针对大型数据集的语义分割算法[2]，[9]，[26]，[27]。例如，RandLA-Net [2]引入了随机采样以提高计算和内存的效率，TagentConv [9]利用基于切线卷积的U型网络进行大型和密集数据集的语义分割，SPGraph [27]提出了一种新的点云表示（SPG），能够捕获3D点的上下文结构。需要提出更多的大规模点云分割算法。

方法：

A 问题陈述

3D点云语义分割的目的是为每个单独的点分配语义标签，而2D分割是为每个像素分配特定的标签。在某种程度上，这两种类型的任务具有相似的目的和解决方案。根据我们上面的陈述，可以将3D点云语义分割任务转移到2D鸟瞰图分割问题。主要过程包括鸟瞰图映射和2D多模态分割。

B 鸟瞰投影为什么合理

当我们将一个任务转移到另一个任务时，它要求输入数据和预期输出的一致性。为了评估我们的想法，我们在构建模型之前进行点级分析。我们首先将3D点投影到BEV图上（将在下文中详细描述）并计算重叠率。在投影中以0.04m为单位进行坐标缩放时，约有25.44%的点会丢失。对于那些点密集的地方，比例将提高到50%或更多。然而，我们发现大多数重叠点属于与顶部点相同的类别。类重叠率低于2.3%，mIoU可达93.7%。在这种情况下，可以将3D分割任务转移到2D BEV分割。我们的目标是在BEV图像上进行精确识别。

C 鸟瞰图

为了优化这种大型点云的数据处理负载，我们将整个工作分为三个部分：3D到BEV投影、稀疏BEV图像完成和BEV到3D重新映射。前两个部分的处理在下面的算法1中被呈现为伪代码。我们设置一个滑动窗口来处理点并生成BEV图像。在投影之前，我们需要初始化参数gscale，gscale，gscale，它控制滑动窗口的缩放，大小和移动步骤。对于每个滑动步骤，我们通过x/y坐标对点进行排序，并从当前BEV投影窗口开始/结束坐标中查询点，之后将删除处理过的点以减少后续数据处理量。为了获得最佳的参数，我们测试了不同的投影尺度从0.01到0.04的空间重叠率，如图3所示。当我们将点云的尺度设置在[0.01，0.03]时，会导致点云不同部分的重叠分布非常接近，即城市尺度点云中的点的最小间距在[0.03，0.05]（m）以内。此外，根据我们的投影图像数量估计，合适的窗口长度在[20，50]（m）以内。因此，我们将参数设置为gscale = 0.05，gsize = gstep = 25。然而，我们也建议多尺度，多尺寸和多步采样，以便在未来的工作或其他类似的任务中更好地训练。

对于单个滑动窗口中的点，我们通过积分x/y坐标将点映射到像素。这将不可避免地带来值量化的损失，但是，如果我们在3D重映射中进行相同的过程，它不会影响标签检索过程。BEV图使用顶部的点进行更新，生成具有颜色和z坐标值的RGB和海拔（Alt）图像。考虑到BEV图像上投影点云的显著稀疏性，这将在标记和模型学习中引入严重的噪声，因此有必要对投影进行像素级完成，特别是对于不同类点周围的内部区域和边缘。在我们的实验中，我们迭代地对每个图像中的每个通道进行三次2D最大池化。标签的渐进变化如图4所示。

完工测试。对于从左到右，我们呈现原始BEV标签和具有一次/两次/三次最大池化完成的标签。

对于3D重映射，我们存储每个投影窗口的绝对x/y坐标，并使用主题查询原始大规模点云中的提取位置以获得2D分割输出。对应于相同像素的点将被赋值为与像素相同的类。之后，我们能够评估3D语义分割性能。

D.最大值多模态分割

通过BEV投影的高度和RGB图像，我们可以利用多模态网络从数据的不同方面进行学习。为了快速开发一个合适的模型，我们考虑一个编码器-解码器网络UNet作为我们的基线，不仅因为它的流行模型架构，而且因为它在修改，训练和推理方面的效率。它包括编码器中的4个块和解码器中的5个块，其中两个是ResNet-34块，最后四层使用转置卷积，其余是卷积块。所有卷积块都有一个批量归一化层和一个ReLU层，所有内核大小都是3x 3。编码器中的每个块都用虚线链接到解码器中的相应块，该虚线将它们的输出连接起来以检索低级特征。

通常，多模态融合依赖于各层中的特征通信。在此基础上，提出了一种灵活的多级融合网络，支持不同时间、不同地点的多管道数据融合。熔合层包括若干恒定形状的熔合块。每个块接受来自两个管道的两个相等形状的张量，并采用注意力层从连接的特征图中选择关键通道。以这种方式，熔合块倾向于丢弃不相关的特征，并且熔合在随后的层中容易被激活的那些特征。对于注意力块，我们参考我们以前的工作？？，提出了一种用于语义分割的跨通道多模态融合注意块。之后，我们添加1x1卷积以降低维度，并针对图像特征和融合特征、海拔特征和融合特征重复这样的融合块。重要的是外块保持特征图的恒定形状，这意味着我们可以根据需要堆叠具有各种网络形状的无限块。

实验

A setup

数据集：SensatUrban [3]在英国3个大城市采集，包含2847M个点，覆盖真实的世界7.64× 106m2的面积，是目前最大的3D点云数据集。在获得无人机拍摄的区域图像序列后，从这些图像重建SensatUrban点云数据集。它包含13个语义类，包括地面、建筑物、交通道路等大类和自行车、铁路、桥梁等小类。在实验中，37个点云用于训练，6个点云用于测试。每个点包含三维坐标、RGB颜色和语义类的特征。请注意，由于缺乏测试集标签，我们将训练集随机分为4：1，使用80%的数据进行训练，使用20%的数据进行测试。所有测试数据都不用于训练。

度量：我们将我们的模型与几个使用不同方法（例如，基于点的方法、基于投影的方法等）并且最近出版。选择平均IoU（mIoU）和总体准确度（OA）作为评价指标。

实施情况：我们在训练中使用交叉熵作为损失函数。考虑到不同类间的不平衡性，我们使用对数倒数权值来调整学习中的损失。我们将批处理大小设置为8，将输入大小设置为投影大小500 x500。我们的模型在两个GPU上训练，RTX 3090具有24 G RAM和E5- 2678 v3 CPU。此外，我们使用以下软件设置：Ubuntu 16.04 64位操作系统，Python 3.6，gcc5.4.0，PyTorch 1.7与CUDA 11.0硬件加速。

B. Results

我们使用三个主干实现了我们的模型，UNet和ResNet34，Deeplabv3和ResNet101，OCRNet和HRNet。最后两个模型被训练以探索在我们的BEV分割框架下的潜在性能。我们在表I中展示了分割结果（重新映射到3D点云并在3D中进行评估）。与现有的模型相比，我们的模型可以实现相当有竞争力的结果，在大多数classed和整体performancee在OA，mAcc，和mIoU。缺点是我们的BEV分割仍然无法识别一些小物体，如自行车，因为它们在投影图像中占用的像素也非常有限。在未来的工作中，融合3D和我们的BEV模型可能会解决这个问题。可视化如图5所示。

CONCLUSION

针对大规模无人机点云数据稀疏、处理负担重的问题，设计了一种大规模无人机点云数据预处理方法，即将三维点云投影到密集的鸟瞰图上。此外，我们还提出了一种基于注意力的多模态融合网络来分割生成的二维图像，充分利用RGB颜色和几何信息。我们在SensatUrban数据集上获得了61.17%的mIoU和91.37%的OverallAccuracy测试结果。我们希望我们的工作可以启发大规模的点云语义分割任务。

[论文阅读] 软件工程 | 探索软件生态系统中的开发者体验关键因素
探索软件生态系统中的开发者体验关键因素：从研究到实践引文格式@article{Zacarias2025,title={ExploringDeveloperExperienceFactorsinSoftwareEcosystems},author={Zacarias,RodrigoOliveiraandAntunes,L{\'e}oCarvalhoRamosandBarros,M{\'a}rciod
Fast Image Deconvolution using Hyper-Laplacian Priors论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
FastImageDeconvolutionusingHyper-LaplacianPriors1.论文的研究目标与实际意义2.论文的创新方法2.1核心框架：交替最小化（AlternatingMinimization）2.2x子问题：频域FFT加速2.3w子问题：高效求解的核心创新2.3.1问题形式2.3.2查找表法（LUT）2.3.3解析解法（特定α\alphaα）2.3.4通用α\alphaα
[论文阅读] 人工智能 + 软件工程 | AI 与敏捷开发的破局之路：从挫败到成功的工作坊纪实张较瘦_ 前沿技术论文阅读人工智能软件工程
AI与敏捷开发的破局之路：从挫败到成功的工作坊纪实论文信息arXiv:2506.20159AIandAgileSoftwareDevelopment:FromFrustrationtoSuccess–XP2025WorkshopSummaryTomasHerda,VictoriaPichler,ZheyingZhang,PekkaAbrahamsson,GeirK.HanssenSubjects:
Diff-Retinex: Rethinking Low-light Image Enhancement with A Generative Diffusion Model 论文阅读钟屿论文阅读人工智能深度学习学习图像处理计算机视觉
Diff-Retinex：用生成式扩散模型重新思考低光照图像增强摘要本文中，我们重新思考了低光照图像增强任务，并提出了一种物理可解释的生成式扩散模型，称为Diff-Retinex。我们的目标是整合物理模型和生成网络的优点。此外，我们希望通过生成网络补充甚至推断低光照图像中缺失的信息。因此，Diff-Retinex将低光照图像增强问题表述为Retinex分解和条件图像生成。在Retinex分解中，我
【论文阅读】人工智能在直升机航空电子系统中的应用肥鼠路易论文阅读人工智能航空电子系统应用
人工智能在直升机航空电子系统中的应用论文摘要文章结构参考文献论文摘要论文摘要:在现代战争形势日趋信息化、智能化的背景下，将人工智能应用于武器装备已经是大势所趋。针对直升机飞行任务的特征，对其发展状况进行了描述，并对其作业能力进行了分析，探索了人工智能技术在直升机航电系统中的应用方向，为推进人工智能在直升机上的转化与应用奠定基础。通过对国外先进直升机智能技术的运用现状及对其作业能力的要求进行分析，探
[论文阅读] 人工智能+软件工程 | 用大语言模型架起软件需求形式化的桥梁张较瘦_ 前沿技术人工智能论文阅读软件工程
用大语言模型架起软件需求形式化的桥梁：一篇ACM调查草案的深度解读论文信息arXiv:2506.14627ACMSurveyDraftonFormalisingSoftwareRequirementswithLargeLanguageModelsArshadBeg,DiarmuidO’Donoghue,RosemaryMonahanComments:22pages.6summarytablesSu
Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model论文阅读青铜锁00 深度学习论文阅读 #退化论文阅读
Reti-Diff:IlluminationDegradationImageRestorationwithRetinex-basedLatentDiffusionModel1.研究目标与实际意义1.1研究目标1.2实际意义2.创新方法与模型设计2.1整体框架2.2RetinexPriorExtraction(RPE)模块2.2.1Retinex分解2.2.2先验压缩2.3Retinex-guide
SIMPL论文阅读 ZHANG8023ZHEN 论文阅读
论文链接：https://arxiv.org/pdf/2402.02519文章还没细看，但主要贡献点应该是SymmetricFusionTransformer和Bezier-basedMotionDecoder.对Bezier-basedMotionDecoder比较感兴趣，之后对这块细看一下
【论文阅读笔记】《CodeS: Towards Building Open-source Language Models for Text-to-SQL 》柠石榴 text2sql 论文论文阅读笔记语言模型
文章目录一、论文基本信息1.文章标题2.所属刊物/会议3.发表年份4.作者列表5.发表单位二、摘要三、解决问题四、创新点五、自己的见解和感想六、研究背景七、研究方法模型实验数据评估指标八、总结九、相关重要文献一、论文基本信息1.文章标题CodeS:TowardsBuildingOpen-sourceLanguageModelsforText-to-SQL2.所属刊物/会议未明确标注（会议缩写为“C
agentformer论文阅读 ZHANG8023ZHEN 论文阅读
参考了这篇博文：https://zhuanlan.zhihu.com/p/512764984主要有这几个部分a.map_encoderi.对地图进行CNNb.ContextEncoderi.timeencoder–将时间信息用transformer和positionemb进行融合，加入到特征中ii.agent-awareattention–self和selfattentionother和other
【论文阅读】DynamicControl ：一种新的controlnet多条件控制方法 prinTao pytorch Diffusion 论文阅读
背景现有方法要么处理条件效率低下，要么使用固定数量的条件，这并不能完全解决多个条件的复杂性及其潜在冲突。这强调了需要创新方法来有效管理多种条件，以实现更可靠和详细的图像合成。为了解决这个问题，我们提出了一个新的框架DynamicControl，它支持不同控制信号的动态组合，允许自适应选择不同数量和类型的条件。本文方法从一个双循环控制器开始，它通过利用预先训练的条件生成模型和判别模型为所有输入条件生
论文阅读：2018 arxiv CrowdHuman: A Benchmark for Detecting Human in a Crowd CSPhD-winston-杨帆论文阅读
https://www.doubao.com/chat/9226473480559618https://arxiv.org/pdf/1805.00123CrowdHuman:ABenchmarkforDetectingHumaninaCrowd文章目录论文翻译CrowdHuman：用于检测人群中人体的基准摘要1.引言2.相关工作2.1.人体检测数据集2.2.人体检测框架。论文翻译CrowdHuma
论文阅读：arxiv 2025 OThink-R1: Intrinsic Fast/Slow Thinking Mode Switching for Over-Reasoning Mitigation CSPhD-winston-杨帆论文阅读
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://www.doubao.com/chat/8815924393371650https://arxiv.org/pdf/2506.02397#page=17.09OThink文章目录速览研究背景与问题核心思路与方法实验结果结论与意义速览这篇论文聚焦于
论文阅读：arxiv 2025 Not All Tokens Are What You Need In Thinking
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://arxiv.org/pdf/2505.17827https://www.doubao.com/chat/8814790364572162文章目录速览研究背景提出的解决方案：条件token选择（CTS）实验结果核心贡献研究局限总结速览这篇论文主要探
[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers 颜笑晏晏论文阅读
1.摘要双分支网络结构已显示出其对实时语义分割任务的效率性和有效性。然而，低级细节和高级语义的直接融合将导致细节特征容易被周围上下文信息淹没，即本文中的超调(overshoot)，这限制了现有两个分支模型的准确性的提高。在本文中，我们在卷积神经网络（CNN）和比例积分微分（PID）控制器之间架起了桥梁，并揭示了双分支网络只是一个比例积分（PI）控制器，当然也会存在类似的超调问题。为了解决这个问题，
[论文阅读] 人工智能+软件工程 | 用 LLM + 静态代码分析自动化提升代码质量张较瘦_ 前沿技术论文阅读人工智能软件工程
用LLM+静态代码分析自动化提升代码质量论文信息AugmentingLargeLanguageModelswithStaticCodeAnalysisforAutomatedCodeQualityImprovements@article{abtahi2025augmenting,title={AugmentingLargeLanguageModelswithStaticCodeAnalysisfo
word稿件转化成html格式后图片很模糊是什么原因,你保存的word和pdf文档图片为什么变模糊了？... 测试狗科研服务 word稿件转化成html格式后图片很模糊是什么原因
本文为粉丝原创投稿~科研论文中图片的质量是投稿时的硬性标准，有时候图片质量的高低甚至会成为你的文章能否被接受的关键因素之一。不少老师同学们白天辛辛苦苦做完实验，晚上熬夜分析数据，但由于不会保存图片，导致原始图片丢失或者质量下降，是在是一件非常可惜的事情。尤其是那些喜欢用word和ppt来保存图片的同学，更应该引起注意了。今天要跟大家分享的就是如何保存高质量的图片和文档，简单几招教你轻松搞定SCI编
经典论文阅读《A Framework for Unifying Reordering Transformations》《统一重排序变换的框架》好好学习啊天天向上自动性能优化
1）摘要我们提出了一个用于统一迭代重排序变换的框架，这些变换包括循环交换、循环分布、倾斜、分块、索引集拆分和语句重排序。该框架基于这样一种思想：变换可以表示为将原始迭代空间映射到新迭代空间的调度。框架旨在为变换提供一种统一的表示和推理方式。作为框架的一部分，我们提供了辅助构建和使用调度的算法，特别是用于检验调度合法性、对齐调度以及为调度生成优化代码的算法。2）优化编译器会对语句的迭代进行重新排序，
[论文阅读] 系统架构 | 零售 IT 中的微服务与实时处理：开源工具链与部署策略综述张较瘦_ 前沿技术论文阅读大数据零售
零售IT中的微服务与实时处理：开源工具链与部署策略综述论文信息MicroservicesandReal-TimeProcessinginRetailIT:AReviewofOpen-SourceToolchainsandDeploymentStrategiesAaditaaVashisht(DepartmentofInformationScienceandEngineering,RVCollege
[论文阅读]人工智能 | CoMemo：给大视觉语言模型装个“图像记忆” 张较瘦_ 前沿技术人工智能论文阅读语言模型
【论文速览】CoMemo：给大视觉语言模型装个“图像记忆”论文信息Liu,S.,Su,W.,Zhu,X.,Wang,W.,&Dai,J.(2025).CoMemo:LVLMsNeedImageContextwithImageMemory.arXivpreprintarXiv:2506.06279.一、研究背景：当LVLMs遇到“视觉健忘症”想象一下，你在阅读一本图文并茂的小说时，随着文字篇幅越来越
[论文阅读] 人工智能+软件工程 | 结对编程中的知识转移新图景张较瘦_ 前沿技术人工智能软件工程结对编程
当AI成为编程搭档：结对编程中的知识转移新图景论文信息论文标题：FromDeveloperPairstoAICopilots:AComparativeStudyonKnowledgeTransfer（从开发者结对到AI副驾驶：知识转移的对比研究）作者及机构：AlisaWelter等来自德国萨尔兰大学，ChristofTinnes同时隶属于西门子公司发表平台：arXiv预印本平台发表时间：2025年
【论文阅读笔记】HaDes幻觉检测benchmark zsq 论文分享论文阅读笔记 NLP 大语言模型幻觉
0论文信息题目：AToken-levelReference-freeHallucinationDetectionBenchmarkforFree-formTextGeneration作者：TianyuLiu,YizheZhang,ChrisBrockett,YiMao,ZhifangSui,WeizhuChen,BillDolan会议：ACL，2022链接：https://arxiv.org/ab
论文阅读：Enhancing Retrieval and Managing Retrieval: A Four-Module Synergy for Improved Quality and Ef clvsit RAG 论文阅读 LLM
检索增强生成（RAG）技术利用大型语言模型（LLM）的上下文学习能力，生成更准确、更相关的响应。RAG框架起源于简单的“检索-阅读”方法，现已发展成为高度灵活的模块化范式。其中一个关键组件——查询重写模块，通过生成搜索友好的查询来增强知识检索。这种方法能使输入问题与知识库更紧密地结合起来。作者的研究发现了将QueryRewriter模块增强为QueryRewriter+的机会，即通过生成多个查询来
论文阅读：HySCDG生成式数据处理流程
论文地址:TheChangeYouWantToDetect:SemanticChangeDetectionInEarthObservationWithHybridDataGenerationAbstract摘要内容介绍问题背景“Bi-temporalchangedetectionatscalebasedonVeryHighResolution(VHR)imagesiscrucialforEarth
[论文阅读] 人工智能 | 搜索增强LLMs的用户偏好与性能分析张较瘦_ 前沿技术人工智能论文阅读
【论文解读】SearchArena：搜索增强LLMs的用户偏好与性能分析论文信息作者:MihranMiroyan,Tsung-HanWu,LoganKing等标题:SearchArena:AnalyzingSearch-AugmentedLLMs来源:arXivpreprintarXiv:2506.05334v1,2025一、研究背景：当LLMs需要“上网查资料”时，我们如何评估它？想象你在问AI
[论文阅读] 人工智能 | 如何快速检测LLM生成的代码？这篇论文提出了一个巧妙的方法张较瘦_ 前沿技术人工智能论文阅读
如何快速检测LLM生成的代码？这篇论文提出了一个巧妙的方法论文引文格式@misc{ashkenazi2025zero,title={Zero-ShotDetectionofLLM-GeneratedCodeviaApproximatedTaskConditioning},author={MaorAshkenaziandOfirBrennerandTalFurmanShohetandEranTrei
[论文阅读] 人工智能+软件工程 | 理解GitGoodBench：评估AI代理在Git中表现的新基准张较瘦_ 前沿技术论文阅读人工智能软件工程
理解GitGoodBench：评估AI代理在Git中表现的新基准论文信息GitGoodBench:ANovelBenchmarkForEvaluatingAgenticPerformanceOnGitTobiasLindenbauer,EgorBogomolov,YaroslavZharovCiteas:arXiv:2505.22583[cs.SE]研究背景：当AI走进开发者的协作工具箱在软件开发
[论文阅读] 人工智能+软件工程（软件测试） | 当大语言模型遇上APP测试：SCENGEN如何让手机应用更靠谱张较瘦_ 前沿技术人工智能论文阅读软件工程
当大语言模型遇上APP测试：SCENGEN如何让手机应用更靠谱？一、论文基础信息论文标题：LLM-GuidedScenario-basedGUITesting（《大语言模型引导的基于场景的GUI测试》）作者及机构：ShengchengYu等（德国慕尼黑工业大学、南京大学、同济大学等）发表来源：IEEETransactionsonSoftwareEngineering（IEEE软件工程汇刊）发表时间
[论文阅读] 人工智能+软件工程 | 用大模型优化软件性能张较瘦_ 前沿技术论文阅读人工智能软件工程
用大模型优化软件性能？这篇论文让代码跑出新速度！arXiv:2506.01249SysLLMatic:LargeLanguageModelsareSoftwareSystemOptimizersHuiyunPeng,ArjunGupte,RyanHasler,NicholasJohnEliopoulos,Chien-ChouHo,RishiMantri,LeoDeng,KonstantinLäuf
Enhanced Sparse Model for Blind Deblurring论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
EnhancedSparseModelforBlindDeblurring1.研究目标与意义1.1研究目标1.2实际意义与产业价值2.论文提出的新思路、方法及模型2.1增强稀疏模型（EnhancedSparseModel,lel_ele）模型定义与数学表达闭式解与稀疏性增强机制2.2改进的噪声建模策略噪声拟合函数的构建空间随机性建模2.3整体优化框架与半二次分裂法目标函数设计优化步骤拆分参数设置与
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

《论文阅读13》Efficient Urban-scale Point Clouds Segmentationwith BEV Projection

一、论文

二、论文概要

三、论文全文

你可能感兴趣的:(科研论文,论文阅读)