Skies_

（十二）论文阅读 | 目标检测之CentripetalNet

简介

图1：论文原文

论文是发表在 ${\rm CVPR\ 2020}$ 上的一篇关于目标检测的论文，论文主要是对基于关键点的 ${\rm Anchors﹣Free}$ 检测方法（主要是 ${\rm CornerNet}$ 和 ${\rm CenterNet}$ ）的改进和优化。实验结果为该模型在 ${\rm MS\ COCO}$ 数据集上目标检测的 ${\rm AP}$ 为 ${\rm 48.0\%}$ 、实例分割的 ${\rm MaskAP}$ 为 ${\rm 40.2\%}$ ，在 ${\rm Anchors﹣Free}$ 目标检测方法上达到了 ${\rm SOTA}$ 。
论文原文源码

0. Abstract

基于关键点的目标检测方法取得了不错的结果，但存在的关键点错误匹配问题，极大地影响了检测器的性能。论文提出的 ${\rm CentripetalNet}$ 就是用于解决上述问题，使用向心位移匹配同一目标的角点。该模型预测角点的位置和向心位移，并根据位移的对齐情况匹配角点，这比传统使用的嵌入方法更加有效（可参考 ${\rm CornerNet}$ ，在匹配角点时根据嵌入向量的距离进行匹配）。此外，该模型可通过添加一个 ${\rm mask}$ 分支用于实例分割。

论文贡献：（一）提出一种新的基于关键点的目标检测方法；（二）针对传统关键点配对方法（嵌入向量），提出向心位移概念改善关键点配对；（三）通过添加掩膜分支，模型可以应用于实例分割任务；（四）在 ${\rm Anchors﹣Free}$ 目标检测方法上达到了 ${\rm SOTA}$ ，在实例分割任务上也取得了优异的结果。

1. Introduction

目标检测在视觉任务中应用广泛，但尺度多变、物体变形、物体遮挡仍是一系列挑战。接下来列举了 ${\rm Anchors﹣Based}$ 目标检测方法的不足（在这里不赘述了，前面几篇文章都有提到）。基于关键点匹配的 ${\rm CornerNet}$ 提出一种新的 ${\rm Anchors﹣Free}$ 检测方法，这类方法主要分为检测关键点和关键点匹配两个步骤。而论文提出的 ${\rm CentripetalNet}$ 致力于改善关键点匹配。

传统用于关键点匹配的方法主要是关联嵌入，模型为每个角点预测一个嵌入向量，然后根据嵌入向量的距离匹配角点。期间，如果两个角点来自于同一个目标，则它们的距离相近。但是这类方法也存在不足：（1）在训练过程中使用 ${\rm pull}$ 损失将属于同一目标的角点对推进、使用 ${\rm push}$ 损失将属于不同目标的角点对拉开，这样，模型在训练过程中实际是在寻找唯一匹配的角点对。这使得模型对噪声点高度敏感，并且在一幅图像中有多个相似对象时，训练难度将急剧增加；（2）基于关联嵌入的方法仅利用目标的表观特征，而没有使用位置信息。如下图：

图2：各模型检测结果对比

上图中目标相似且密集， ${\rm CornerNet}$ 基于目标表观特征匹配角点对产生了许多错误的结果， ${\rm CenterNet}$ 利用中心关键点辅助角点的匹配减少了许多错误，但仍无法适应目标密集的场景。图 ${\rm (c)}$ 中 ${\rm CentripetalNet}$ 很好解决了上述问题。

论文提出一种新的关键点匹配方法，利用向心位移完成角点匹配，同时使用 ${\rm cross﹣star}$ 可变形卷积模块改善向心位移的生成。简单地说，给定角点对，定义一个二维的位移向量表示对中心点的偏移。这样，每个角点可以基于向心位移生成一个中心点。如果两个角点属于同一个目标，则由它们产生的中心点位置应该很接近。则可以通过生成的中心点与几何中心点的距离衡量匹配结果（这里使用了边界框的位置信息）。此外，论文还提出一种 ${\rm cross﹣star}$ 可变形卷积模块，不仅可以获得较大的感受野，还能学习 ${\rm cross﹣star}$ 的几何结构（这里不清楚的话看下面 $(3.2)$ 部分）。

2. Related Work

相关工作部分首先介绍了 ${\rm Anchors﹣Based}$ 目标检测方法，如 ${\rm R﹣CNN}$ 系列、 ${\rm SSD}$ 、 ${\rm YOLO}$ 系列、 ${\rm Retina}$ ${\rm ﹣Net}$ 、 ${\rm RefineDet}$ 等，然后介绍了 ${\rm Anchors﹣Free}$ 目标检测方法，如 ${\rm DenseBox}$ 、 ${\rm UnitBox}$ 、 ${\rm FCOS}$ 、 ${\rm Cor}$ ${\rm﹣nerNet}$ 、 ${\rm ExtremeNet}$ 、 ${\rm RepPoints}$ 、 ${\rm CenterNet}$ 等。

3. CentripetalNet

首先来看一下模型的整体结构：

图3：模型整体结构

由图可知，该模型一共由 $4$ 个模块组成：角点检测模块、向心位移模块、 ${\rm cross﹣star}$ 可变形卷积模块、用于实例分割的掩膜模块。大体流程是：首先基于 ${\rm CornerNet}$ 产生候选角点，根据向心位移算法获得高质量的角点对，然后根据角点对生成目标边界框；接着使用 ${\rm cross﹣star}$ 可变形卷积模块进行特征适配以丰富角点位置处的视觉特征；最后使用掩膜分支改善检测结果，同时产生实例分割结果。接下来详细说明每个模块（角点检测模块这里不做说明，具体内容可查看CornerNet）：

3.1 Centripetal Shift Module

${\rm Centripetal\ Shift}$ ，对于边界框 $bbox^i=(tlx^i,tly^i,brx^i,bry^i)$ ，其几何中心为 $(ctx^i,cty^i)=(\frac{tlx^i+brx^i}{2},\frac{tly^i+bry^i}{2})$ 。定义左上角点和右下角点的向心位移为： $cs_{tl}^i=(log(\frac{ctx^i-tlx^i}{s}),log(\frac{cty^i-tly^i}{s}))\\ cs_{br}^i=(log(\frac{brx^i-ctx^i}{s}),log(\frac{bry^i-cty^i}{s}))\tag{3.1}$

这里使用 $l o g$ 函数控制数据的范围， $s$ 为超参数。

在训练过程中，使用 ${\rm SmoothL1}$ 损失函数对向心位移的预测优化： $L_{cs}=\frac{1}{N}\sum_{k=1}^{N}[L_1(cs_{tl}^k,\hat{cs}_{tl}^k)+L_1(cs_{br}^k,\hat{cs}_{br}^k)]\tag{3.2}$

其中 $cs_*^k$ 和 $\hat{cs}_*^k$ 分别表示标注框和候选框的向心位移， $N$ 表示一幅图形中目标的数量。

${\rm Corner\ Matching}$ ，上面部分提到的向心位移的定义，以及如何使用损失函数对向心位移的预测优化，以达到对角点预测的优化，下面部分就介绍如何对检测的角点进行匹配。论文利用向心位移及其位置信息匹配角点。直观上，如何一对角点来自同一个边界框，它们应共享边界框的中心区域。如图：

图4：边界框预测相关

如图 ${\rm (a)}$ ，由于原图上的点和特征图上的点相互映射回存在偏差，这里定义 $O_{tl}$ 和 $O_{br}$ 分别表示左上角和右下角的偏差（这里整数点为特征图映射到原图结果，由于通常采用 $(\lfloor\frac{x}{s}\rfloor*s,\lfloor\frac{y}{s}\rfloor*s)$ 的形式，所以会造成精度的丢失）。 $e^{cs_{tl}}$ 和 $e^{cs_{br}}$ 分别表示左上和右下的向心位移取指数，这里取指数是为了后面便于求梯度时的导数。边界框中心由红色点标注；
如图 ${\rm (b)}$ ， $δ$ 定义为标注框的角点与边界框中心点的偏移；
如图 ${\rm (c)}$ ，我们可以从预测的角点位置和向心位移得到其相应的中心，由此可以判断一对角点的中心是否足够靠近由角点对组成的边界框的中心区域；
对比图 ${\rm (a)}$ 和 ${\rm (c)}$ ，模型预测的向心位移 $e^{\hat{cs}_{tl}}$ 和 $e^{\hat{cs}_{br}}$ 所指向的中心点分别为蓝色点和绿色点，处于红色点所规定的红色区域内。则判定本次预测的角点有效。

这里，如果由角点热图和局部偏移热图得到的角点满足以下条件，且判断为同一类别，则可以构成边界框： $t l x ＜ b r x ∧ t l y < b r y tlx＜brx∧tly。对于每个边界框 b b o x j bbox^j ，其置信度定义为每个角点置信度的几何平均。由上图中的 ( c ) {\rm (c)} ，中心区域定义为 R c e n t r a l = { ( x , y ) ∣ x ∈ [ c t l x , c b r x ] , y ∈ [ c t l y , c b r y ] } (3.3) R_{central}=\{(x,y)|x∈[ctlx,cbrx],y∈[ctly,cbry]\}\tag{3.3}$

且由以下等式计算：
$\left\{ \begin{aligned} &ctlx=\frac{tlx+brx}{2}-\frac{brx-tlx}{2}μ\\ &ctly=\frac{tly+bry}{2}-\frac{bry-tly}{2}μ\\ &cbrx=\frac{tlx+brx}{2}+\frac{brx-tlx}{2}μ\\ &cbry=\frac{tly+bry}{2}+\frac{bry-tly}{2}μ\\ \end{aligned} \right.\tag{3.4}$

其中 $0 < μ \leq 1$ ，用于控制中心区域的大小， $- / + * μ$ 部分相当于对于中心点的偏移。且基于向心位移，可以计算左上角点和右下角点的中心点 $tl_{ctx},tl_{cty})$ 和 $br_{ctx},br_{cty})$ 。

然后对每个满足条件 $(tl_{ctx}^j,tl_{cty}^j)∈R^j_{central} ∧(br_{ctx}^j,br_{cty}^j)∈R^j_{central}$ 的边界框计算权重 $w^j$ （即满足角点对的中心点均位于边界框的中心区域内）： $w^j=e^{-\frac{|br^j_{ctx}-tl^j_{ctx}||br^j_{cty}-tl^j_{cty}|}{(cbrx^j-ctlx^j)(cbry^j-ctly^j)}}\tag{3.5}$

上述等式是 $e^{-x}$ 是一个减函数，其中指数部分的分母是一个定值，由标注框决定。分母是所得的候选角点对中心点横纵坐标差的绝对值乘积。则上述等式表示如果回归的中心点越接近，其权重越大。对于其他不满足条件的边界框，令 $w^j=0$ 。

3.2 Cross-Star Deformable Convolution

基于 ${\rm corner\ pooling}$ 会产生一些 ${\rm cross\ stars}$ （这里译作交叉点， ${\rm corner\ pooling}$ 的相关知识可参考这里），如图 ${\rm (a)}$ ：

图5：cross stars

由于交叉点通过取最大值和求和得到，其包含了目标丰富的上下文信息。为了捕捉上下文信息，不仅需要一个较大的感受野，还需要学习交叉点的几何结构信息。基于此，论文提出 ${\rm cross﹣star}$ 可变形卷积模块，用于增加角点的视觉特征。如图 $3$ ，首先，该模块以中心池化的结果作为输入。为了学习交叉点的几何结构信息，作者使用相应目标的大小指导偏移图的生成（偏移图是 ${\rm DCN}$ 中的概念，是一个可学习的分支，用于确定卷积核的形状）。

以左上角点为例，模型应该忽略交叉点的左上区域（由于该区域在目标外）。由此，给模型嵌入一个引导偏移，由图 $4$ 的 ${\rm (b)}$ 所示，该偏移从角点到中心点。对于偏移图来说，它既包含了边界框的形状信息，也包含其方向信息（在偏移图中的方向信息可以引导角点和向心位移生成相应的中心点）。

如图 $3$ ，偏移图由三个卷积层构成。前两个卷积层以中心池化的输出为输入，通过以下损失函数优化： $L_δ=\frac{1}{N}\sum_{k=1}{N}[L_1(δ_{tl},\hat{δ}_{tl})+L_1(δ_{br},\hat{δ}_{br})]\tag{3.6}$

其中， $δ$ 由如下方式定义： $δ_{tl}^i=(\frac{ctx^i}{s}-\lfloor\frac{tlx^i}{s}\rfloor,\frac{cty^i}{s}-\lfloor\frac{tly^i}{s}\rfloor)\tag{3.7}$

前两个卷积层的输出为引导偏移。第三个卷积层的输入为引导偏移，输出为偏移图。下图是不同方法得到的采样点：

图6：cross stars

上图中 ${\rm (a)}$ 为标准 ${\rm DCN}$ 的采样结果； ${\rm (b)}$ 为 ${\rm RoI}$ 卷积的结果； ${\rm (c)}$ 为论文提出的 ${\rm cross﹣star}$ 可变形卷积的结果。由图对比可知，论文方法可以有效获得交叉点的几何信息和提取交叉点的边缘。

3.3 Instance Mask Head

这部分介绍如何通过模型得到实例分割结果。如图 $3$ ，掩码模块将送入 ${\rm soft﹣NMS}$ 前的检测结果作为实例分割的候选区域，然后采用 ${\rm FCN}$ 对候选区域处理得到目标掩膜。具体而言，为了得到候选区域，首先预训练几个 ${\rm epoch}$ 的 ${\rm CentripetalNet}$ 产生一系列候选框。接着取分数前 $k$ 的候选框作为 ${\rm RoIAlign}$ 的输入。然后，如图 $3$ ，通过一系列的卷积核反卷积操作，最终得到一个 $28 \times 28$ 大小的掩膜。这里，使用损失函数 $L_{mask}$ 优化掩膜 $\hat{m}_i$ 的生成： $L_{mask}=\frac{1}{N}\sum_{k=1}^{N}CE(m_i,\hat{m}_i)\tag{3.8}$

4. Experiments

综合以上，最终训练过程中的损失函数定义为： $L=L_{det}+L_{off}+αL_δ+L_{cs}+L_{mask}\tag{4.1}$

其中， $L_{det}$ 和 $L_{off}$ 的定义来自CornerNet， $α$ 为平衡系数。

以下是在目标检测模型中精度的对比：

图7：目标检测实验结果对比

以下是在实例分割模型中精度的对比：

图8：实例分割实验结果对比

原文实验部分，还给出了训练和推理过程的实施细节。此外，针对其提出的几个模块做了一系列消融实验，包括向心位移模块、 ${\rm cross﹣star}$ 可变形卷积模块、用于实例分割的掩膜模块。详细内容请查看原文。

5. Conclusion

论文提出一种新的基于关键点的目标检测方法， ${\rm CentripetalNet}$ 。首先，关键点检测基于 ${\rm CornerNet}$ ，然后提出向心位移的概念改善关键点的配对。最后，充分利用中心池化产生的交叉点，获取角点的几何结构信息，改善模型的检测结果。同时，通过添加一个掩膜分支，模型可以应用于实例分割中。
总的来说，自 ${\rm CornerNet}$ 出现以来，出现了大量基于关键点的检测方法。有基于三关键点的检测方法（如 ${\rm CenterNet﹣Triplets}$ ），基于中心关键的检测方法（如 ${\rm CenterNet﹣Points}$ ），基于多关键点的检测方法（如 ${\rm ExtremeNet}$ ）。对这类算法的改进首先是优化关键点的生成（大多是基于人体姿态估计的思路，通过 ${\rm Hourglass}$ 生成热图，通过热图峰值得到候选关键点），然后是关键点的配对算法（传统使用的嵌入向量方法及本文提出的方法），最后是边界框的生成方法（如何通过关键点回归边界框）。

由于没有阅读源码，本文只总结了 ${\rm CentripetalNet}$ 的大体结构和信息，详细内容请阅读论文原文。

参考

Dong Z, Li G, Liao Y, et al. CentripetalNet: Pursuing High-quality Keypoint Pairs for Object Detection[J]. arXiv preprint arXiv:2003.09119, 2020.

完

【LLM论文阅读】一只齐刘海的猫论文阅读
LLM论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN:ExtendingContextWindowofLLMs论文YaRN笔记T5ExploringtheLimitsofTransferLearningwithaUnifiedText-to-Te
Segment Anything in High Quality之SAM-HQ论文阅读 qq_41627642 深度学习论文阅读论文阅读
摘要最近的SegmentAnythingModel（SAM）在扩展分割模型规模方面取得了重大突破，具备强大的零样本能力和灵活的提示机制。尽管SAM在训练时使用了11亿个掩码，其掩码预测质量在许多情况下仍不理想，尤其是对于结构复杂的目标。我们提出了HQ-SAM，使SAM能够精确地分割任意目标，同时保留其原有的可提示设计、高效性和零样本泛化能力。我们的设计充分复用并保留了SAM预训练的模型权重，仅引入
yolov算法详解_yolo 目标检测算法个人总结（yolov1） CHAO JIANG yolov算法详解
yolo目标检测算法个人总结目前yolo目标检测有两个版本，分别为v1和v2。因工作需要用yolo算法检测人物，所以这段时间重点看了这两篇论文，并实现了对应的tensorflow代码。这里记录下在论文阅读过程中的一些细节信息，留给自己，同时也希望各位能指出本人理解错误的地方，谢谢！一：yolov1关于yolov1算法的详解在网上已经非常多了，在这里我大概叙述下算法的流程，以及在开发过程中遇到的一些
《论文阅读》GPT-3是否会产生移情对话？一种新的情境示例选择方法和用于生成同理心对话的自动评估度量 ICCL 2022 365JHWZGo 情感对话论文阅读 gpt-3 共情回复上下文学习提示学习大模型
《论文阅读》GPT-3是否会产生移情对话？一种新的情境示例选择方法和用于生成同理心对话的自动评估度量ICCL2022前言贡献PromptIn-contextlearningSITSMEMOSITSM新的自动指标实验前言亲身阅读感受分享，细节画图解释，再也不用担心看不懂论文啦~无抄袭，无复制，纯手工敲击键盘~今天为大家带来的是《DoesGPT-3GenerateEmpatheticDialogues
[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
Learning Fully Convolutional Networks for Iterative Non-blind Deconvolution论文阅读青铜锁00 #退化论文阅读深度学习论文阅读图像处理
LearningFullyConvolutionalNetworksforIterativeNon-blindDeconvolution1.研究目标与实际问题1.1研究目标1.2实际意义2.创新方法与模型设计2.1核心框架：迭代式梯度域处理2.1.1模型架构2.2关键技术实现2.2.1梯度域去噪网络2.2.2解卷积模块（核心公式实现）2.2.3损失函数设计2.2.4超参数端到端学习2.3与传统方法
KAIST数据集及使用草莓奶忻 SLAM基础 #SLAM数据集 ubuntu
文章目录KAIST复杂城市数据集KAIST数据集转换为rosbag1.将.gz.tar文件解压到其文件夹中2.克隆并构建此存储库3.使用路径和所需主题编辑配置文件4.为每种传感器类型创建一个rosbag文件5.将所有bag合并为一个参考KAIST复杂城市数据集KAIST-Urban-数据集-论文阅读数据集下载：ComplexUrbanDataset复杂城市数据集KAIST数据集转换为rosbag1
[论文阅读] 软件工程 | 需求工程中领域知识研究：系统映射与创新突破张较瘦_ 前沿技术论文阅读软件工程
需求工程中领域知识研究：系统映射与创新突破论文信息DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyarXiv:2506.20754DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyMarinaAraújo,JúliaAraújo,RomeuO
论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
[论文阅读] 软件工程 | 探索软件生态系统中的开发者体验关键因素
探索软件生态系统中的开发者体验关键因素：从研究到实践引文格式@article{Zacarias2025,title={ExploringDeveloperExperienceFactorsinSoftwareEcosystems},author={Zacarias,RodrigoOliveiraandAntunes,L{\'e}oCarvalhoRamosandBarros,M{\'a}rciod
Fast Image Deconvolution using Hyper-Laplacian Priors论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
FastImageDeconvolutionusingHyper-LaplacianPriors1.论文的研究目标与实际意义2.论文的创新方法2.1核心框架：交替最小化（AlternatingMinimization）2.2x子问题：频域FFT加速2.3w子问题：高效求解的核心创新2.3.1问题形式2.3.2查找表法（LUT）2.3.3解析解法（特定α\alphaα）2.3.4通用α\alphaα
[论文阅读] 人工智能 + 软件工程 | AI 与敏捷开发的破局之路：从挫败到成功的工作坊纪实张较瘦_ 前沿技术论文阅读人工智能软件工程
AI与敏捷开发的破局之路：从挫败到成功的工作坊纪实论文信息arXiv:2506.20159AIandAgileSoftwareDevelopment:FromFrustrationtoSuccess–XP2025WorkshopSummaryTomasHerda,VictoriaPichler,ZheyingZhang,PekkaAbrahamsson,GeirK.HanssenSubjects:
Diff-Retinex: Rethinking Low-light Image Enhancement with A Generative Diffusion Model 论文阅读钟屿论文阅读人工智能深度学习学习图像处理计算机视觉
Diff-Retinex：用生成式扩散模型重新思考低光照图像增强摘要本文中，我们重新思考了低光照图像增强任务，并提出了一种物理可解释的生成式扩散模型，称为Diff-Retinex。我们的目标是整合物理模型和生成网络的优点。此外，我们希望通过生成网络补充甚至推断低光照图像中缺失的信息。因此，Diff-Retinex将低光照图像增强问题表述为Retinex分解和条件图像生成。在Retinex分解中，我
【论文阅读】人工智能在直升机航空电子系统中的应用肥鼠路易论文阅读人工智能航空电子系统应用
人工智能在直升机航空电子系统中的应用论文摘要文章结构参考文献论文摘要论文摘要:在现代战争形势日趋信息化、智能化的背景下，将人工智能应用于武器装备已经是大势所趋。针对直升机飞行任务的特征，对其发展状况进行了描述，并对其作业能力进行了分析，探索了人工智能技术在直升机航电系统中的应用方向，为推进人工智能在直升机上的转化与应用奠定基础。通过对国外先进直升机智能技术的运用现状及对其作业能力的要求进行分析，探
[论文阅读] 人工智能+软件工程 | 用大语言模型架起软件需求形式化的桥梁张较瘦_ 前沿技术人工智能论文阅读软件工程
用大语言模型架起软件需求形式化的桥梁：一篇ACM调查草案的深度解读论文信息arXiv:2506.14627ACMSurveyDraftonFormalisingSoftwareRequirementswithLargeLanguageModelsArshadBeg,DiarmuidO’Donoghue,RosemaryMonahanComments:22pages.6summarytablesSu
Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model论文阅读青铜锁00 深度学习论文阅读 #退化论文阅读
Reti-Diff:IlluminationDegradationImageRestorationwithRetinex-basedLatentDiffusionModel1.研究目标与实际意义1.1研究目标1.2实际意义2.创新方法与模型设计2.1整体框架2.2RetinexPriorExtraction(RPE)模块2.2.1Retinex分解2.2.2先验压缩2.3Retinex-guide
SIMPL论文阅读 ZHANG8023ZHEN 论文阅读
论文链接：https://arxiv.org/pdf/2402.02519文章还没细看，但主要贡献点应该是SymmetricFusionTransformer和Bezier-basedMotionDecoder.对Bezier-basedMotionDecoder比较感兴趣，之后对这块细看一下
【论文阅读笔记】《CodeS: Towards Building Open-source Language Models for Text-to-SQL 》柠石榴 text2sql 论文论文阅读笔记语言模型
文章目录一、论文基本信息1.文章标题2.所属刊物/会议3.发表年份4.作者列表5.发表单位二、摘要三、解决问题四、创新点五、自己的见解和感想六、研究背景七、研究方法模型实验数据评估指标八、总结九、相关重要文献一、论文基本信息1.文章标题CodeS:TowardsBuildingOpen-sourceLanguageModelsforText-to-SQL2.所属刊物/会议未明确标注（会议缩写为“C
agentformer论文阅读 ZHANG8023ZHEN 论文阅读
参考了这篇博文：https://zhuanlan.zhihu.com/p/512764984主要有这几个部分a.map_encoderi.对地图进行CNNb.ContextEncoderi.timeencoder–将时间信息用transformer和positionemb进行融合，加入到特征中ii.agent-awareattention–self和selfattentionother和other
【论文阅读】DynamicControl ：一种新的controlnet多条件控制方法 prinTao pytorch Diffusion 论文阅读
背景现有方法要么处理条件效率低下，要么使用固定数量的条件，这并不能完全解决多个条件的复杂性及其潜在冲突。这强调了需要创新方法来有效管理多种条件，以实现更可靠和详细的图像合成。为了解决这个问题，我们提出了一个新的框架DynamicControl，它支持不同控制信号的动态组合，允许自适应选择不同数量和类型的条件。本文方法从一个双循环控制器开始，它通过利用预先训练的条件生成模型和判别模型为所有输入条件生
论文阅读：2018 arxiv CrowdHuman: A Benchmark for Detecting Human in a Crowd CSPhD-winston-杨帆论文阅读
https://www.doubao.com/chat/9226473480559618https://arxiv.org/pdf/1805.00123CrowdHuman:ABenchmarkforDetectingHumaninaCrowd文章目录论文翻译CrowdHuman：用于检测人群中人体的基准摘要1.引言2.相关工作2.1.人体检测数据集2.2.人体检测框架。论文翻译CrowdHuma
论文阅读：arxiv 2025 OThink-R1: Intrinsic Fast/Slow Thinking Mode Switching for Over-Reasoning Mitigation CSPhD-winston-杨帆论文阅读
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://www.doubao.com/chat/8815924393371650https://arxiv.org/pdf/2506.02397#page=17.09OThink文章目录速览研究背景与问题核心思路与方法实验结果结论与意义速览这篇论文聚焦于
论文阅读：arxiv 2025 Not All Tokens Are What You Need In Thinking
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://arxiv.org/pdf/2505.17827https://www.doubao.com/chat/8814790364572162文章目录速览研究背景提出的解决方案：条件token选择（CTS）实验结果核心贡献研究局限总结速览这篇论文主要探
[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers 颜笑晏晏论文阅读
1.摘要双分支网络结构已显示出其对实时语义分割任务的效率性和有效性。然而，低级细节和高级语义的直接融合将导致细节特征容易被周围上下文信息淹没，即本文中的超调(overshoot)，这限制了现有两个分支模型的准确性的提高。在本文中，我们在卷积神经网络（CNN）和比例积分微分（PID）控制器之间架起了桥梁，并揭示了双分支网络只是一个比例积分（PI）控制器，当然也会存在类似的超调问题。为了解决这个问题，
[论文阅读] 人工智能+软件工程 | 用 LLM + 静态代码分析自动化提升代码质量张较瘦_ 前沿技术论文阅读人工智能软件工程
用LLM+静态代码分析自动化提升代码质量论文信息AugmentingLargeLanguageModelswithStaticCodeAnalysisforAutomatedCodeQualityImprovements@article{abtahi2025augmenting,title={AugmentingLargeLanguageModelswithStaticCodeAnalysisfo
经典论文阅读《A Framework for Unifying Reordering Transformations》《统一重排序变换的框架》好好学习啊天天向上自动性能优化
1）摘要我们提出了一个用于统一迭代重排序变换的框架，这些变换包括循环交换、循环分布、倾斜、分块、索引集拆分和语句重排序。该框架基于这样一种思想：变换可以表示为将原始迭代空间映射到新迭代空间的调度。框架旨在为变换提供一种统一的表示和推理方式。作为框架的一部分，我们提供了辅助构建和使用调度的算法，特别是用于检验调度合法性、对齐调度以及为调度生成优化代码的算法。2）优化编译器会对语句的迭代进行重新排序，
[论文阅读] 系统架构 | 零售 IT 中的微服务与实时处理：开源工具链与部署策略综述张较瘦_ 前沿技术论文阅读大数据零售
零售IT中的微服务与实时处理：开源工具链与部署策略综述论文信息MicroservicesandReal-TimeProcessinginRetailIT:AReviewofOpen-SourceToolchainsandDeploymentStrategiesAaditaaVashisht(DepartmentofInformationScienceandEngineering,RVCollege
[论文阅读]人工智能 | CoMemo：给大视觉语言模型装个“图像记忆” 张较瘦_ 前沿技术人工智能论文阅读语言模型
【论文速览】CoMemo：给大视觉语言模型装个“图像记忆”论文信息Liu,S.,Su,W.,Zhu,X.,Wang,W.,&Dai,J.(2025).CoMemo:LVLMsNeedImageContextwithImageMemory.arXivpreprintarXiv:2506.06279.一、研究背景：当LVLMs遇到“视觉健忘症”想象一下，你在阅读一本图文并茂的小说时，随着文字篇幅越来越
[论文阅读] 人工智能+软件工程 | 结对编程中的知识转移新图景张较瘦_ 前沿技术人工智能软件工程结对编程
当AI成为编程搭档：结对编程中的知识转移新图景论文信息论文标题：FromDeveloperPairstoAICopilots:AComparativeStudyonKnowledgeTransfer（从开发者结对到AI副驾驶：知识转移的对比研究）作者及机构：AlisaWelter等来自德国萨尔兰大学，ChristofTinnes同时隶属于西门子公司发表平台：arXiv预印本平台发表时间：2025年
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round