live_for_myself

论文阅读：EasyMesh: An efficient method to reconstruct 3D mesh from a single image

文章目录

- - Abstract
  - Introduction
  - Related work
  - - 3D 视觉中的生成对抗网络。
    - 3D shape reconstruction
  - Method description
  - - 3D shape generator
    - 3D shape discriminator
    - Viewpoint estimation（视点估计）
    - 剪影图像重新渲染 (Silhouette image re-rendering)
    - 从几何图像重建表面（Surface reconstruction from geometry image）

Abstract

本文提出了一种有效解决此问题的新方法，通过使用专门设计的 GAN 模型将给定的自然图像映射到几何图像，从中可以重建相应的 3D 网格。具体来说，是将视点估计（viewpoint estimation）和 3D 重建任务分开，确保重建网络专注于生成具有准确视点信息的生动 3D 网格。
作者还添加了一个可微分模块来为合成的几何图像从不同的视角创建轮廓（add a differentiable module to create silhouettes from various viewpoints for the synthesized geometry image），旨在提高生成的 3D 模型与其输入的 2D 图像之间的一致性。
此外，作者为几何图像设计了一个紧凑但有效的鉴别器，以保证生成对象的整体轮廓合理。

Introduction

关于点云（point clouds）点云
从单个自然图像重建完整的 3D 模型现在仍然是一个具有挑战性和持续性的问题。
传统的 3D 形状重建方法通常基于预定义的模板，并通过从源数据库中检索和组装相似的零件或对象来生成 3D 模型（Chaudhuri 等人，2011 年；Kalogerakis 等人，2012 年）。尽管生成的 3D 模型质量很高，但这种方法仅限于重新组合现有部件，无法合成他们从未见过的新对象。

基于深度学习的方法可以对新型 3D 形状的不确定性进行建模。大多数基于深度神经网络的现有作品都将Voxels (三维像素)作为 3D 形状的表示，并采用体积卷积网络（volumetric convolutional networks）进行形状合成（Girdhar 等，2016；Wu 等，2016；Yan 等，2016）。

然而，由于额外的维度，体积卷积操作比二维卷积占用更多的内存，这限制了体积分辨率的扩展。此外，体积表示是信息稀疏的。体积卷积花费昂贵的计算资源来处理表面内无用的信息是低效的。一些研究人员试图避免体积表示并从多个视点渲染深度图像（avoid volumetric representation and render depth images from multiple viewpoints）（Soltani 等人，2017 年；Lin 等人，2017 年）。尽管这些方法通常很有效，但从预测的深度图像重建的 3D 形状很容易在空间周围散布噪声点。
这主要是由于视点估计和深度图像渲染的纠缠过程造成的（This is mainly caused by the entangled process of viewpoint estimation and depth image rendering）。
在没有用于监督的视点信息的情况下，很难从其他训练资源中精确地预测给定视点上的深度图像。
也存在一些直接处理点云（point clouds）的生成方法。

然而，这些方法生成的 3D 形状（Fan et al., 2017）通常在表面上缺乏平滑度，这使得很难转换为网格。最近提出的 Pixel2Mesh（Wang et al., 2018）采用复杂的图形网络从单个图像中恢复 3D 网格。
Pixel2Mesh++ (Wen et al., 2019) 进一步结合了来自多个视图的信息，并使用图形卷积网络稍微调整了点云的坐标。尽管具有生成高质量网格的能力，但它需要预先定义点和边之间的关系，这使得它不太灵活。此外，训练需要自然图像的配对数据及其相应的 3D 形状，这使得构建具有满意样本的大型存储库变得非常重要。

在本文中，作者提出了一种从单个自然图像重建 3D 网格的两阶段方法。在第一阶段对对象的轮廓进行分割，并将其馈送到第二阶段的网格重建网络。两个阶段的分离训练过程不再需要配对的 3D 对象和自然图像。
这两个数据集都很容易获取，作者认为这有利于每个阶段的训练过程，同时不会降低泛化能力。
作者考虑另一种表示，几何图像（Gu 等人，2002 年；Sinha 等人，2016 年），用于 3D 网格生成。
给定一个 3D 对象，相应的几何图像对表面上采样的点的坐标进行编码（the corresponding geometry image encodes the coordinates of points sampled on the surface)，这本质上是一种类似图像格式的点云的特殊排列。
通过这种方式，可以将2D 卷积操作应用于几何图像，避免体积卷积或复杂图卷积的昂贵计算成本。

作者结合了视点估计和轮廓重新渲染模块（incorporate the viewpoint estimation and silhouette re-rendering modules），使生成的 3D 形状与输入图像重合。此外，在表面上定义了几个新的损失，以确保生成的网格模型的平滑性和连续性。

与其他最先进的 3D 重建方法相比，定性和定量评估都证明了此方法的优越性。

本文的主要贡献有三方面：

首先，提出了一种新颖的两阶段方法来从单个自然图像重建 3D 网格。
其次，设计了一个高效的 3D 形状特征提取器作为鉴别器。
第三，结合视点估计和轮廓渲染模块来强制生成的 3D 形状和输入图像之间的一致性

Related work

3D 视觉中的生成对抗网络。

对于 3D 形状生成问题，很少有方法引入鉴别器。
3D-GAN（Wu et al., 2016）是第一个采用 GAN 架构并将低维噪声向量映射到 3D 模型空间的方法。
PrGAN(Gadelha et al., 2017) 添加了一个额外的投影仪来从生成的 3D 体积渲染 2D 图像，它的鉴别器将生成的图像与真实图像区分开来。

朱等人。 (2018) 训练了一个由图像增强器、3D 模型生成器和两个分别对图像和 3D 模型进行操作的鉴别器组成的两分支模型。上述方法合成 3D 体积，不能表示准确的几何体。
其他格式，例如网格，很难被神经网络处理，因为表面很难表示和输入网络。

本文利用在几何图像上操作的 2D 卷积，它有效地编码点的坐标并以类似图像的格式排列点云。此外，3D 形状特征提取器专为几何图像而设计，可作为鉴别器来增强 3D 形状细节。（we leverage 2D convolutions operated on the geometry image, which efficiently encode coordinates of points and arrange the point cloud in an image-like format. Furthermore, a 3D shape feature extractor is specifically designed for geometry images and serves as the discriminator to enhance 3D shape details.）

3D shape reconstruction

尽管基于多视图几何（multi-view geometry）的 3D 重建已经取得了很大的进步，例如 SLAM（Fuentes-Pacheco 等，2015），但研究人员对从单个图像生成 3D 形状越来越感兴趣。
由于遮挡，单个图像显然无法覆盖 3D 对象的整个形状信息。
基于深度学习的方法模拟 3D 存储库的数据分布，并显示出强大的建模不确定性和预测对象不可见部分的能力。

一些先驱作品（Choy 等人，2016 年；Girdhar 等人，2016 年）将底层 3D 对象预测为 3D 体积(predicted the underlying 3D object as 3D volume)，通常仅限于 32 ×32 ×32 的低分辨率，丢弃了详细信息。后期作品探索了各种格式来表示 3D 模型。范等人(2017) 提出了一种合成点云的网络，并使用距离度量损失（即倒角距离或 EM 距离损失）来训练网络(proposed a fancy network synthesizing point clouds and trained the network with a distance metric loss)，其时间复杂度与点数的平方成正比，在训练时表现出低效率。邹等人。 (2017) 制作了许多不同比例和旋转角度的图元，并按顺序组装它们以构建结构简单的对象。也有一些工作可以预测多个给定视点的深度图像（Soltani et al., 2017; Lin et al., 2017）。尽管可以有效地训练这些方法，但预测深度图像的实际视点很难精确地聚焦在所需的视点上。
因此，当从深度图像重建点云时，经常会发生错位。

许多工作专注于生成 3D 网格模型而不是点云或体素（Groueix 等人，2018 年；Kato 等人，2018 年；Liu 等人，2019 年）。先驱工作 Pixel2Mesh(Wang et al., 2018) 直接预测点云的坐标，并利用预先定义的点和网格之间的关系重建表面。
与 Pixel2Mesh 相比，作者取得了可比的结果，具有两个优势。

一方面，我们不需要成对的 3D 形状和相应的自然图像，这简化了收集包含对齐对的大型存储库的要求。
另一方面，避免了点之间复杂邻接关系的定义，因此可以使用灵活简单的方法从预测的几何图像重建光滑表面。

Method description

作者方法的目标是通过使用深度神经网络合成的几何图像，从单个自然图像重建高质量的 3D 网格模型。
图 2 说明了模型的整体流程，它由以下两个阶段组成。

第一阶段包含一个现成的语义分割网络 Deeplab v3+（Chen et al., 2018），它能够从给定的自然图像中精确提取对象的轮廓。（就是对于每个像素的分类， logits是网络的输出，logits.shape=(batch_size, w, h, 21)，21类语义标签。）
然后，将轮廓图像输入到第二部分以生成 3D 模型。
作者没有以端到端的方式训练整个模型，即直接将自然图像转换为 3D 形状，而是分别训练这两个部分，因为我们发现很难获得包含大量 3D 模型的数据集作为它们对应的自然图像。

作者的 3D 形状重建模型的细节如下：

3D shape generator

作者的 3D 形状生成器包含一个图像编码器和一个 3D 形状转换网络，可将输入轮廓图像映射到其相应的几何图像。在介绍主干之前，先简单分析一下几何图像的属性。
几何图像包含 3 个通道（channels），分别对应点的 x、y、z 坐标。几何图像中的像素代表 3D 空间中的一个点。此外，几何图像中的相邻像素在 3D 点云中保持其相邻关系。
基于这一观察，可以应用卷积相关操作来捕捉局部形状结构。
作者的图像编码器包括 3 个通道大小为 {32, 64, 96}、内核大小为 3 ×3 的残差块和两个 3 ×3 步长为 2 的卷积操作，将分辨率为 64 ×64 的输入轮廓图像嵌入到一个紧凑的特征空间中。（Our image encoder includes 3 residual blocks with channel size {32, 64, 96}, kernel size 3 ×3 and two 3 ×3 convolutional operations with stride 2, embedding the input silhouette image whose resolution is 64 ×64into a compact feature space.）
这些编码特征包含对象的形状信息，并引导形状变换网络生成所需的 3D 形状。形状变换网络不是直接将紧凑的特征向量解码为 3D 形状，而是从小尺寸的几何图像开始。
初始几何图像大小为 16 × 16 × 3，对应于在单位球表面均匀采样的 256 个点。（The initial geometry image is of size 16 ×16 ×3and corresponds to 256 points that are uniformly sampled on the surface of a unit ball）
我们采用由粗到细的策略，通过编码器的交互引导将初始几何图像逐渐雕刻成目标形状。
形状变换网络包含两个交替操作：形状变形和点增强
在形状变形步骤中，模型结合来自图像编码器的形状信息并提取附加到每个点的特征以向目标形状变形
在点增强步骤中，我们结合对几何图像的双线性插值和反卷积操作来增加点的数量。由于几何图像的特性，上采样后新生成的点来自它们相邻的旧点，我们不需要在点之间分配连接关系。
插值后的几何图像跳跃式连接到下一个变形网络的末端，使变形网络专注于学习细微的调整以矫正 3D 形状。经过两次上采样操作，几何图像的分辨率增加到 64×64，包含 4096 个点，足以表示一个 3D 形状

作者在多个层次上施加监督，使形状转换过程更加可控。作者发现，简单地计算生成的几何图像与其相应的地面实况之间的 L2losses 可能会导致生成扭曲和平均的 3D 形状。因此，转而使用点云之间的倒角损失。

假设生成的和ground-truth的几何图像都由N个点和点xin的邻域N(x)组成，几何图像定义为一个以x为中心的K×Kgrid，原始倒角损失需要寻找最近邻源中每个点的目标，其时间复杂度为 O(N2)。在本文中，我们提出了在几何图像上操作的局部倒角损失，它只是为源中的每个点 xin 找到与目标中 N(x) 对应的区域最近的点。这种简化将时间复杂度从 O(N2) 降低到 O(NK2)。建议的局部倒角距离定义为:

其中 Gpre 和 Ggt 分别是预测和真实几何图像。
仅在点云上施加倒角损失并不能保证光滑的表面，因此我们引入法线损失使地面实况法线位于与其切线垂直的点上

其中 ni 是点 pi 处的真实法线。在实践中，后一项可以通过在 pi 处应用深度卷积和固定核 Ktan 来有效计算

类似于王等人 (2018)，使用边长正则化来避免飞点（use the edge length regularization to avoid flying points）

然后，我们得到施加在网格上的最终损失函数

在实践中，我们发现上述损失函数在几何图像的内部区域效果很好，但对四个边缘施加的限制很少，这可能会导致严重的表面扭曲。
根据折叠规则，如图3所示，我们建议用逆对称填充来填充生成的几何图像。

我们转置每条边中元素的顺序，并用这四个新边围绕生成的几何图像。
在计算上述损失时，仅对生成的图像进行填充，而不是对解码器的中间层进行填充，就足以消除不准确的边缘连接并避免表面失真。

3D shape discriminator

如上所述，几何图像实际上是以类似图像的格式排列的点云。因此，用于处理图像和点云的工具都可以用于处理几何图像。专门为处理点云而设计的网络，如 PointNet（Qi 等人，2017），尽管容量强大，但仍包含大量参数。作为整个网络的一部分，鉴别器需要在参数数量和表示 3D 形状特征的能力之间进行权衡。受Shen等人的启发（2018 年），处理乱序点云，我们针对有序点云调整我们的判别器。如图 4 所示，我们的鉴别器从一个动态形状感知模块开始。

我们使用各种卷积来感知多个感受野的局部 3D 形状结构。这些多尺度特征通过全局平均池化层形成 3D 形状的全局描述，然后由多层感知 (MLP) 使用来学习确定每个特征图重要性的权重。动态分配机制强调捕捉 3D 形状的有区别的局部结构的特征图。之后，将获得的特征图与原始几何图像连接起来。重构后的 (w ×h) ×(L +3) 矩阵中的每一行都对一个点的特征进行编码。全局平均池化层进一步排除了点序的影响，输出了 3D 形状的最终表示。最后，作为分类器的三个全连接层计算输入 3D 形状被识别为真实的概率。生成器和鉴别器的损失函数可以表示为

其中y表示ground-truth几何图像，s表示输入轮廓图像，G(s)表示合成几何图像，D(•)表示判别器输出的概率值

Viewpoint estimation（视点估计）

估计给定场景图像的相机姿态是很重要的。在本文中，我们专注于如何估计轮廓图像的视点（focus on how to estimate viewpoints for silhouette images)。
考虑到我们通过OpenGL渲染轮廓图像进行训练的过程，可以调整三组参数来确定渲染对象在2D图像上出现的姿势：相机在世界坐标系中的位置，相机镜头的方向面，以及相机向上矢量的方向。
在合成轮廓图像并使用从 VGG 改编的深度神经网络来回归这些参数时，我们尝试了上述三个参数的各种设置和组合。它适用于某些场景中的某些配置，但对其他人却不尽如人意。因此，我们简化了我们的视点估计模块，通过裁剪轮廓图像并将对象放置在图像的中心，切断第二个参数的预测并将相机镜头面向的方向固定在 (0, 0, 0)。此外，我们假设向上向量的方向仍然是 (0, 1, 0)，其在图像平面上的投影决定了场景坐标系的 y 轴。基于这些假设，我们可以推导出相机的旋转矩阵 R。因此，唯一需要预测的参数是相机的位置。这里，一个类似 VGG 的网络被用于预测相机的坐标 (x, y, z) 并且视点估计的损失函数被定义为:

剪影图像重新渲染 (Silhouette image re-rendering)

大多数现有的 3D 重建方法只能恢复看起来与输入 2D 图像相似的 3D 对象的粗略轮廓。
要获得高质量的 3D 对象，必须增强 3D 表面的细节。
一个直观的想法是，我们需要找到一种合适的方法来计算 3D 形状描述符，并使真实 3D 对象和合成对象的表示尽可能相似。

理想的描述符应该具有表现力和辨别力，并且计算成本低。
为了将描述符嵌入到整个流水线中并使其能够以端到端的方式进行训练，特征提取模块也应该是可微的。
基于这一见解，我们选择从 3D 点云重新渲染的多个视点的轮廓作为描述符，并设计可微分的管道来实现目标。我们推测，如果渲染的轮廓与其对应的地面实况轮廓匹配得很好，那么生成的 3D 形状应该具有良好的细节。类似的想法在之前的作品中也出现过，例如 (Tulsiani et al., 2018; Yang et al., 2018)，其中从体素数据投影的图像作为优化的主要监督。然而，在本文中，轮廓是从点云渲染的，仅起到次要作用，旨在确保与地面实况对象的一致性。给定视点 i 的旋转矩阵 Riand 变换矩阵，规范坐标系中的每个点都可以通过以下方式映射到图像坐标

其中 Ki 是相机内在矩阵，pi 是点的 3D 规范坐标，x 表示 (xc, yc, zc) 其中 (xc, yc) 是 2D 图像平面中的对应坐标，zc 表示深度值。当从点云投影到 2D 图像时，一些点是否碰撞并落在同一像素上并不重要，因为我们很少关心深度信息。轮廓可以通过下面式子

并且我们重新渲染模块中每个像素的损失函数定义为：

其中
分别是在视点 i 处从预测点云和地面实况点云渲染的轮廓，视点总数为 N。我们惩罚本应在视点内部的“空”像素对象的轮廓通过添加一个掩码M，其中如果S（x，y）=1，则权重值选择为3，如果S（x，y）=0，则选择权重值为1。最后，整体训练损失可以写为

我们交替训练生成器和判别器直到收敛，然后生成器获得了 3D 形状重建的能力

从几何图像重建表面（Surface reconstruction from geometry image）

由于几何图像中相邻点之间的相邻关系，我们可以轻松地恢复 3D 网格的表面。

请注意，基于几何图像构建网格的方式并不是唯一的，这里我们采用一种简单有效的方式。

如图 5 所示，对于每个由四个相邻点组成的四边形，我们连接它的四个边和一个对角线。

通过此操作，可以获得 watertight 3D mesh。

Prompt相关论文阅读(02)--Auto-CoT(2024-11-25) zhilanguifang 论文 prompt engineering 论文阅读笔记
论文阅读笔记2024-11-24~2024-11-25Auto-CoT:AutomaticChainofThoughtPromptinginLargeLanguageModels(ICLR2023)碎碎念：复现代码和笔记保存到gitee仓库上海交通大学的学生在亚马逊实习的时候的成果ICLR2023摘要：LLM能够通过生成中间推理步骤执行复杂的推理。提供这些步骤用于提示演示叫做思维链提示CoT。Co
【论文阅读】Dynamic Few-Shot Visual Learning without Forgetting Bosenya12 论文阅读
系统概述如下：(a)一个基于卷积神经网络（ConvNet）的识别模型，该模型包含特征提取器和分类器；(b)一个少样本分类权重生成器。这两个组件都是在一组基础类别上训练的，我们为这些类别准备了大量训练数据。在测试阶段，权重生成器会接收少量新类别的训练数据以及基础类别的分类权重向量（分类器框内的绿色矩形），并为新类别生成相应的分类权重向量（分类器框内的蓝色矩形）。这样，卷积神经网络就能同时识别基础类别
【论文阅读】Few-Shot PPG Signal Generation via Guided Diffusion Models Bosenya12 论文阅读
从少量样本数据选择到后处理的整体框架。首先，扩散模型在N样本数据集和指导下的训练。接着，模型生成一个增强的数据集，并进一步优化以提高保真度。最后，这些合成数据与少量样本训练数据集结合，用于基准模型的训练和评估。数据分布从最初的红色变为保真度增强的蓝色，这表明模型与真实数据更加吻合，如简化后的数据分布示意图所示。这篇文章的核心内容是介绍了一种名为BG-Diff（Bi-GuidedDiffusion）
[论文阅读] 人工智能 | 读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法张较瘦_ 前沿技术论文阅读人工智能
读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法论文标题：Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsMiguelRomero-Arjona,JoséA.Parejo,Jua
【LLM论文阅读】一只齐刘海的猫论文阅读
LLM论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN:ExtendingContextWindowofLLMs论文YaRN笔记T5ExploringtheLimitsofTransferLearningwithaUnifiedText-to-Te
Segment Anything in High Quality之SAM-HQ论文阅读 qq_41627642 深度学习论文阅读论文阅读
摘要最近的SegmentAnythingModel（SAM）在扩展分割模型规模方面取得了重大突破，具备强大的零样本能力和灵活的提示机制。尽管SAM在训练时使用了11亿个掩码，其掩码预测质量在许多情况下仍不理想，尤其是对于结构复杂的目标。我们提出了HQ-SAM，使SAM能够精确地分割任意目标，同时保留其原有的可提示设计、高效性和零样本泛化能力。我们的设计充分复用并保留了SAM预训练的模型权重，仅引入
yolov算法详解_yolo 目标检测算法个人总结（yolov1） CHAO JIANG yolov算法详解
yolo目标检测算法个人总结目前yolo目标检测有两个版本，分别为v1和v2。因工作需要用yolo算法检测人物，所以这段时间重点看了这两篇论文，并实现了对应的tensorflow代码。这里记录下在论文阅读过程中的一些细节信息，留给自己，同时也希望各位能指出本人理解错误的地方，谢谢！一：yolov1关于yolov1算法的详解在网上已经非常多了，在这里我大概叙述下算法的流程，以及在开发过程中遇到的一些
《论文阅读》GPT-3是否会产生移情对话？一种新的情境示例选择方法和用于生成同理心对话的自动评估度量 ICCL 2022 365JHWZGo 情感对话论文阅读 gpt-3 共情回复上下文学习提示学习大模型
《论文阅读》GPT-3是否会产生移情对话？一种新的情境示例选择方法和用于生成同理心对话的自动评估度量ICCL2022前言贡献PromptIn-contextlearningSITSMEMOSITSM新的自动指标实验前言亲身阅读感受分享，细节画图解释，再也不用担心看不懂论文啦~无抄袭，无复制，纯手工敲击键盘~今天为大家带来的是《DoesGPT-3GenerateEmpatheticDialogues
[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
Learning Fully Convolutional Networks for Iterative Non-blind Deconvolution论文阅读青铜锁00 #退化论文阅读深度学习论文阅读图像处理
LearningFullyConvolutionalNetworksforIterativeNon-blindDeconvolution1.研究目标与实际问题1.1研究目标1.2实际意义2.创新方法与模型设计2.1核心框架：迭代式梯度域处理2.1.1模型架构2.2关键技术实现2.2.1梯度域去噪网络2.2.2解卷积模块（核心公式实现）2.2.3损失函数设计2.2.4超参数端到端学习2.3与传统方法
KAIST数据集及使用草莓奶忻 SLAM基础 #SLAM数据集 ubuntu
文章目录KAIST复杂城市数据集KAIST数据集转换为rosbag1.将.gz.tar文件解压到其文件夹中2.克隆并构建此存储库3.使用路径和所需主题编辑配置文件4.为每种传感器类型创建一个rosbag文件5.将所有bag合并为一个参考KAIST复杂城市数据集KAIST-Urban-数据集-论文阅读数据集下载：ComplexUrbanDataset复杂城市数据集KAIST数据集转换为rosbag1
[论文阅读] 软件工程 | 需求工程中领域知识研究：系统映射与创新突破张较瘦_ 前沿技术论文阅读软件工程
需求工程中领域知识研究：系统映射与创新突破论文信息DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyarXiv:2506.20754DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyMarinaAraújo,JúliaAraújo,RomeuO
论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
[论文阅读] 软件工程 | 探索软件生态系统中的开发者体验关键因素
探索软件生态系统中的开发者体验关键因素：从研究到实践引文格式@article{Zacarias2025,title={ExploringDeveloperExperienceFactorsinSoftwareEcosystems},author={Zacarias,RodrigoOliveiraandAntunes,L{\'e}oCarvalhoRamosandBarros,M{\'a}rciod
Fast Image Deconvolution using Hyper-Laplacian Priors论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
FastImageDeconvolutionusingHyper-LaplacianPriors1.论文的研究目标与实际意义2.论文的创新方法2.1核心框架：交替最小化（AlternatingMinimization）2.2x子问题：频域FFT加速2.3w子问题：高效求解的核心创新2.3.1问题形式2.3.2查找表法（LUT）2.3.3解析解法（特定α\alphaα）2.3.4通用α\alphaα
[论文阅读] 人工智能 + 软件工程 | AI 与敏捷开发的破局之路：从挫败到成功的工作坊纪实张较瘦_ 前沿技术论文阅读人工智能软件工程
AI与敏捷开发的破局之路：从挫败到成功的工作坊纪实论文信息arXiv:2506.20159AIandAgileSoftwareDevelopment:FromFrustrationtoSuccess–XP2025WorkshopSummaryTomasHerda,VictoriaPichler,ZheyingZhang,PekkaAbrahamsson,GeirK.HanssenSubjects:
Diff-Retinex: Rethinking Low-light Image Enhancement with A Generative Diffusion Model 论文阅读钟屿论文阅读人工智能深度学习学习图像处理计算机视觉
Diff-Retinex：用生成式扩散模型重新思考低光照图像增强摘要本文中，我们重新思考了低光照图像增强任务，并提出了一种物理可解释的生成式扩散模型，称为Diff-Retinex。我们的目标是整合物理模型和生成网络的优点。此外，我们希望通过生成网络补充甚至推断低光照图像中缺失的信息。因此，Diff-Retinex将低光照图像增强问题表述为Retinex分解和条件图像生成。在Retinex分解中，我
【论文阅读】人工智能在直升机航空电子系统中的应用肥鼠路易论文阅读人工智能航空电子系统应用
人工智能在直升机航空电子系统中的应用论文摘要文章结构参考文献论文摘要论文摘要:在现代战争形势日趋信息化、智能化的背景下，将人工智能应用于武器装备已经是大势所趋。针对直升机飞行任务的特征，对其发展状况进行了描述，并对其作业能力进行了分析，探索了人工智能技术在直升机航电系统中的应用方向，为推进人工智能在直升机上的转化与应用奠定基础。通过对国外先进直升机智能技术的运用现状及对其作业能力的要求进行分析，探
[论文阅读] 人工智能+软件工程 | 用大语言模型架起软件需求形式化的桥梁张较瘦_ 前沿技术人工智能论文阅读软件工程
用大语言模型架起软件需求形式化的桥梁：一篇ACM调查草案的深度解读论文信息arXiv:2506.14627ACMSurveyDraftonFormalisingSoftwareRequirementswithLargeLanguageModelsArshadBeg,DiarmuidO’Donoghue,RosemaryMonahanComments:22pages.6summarytablesSu
Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model论文阅读青铜锁00 深度学习论文阅读 #退化论文阅读
Reti-Diff:IlluminationDegradationImageRestorationwithRetinex-basedLatentDiffusionModel1.研究目标与实际意义1.1研究目标1.2实际意义2.创新方法与模型设计2.1整体框架2.2RetinexPriorExtraction(RPE)模块2.2.1Retinex分解2.2.2先验压缩2.3Retinex-guide
SIMPL论文阅读 ZHANG8023ZHEN 论文阅读
论文链接：https://arxiv.org/pdf/2402.02519文章还没细看，但主要贡献点应该是SymmetricFusionTransformer和Bezier-basedMotionDecoder.对Bezier-basedMotionDecoder比较感兴趣，之后对这块细看一下
【论文阅读笔记】《CodeS: Towards Building Open-source Language Models for Text-to-SQL 》柠石榴 text2sql 论文论文阅读笔记语言模型
文章目录一、论文基本信息1.文章标题2.所属刊物/会议3.发表年份4.作者列表5.发表单位二、摘要三、解决问题四、创新点五、自己的见解和感想六、研究背景七、研究方法模型实验数据评估指标八、总结九、相关重要文献一、论文基本信息1.文章标题CodeS:TowardsBuildingOpen-sourceLanguageModelsforText-to-SQL2.所属刊物/会议未明确标注（会议缩写为“C
agentformer论文阅读 ZHANG8023ZHEN 论文阅读
参考了这篇博文：https://zhuanlan.zhihu.com/p/512764984主要有这几个部分a.map_encoderi.对地图进行CNNb.ContextEncoderi.timeencoder–将时间信息用transformer和positionemb进行融合，加入到特征中ii.agent-awareattention–self和selfattentionother和other
【论文阅读】DynamicControl ：一种新的controlnet多条件控制方法 prinTao pytorch Diffusion 论文阅读
背景现有方法要么处理条件效率低下，要么使用固定数量的条件，这并不能完全解决多个条件的复杂性及其潜在冲突。这强调了需要创新方法来有效管理多种条件，以实现更可靠和详细的图像合成。为了解决这个问题，我们提出了一个新的框架DynamicControl，它支持不同控制信号的动态组合，允许自适应选择不同数量和类型的条件。本文方法从一个双循环控制器开始，它通过利用预先训练的条件生成模型和判别模型为所有输入条件生
论文阅读：2018 arxiv CrowdHuman: A Benchmark for Detecting Human in a Crowd CSPhD-winston-杨帆论文阅读
https://www.doubao.com/chat/9226473480559618https://arxiv.org/pdf/1805.00123CrowdHuman:ABenchmarkforDetectingHumaninaCrowd文章目录论文翻译CrowdHuman：用于检测人群中人体的基准摘要1.引言2.相关工作2.1.人体检测数据集2.2.人体检测框架。论文翻译CrowdHuma
论文阅读：arxiv 2025 OThink-R1: Intrinsic Fast/Slow Thinking Mode Switching for Over-Reasoning Mitigation CSPhD-winston-杨帆论文阅读
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://www.doubao.com/chat/8815924393371650https://arxiv.org/pdf/2506.02397#page=17.09OThink文章目录速览研究背景与问题核心思路与方法实验结果结论与意义速览这篇论文聚焦于
论文阅读：arxiv 2025 Not All Tokens Are What You Need In Thinking
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://arxiv.org/pdf/2505.17827https://www.doubao.com/chat/8814790364572162文章目录速览研究背景提出的解决方案：条件token选择（CTS）实验结果核心贡献研究局限总结速览这篇论文主要探
[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers 颜笑晏晏论文阅读
1.摘要双分支网络结构已显示出其对实时语义分割任务的效率性和有效性。然而，低级细节和高级语义的直接融合将导致细节特征容易被周围上下文信息淹没，即本文中的超调(overshoot)，这限制了现有两个分支模型的准确性的提高。在本文中，我们在卷积神经网络（CNN）和比例积分微分（PID）控制器之间架起了桥梁，并揭示了双分支网络只是一个比例积分（PI）控制器，当然也会存在类似的超调问题。为了解决这个问题，
[论文阅读] 人工智能+软件工程 | 用 LLM + 静态代码分析自动化提升代码质量张较瘦_ 前沿技术论文阅读人工智能软件工程
用LLM+静态代码分析自动化提升代码质量论文信息AugmentingLargeLanguageModelswithStaticCodeAnalysisforAutomatedCodeQualityImprovements@article{abtahi2025augmenting,title={AugmentingLargeLanguageModelswithStaticCodeAnalysisfo
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那