一梦轻尘

【译】Multi-Scale Context Aggregation by Dilation Convolutions(空洞卷积)

Multi-Scale Context Aggregation by Dilation Convolutions

通过膨胀卷积进行多层次的上下文聚合

原作：Fisher Yu， Princeton University； Vladlen Koltun ，Intel Labs

翻译：一梦轻尘

原文链接：Multi-Scale Context Aggregation by Dilation Convolutions

摘要

最先进的语义分割模型是基于卷积网络的适应性，而卷积网络最初是为图像分类而设计的。但是，语义分割等密集预测问题在结构上与图像分类不同。在这项工作中，我们开发了一个新的卷积网络模块，专门设计用于密集预测。所提出的模块采用扩张性卷积方法(空洞卷积)系统地聚合多尺度上下文信息而不丢失分辨率。这种架构基于这样一个事实:膨胀的卷积支持感受野的指数扩张，而不会丢失分辨率或覆盖率。我们证明所提供的上下文模块提高了最先进的语义分割系统的准确性。此外，我们还研究了图像分类网络对密集预测的适应性，并表明简化适应网络可以提高准确性。

1. 介绍

计算机视觉中的许多自然问题都是密集预测的实例。目标是为图像中的每个像素计算一个离散或连续的标签。一个突出的例子是语义分割，它要求将每个像素划分为给定的一组类别。语义分割具有挑战性，因为它需要将像素级精度与多尺度上下文推理相结合。

最近，通过使用逆向传播训练的卷积网络获得了语义分割的显著精度提高。Long等(2015)的研究表明，原本用于图像分类的卷积网络架构可以成功地用于密集预测。这些被报道的网络在挑战语义分割基准方面远远超过了先前的技术水平。这就引出了图像分类和密集预测之间的结构差异所引发的新问题。重构网络的哪些方面是真正必要的，哪些方面在密集操作时会降低准确性?专为密集预测设计的专用模块能进一步提高准确性吗?

现代图像分类网络通过连续的池化和下采样层集成了多尺度上下文信息，降低了分辨率，直到获得全局预测。相反，密集的预测需要多尺度上下文推理和全分辨率输出。最近的工作研究了两种处理多尺度推理和全分辨率密集预测冲突需求的方法。一种方法涉及重复的上卷积，目的是在从下采样层进行全局透视时恢复丢失的分辨率。这就产生了一个问题，即严格的中间下采样是否真的有必要。另一种方法是提供多个重新扫描的图像作为网络输入，并结合对这些多输入的预测。同样，目前还不清楚是否真的有必要对重新扫描的输入图像进行单独分析。

在这项工作中，我们开发了一个卷积网络模块，可以聚合多尺度的上下文信息，而不会丢失分辨率或分析重新缩放的图像。该模块可以任何分辨率插入现有架构。与从图像分类中延续的金字塔形结构不同，所呈现的上下文模块专门用于密集预测。它是一个由卷积层组成的矩形棱镜，没有池化或子采样。该模块基于扩张的卷积，其支持感受野的指数扩展而不损失分辨率或覆盖范围。

作为这项工作的一部分，我们还重新研究了基于语义分割的图像分类网络的性能。越来越复杂的系统，包括结构化预测、多列体系结构、多训练数据集和其他扩展，可能会无意中掩盖核心预测模块的性能。因此，我们研究了深度图像分类网络在受控设置中的主要适应性，并去除阻碍密集预测性能的退化成分。结果是一个初始预测模块，比先前的适应性更简单、更准确。

通过对Pascal VOC 2012数据集的控制实验，使用简化的预测模块对所给出的上下文网络进行评价。实验表明，将上下文模块插入现有的语义分割体系结构中能够可靠地提高其准确性。

2. 扩张的卷积(空洞卷积)

定义：F：Z^2→R是一个离散函数，定义→R是一个离散滤波器，大小为，离散卷积算子∗可以被定义为：

我们现在推广这个算子。让l是一个扩张的因素,让∗l被定义为：

我们将使用∗l代表空洞卷积或l-dilated卷积。熟悉的离散卷积∗只是1-dilated卷积。

膨胀卷积算子过去被称为“膨胀滤波器的卷积”。它在小波分解算法中起着关键作用。我们用“膨胀卷积”来代替“与膨胀滤波器卷积”来解释没有构造或表示“膨胀过滤器”。卷积运算符本身被修改为以不同的方式使用过滤参数。膨胀的卷积算子可以用不同的膨胀因子在不同的范围内应用相同的滤波器。我们的定义反映了膨胀卷积算子的正确实现，它不需要构造膨胀滤波器。

在最近关于语义分割的卷积网络的工作中，Long等人分析过滤器膨胀，但选择不使用它。陈等人使用扩张来简化Long等人的架构。相比之下，我们开发了一种新的卷积网络架构，该架构系统地使用扩散卷积进行多尺度上下文聚合。

我们的体系结构的动机是，扩张的卷积支持指数扩展的感受野，而不会丢失分辨率或覆盖范围。设F0，F1，...，Fn-1：Z^2→R为离散函数，设k0，k1，...，kn-2：Ω1→R是离散的3×3滤波器。考虑应用指数增加膨胀的滤波器：

将中元素p的感受野定义为F 0中修改（p）值的元素集。令中p的感受野的大小为这些元素的数量。很容易看出中每个元素的感受野的大小是。感受野是指数增大的平方。这在图1中说明。

图1：系统扩张支持感受野的指数扩张而不会损失分辨率或覆盖范围。（a）F 1由F 0通过1扩张卷积产生; F 1中的每个元素具有3×3的感受野。（b）F 2由F 1通过2扩张卷积产生; F 2中的每个元素具有7×7的感受野。（c）F 3由F 2通过4扩张卷积产生; F 3中的每个元素具有15×15的感受野。与每个层相关联的参数数量是相同的。感受野呈指数增长，而参数数量呈线性增长。

3. 多尺度的上下文聚合

上下文模块旨在通过聚合多尺度上下文信息来提高密集预测体系结构的性能。该模块将C要素图作为输入，并生成C要素图作为输出。输入和输出具有相同的形式，因此模块可以插入现有的密集预测体系结构中。

我们从描述上下文模块的基本形式开始。在这个基本形式中，每个层都有C通道。每个层的表示都是相同的，可以直接获得每个类的密集预测，虽然特征映射不是标准化的，并且在模块内部没有定义损失。直觉上，该模块可以通过将特征映射传递给公开上下文信息的多个层来提高其准确性。

基本上下文模块有7个层，应用3×3卷积和不同的膨胀因子。扩张是1 1 12 4 8 16和 1。每个卷积操作在所有层:严格地说,这些都是3×3×C运算与扩张的两个维度。每一个卷积后面都有一个点截断最大值(·，0)。最后一层执行1×1×C卷积和产生输出模块。表1总结了该体系结构。注意,前端模块提供的输入上下文网络在我们的实验中产生的特征图谱分辨率为64×64。因此，在第六层之后，我们停止了感受野的指数扩张。

我们最初训练上下文模块的尝试并没有提高预测精度。实验表明，标准的初始化过程并不支持模块的训练。卷积网络通常使用随机分布的样本进行初始化(Glorot & Bengio, 2010;Krizhevsky et al .,2012;Simonyan &Zisserman,2015)。然而，我们发现随机初始化方案对上下文模块无效。我们发现一个具有清晰语义的替代初始化更有效:

其中a为输入featuremap的索引，b为输出map的索引。这是身份初始化的一种形式，最近被提倡用于周期性网络(Le et al.， 2015)。这个初始化设置了所有的过滤器，以便每个层都可以直接将输入传递给下一个。一个自然的问题是，这种初始化可能会使网络处于一种模式，在这种模式中，反向传播不能显著改善简单地传递信息的默认行为。然而，实验表明事实并非如此。反向传播可以可靠地获取网络提供的上下文信息，从而提高处理后的地图的准确性。

表1:上下文网络架构。网络通过聚合上下文信息来处理C特征映射，并在不丢失分辨率的情况下逐步增加规模。

这就完成了基本上下文网络的表示。我们的实验表明，即使是这个基本模块也可以在定量和定性上提高稠密预测的精度。尤其引人注目的网络参数:≈64 c两个参数。

我们还培训了一个更大的上下文网络，在更深层使用更多的特征映射。表1总结了大型网络中的地图数量。我们概括了初始化方案，以解释不同层中feature map的数量差异。让c i和c i+1是两个连续层的featuremap的数量。假设C同时除以C i和C i+1。初始化是

这里ε∼N(0,)和σ<

4前端

我们实现并培训了一个前端预测模块，该模块以彩色图像作为输入，生成C = 21 feature maps作为输出。前端模块遵循Longet al.(2015)和Chen etal.(2015a)的工作，但单独实施。我们采用vgg16网络(Simonyan & Zisserman, 2015)进行了密集预测，并删除了最后两个池化层和跨越层。具体地说，每个池化层和跨越层都被删除，所有后续层的卷积都被每一个衰减的池化层的2倍放大。因此，最终层中的卷积(在两个被分割的池化层之后)被放大了4倍。这允许使用原始分类网络的参数进行初始化，但会产生高分辨率的输出。前端模块需要填充图像作为输入,并生成特征图谱分辨率64×64。我们使用反射填充:缓冲区域通过反射每个边缘的图像来填充。

我们的前端模块是通过去除对密集预测起反作用的分类网络的残余来获得的。最重要的是，我们完全删除了最后两个池化层和跨越层，而Long等人保留了它们，Chen等人用扩展替换了跨越层，但保留了池化层。我们发现通过删除池化层简化网络使其更加准确。我们还删除了中间特性映射的填充。在原始的分类网络中使用了中间填充，但在稠密时既不需要也不合理。

该简化的预测模块经过Pascal VOC 2012训练集训练，由Hariharan等(2011)所创建的注释扩充。我们没有使用来自VOC-2012验证集的图像进行训练，因此只使用了Hariharan等人（2011）的注释的一个子集。训练是由随机梯度下降法(SGD)mini-batch 大小为14,学习速率,动量0.9。该网络经过60K次迭代训练。

现在我们将前端模块的精度与Long et al.(2015)的FCN-8s设计和Chen et al. (2015a)的DeepLab网络进行比较。对于FCN-8s和DeepLab，我们评估了原始作者在vocs -2012年训练的公共模型。图2显示了来自voc2012数据集的不同模型对图像的分割。vocs -2012测试集上模型的精度如表2所示。

我们的前端预测模块比之前的模型更简单、更准确。具体来说，我们的简化模型在测试集上比FCN-8s和DeepLab网络都要高出5个百分点。有趣的是，我们简化的前端模块在测试集上超过了一个百分点(67.6% vs. 66.4%)，而没有使用CRF，在测试集上的领先优势超过一个百分点(67.6% vs. 66.4%)。

图2:基于vgg-16分类网络的不同修改所产生的语义分割。从左到右:(a)输入图像，(b)通过fcn - 8s(Long等人，2015年)的预测，(c)DeepLab(Chen等人，2015a)的预测，(d)通过简化的前端模块，(e)基本真值的预测。

表2:我们的前端预测模块比之前的模型更简单、更准确。此表报告vocs -2012测试集的准确性。

5实验

我们的实现基于Caffe库(Jia etal.， 2014)。我们对膨胀卷积的实现现在是stanfardCaffe发行版的一部分。

为了与最近的高性能系统进行公平的比较，我们训练了一个前端模块，它的结构与第4节中描述的相同，但是训练了来自Microsoft COCO数据集的其他图像(Linet al.， 2014)。我们使用了Microsoft COCO中的所有图像，其中至少有一个来自vocs -2012类别的对象。来自其他类别的带注释的对象被视为背景。

训练分为两个阶段。在第一阶段，我们一起学习了vocs -2012和MicrosoftCOCO image。训练由SGD执行，min-batch14和动量0.9。进行学习速率为的100 k次迭代和学习速率为的40 k次后续迭代。在第二阶段，我们只对vocs -2012图像进行了微调。微调了50 k次迭代，学习速率为。来自VOC-2012验证集的图像不用于训练。

本程序训练的前端模块在vocs -2012验证集中达到69.8%的平均IoU，在测试集中达到71.3%的平均IoU。请注意，这种精度仅通过前端实现，没有上下文模块或结构化预测。我们再次将这种高精确度部分归因于去除最初用于图像分类而不是密集预测的多余成分。

上下文聚合的受控评估。我们现在进行控制实验，以评估第3节中介绍的上下文网络的效果。我们首先将两个上下文模块(基本的和大型的)插入前端。由于上下文网络的接受域是67 67，所以我们用宽度为33的缓冲区来填充输入特性图。在我们的实验中，零填充和反射填充产生了相似的结果。上下文模块接受来自前端的特性映射作为输入，并在训练期间提供此输入。在我们的实验中，上下文模块和前端模块的联合训练没有取得显著的改进。学习速率设置为。训练按照第3节的描述进行了初始化。

表3显示了将上下文模块添加到三个不同的体系结构中进行语义分割的效果。第一个体系结构(顶部)是第4部分中描述的前端。它执行语义分割而不进行结构化预测，类似于Long et al.(2015)的原始工作。第二个体系结构(表3，中间)使用密集的CRF进行结构化预测，类似于Chen等人的系统(2015a)。我们使用Krahenbuhl& Koltun(2011)的实现，在验证集上通过网格搜索训练CRF参数。第三个架构(表3，底部)使用CRF- rnn进行结构化预测(Zhenget al.，2015)。我们利用Zheng等(2015)的实施，对CRF-RNN进行各条件的训练。

实验结果表明，上下文模块提高了三种配置的准确性。基本上下文模块增加了每个配置的准确性。大上下文模块增加了更大的精确度。实验表明，上下文模块和结构化预测是协同的:无论后续的结构化预测是否进行，上下文模块都提高了准确性。定性结果如图3所示。

对测试集进行评估。我们现在对测试集进行评估，将我们的结果提交给Pascal VOC 2012评估服务器。结果见表4。我们在这些实验中使用大上下文模块。正如结果所示，上下文模块在前端的准确性上有了显著提高。单是上下文模块，没有后续的结构化预测，其性能就超过了DeepLab-CRF-COCO-LargeFOV (Chen et al.， 2015a)。具有密集CRF的上下文模块使用Krahenbuhl & Koltun(2011)的原始实现，其性能与最近的CRF- rnn (Zheng et al.， 2015)相当。与CRF-RNN结合的上下文模块进一步提高了CRF-RNN的性能。

6.结论

我们已经研究了卷积网络结构的密集预测。由于模型必须产生高分辨率的输出，我们认为高分辨率的操作在整个网络中是可行和可取的。我们的研究表明，扩张的卷积运算符特别适合于密集的预测，因为它能够在不丢失分辨率或覆盖的情况下扩展接收域。我们使用了扩展的卷积来设计一种新的网络结构，这种结构可以在现有的语义分割系统中可靠地提高准确性。作为这项工作的一部分，我们还展示了通过去除用于图像分类的残留成分，可以提高现有的卷积网络在语义分割中的准确性。

我们认为，所提出的工作是朝着不受图像分类前体约束的密集预测的专用体系结构迈出的一步。随着新的数据来源的出现，未来的体系结构可能会被训练成密集的端到端，从而消除了对图像分类数据集进行预处理的需要。这可能使体系结构简化和统一。具体来说，端到端密集训练可以使完全密集的体系结构(类似于所提供的上下文网络)在整个过程中以全分辨率运行，接受原始图像作为输入，并以全分辨率生成密集的标签分配作为输出。最新的语义分割系统为未来的发展留下了巨大的空间。我们最精确的配置的失败案例如图4所示。我们将发布我们的代码和经过训练的模型来支持这一领域的进展。

图3:不同模型产生的语义分割。从左到右:(a)输入图像，(b)前端模块预测，(c)大上下文网络插入前端预测，(d)前端预测+上下文模块+ CRF-RNN， (e)背景实值。

表3:对上下文模块对三种不同架构进行语义分割的准确性的控制评价。在vocs -2012验证系统上进行的实验没有使用验证图像进行训练。顶部:在没有结构化预测的语义分割前端添加上下文模块(Longetal.，2015)。基本上下文模块增加了准确性，大模块增加了更大的优势。中间:当插入前端+密集CRF配置时，上下文模块增加了准确性(Chen et al.，2015a)。底部:当插入前端+CRF-RNN配置时，上下文模块增加了准确性(Zheng et al.，2015)。

表4:voca -2012测试集评价。‘DeepLab+++’代表DeepLab- crf - coco - largefov，‘DeepLab- msc ++’代表DeepLab-mscf - crf - largefov - co - crossjoint (Chen et al.，2015a)。“CRF-RNN”是郑等人(2015)的系统。“Context”是指插入到前端的大型上下文模块。上下文网络提供了非常高的精度，我们在不执行结构化预测的情况下执行了DeepLab++架构。结合上下文网络与CRF-RNN结构预测模块，提高了CRF-RNN系统的准确性。

图4:vocs -2012验证集的失败案例。我们训练的最精确的架构(Context + CRF-RNN)在这些图像上的表现很差。

（PS：小弟第一次翻译深度学习论文，如有错误，恳请不吝赐教）

论文翻译：arxiv-2022 Ignore Previous Prompt: Attack Techniques For Language Models CSPhD-winston-杨帆论文翻译 LLMs-安全 prompt 语言模型人工智能
IgnorePreviousPrompt:AttackTechniquesForLanguageModelshttps://arxiv.org/pdf/2211.09527忽略之前的提示：针对语言模型的攻击技术文章目录忽略之前的提示：针对语言模型的攻击技术摘要1引言摘要基于Transformer的大型语言模型（LLMs）为大规模面向客户的应用程序中的自然语言任务提供了强大的基础。然而，探索恶意用户
论文翻译：arxiv-2024 Data Contamination Quiz: A Tool to Detect and Estimate Contamination in Large CSPhD-winston-杨帆 LLMs-数据污染论文翻译语言模型人工智能深度学习
DataContaminationQuiz:ATooltoDetectandEstimateContaminationinLargeLanguageModelshttps://arxiv.org/abs/2311.06233数据污染测验：一种检测和估计大型语言模型中污染的工具文章目录数据污染测验：一种检测和估计大型语言模型中污染的工具摘要1引言摘要我们提出了数据污染测验（DataContamina
实验DAY5：借假修真放逐997
a.昨日完成情况不佳，起床是9.30，除了报名（一口气报了五门..祝我好运），论文翻译和教育都没有完成；b.明日计划：9点前起床；明天优先复盘教育，以及准备cpa的考试资料；论文、和cpa留到周末做吧c.今天读到一篇讲美团公司战略的文章，对于整体战略搭建的方法论、具体业务的促成、以及更偏意识上层的“借假修真”思想的解读非常佩服，摘录核心如下：美团的增长引擎：1.严明的纪律性：放弃不符合业务逻辑的利
开源Bluespec bsc编译器和可重用示例设计达坦科技DatenLord 硬件加速 fpga fpga开发硬件工程开源
这篇介绍Bluespec以及设计示例的文章，是在2021年ICCAD（InternationalConferenceOnComputer-AidedDesign）发布的论文。达坦科技的open-rdma项目和推广的MIT体系结构学习社区都用到Bluespec，因此将此论文翻译成中文，以便大家了解2020年Bluespec开源后相关的开源项目。摘要：bsc编译器是一个商业可用的编译器，在过去的二十年
论文翻译 - BITE: Textual Backdoor Attacks with Iterative Trigger Injection anniewwy LLM Backdoor Attack
论文链接：https://arxiv.org/pdf/2205.12700.pdf项目代码：https://github.com/INK-USC/BITEBITE:TextualBackdoorAttackswithIterativeTriggerInjectionAbstract1Introduction2ThreatModel3Methodology3.1BiasMeasurementonLa
我做这件事，唯一的目的就是让你开心沉吟大叔
一个男人心里满满的爱意：我做这件事，唯一的目的就是让你高兴，而不是赢得你的好感、证明我的能力、让你对我感恩戴德。所以，我不想让你知道我的付出，不想让你对我怀有歉意和内疚，更不想因此获得什么回报。我只是心甘情愿地想为你做点什么，因为我爱你。这才是真爱吧。以前有个读者，说她男朋友特别小气，还不诚实。请她吃顿饭要念叨很久，给她买礼物，花一百要说成三百，帮她做论文翻译，明明一小时就搞定了，非要说是熬了个通
剖析以太坊上的庞氏骗局：识别、分析和影响卷神
区块链安全防护论文翻译：Bartoletti,Massimo,etal."DissectingPonzischemesonEthereum:identification,analysis,andimpact."FutureGenerationComputerSystems102(2020):259-277.摘要：庞氏骗局是一种以高额利润为诱饵的金融欺诈。实际上，只有新用户加入了庞氏骗局，用户才能得
《 HFContractFuzzer: Fuzzing Hyperledger Fabric Smart Contractsfor Vulnerability Detection》论文翻译 WXF_Security 智能合约安全研究 fabric golang
《HFContractFuzzer:FuzzingHyperledgerFabricSmartContractsforVulnerabilityDetection》（EASE2021）摘要区块链技术以其特有的去中心化、不可变性等优点，近年来被广泛应用于各个领域。运行在区块链上的智能合约在去中心化应用场景中也扮演着越来越重要的角色。因此，自动检测智能合约中的安全漏洞成为区块链技术应用中亟待解决的问题
Data Augmentation and Deep Learning Methods in SoundClassification: A Systematic Review ggqyh 深度学习人工智能
文章为翻译，仅供学习参考论文原地址：DataAugmentationandDeepLearningMethodsinSoundClassification:ASystematicReview作者：OlusolaO.Abayomi-Alli,RobertasDamaševiˇcius,AtikaQazi,MariamAdedoyin-OloweandSanjayMisra4论文翻译地址：https:
因果学习及反因果学习（论文翻译）三分钟湿度
OnCausalandAnti-causalLearning本博文对论文OnCausalandAnti-causalLearning的摘要和模型部分做了翻译和小修改，本论文主要描述因果学习中常见的几类基于函数估计的模型，同时说明了因果与相关性、因果学习与机器学习之间的关系，论文重点在讨论和比较不同模型，内容较为笼统，不做深入探讨，但对不同模型之间的本质关系的讨论值得一看。论文地址：https://
Convolutional Neural Networks for No-Reference Image Quality Assessment 论文翻译亚里论文阅读 NR-IQA 使用卷积网络进行图像质量评价
ConvolutionalNeuralNetworksforNo-ReferenceImageQualityAssessment论文翻译TranslationAbstract1Introduction2RelatedWork3CNNforNR-IQA3.1NetworkArchitecture3.2LocalNormalization3.3Pooling3.4ReLUNonlinearity3.5
有道论文翻译接口，python版和lua版 monsterskiller 手机编程脚本编程 python
论文翻译接口python版importrequestsimporthashlibfromurllib.parseimportquotedefget_md5(s,is_hex=True):md5=hashlib.md5()md5.update(s.encode())ifis_hex:returnmd5.hexdigest()returnmd5.digest()deftranslate(source_
医学论文翻译有哪些要求，应该如何翻译呢？英信翻译公司其他
近年来，随着国内医学水平的不断提高，医学论文翻译的需求也呈现出快速增长的趋势。在国外期刊上发表论文，往往需要将整篇论文翻译成英文。那么，医学论文翻译有哪些要求，应该如何翻译呢？专家指出，医学论文翻译最基本的要求就是准确性，要求翻译者能够准确地将原文的含义传达给读者，不出现歧义或者误解的情况。这要求翻译者具备深厚的医学专业知识和语言能力，能够理解原文的含义，并将其准确地表达出来。除了准确性之外，医学
GPT原始论文：Improving Language Understanding by Generative Pre-Training论文翻译 iKang_dlut gpt 人工智能深度学习
1摘要自然语理解包括文本蕴含、问题回答、语义相似性评估和文档分类等一系列多样化的任务。尽管大量未标注的文本语料库很丰富，但用于学习这些特定任务的标注数据却很稀缺，这使得基于区分性训练的模型难以充分发挥作用。我们展示了通过在多样化的未标注文本语料库上对语言模型进行生成式预训练，随后对每个特定任务进行区分性微调，可以实现这些任务的大幅度改进。与以往的方法不同，我们在微调过程中使用了任务感知的输入转换，
【论文翻译】Generation of Non-Deterministic Synthetic Face Datasets Guided by Identity Priors（21.12）联系丝信计算机视觉
文章目录读后感Abstract1Introduction1.1Ourcontributions2RelatedWorks2.1SyntheticImageGeneration2.2MatedSampleGeneration2.3LimitationsinState-of-the-art3PCA-FR-GuidedSampling4SyntheticMatedFace(SymFace)Dataset
ORB-SLAM2代码学习1 rgdb_tum.cc Dziwu SLAM 学习计算机视觉人工智能
论文翻译参考1参考2rgdb_tum.cc的框架代码大致思路LoadImages()加载图像——判断rgb图是否存在——判断rgb图与depth图数量是否对应相同。ORB_SLAM2::SystemSLAM()初始化，创建SLAM系统，并初始化各个线程。遍历每一对RGB图和depth图【读取RGB图和depth图，读取时间戳（vTimestamps存储了时间戳，实际上就是存储了数据文件的每一幅图像
GFS--Google File System论文翻译和理解不争_900c
一、系统设计目标高可用的大文件分布式文件系统。二、关键点Architecture-架构：有哪些Server，每个Server的功能。Master存储的MetaData的结构。client写数据流程。client读数据流程。启动时Master和ChunkServer的交互。ChunkServer发生故障时，Master和ChunkServer的交互。三、核心设计概述2.Master中存储的MetaD
翻译 5765f3fa240e
对于论文翻译，大家要极其重视阅读平行文本和查资料的重要性。我平时经常做论文翻译和润色，每一次都是如履薄冰。需要阅读核心参考文献，查资料消除术语，彻底领会论文背后的逻辑。这些都解决了，才轮到运用语言基本功。假如大家接论文翻译，请认真对待查资料和阅读平行文本这两件事，如果做不到，暂时不要接论文翻译。
BERT论文翻译 TheHonestBob NLP 自然语言处理
一、写在前面在Transformer和BERT大行其道的时代，搞懂这两种基础模型结构很有必要，在网上没有搜索到满意的论文翻译结果，最近刚好有时间，把BERT的论文在个人英语水平基础上最大程度的保留原作者的本意翻译一遍，如有翻译不到位的地方请各位指出，觉得不错的点个赞鼓励一下，Tansformer的论文我之前已经翻译了，可以查看我的这篇博客attentionisallyouneed论文翻译。查看be
ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中英文对照 SnailTyan 深度学习 Deep Learnig
文章作者：Tyan博客：noahsnail.com|CSDN|简书翻译论文汇总：https://github.com/SnailTyan/deep-learning-papers-translationImageNetClassificationwithDeepConvolutionalNeuralNetworksAbstractWetrainedalarge,deepconvolutionaln
2021-02-05 碰撞检测GJK算法详解（初学者慎入） MathPhilosophy
碰撞检测有2个经典算法，一个是分离轴算法SAT,还有一个就是本文要介绍的GJK，GJK是三个人的名字首写大字母；这个算法的数学推导有点复杂，目前网上只有这篇https://blog.csdn.net/u010016421/article/details/104788769/相对比较详细的介绍了算法，其主要也是参考原始论文翻译的；考虑到原始论文比较难读，博主特地专门写一篇文章介绍，博主的这篇文章会必
YoloV8改进策略：BackBone改进|DCNv4最新实践|高效涨点|多种改进教程|完整论文翻译静静AI学堂 YOLO
摘要涨点效果：在我自己的数据集上，mAP50由0.986涨到了0.993，mAP50-95由0.737涨到0.77，涨点明显！DCNv4是可变形卷积的第四版，速度和v3相比有了大幅度的提升，但是环境搭建有一定的难度，对新手不太友好。如果在使用过程遇到编译的问题，请严格按照我写的环境配置。论文：《DCNv4：对视觉应用的动态和稀疏算子的重新思考》https://arxiv.org/pdf/2401.
论文翻译 SVSGAN: Singing Voice Separation Via Generative Adversarial Network 夏HL
文章主要是将混合音频的声谱作为输入，人声,bgm的声谱作为标签，通过GAN来完成近似过程，生成器最后一层用的output_voice=[z_voice/(z_voice+z_bgm)]*x,output_bgm=[z_bgm/(z_voice+z_bgm)]*x而且文章中的生成器是经过预先训练后的。我在MKR-100上用SVSGAN时难以训练(以后换成wgan)。0.摘要从混合音频中分离出两种来源
ALOHA论文翻译：Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware baidu_huihui 精细双手操作低成本硬件
学习用低成本硬件进行精细双手操作MobileALOHA论文翻译：LearningFine-GrainedBimanualManipulationwithLow-CostHardware论文翻译@[TOC]在这里插入图片描述图1：ALOHA：一种用于双手远程操作的低成本开源硬件系统。整个系统使用现成的机器人和3D打印组件，总成本不到20,000美元。左图：用户通过反向驱动领导机器人进行远程操作，从而
手把手教你用GPT写提示词；进行文献综述；论文翻译/润色及写作 asyxchenchong888 gpt4 GPT gpt chatgpt 人工智能 python
2023年随着OpenAI开发者大会的召开，最重磅更新当属GPTs，多模态API，未来自定义专属的GPT。微软创始人比尔盖茨称ChatGPT的出现有着重大历史意义，不亚于互联网和个人电脑的问世。360创始人周鸿祎认为未来各行各业如果不能搭上这班车，就有可能被淘汰在这个数字化时代，如何能高效地处理文本、文献查阅、PPT编辑、编程、绘图和论文写作已经成为您成功的关键。而ChatGPT，作为一种强大的自
【Linux系统下论文翻译软件Zotero】 Dymc 安装笔记 linux 服务器论文翻译软件
Linux系统下论文翻译软件Zotero1下载安装包2建立快捷方式3插件安装4翻译插件出现报错1下载安装包Linux系统下的论文翻译软件Zotero，下载地址：https://www.zotero.org/download/2建立快捷方式解压后，创建快捷方式，即创建软链接：sudomkdir/opt/zoterosudomvZotero_linux-x86_64/*/opt/zotero/cd/o
KGCapsAN论文翻译毕一
摘要：基于方面(方面级)的情感分析是在细粒度情感分析中非常重要的子任务，旨在自动推断出某一方面在其上下文中的情绪。之前的研究已经表明，利用注意力为基础的方法可以有效地提高基于方面的情感分析的精度。尽管有了卓越的进步,基于方面的情绪分析现实中几个方面挑战。(1)目前基于注意力的方法可能会导致某一方面的注意力不正确地集中在与句法无关的词上。(2)传统的方法无法将情感与特殊的句子结构区分开来，如双重否定
记你我的第一次相遇易美编校
Hi大家好！今天是易美编校在与你们的第一次相遇，让我想到了白落梅的《世间所有的相遇都是久别重逢》,人和人的缘分真的很深，可以维系千年，任凭风尘起落，情怀不改。人和人的缘分真的很浅，只不过是相逢刹那，转身便成了永远的陌路。不知道你我之间将会有怎样的一个开始？先做个自我介绍吧，Emate易美编校是北京龙华全科教育科技有限公司旗下学术服务品牌，旨在为非英语国家的科学家提供专业化的论文翻译、润色、修改及其
基于ChatGPT的代码解释神器：GPT Academic、GitHub Copilot 码上出奇迹 chatgpt gpt github
（个人推荐使用第二个GitHubCopilot）1.GPT学术优化(GPTAcademic)工具简介GPTAcademic是什么为ChatGPT/GLM提供实用化交互界面，特别优化论文阅读/润色/写作体验，模块化设计，支持自定义快捷按钮&函数插件，支持Python和C++等项目剖析&自译解功能，PDF/LaTex论文翻译&总结功能，支持并行问询多种LLM模型，支持chatglm2等本地模型。兼容文
推荐几个将pdf论文翻译转化为中文论文的免费在线网站 Wency(王斯-CUEB) 经验分享
如果你需要将英文PDF研究论文翻译成中文，有几个网站可以帮助你：OnlineDocTranslator【传送门】这项免费服务允许您上传PDF并将其翻译成中文。它支持包括PDF在内的多种文档格式，并保持文档的原始布局。GroupDocs【传送门】这个在线工具提供免费的PDF文档从英文到中文的翻译。它是一个基于浏览器的应用程序，因此不需要安装软件。请注意，PDF文档的字符限制为10,000个字符。Do
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持