Tra_cy

【论文笔记】Bayesian Loss for Crowd Count Estimation with Point Supervision

文章目录

Abstract
1.Introduction
2. Related Work
3. The Proposed Method

3.1. Background and Motivation
3.2. Bayesian Loss
3.3. Background Pixel Modelling
3.4. Visualization and Analysis

4. Experiments

4.1. Evaluation Metrics
4.2. Datasets
4.3. Implementation Details
4.4. Experimental Evaluations
4.5. Ablation Studies

5. Conclusions and Future Work

Abstract

在人群计数数据集中，每个人都被一个点标注，这个点通常是头部的中心。任务是估计一个人群场景中的总人数。目前最先进的方法大多基于密度图估计，将稀疏点标注通过Gaussian kernel转换为“ground truth”密度图，然后将其作为学习目标来训练密度图估计器。然而，由于遮挡、透视效果、物体形状的变化等原因，这种“ground truth”密度图并不完美。相反，我们提出了一种新的损失函数——Bayesian loss，它从点注释的角度构造了一个密度贡献概率模型。提出的训练损失不是对密度图中每个像素的值进行约束，而是对每个注释点的计数期望进行更可靠的监督。如果没有附加的功能，损失函数将大大改善所有测试数据集的baseline loss。此外，我们的loss配备了一个标准的主干网络，不使用任何外部探测器或多尺度架构，对目前的技术状态起到了积极的作用。在最新和最大的UCF-QNRF数据集上，我们的方法大大优于以前的最佳方法。源代码可以在https://github.com/ZhihengCV/Bayesian-Crowd-Counting找到。
数据集参考：https://blog.csdn.net/NcepuKZH/article/details/89349623

1.Introduction

利用计算机视觉技术对密集人群进行计数是近年来备受关注的研究课题。它有广泛的应用，如估计规模，并计算参加政治集会，民间动乱，社会和体育活动的人数等。此外,人群计数的方法也有很大的潜力来处理类似的任务在其他领域,包括估计交通拥堵的车辆数量、计算细胞和细菌从微观图像、和动物的人群估计生态调查等等。

人群计数是一项非常具有挑战性的任务，因为：1. 密集人群之间往往存在严重的重叠和遮挡；2. 透视效果可能会导致图像中人类的大小、形状和外观发生很大的变化。在过去的十年中，文献中提出了许多人群计数算法。近年来，利用卷积神经网络(Convolutional Neural Networks, CNNs)进行人群计数的方法取得了显著的进展。最好的方法大多基于密度图估计，通常通过预测输入图像的密度图，然后对估计的密度图求和来获得人群计数。目前，用于训练的公开数据集仅为每个训练图像提供点注释，即每个人只有一个像素被标记(通常是头部的中心)。目前，使用这些标注最常见的方法是，首先使用高斯核将每个训练图像的点标注转换为“groundtruth”密度图，然后通过对密度图中每个像素的值进行回归来训练CNN模型。在这种像素级的严格监督下，CNN模型的准确性高度依赖于获得的“groundtruth”密度图的质量。

显然，由于遮挡、不规则的人群分布、物体大小、形状、密度等方面的巨大变化，将假设的高斯核应用于点注释得到的“groundtruth”密度图很难达到高质量。与此相反，我们提出了贝叶斯损失，它从点注释的角度构造了一个密度贡献概率模型。然后，通过对贡献概率和每个像素的估计密度的乘积求和，计算出每个注释点的期望计数。与之前限制每个像素密度值的损失函数相比，我们提出的训练损失对每个注释点的计数期望进行监督。

大量的实验评估表明，在UCF- qnrf[16]、ShanghaiTech[57]和UCF CC 50[15]基准数据集上，所提出的损失函数显著优于基线训练损失。此外，我们提出的损耗函数以标准VGG-19网络[39]为骨干，不使用任何外部探测器或多尺度架构，实现了所有基准数据集的最新性能，特别是与其他方法相比，UCF-QNRF数据集有了显著的改进。

2. Related Work

我们从以下几个方面对文献中关于人群计数估计的相关工作进行了综述。Detection-then-counting. Direct count regression. Density map estimation. Hybrid training.

3. The Proposed Method

3.1. Background and Motivation

${ D(x_m) >=0 : m = 1, 2, ......, M \}$ 表示一个密度图，其中， $x_m$ 表示一个二维像素位置， $M$ 是密度图中的像素总数。

${ (z_n, y_n) : n = 1, 2, ......, N \}$ 表示样本图像的点注释图，其中N为总人数， $z_n$ 为顶点位置， $y_n = n$ 为对应的标签。点注释映射为每个人只包含一个像素(通常是头部的中心)，它是稀疏的，不包含关于对象大小和形状的信息。直接使用这样的点注释图来训练密度映射估计器是很困难的。解决这个问题的一个常用方法是使用高斯核将其转换为“ground truth”密度图。

上述公式为正态分布的公式。

为在 $x_m$ 处的2D Gaussian distribution。
最近的工作大多数使用了上面的“ground truth”密度图为学习目标，利用以下损失函数训练一个密度map估计器:

其中 $F (\cdot)$ 为距离函数， $D^{est}$ 为估计密度图。假设数据集中所有的人都有同样的头部大小和形状，则可以Gaussian kernel 设置为一个固定大小，显然这和实际情况是不符的；另一种解决方案是为每一个n设置一种自适应Gaussian kernel: $\sigma_n$ ∝ $d_n$ , $d_n$ 是一个距离，取决于其所在空间域的最近邻点，它假定人群是均匀分布的。其他还有一些利用特定的信息的方法，如相机参数，以获得更准确的透视图，但通常这些信息是不可用的。

我们认为，在可用的人群计数数据集中的点注释可以被认为是密度图估计的弱标签。更合理的做法是将这些注释作为先验，而不是学习目标。在训练CNN模型时，采用密度图上Eq.(2)这样严格的像素对像素的监督的损失函数并不总是有利于提高计数估计的准确性，因为它迫使模型学习不准确的，甚至错误的信息。

3.2. Bayesian Loss

设 $x$ 为表示空间位置的随机变量， $y$ 为表示标注的点的随机变量。在以上讨论的基础上，我们不以Eq.(1)生成的“ground truth”密度图作为学习目标，而是根据所给的标签 $y_n$ 提出构建 $x_m$ 的似然函数.

为了简化符号，我们在下列公式中省略了随机变量x和y，例如，式(3)变成 $x_m | y_n ) = N ( x_m; z_n, \sigma^2 1_{2×2})$ 。根据贝叶斯定理，给定密度图中的像素位置 $x_m$ , $x_m$ 具有 $y_n$ 标签的后验概率可计算为：

在上面的推导中，第三个等式成立，因为我们假设每个类别标签 $y_n$ 的先验概率相等，即 $p(y_n)$ 相等，如 $p(y_n) = 1/N$ 。在实践中，如果我们事先知道人群或多或少会出现在某些地方，可以在这里应用一个定制的 $p(y_n)$ 。

利用后验标记概率 $p(y_n | x_m)$ 和估计密度图 $D^{est}$ ，我们得出Bayesian loss如下：令 $c^m_n$ 表示 $x_m$ 贡献 $y_n$ 的count， $c_n$ 为与 $y_n$ 相关的总count，则 $c_n$ 的期望为：

显然，每个注释点的ground-truth count $c_n$ 为1，因此我们有以下损失函数：

$F (\cdot)$ 是一个距离函数，在我们的实验中采用 ℓ1 距离表示。当训练图像中没有object时，应处理特殊情况。在这种情况下，我们直接将密度映射的总和强制为零。我们提出的损失函数是可微的，可以很容易地应用到一个给定的CNN使用标准的反向传播训练算法。

在推理阶段，我们不需要提前知道后验标概率 $p(y_n | x_m)$ ，因为当我们对估计的密度图求和时，我们消除了 $p(y_n | x_m)$ 如下：

3.3. Background Pixel Modelling

对于没有任何注释的背景像素，将它们分配给 $y_n$ 没有任何意义。为了更好地建模背景像素，除了标签 ${ y_n = n: n = 1,2，…N \}$ ,我们引入了一个额外的背景标签 $y_0 = 0$ 。那么，后验标签概率可以改写为：

假设 $p(y_n) = p(y_0) = \frac{1}{N+1}$ ，则可以得到最后一个等式。同理，我们有：

人和整个背景的期望count被定义为：

在这种情况下，整个密度图的总和 $\sum_{m=1}^M D^{est}(x_m)$ 包括了foreground counts $\sum_{n=1}^NE[c_n]$ 和background count $E[c_0]$ 。显然，我们希望background count的概率为0，foreground counts的概率为1，因此，我们有以下增强的损失函数。

为了定义背景似然，我们为每个像素构造一个虚拟的背景点

这里的 $z^m_n$ 表示 $x_m$ 最近的注释点， $d$ 是一个参数，控制head和虚拟背景点之间的空白，如图1所示。使用定义的虚拟背景点 $z^m_0$ ，对于远离head points的像素 $x_m$ ，可以将其分配给背景标签。这里我们也使用Gaussian kerne来定义背景似然。

3.4. Visualization and Analysis

我们构建了用于可视化和分析的标签分配的熵映射Ent，它对每个像素 $x_m$ 的计算如下:

熵度量了密度图中像素 $x_m$ 所属的标签上的不确定性。我们在图2中显示了不同设置下的熵图，总结如下：

后验可以大致找到人与人之间的界限。
密集区域的熵值高于稀疏区域。
对比(b)和(e)，通过背景像素建模，远离人群的像素处理得更好。
比较(e)和(f)，参数d控制前景和背景之间的距离。

4. Experiments

4.1. Evaluation Metrics

人群计数估计方法采用两种广泛使用的度量标准：平均绝对误差(MAE)和平均平方误差(MSE)，其定义如下：

其中K为测试图像的数量， $N_k$ 和 $C_k$ 分别为第K张图像的ground-truth count和estimated count。

4.2. Datasets

实验评估使用四种广泛使用的人群计数基准数据集：UCFQNRF、UCF CC 50、ShanghaiTech part A和part b。

4.3. Implementation Details

**Network structure.**我们使用标准的图像分类网络，去掉最后的池化层和随后的全连接层。在我们的实验中，我们测试了两个网络:VGG-19和AlexNet。通过双线性插值，我们upsample，网络的输出变为输入图片尺寸的1/8，然后通过一个regression header，它由两个分别为256和128channels的3×3卷积层构成，再通过一个1×1卷积层得到密度图。regression header由MSRA初始化器初始化，网络在ImageNet上预先训练。初始学习速率为 $10^{−5}$ 的Adam优化器用于更新参数。

**Training details.**我们使用随机裁剪和水平翻转来增加训练数据。我们注意到UCF-QNRF的图像分辨率从0.08万像素到6600万像素差别很大。然而，常规的CNN由于接受域有限，无法处理各种尺度的图像。因此，在UCF-QNRF中，我们将每个图像的短边限制在2048像素内。然后随机裁剪图像进行训练，图像分辨率较小的ShanghaiTechA和UCF_CC_50的裁剪尺寸为256×256，ShanghaiTechB和UCFQNRF的裁剪尺寸为512×512。在等式(3)和(14)中，我们设置了高斯参数σ为8，式(13)中的距离参数d到图像较短一侧的15%。这些参数是在UCF-QNRF的验证集(从训练集随机抽取的120幅图像)上选择的。

4.4. Experimental Evaluations

4.5. Ablation Studies

5. Conclusions and Future Work

本文提出了一种新的基于点监督的人群计数估计损失函数。与以往的基于像素监督的Gaussian kernel 将点注释转换为“ground truth”密度图的方法不同，我们的损失函数对每个注释点的计数期望采用了更可靠的监督。大量的实验证明了我们提出的方法在准确性、鲁棒性和泛化方面的优势。我们的公式目前的形式是相当普遍的，可以很容易地结合其他知识，例如，具体的foreground 或background先验，规模和时间的可能性，和其他事实，以进一步完善提出的方法。

论文笔记—NDT-Transformer: Large-Scale 3D Point Cloud Localization using the Normal Distribution Transfor 入门打工人笔记 slam 定位算法
论文笔记—NDT-Transformer:Large-Scale3DPointCloudLocalizationusingtheNormalDistributionTransformRepresentation文章摘要~~~~~~~在GPS挑战的环境中，自动驾驶对基于3D点云的地点识别有很高的要求，并且是基于激光雷达的SLAM系统的重要组成部分（即闭环检测）。本文提出了一种名为NDT-Transf
[论文笔记]Circle Loss: A Unified Perspective of Pair Similarity Optimization 愤怒的可乐 #文本匹配[论文]论文翻译/笔记自然语言处理论文阅读人工智能
引言为了理解CoSENT的loss，今天来读一下CircleLoss:AUnifiedPerspectiveofPairSimilarityOptimization。为了简单，下文中以翻译的口吻记录，比如替换"作者"为"我们"。这篇论文从对深度特征学习的成对相似度优化角度出发，旨在最大化同类之间的相似度sps_ps
【论文笔记】Multi-Task Learning as a Bargaining Game xhyu61 机器学习学习笔记论文笔记论文阅读人工智能深度学习
Abstract本文将多任务学习中的梯度组合步骤视为一种讨价还价式博弈(bargaininggame)，通过游戏，各个任务协商出共识梯度更新方向。在一定条件下，这种问题具有唯一解(NashBargainingSolution)，可以作为多任务学习中的一种原则方法。本文提出Nash-MTL，推导了其收敛性的理论保证。1Introduction大部分MTL优化算法遵循一个通用方案。计算所有任务的梯度g
[论文笔记] LLaVA 心心喵论文笔记论文阅读
一、LLaVA论文中的主要工作和实验结果ExistingGap:之前的大部分工作都在做模态对齐，做图片的representationlearning，而没有针对ChatBot（多轮对话，指令理解）这种场景优化。Contribution:这篇工作已经在BLIP-2之后了，所以Image的理解能力不是LLaVA希望提升的重点，LLaVA是想提升多模态模型的Instruction-Followingab
[论文笔记] LLM模型剪枝心心喵论文笔记论文阅读剪枝算法
AttentionIsAllYouNeedButYouDon’tNeedAllOfItForInferenceofLargeLanguageModelsLLaMA2在剪枝时，跳过ffn和跳过fulllayer的效果差不多。相比跳过ffn/fulllayer，跳过attentionlayer的影响会更小。跳过attentionlayer：7B/13B从100%参数剪枝到66%，平均指标只下降1.7～
【论文笔记】Training language models to follow instructions with human feedback B部分 Ctrl+Alt+L 大模型论文整理论文笔记论文阅读语言模型人工智能自然语言处理
TraininglanguagemodelstofollowinstructionswithhumanfeedbackB部分回顾一下第一代GPT-1：设计思路是“海量无标记文本进行无监督预训练+少量有标签文本有监督微调”范式；模型架构是基于Transformer的叠加解码器（掩码自注意力机制、残差、Layernorm）；下游各种具体任务的适应是通过在模型架构的输出后增加线性权重WyW_{y}Wy实
【论文笔记】：LAYN：用于小目标检测的轻量级多尺度注意力YOLOv8网络 hhhhhhkkkyyy 论文阅读目标检测 YOLO
背景针对嵌入式设备对目标检测算法的需求，大多数主流目标检测框架目前缺乏针对小目标的具体改进，然后提出的一种轻量级多尺度注意力YOLOv8小目标检测算法。小目标检测精度低的原因随着网络在训练过程中的加深，检测到的目标容易丢失边缘信息和灰度信息等。获得高级语义信息也较少，图像中可能存在一些噪声信息，误导训练网络学习不正确的特征。映射到原始图像的感受野的大小。当感受野相对较小时，空间结构特征保留较多，但
激光SLAM--(8) LeGO-LOAM论文笔记 lonely-stone slam 激光SLAM 论文阅读
论文标题：LeGO-LOAM：LightweightandGround-OptimizedLidarOdometryandMappingonVariableTerrain应用在可变地形场景的轻量级的、并利用地面优化的LOAMABSTRACT轻量级的、基于地面优化的LOAM实时进行六自由度位姿估计，应用在地面的车辆上。强调应用在地面车辆上是因为在这里面要求雷达必须水平安装，而像LOAM和LIO-SA
论文浅尝 - AAAI2020 | 迈向建立多语言义元知识库：用于 BabelNet Synsets 义元预测... 开放知识图谱机器学习人工智能知识图谱自然语言处理深度学习
论文笔记整理：潘锐，天津大学硕士。来源：AAAI2020链接：https://arxiv.org/pdf/1912.01795.pdf摘要义原被定义为人类语言的最小语义单位。义原知识库（KBs）是一种包含义原标注词汇的知识库，它已成功地应用于许多自然语言处理任务中。然而，现有的义原知识库建立在少数几种语言上，阻碍了它们的广泛应用。为此论文提出在多语种百科全书词典BabelNet的基础上建立一个统一
[论文笔记] LLM数据集——LongData-Corpus 心心喵论文笔记服务器 ubuntu linux
https://huggingface.co/datasets/yuyijiong/LongData-Corpus1、hf的数据在开发机上要设置sshkey，然后cat复制之后在设置在hf上2、中文小说数据在云盘上清华大学云盘下载：#!/bin/bash#BaseURLbase_url="https://cloud.tsinghua.edu.cn/d/0670fcb14d294c97b5cf/fi
[论文笔记] eval-big-refactor lm_eval 每两个任务使用一个gpu，并保证端口未被使用心心喵论文笔记 restful 后端
1.5B在eval时候两个任务一个gpu是可以的。7B+在evalbelebele时会OOM，所以分配时脚本不同。eval_fast.py：importsubprocessimportargparseimportosimportsocket#参数列表task_name_list=["flores_mt_en_to_id","flores_mt_en_to_vi","flores_mt_en_to_
【论文笔记】Separating the “Chirp” from the “Chat”: Self-supervised Visual Grounding of Sound and Language xhyu61 机器学习学习笔记论文笔记论文阅读
Abstract提出了DenseAV，一种新颖的双编码器接地架构，仅通过观看视频学习高分辨率、语义有意义和视听对齐的特征。在没有明确的本地化监督的情况下，DenseAV可以发现单词的"意义"和声音的"位置"。此外，它在没有监督的情况下自动发现并区分这两种类型的关联。DenseAV的定位能力源于一种新的多头特征聚合算子，该算子直接比较稠密的图像和音频表示进行对比学习。相比之下，许多其他学习"全局"音
图形学论文笔记 Jozky86 图形学图形学笔记
文章目录PBD：XPBD：shapematchingPBD：【深入浅出NvidiaFleX】(1)PositionBasedDynamics最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码XPBD：基于XPBD的物理模拟一条龙：公式推导+代码+文字讲解（纯自制）【论文精读】XPBD基于位置的动力学XPBD论文解读(
【视觉三维重建】【论文笔记】Deblurring 3D Gaussian Splatting CS_Zero 论文阅读
去模糊的3D高斯泼溅，看Demo比3D高斯更加精细，对场景物体细节的还原度更高，[官网]（https://benhenryl.github.io/Deblurring-3D-Gaussian-Splatting/）背景技术Volumetricrendering-basednerualfields：NeRF.Rasterizationrendering:3D-GS.Rasterization比vol
[论文笔记] Transformer-XL 心心喵论文笔记 transformer 深度学习人工智能
这篇论文提出的Transformer-XL主要是针对Transformer在解决长依赖问题中受到固定长度上下文的限制，如Bert采用的Transformer最大上下文为512（其中是因为计算资源的限制，不是因为位置编码，因为使用的是绝对位置编码正余弦编码）。Transformer-XL能学习超过固定长度的依赖性，而不破坏时间一致性。它由段级递归机制和一种新的位置编码方案组成。该方法不仅能够捕获长期
SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning 论文笔记头柱碳只狼小样本学习
前言目前大多数小样本学习器首先使用一个卷积网络提取图像特征，然后将元学习方法与最近邻分类器结合起来，以进行图像识别。本文探讨了这样一种可能性，即在不使用元学习方法，而仅使用最近邻分类器的情况下，能否很好地处理小样本学习问题。本文发现，对图像特征进行简单的特征转换，然后再进行最近邻分类，也可以产生很好的小样本学习结果。比如，使用DenseNet特征的最近邻分类器，在结合均值相减（meansubtra
多模态相关论文笔记靖待大模型人工智能论文阅读
(cilp)LearningTransferableVisualModelsFromNaturalLanguageSupervision从自然语言监督中学习可迁移的视觉模型openAI2021年2月48页PDFCODECLIP(ContrastiveLanguage-ImagePre-Training)对比语言图像预训练模型引言它比ImageNet模型效果更好，计算效率更高。尤其是zero-sho
【论文笔记 · PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting lokol. 论文笔记论文阅读 llama
Lag-Llama:TowardsFoundationModelsforTimeSeriesForecasting摘要本文提出Lag-Llama，在大量时间序列数据上训练的通用单变量概率时间序列预测模型。模型在分布外泛化能力上取得较好效果。模型使用平滑破坏幂律（smoothlybrokenpower-laws）。介绍目前任务主要集中于在相同域的数据上训练模型。当前已有的大规模通用模型在大规模不同数
【论文笔记】Unsupervised Learning of Video Representations using LSTMs 奶茶不加糖え lstm 深度学习自然语言处理
摘要翻译我们使用长短时记忆（LongShortTermMemory,LSTM）网络来学习视频序列的表征。我们的模型使用LSTM编码器将输入序列映射到一个固定长度的表征向量。之后我们用一个或多个LSTM解码器解码这个表征向量来实现不同的任务，比如重建输入序列、预测未来序列。我们对两种输入序列——原始的图像小块和预训练卷积网络提取的高层表征向量——都做了实验。我们探索不同的设计选择，例如解码器的LST
MOSSE算法论文笔记以及代码解释 five days 计算机视觉深度学习机器学习
论文《VisualObjectTrackingusingAdaptiveCorrelationFilters》代码github1.论文idea提出以滤波器求相关的形式，找到最大响应处的位置，也就是我们所跟踪的目标的中心，进而不断的更新跟踪目标框和滤波器。2.跟踪策略如图，根据初始帧圈出的目标框训练滤波器，最大响应处为目标框的中心点，当移动到下一帧时，根据滤波器求相关的算法获得最大响应值，进而得出下
Attention Is All Your Need论文笔记 xiaoyan_lu 论文笔记论文阅读
论文解决了什么问题？提出了一个新的简单网络架构——transformer，仅仅是基于注意力机制，完全免去递推和卷积，使得神经网络训练地速度极大地提高。Weproposeanewsimplenetworkarchitecture,theTransformer,basedsolelyonattentionmechanisms,dispensingwithrecurrenceandconvolution
论文笔记：相似感知的多模态假新闻检测图学习的小张论文笔记论文阅读 python
整理了RecSys2020ProgressiveLayeredExtraction:ANovelMulti-TaskLearningModelforPersonalizedRecommendations）论文的阅读笔记背景模型实验论文地址：SAFE背景在此之前，对利用新闻文章中文本信息和视觉信息之间的关系(相似性)的关注较少。这种相似性有助于识别虚假新闻，例如，虚假新闻也许会试图使用不相关的图
[论文总结] 深度学习在农业领域应用论文笔记12 落痕的寒假论文总结深度学习论文阅读人工智能
文章目录1.3D-ZeF:A3DZebrafishTrackingBenchmarkDataset(CVPR,2020)摘要背景相关研究所提出的数据集方法和结果个人总结2.Automatedflowerclassificationoveralargenumberofclasses(ComputerVision,Graphics&ImageProcessing,2008)摘要背景分割与分类数据集和实
论文笔记之LINE:Large-scale Information Network Embedding 小弦弦喵喵喵
原文：LINE:Large-scaleInformationNetworkEmbedding本文提出一种新的networkembeddingmodel：LINE.能够处理大规模的各式各样的网络，比如：有向图、无向图、有权重图、无权重图.文中指出对于networkembedding问题，需要保留localstructure和globalstructure，分别对应first-orderproximi
打败一切NeRF！ 3D Gaussian Splatting 的简单入门知识 Ci_ci 17 3d python
新手的论文笔记3DGaussianSplatting的笔记introductionRelatedwork预备知识Gaussiansplatting3D高斯泼溅原理Overview3DGaussianSplatting的笔记每次都是在csdn上找救命稻草，这是第一次在csdn上发东西。确实是个不错的笔记网站，还能同步，保存哈哈哈。印象笔记，Onenote逊爆了。研一刚开学两个月，导师放养，给的方向还
《Residual Bi-Fusion Feature Pyramid Network for Accurate Single-shot Object Detection》论文笔记 m_buddy #General Object Detection Bi-Fusion
参考代码：无1.概述导读：在检测任务中一般会引入FPN增强在不同尺度下网络的检测性能，但是只通过top-down的FPN网络是很难去重建由于特征图的漂移（水平或是垂直方向运动）在经过pooling操作（pooling不具有平移不变性）带来结果相差很大的问题（特别针对小目标），而且FPN带来的性能提升会在使用较多卷积层之后逐渐被稀释（卷积的平移不变形），进而会导致一些小目标定位性能降低。对此可以通过
论文笔记-Generative Adversarial Nets 升不上三段的大鱼
论文链接：https://papers.nips.cc/paper/2014/file/5ca3e9b122f61f8f06494c97b1afccf3-Paper.pdf论文解读：https://www.bilibili.com/video/BV1rb4y187vD?share_source=copy_web一句话总结：提出了生成模型框架GAN，包括一个生成模型G和一个判别模型D，用有监督的损失
论文笔记：NIPS 2020 Graph Contrastive Learning with Augmentations 饮冰l 图弱监督数据挖掘机器学习神经网络深度学习
前言本文主要提出在图对比学习大框架下的图数据增强的若干方法。概括来说，本文提出了一种图对比学习框架来无监督的完成图表示学习，首先作者提出了基于各种先验信息的四种图数据增强方法。然后，作者分析了在四种不同的图数据增强条件下，不同组合对多个数据集的影响:半监督、无监督、迁移学习以及对抗性攻击。作者为GNN的预训练提出了基于图数据增强的对比学习框架来解决图中数据异质性的挑战，本文的主要贡献如下：作者提出
论文笔记-vChain: Enabling Verifiable Boolean Range Queries over Blockchain Databases qq_40431700 笔记区块链
核心方法：提出了一种基于累加器的可认证数据结构，可以动态聚合任意查询属性提出块内和块间索引，聚合块内和块间数据，可以做高效查询验证倒排前缀树结构，加速同时处理大量数据的订阅查询提出问题：1.range查询2.布尔查询3.没有可靠第三方、而且不能保证查询的完整性图中元素有：①全节点②矿工节点：是全节点，而且负责构建共识证明，比如计算nonce③轻节点：存nonce、区块的哈希，不存数据记录提出的Vc
论文笔记--Improving Language Understanding by Generative Pre-Training Isawany 论文阅读论文阅读自然语言处理 chatgpt 语言模型 nlp
论文笔记GPT1--ImprovingLanguageUnderstandingbyGenerativePre-Training1.文章简介2.文章导读2.1概括2.2文章重点技术2.2.1无监督预训练2.2.2有监督微调2.2.3不同微调任务的输入3.Bert&GPT4.文章亮点5.原文传送门6.References1.文章简介标题：ImprovingLanguageUnderstandingb
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理