BUAA～冬之恋

Circle Loss: A Unified Perspective of Pair Similarity Optimization 圆损失函数，统一优化视角，革新深度特征学习范式 CVPR 2020

论文来源：CVPR 2020
论文链接

最近旷视做了一项非常fundamental的工作。简单来讲，原来特征学习有 2 种基本范式，分类学习和 pairwise 学习，人们普遍都觉得这两者虽然有联系，但是总体上仍是割裂的。旷视在这项工作中首次将两者放在一个统一的框架下，用一个general 的公式定义了这两种范式，且在这统一的公式下，获得了比两者各自最高水平方法都要好的性能。这项工作已经发表在CVPR 2020。

深度特征学习有两种基本范式，分别是使用类标签和使用正负样本对标签进行学习。使用类标签时，一般需要用分类损失函数（比如 softmax + cross entropy）优化样本和权重向量之间的相似度；使用样本对标签时，通常用度量损失函数（比如 triplet 损失）来优化样本之间的相似度。

这两种学习方法之间并无本质区别，其目标都是最大化类内相似度( $s_p$ )和最小化类间相似度( $s_n$ )。从这个角度看，很多常用的损失函数（如 triplet 损失、softmax 损失及其变体）有着相似的优化模式：

它们会将 $s_n$ 和 $s_p$ 组合成相似度对 (similarity pair)来优化，并试图减小( $s_n-s_p$ )。在( $s_n-s_p$ )中，增大 $s_p$ 等效于降低 $s_n$ 。这种对称式的优化方法容易出现以下两个问题，如图 1 (a) 所示。

优化缺乏灵活性

$s_n$ 和 $s_p$ 上的惩罚力度是严格相等的。换而言之，给定指定的损失函数，在 $s_n$ 和 $s_p$ 上的梯度的幅度总是一样的。例如图 1(a)中所示的 A 点，它的 $s_n$ 已经很小了，可是， $s_n$ 会不断受到较大梯度。这样现象低效且不合理。

收敛状态不明确

优化 ( $s_n-s_p$ ) 得到的决策边界为 $s_n-s_p=m$ （m 是余量）。这个决策边界平行于 $s_n=s_p$ ，维持边界上任意两个点（比如 $T = (0.4, 0.7)$ 和 $T^{'} = (0.2, 0.5)$ ）的对应难度相等，这种决策边界允许模棱两可的收敛状态。比如， $T$ 和 $T^{'}$ 都满足了 $s_p-s_n=0.3$ 的目标，可是比较二者时，会发现二者之间的分离量只有 0.1( $s_p'-s_n=0.1$ )，从而降低了特征空间的可分性。

1、简介

为此，旷视研究院仅仅做了一项非常简单的改变，把 ( $s_n-s_p$ ) 泛化为 ( $\alpha_ns_n-\alpha_ps_p$ )，从而允许 $s_n$ 和 $s_p$ 能以各自不同的步调学习。

具体来讲，把 $\alpha_n$ 和 $\alpha_p$ 分别实现为 $s_n$ 和 $s_p$ 各自的线性函数，使学习速度与优化状态相适应。相似度分数偏离最优值越远，加权因子就越大。如此优化得到的决策边界为 $\alpha_ns_n-\alpha_ps_p=m$ ，能够证明这个分界面是 ( $s_n,s_p$ ) 空间中的一段圆弧，因此，这一新提出的损失函数称之为 Circle Loss，即圆损失函数。

由图 1(a) 可知，降低 ( $s_n-s_p$ ) 容易导致优化不灵活（A、B、C 相较于 $s_n$ 和 $s_p$ 的梯度都相等）以及收敛状态不明确（决策边界上的 $T$ 和 $T^{'}$ 都可接受）；而在 Circle Loss 所对应的图 1 (b) 中，减小 ( $\alpha_ns_n-\alpha_ps_p$ ) 会动态调整其在 $s_n$ 和 $s_p$ 上的梯度，由此能使优化过程更加灵活。

对于状态 A，它的 $s_p$ 很小（而 $s_n$ 已经足够小），因此其重点是增大 $s_p$ ；对于 B，它的 $s_n$ 很大（而 $s_p$ 已经足够大），因此其重点是降低 $s_n$ 。此外，本文还发现，圆形决策边界上的特定点 $T$ （圆弧与45度斜线的切点）更有利于收敛。因此，Circle Loss 设计了一个更灵活的优化途径，通向一个更明确的优化目标。

Circle Loss 非常简单，而它对深度特征学习的意义却非常本质，表现为以下三个方面：

1、统一的（广义）损失函数。从统一的相似度配对优化角度出发，它为两种基本学习范式（即使用类别标签和使用样本对标签的学习）提出了一种统一的损失函数；

2、灵活的优化方式。在训练期间，向 $s_n$ 或 $s_p$ 的梯度反向传播会根据权重 $\alpha_n$ 或 $\alpha_p$ 来调整幅度大小。那些优化状态不佳的相似度分数，会被分配更大的权重因子，并因此获得更大的更新梯度。如图 1(b) 所示，在 Circle Loss 中，A、B、C 三个状态对应的优化各有不同。

3、明确的收敛状态。在这个圆形的决策边界上，Circle Loss 更偏爱特定的收敛状态（图 1 (b) 中的 $T$ ）。这种明确的优化目标有利于提高特征鉴别力。

2、统一的相似性优化视角

深度特征学习的优化目标是最大化 $s_p$ ，最小化 $s_n$ 。在两种基本学习范式中，采用的损失函数通常大相径庭，比如大家熟知的 sofmax loss 和 triplet loss。

这里不去在意相似性计算的具体方式——无论是样本对之间的相似性（相似性对标签情况下）还是样本与类别代理之间的相似性（类别标签情况下）。本文仅仅做这样一个假设定义：给定特征空间中的单个样本 $x$ ，假设与 $x$ 相关的类内相似度分数有 $K$ 个，与 $x$ 相关的类间相似度分数有 $L$ 个，分别记为 $\{s_p^i\}(i=1,2,\cdots,K)$ 和 $\{s_n^j\}(j=1,2,\cdots,L)$ 。

为了实现最大化 $s_p$ 与最小化 $s_n$ 的优化目标，本文提出把所有的 $s_p$ 和 $s_n$ 两两配对，并通过在所有的相似性对上穷举、减小二者之差，来获得以下的统一损失函数：

这个公式仅需少量修改就能降级得到常见的 triplet 损失或分类损失，比如得到 AM-Softmax 损失：

或 triplet 损失：

3、Circle Loss：自定步调的加权方式

暂先忽略等式 (1) 中的余量项 $m$ 并对 $s_n$ 和 $s_p$ 进行加权，可得到新提出的 Circle Loss：

再定义 $s_p$ 的最优值为 $O_p$ ， $s_n$ 的最优值为 $O_n$ ； $O_nOn<Op$

4、类内余量和类间余量

不同于优化 ( $s_n-s_p$ ) 的损失函数，在 Circle Loss 中， $s_n$ 和 $s_p$ 是不对称的，本文为其各自定义了余量 $\Delta_n$ 和 $\Delta_p$ ，这样可得到最终带余量的 Circle Loss：

通过推导决策边界，本文进一步分析 $_n$ 和 $_p$ 。为简单起见，这里以二元分类的情况进行说明，其中决策边界是在 $\alpha_n(s_n-\Delta_n)-\alpha_p(s_p-\Delta_p)=0$ 处得到。根据等式 (5) 和 (6) ，可得到决策边界：

其中 $C=\frac{(O_n-\Delta_n)^2+(O_p-\Delta_p)^2}{4}$ 。

Circle Loss 有 5 个超参数，即 $O_p$ 、 $O_n$ 、 $\gamma$ 、 $\Delta_n$ 和 $\Delta_p$ 。通过将 $O_p=1+m$ ， $O_n=-m$ ， $\Delta_p=1-m$ ， $\Delta_n=m$ 。可将等式 (7) 约简为：

基于等式 (8) 定义的决策边界，可对 Circle Loss 进行另外一番解读。其目标是优化 $s_p\to 1$ 和 $s_n\to 0$ 。参数 $m$ 控制着决策边界的半径，并可被视为一个松弛因子。
换句话说，Circle Loss 期望 $s_p^i>1-m$ 且 $s_n^isni<m$

5、优势

Circle Loss 在 $s_n^j$ 和 $s_p^i$ 上的梯度分别为：

图 2© 在二元分类的实验场景中可视化了不同 $m$ 值设置下的梯度情况，对比图 2(a) 和 (b) 的triplet 损失和 AMSoftmax 损失的梯度，可知 Circle Loss 有这些优势：在 $s_n$ 和 $s_p$ 上能进行平衡的优化、梯度会逐渐减弱、收敛目标更加明确。

上图的可视化结果表明，triplet 损失和 AMSoftmax 损失都缺乏优化的灵活性。它们相对于 $s_n$ （左图）和 $s_p$ （右图）的梯度严格相等，而且在收敛方面出现了陡然的下降（相似度配对 B）。比如，在 A 处，类内相似度分数 $s_p$ 已接近 1 ，但仍出现了较大的梯度。此外，决策边界平行于 $s_p=s_n$ ，这会导致收敛不明确。

相对而言，新提出的 Circle Loss 可根据相似性得分与最优值的距离，动态地为相似度分数分配不同的梯度。对于 A（ $s_n$ 和 $s_p$ 都很大），Circle Loss 的重点是优化 $s_n$ ；对于 B，因为 $s_n$ 显著下降，Circle Loss 会降低它的梯度，并因此会施加温和的优化。

Circle Loss 的决策边界是圆形的，与 $s_n-s_p=m$ 直线有着明确的切点，而这个切点将成为明确的收敛目标。这是因为，对于同样的损失值，该切点具有最小的类间-类内差距，是最容易维持的。

6、实验

本文在三个特征学习任务（人脸识别，行人再识别，细粒度图像检索）上，对 Circle Loss 进行了全面评估，结果如下：

表 1：使用不同主干网络和损失函数在 MFC1 数据集上得到的识别 rank-1 准确度（%）

表 2：使用 ResNet34 主干网络在 LFW、YTF 和 CFP-FP 上的人脸识别准确度

表 3：在 IJB-C 1:1 验证任务上的真实接收率（%）比较

表 4：在行人再识别任务上的 Circle 损失的评估，这里报告了 R-1 准确度（%）和 mAP（%）

表 5：在 CUB-200-2011、Cars196 和 Stanford Online Products 上与当前最佳结果的比较，这里报告的是 R@K（%）

可以看到，在上述三个任务中，Circle Loss 都表现出非常强的竞争力。在人脸上，采用分类模式，Circle Loss 超过了该领域先前的最好方法（如AM-Softmax，ArcFace）；在细粒度检索中，采用样本对学习方式，Circle Loss 又媲美了该领域先前的最高方法（如Multi-Simi）。

值得一提的是，以往这两种范式下的损失函数形式通常大相径庭，而 Circle Loss 则使用完全一样的公式获得了上述表现，且每个参数都具有较好的可解读性。

下面这个关于收敛状态分析的实验，则进一步揭示了Circle Loss的优化特性。

图 3 在 ( $s_n,s_p$ ) 坐标中展现收敛前后的相似性状态，本文关注两种状态：

首先，是绿色散布点代表的收敛后状态；

其次，是蓝色累积点反映的通过决策面时瞬间的分布密度。

图3(a) 中的 AMSoftmax 和（b）中的 Circle Loss 具有相切的决策面，可以看到，收敛后，Circle Loss 的收敛状态更紧密。而且，这些状态都是从一个相对狭小的通道通过决策面并最终收敛的。

当对Circle Loss使用（c）中更优的参数，这个现象更为明显。该观察从实验角度验证了图 1中，对 Circle Loss 倾向一个特定收敛状态 T 的猜测和理论分析。

原文还有更多深入的实验来分析重要超参的影响、训练全过程相似性的变化过程。论文进行CVPR 2020 oral presentation及交流之前，可先前往https://arxiv.org/pdf/2002.10857.pdf 一睹为快。

7、结论

本文对深度特征学习做出了两项深刻理解。第一，包括 triplet 损失和常用的分类损失函数在内的大多数损失函数具有统一的内在形式，它们都将类间相似度与类内相似度嵌入到相似性配对中进行优化。第二，在相似度配对内部，考虑各个相似度得分偏离理想状态的程度不同，应该给予它们不同的优化强度。

将这两项理解联合起来，便得到 Circle Loss。通过让每个相似性得分以不同的步调学习，Circle Loss 赋予深度特征学习的更灵活的优化途径，以及更明确的收敛目标；并且，它为两种基本学习范式（样本对和分类学习）提供了统一的解读以及统一的数学公式。

在人脸识别、行人再识别、细粒度的图像检索等多种深度特征学习任务上，Circle Loss 都取得了极具竞争力的性能。

论文阅读笔记（十九）：YOLO9000: Better, Faster, Stronger __Sunshine__ 笔记 YOLO9000 detection classification
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning论文阅读笔记慘綠青年627 论文阅读笔记深度学习
SAFEFL:MPC-friendlyFrameworkforPrivateandRobustFederatedLearning适用于私有和鲁棒联邦学习的MPC友好框架SAFEFL，这是一个利用安全多方计算(MPC)来评估联邦学习(FL)技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。概述传统机器学习（ML）：集中收集数据->隐私保护问题privacy-preservingML(PPML)采
A Tutorial on Near-Field XL-MIMO Communications Towards 6G【论文阅读笔记】 Cc小跟班【论文阅读】相关论文阅读笔记
此系列是本人阅读论文过程中的简单笔记，比较随意且具有严重的偏向性（偏向自己研究方向和感兴趣的），随缘分享，共同进步~论文主要内容：建立XL-MIMO模型，考虑NUSW信道和非平稳性；基于近场信道模型，分析性能（SNRscalinglaws，波束聚焦、速率、DoF）XL-MIMO设计问题：信道估计、波束码本、波束训练、DAMXL-MIMO信道特性变化：UPW➡NUSW空间平稳–>空间非平稳（可视区域
时序预测相关论文阅读笔记能力越小责任越小YA 论文阅读笔记时序预测 Transformer
笔记链接：【有道云笔记】读论文（记录）https://note.youdao.com/s/52ugLbot用于个人学习记录。
Your Diffusion Model is Secretly a Zero-Shot Classifier论文阅读笔记 Rising_Flashlight 论文阅读笔记计算机视觉
YourDiffusionModelisSecretlyaZero-ShotClassifier论文阅读笔记这篇文章我感觉在智源大会上听到无数个大佬讨论，包括OpenAISora团队负责人，谢赛宁，好像还有杨植麟。虽然这个文章好像似乎被引量不是特别高，但是和AI甚至人类理解很本质的问题很相关，即是不是要通过生成来构建理解的问题，文章的做法也很巧妙，感觉是一些学者灵机一动的产物，好好学习一个！摘要这
Conditional Flow Matching: Simulation-Free Dynamic Optimal Transport论文阅读笔记猪猪想上树论文阅读笔记
ConditionalFlowMatching:Simulation-FreeDynamicOptimalTransport笔记发现问题连续正规化流（CNF）是一种有吸引力的生成式建模技术，但在基于模拟的最大似然训练中受到了限制。解决问题介绍一种新的条件流匹配（CFM)，一种针对CNFs的免模拟训练目标。具有稳定的回归目标，用于扩散模型中的随机流，但享有确定性流模型的有效推断。与扩散模型和CNF目
论文阅读笔记《SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning》深视论文阅读笔记 #小样本学习深度学习小样本学习
小样本学习&元学习经典论文整理||持续更新核心思想本文提出一种基于最近邻方法的小样本学习算法（SimpleShot），作者指出目前大量的小样本学习算法都采用了元学习的方案，而作者却发现使用简单的特征提取器+最近邻分类器的方法就能实现非常优异的小样本分类效果。本文首先用特征提取网络fθf_{\theta}fθ+线性分类器在一个基础数据集上对网络进行训练，将训练得到的特征提取网络增加一个简单的特征
【论文阅读笔记】（2015 ICML）Unsupervised Learning of Video Representations using LSTMs 小吴同学真棒学习人工智能 LSTM 动作识别无监督自监督 self-supervised
UnsupervisedLearningofVideoRepresentationsusingLSTMs（2015ICML）NitishSrivastava,ElmanMansimov,RuslanSalakhutdinovNotesContributionsOurmodelusesanencoderLSTMtomapaninputsequenceintoafixedlengthrepresent
使用动态网格的流体动画 Fluid Animation with Dynamic Meshes 论文阅读笔记 hijackedbycsdn Fluid Simulation 笔记
目录引言背景方法离散化离散化的导数算子速度插值广义的半拉格朗日步重新网格化双向流固耦合和质量守恒原文：Klingner,BryanM.,etal.“Fluidanimationwithdynamicmeshes.”ACMSIGGRAPH2006Papers.2006.820-825.引言使用[Alliezetal.,2005]的方法动态生成不规则的四面体网格根据边界的位置、边界的形状、基于流体和速
【论文阅读笔记】AutoAugment:Learning Augmentation Strategies from Data 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
AutoAugment:LearningAugmentationStrategiesfromData摘要研究方法:本文描述了一种名为AutoAugment的简单程序，通过这个程序可以自动寻找改进的数据增强策略。研究设计了一个策略空间，其中策略包含多个子策略，在每个小批量数据中针对每张图片随机选择一个子策略。每个子策略由两个操作组成，每个操作是图像处理函数（如平移、旋转或剪切），以及应用这些函数的概
【论文阅读笔记】Contrastive Learning with Stronger Augmentations 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
ContrastiveLearningwithStrongerAugmentations摘要基于提供的摘要，该论文的核心焦点是在对比学习领域提出的一个新框架——利用强数据增强的对比学习（ContrastiveLearningwithStrongerAugmentations，简称CLSA）。以下是对摘要的解析：问题陈述：表征学习（representationlearning）已在对比学习方法的推动
使用八叉树模拟水和烟雾 Simulating Water and Smoke with an Octree Data Structure 论文阅读笔记 hijackedbycsdn Fluid Simulation 笔记
原文：Losasso,Frank,FrédéricGibou,andRonFedkiw.“Simulatingwaterandsmokewithanoctreedatastructure.”Acmsiggraph2004papers.2004.457-462.引言这篇文章扩展了[Popinet2003]的工作，拓展到表面自由流，并且使得八叉树不受限制自适应网格划分的一个缺点是，它的模板不是均匀的，
PointMixer论文阅读笔记 ZHANG8023ZHEN 论文阅读笔记
MLP-mixer是最近很流行的一种网络结构，比起Transformer和CNN的节构笨重，MLP-mixer不仅节构简单，而且在图像识别方面表现优异。但是MLP-mixer在点云识别方面表现欠佳，PointMixer就是在保留了MLP-mixer优点的同时，还可以很好的处理点云问题。PointMixer可以很好的处理intra-set,inter-set,hierarchical-set的点云。
DCNNs之DNA论文阅读笔记苏十一0421
Article:DeepConvolutionalNeuralNetworkArchitectureWithReconfigurableComputationPatternsJournalTitle:IEEETransactionsonVeryLargeScaleIntegration(VLSI)SystemsIssue:No.08-Aug.(2017vol.25)ISSN:1063-8210pp
【论文阅读笔记】UNSUPERVISED REPRESENTATION LEARNING FOR TIME SERIES WITH TEMPORAL NEIGHBORHOOD CODING 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
UNSUPERVISEDREPRESENTATIONLEARNINGFORTIMESERIESWITHTEMPORALNEIGHBORHOODCODINGABSTRACT 本文提出了一种自监督框架，名为“时间邻域编码”（TemporalNeighborhoodCoding，TNC），用于学习非平稳时间序列的可泛化表示。该方法利用信号生成过程的局部平滑性来定义具有平稳性质的时间邻域。通过使用去偏差对
Deep Learning Workload Scheduling in GPU Datacenters:Taxonomy, Challenges and Vision 论文阅读牛码当驴云计算算法云计算论文阅读
【论文阅读笔记】DeepLearningWorkloadSchedulinginGPUDatacenters:Taxonomy,ChallengesandVision论文链接GPU数据中心的DL工作负载调度：分类、挑战、展望AbstractDeeplearning(DL)showsitsprosperityinawidevarietyoffields.ThedevelopmentofaDLmode
论文阅读笔记 RPT: Learning Point Set Representation for Siamese Visual Tracking faverr
论文阅读笔记RPT:LearningPointSetRepresentationforSiameseVisualTracking综合了可形变卷积、RepPoints检测、多层级卷积特征等思想论文地址代码地址现有跟踪方法中存在的问题现有的跟踪方法往往采用矩形框或四边形来表示目标的状态（位置和大小），这种方式忽略了目标自身会变化的特点（形变、姿态变化），因此作者采用表示点（Representative
SpanDB: A Fast, Cost-Effective LSM-tree Based KV Store on Hybrid Storage——论文泛读妙BOOK言论文阅读论文阅读 KV存储 lsm-tree
FAST2021Paper论文阅读笔记整理问题键值（KV）存储支持许多关键的应用和服务。它们在内存中执行快速处理，但通常受到I/O性能的限制。最近出现的高速NVMeSSD推动了新KV系统设计，以利用其低延迟和高带宽。挑战当前基于LSM树的KV存储未能充分发挥NVMeSSD的全部潜力。例如，在OptaneP4800X上部署RocksDB，相对于SATASSD，对于50%写入的工作负载，吞吐量仅提高了
DyTIS: A Dynamic Dataset Targeted Index Structure Simultaneously Efficient for Search, Inse...——论文泛读妙BOOK言论文阅读论文阅读 KV存储
EuroSys2023Paper论文阅读笔记整理问题在现实生活中，许多数据集都是复杂且动态的，即它们的键密度在整个键空间上变化，它们的键分布随时间变化。对于这样的动态数据集，使得索引结构能够高效支持数据管理中的所有关键操作，特别是搜索、插入和扫描，是一项具有挑战性的任务。挑战对于内存中的数据管理系统，例如内存数据库和键值存储[4,12,34,35,56]，索引结构的效率至关重要，强烈影响系统的最终
Gan论文阅读笔记 Alex·Fall 深度学习生成对抗网络论文阅读笔记
GAN论文阅读笔记2014年老论文了，主要记录一些重要的东西。论文链接如下：GenerativeAdversarialNets(neurips.cc)文章目录GAN论文阅读笔记出发点创新点设计训练代码网络结构代码测试代码出发点Deepgenerativemodelshavehadlessofanimpact,duetothedifficultyofapproximatingmanyintracta
PairLIE论文阅读笔记 Alex·Fall 低光增强论文阅读笔记
PairLIE论文阅读笔记论文为2023CVPR的LearningaSimpleLow-lightImageEnhancerfromPairedLow-lightInstances.论文链接如下：openaccess.thecvf.com/content/CVPR2023/papers/Fu_Learning_a_Simple_Low-Light_Image_Enhancer_From_Paire
点云transformer算法: FlatFormer 论文阅读笔记 zhaoyqcsdn 深度学习 transformer 算法论文阅读
代码：https://github.com/mit-han-lab/flatformer论文：https://arxiv.org/abs/2301.08739[FlatFormer.pdf]Flatformer是对点云检测中的backbone3d部分的改进工作，主要在探究怎么高效的对点云应用transformer具体的工作如下：一个缩写：**PCTs即pointcloudtransformers*
【论文阅读笔记】InstantID : Zero-shot Identity-Preserving Generation in Seconds LuH1124 论文阅读笔记图像编辑文生图论文阅读文生图扩散模型人脸识别
InstantID:秒级零样本身份保持生成理解摘要Introduction贡献RelatedWorkText-to-imageDiffusionModelsSubject-drivenImageGenerationIDPreservingImageGenerationMethod实验定性实验消融实验与先前方法的对比富有创意的更多任务新视角合成身份插值多身份区域控制合成结论和未来工作project：
【论文阅读笔记】Taming Transformers for High-Resolution Image Synthesis LuH1124 论文阅读笔记论文阅读 transformer cnn 图像生成
TamingTransformersforHigh-ResolutionImageSynthesis记录前置知识AbstractIntroductionRelatedWorkMethodLearninganEffectiveCodebookofImageConstituentsforUseinTransformersLearningtheCompositionofImageswithTransfo
【论文阅读笔记】Make-A-Character: High Quality Text-to-3D Character Generation within Minutes LuH1124 论文阅读笔记数字人 Relight 论文阅读 3d 数字人计算机图形学头发生成
【论文阅读笔记】分钟级别的高质量文本到3D角色生成AbstractIntroductionMethodLL/VM解析人脸面部属性并生成根据密集地标重建face/head形状几何生成纹理生成纹理提取漫反射反照率（DiffusionAlbedo）估计纹理矫正和补全头发生成（牛了）资产匹配实验未来工作paperhttps://arxiv.org/abs/2312.15430Demohttps://hug
【论文阅读笔记】Würstchen: AN EFFICIENT ARCHITECTURE FOR LARGE-SCALETEXT-TO-IMAGE DIFFUSION MODELS LuH1124 论文阅读笔记文生图论文阅读 text2img 扩散模型
WURSTCHEN：用于大规模文本到图像扩散模型的高效架构摘要贡献方法训练推理实验结论附录附录A附录B附录C附录D附录E这篇文章提出了一个高效的用于文本到图像生成模型架构，整体思路比较直白，在不损失图像生成质量的情况下，相比于现有T2I模型（SD1.4，SD2.1等）大大节约了成本。附录部分给了一些有趣的东西，比如FID的鲁棒性整篇文章还有点疑惑，比如阶段B的训练，使用的模型；节省成本主要是在说C
【论文阅读笔记】Advances in 3D Generation: A Survey LuH1124 论文阅读笔记 3DGeneration 论文阅读 3d 神经表示渲染
Advancesin3DGeneration:ASurvey挖个坑，近期填完摘要time：2024年1月31日paper：arxiv机构：腾讯挖个坑，近期填完摘要生成3D模型位于计算机图形学的核心，一直是几十年研究的重点。随着高级神经表示和生成模型的出现，3D内容生成领域发展迅速，能够创建越来越高质量和多样化的3D模型。该领域的快速增长使得很难跟上所有最近的发展。在本次调查中，我们旨在介绍3D生成
【论文阅读笔记】Transformer-XL 没啥信心
Paper:Transformer-XL:AttentiveLanguageModelsBeyondaFixed-LengthContext重点关注论文中的相对位置编码及提高融合了相对位置信息的attentionscore的计算效率的部分。AbstractTransformer具有学习长依赖的能力，但受限于语言模型固定长度上下文的限定。本文提出的Transformer-XL神经网络架构可以在不打破
【论文阅读笔记】Time Series Contrastive Learning with Information-Aware Augmentations 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimeSeriesContrastiveLearningwithInformation-AwareAugmentations摘要背景：在近年来，已经有许多对比学习方法被提出，并在实证上取得了显著的成功。尽管对比学习在图像和语言领域非常有效和普遍，但在时间序列数据上的应用相对较少。对比学习的关键组成部分：对比学习的一个关键组成部分是选择适当的数据增强（augmentation）方式，通过施加一些先
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST