BUAA～冬之恋

图上的预训练 ICLR 2020

论文链接：https://openreview.net/forum?id=HJlWWJSFDH¬eId=HJlWWJSFDH
代码链接：https://github.com/snap-stanford/pretrain-gnns/
参考文档：https://blog.csdn.net/byn12345/article/details/105252169/

摘要

本文解决的是图上的预训练问题。

预训练解决的问题是：针对特定任务的标签数据有限，可以在有充足数据的相关任务上进行模型的预训练，然后再针对下游任务进行微调。

在NLP、CV领域已经验证了预训练的有效性，如何在图上进行预训练呢？

本文提出一种新的GNN的预训练策略和自监督的方法。本文方法的关键是在单个节点以及整个图上进行预训练，这样GNN就可以同时学习到局部和全局的表示信息。

实验证明只在整张图上或者在单个节点上进行GNN的预训练，带来的提升很有限，甚至会在许多下游任务中带来负迁移。本文的策略避免了负迁移并且提升了多个下游任务的性能，在分子性质预测和蛋白质功能预测任务中超越了state-of-the-art。

1、引言

迁移学习指的是模型先在某些数据充足的任务上进行训练，然后在不同但相关的任务上重新使用。深度迁移学习已经在CV和NLP领域取得了巨大的成功，但是目前几乎没有在图数据上进行预训练的研究。

为什么要在图数据集上进行预训练？

（1）针对特定任务的有标签的数据非常有限。这个问题在化学生物等科学领域显得更加严重，这些领域的数据有限，而且标注起来非常耗时。

（2）来自真实世界应用的数据通常包含不均匀分布(out-of-distribution)的样本，也就是说训练集中的图和测试集中的图结构有很大的不同。例如要预测一个新合成的分子的属性信息，这个分子和训练集中所有出现的分子都不同。

然而，实现图数据上的预训练还是个挑战。一些研究表明成功的迁移学习需要和下游任务相关的大量的有标签的数据集，这就需要大量的领域专家选择和下游任务相关的样本并打标签。否则，很难把相关的预训练任务的知识泛化到新的下游任务，这被称为负迁移(negative transfer)，这限制了预训练模型的应用能力。

在系统的研究过程中，作者发现预训练GNN有时不能带来帮助。朴素的预训练策略会在许多下游任务中导致负迁移。看似强大的预训练策略（例如使用state-of-the-art的GNN进行图级别的多任务的有监督预训练，用于图级别的预测任务），只能获得有限的性能提升。这种策略还会在许多下游任务中导致负迁移。

作者提出了有效的GNN预训练策略，关键思想是：使用易获得的节点信息，让GNN捕获关于节点和边的特定领域的知识，以及图级别的知识。这使得GNN学习到了全局和局部层面的表示信息，如图1 a.iii所示。并使得GNN可以生成鲁棒的可迁移到不同下游任务的图级别的表示（通过对节点表示的pooling得到），如图1所示。

在实验中和无预训练的GNN、使用图级别的多任务的有监督预训练进行了对比，在其基础上性能均有提升。还发现表示能力最强的的GIN比表示能力较弱的模型，例如GCN、GraphSAGE、GAT更能从预训练中获益。并且，预训练GNN可以训练、微调地更快。

2、GNN相关知识

2.1、图上的监督学习

定义图为 $G = (V, E)$ ，节点属性为 $X_v$ ，边属性为 $e_{uv}$ 。给定图的集合 $\{G_1,\cdots,G_N\}$ 和标签 ${y_1,...,y_N\}$ 。图上的有监督学习的任务是学习到图的向量表示 $h_G$ 为一个图预测标签： $y_G=g(h_G)$ 。

2.2、GNN

GNN使用图上的节点和边的属性，为每个节点学习到向量表示 $h_v$ 。GNN通常是递归地聚合邻居信息和边的信息，更新目标节点的信息。 $k$ 次迭代后，目标节点 $v$ 的表示含有 $k - h o p$ 邻域的结构信息。第 $k$ 层的GNN定义为： $h_v^{(k)}=\text{COMBINE}^{(k)}\left(h_v^{(k-1)},\text{AGGREGATE}^{(k)}\left(\{\left(h_v^{(k-1)},h_u^{(k-1)},e_{uv}\right):u\in\mathcal{N}(v)\}\right)\right)$

$h_v^{(k)}$ 表示节点 $v$ 在第 $k$ 层的表示， $h_v^{(0)}=X_v$
$e_{uv}$ 表示节点 $u, v$ 之间连边的特征向量；
$\mathcal{N}(v)$ 是节点 $v$ 的邻居集合。

2.3、图表示学习

READOUT函数从最后一次迭代的输出中得到整张图的表示 $h_G$ ： $h_G=\text{READOUT}\left(\{h_v^{(K)}|v\in G\}\right)$ READOUT函数是一种不随输入排序变化而改变的函数，例如平均操作或图级别的池化函数。

3、GNN预训练策略

本文训练策略的核心是在单个节点层面以及整张图层面进行GNN的预训练，这使得GNN能捕获两个层面的针对领域的语义信息，如图1 a.iii所示。这和只使用整张图进行预训练（图1 a.ii）、只使用单个节点进行预训练（图1 a.i）形成对比。

3.1、节点级别的预训练

使用易得的无标签数据捕获图中特定领域的知识信息。作者提出两种自监督的方法：上下文预测(context prediction)和属性遮掩(attribute masking)。

3.1.1、context predicting

在上下文预测中，使用子图预测其周围的图结构。目标是训练出一个GNN可以将有着相似上下文结构的节点映射成相近的表示向量。

（1）邻居和上下文图

节点 $v$ 的** $K - h o p$ 邻居包含和 $v$ 距离不超过 $K$ 的所有节点和边**。节点 $v$ 的上下文图定义为 $v$ 邻居的图结构。用 $K$ 层的GNN聚合 $v$ 的 $K$ 阶邻居信息，得到节点嵌入 $h_v^{(K)}$ 。

上下文图由 $r_1,r_2$ 两个参数描述，表示 $v$ 的 $r_1−hops$ 和 $r_2−hops$ 的子图（宽度为 $r_2−r_1$ 的环）。

图2 a展示了邻居和上下文图。

其中， $r_1r1<K$

（2）使用辅助的GNN将上下文编码到向量中

由于图的组合特性，直接预测上下文图是很困难的。这不同于NLP，文本中的词语都是来源于一个有限的词表。

为了实现上下文的预测，作者使用辅助的GNN（context GNN）将上下文图编码成固定长度的向量，如图2 a中的 $G N N^{'}$ 所示。

如图2 a所示，应用上下文GNN得到上下文图的节点嵌入。然后对上下文锚节点的嵌入取平均，得到固定长度的上下文嵌入。节点 $v$ 对应的上下文嵌入表示为 $c_v^G$ 。

（3）使用负采样进行学习

使用负采样联合学习main GNN和context GNN。main GNN将邻居编码成节点嵌入，context GNN将上下文图编码成上下文的嵌入。

上下文预测的目标函数是一个二分类问题，判断特定的邻居和上下文图是否属于同一个节点： $\sigma\left(h_v^{(K)\top}c_{v'}^{G'}\right)\approx\textbf{1}\{\text{$v$ and $v'$ are the same nodes}\}$

$σ (\cdot)$ 表示sigmoid函数
$\textbf{1}(⋅)$ 是指示函数
正样本对： $v^{'} = v$ , $G^{'} = G$
负样本对：从随机选择的图 $G^{'}$ 中随机采样节点 $v^{'}$
负样本采样率为1，即正负样本数量相等，使用负对数似然函数作为损失函数。

预训练后的main GNN就是获得的预训练模型。

3.1.2、attribute masking

在属性遮掩中，目的是通过学习图结构上节点/边属性分布的规律，捕获到领域知识。

（1）Masking node and edges attributes

属性遮掩的预训练工作如下：mask掉节点/边的属性信息，基于邻域结构，使用GNN预测这些属性信息。图2 b展示了这一方法在分子图中的应用。

随机mask掉输入节点/边的属性，例如分子图中的原子类型，使用特殊的标志mask这些属性。然后使用GNN得到相应的节点/边的嵌入（边的嵌入可通过对边末尾连接的节点嵌入求和得到）。最后应用线性模型预测mask的节点/边的属性。注意使用的是非全连接的图来捕获不同图结构中节点/边的分布规律。

这种mask节点和边属性的方法可用于有丰富信息的图，例如：

（1）分子图，节点的属性对应于原子的类型。捕获到这些属性在图中是如何分布的，有助于GNN学习到简单的化学规则（例如化合价）以及更复杂的化学现象。

（2）在蛋白质相互作用网络(PPI)，边的属性对应于一对蛋白质中不同的互作关系。捕获这些属性在图中是如何分布的，有助于GNN学习到不同的交互是如何相互关联的。

3.2、图级别的预训练

有两种进行图级别的预训练方式：（1）对整张图的特定领域的属性做预测(例如有监督的标签)；（2）对图结构做预测。

3.2.1、有监督的图级别的属性预测

由于图级别的表示 $h_G$ 是直接用于下游预测任务的微调的，所以我们需要将特定领域的信息编码到 $h_G$ 中。

通过定义有监督的图级别的预测任务，我们将图级别特定领域的知识编码到预训练的嵌入表示中。具体来说是使用图级别的多任务的有监督预训练，联合预测多个图的标签（这些标签有真实值）。

例如，在蛋白质功能的预测中，目标是预测给定的蛋白质是否有给定的功能，可以预训练GNN来预测到目前为止已经被验证过的蛋白质的功能。

为了联合预测多个图属性，每个属性都对应于一个二分类任务，在得到图的表示后经过一个线性分类器。

仅仅使用多任务图级别的预训练进行迁移学习的效果可能并不好，因为一些有监督的预训练任务可能和下游任务不相关，甚至会对下游任务的性能产生负作用(负迁移)。一种方法是选择相关的有监督的预训练任务，并且在在这些任务上预训练GNN。但是这种方法通常不可取，因为选择出相关的任务需要专家的知识，而且预训练应该能应用于多个独立的不同的下游任务才对。

为了解决这一问题，作者只使用多任务的有监督预训练进行图级别的学习，不使用在此过程中生成的节点嵌入（如图1 a.ii所示）。这些无用的节点表示可能会加重负迁移问题，因为在节点的嵌入空间中，许多不同的预训练任务容易互相干扰。

所以，本文预训练的策略是：首先进行节点级别的预训练，然后再进行图级别的预训练。这种方法可以生产更具有可迁移能力的图表示，并且有鲁棒性，可以提高下游任务的性能，不需要专家人为选择有监督的预训练任务。

3.2.2、结构相似度预测

第二种图级别预测任务方法的目的是：建模两个图间结构的相似性。这样的任务有：建模图的编辑距离、预测图结构的相似性。然而找到图距离的真实值是很困难的，大规模的图数据集中节点对数量巨大。这个方法超出了本文的范围，将其作为未来的工作。

3.3、概览：预训练GNN和下游任务微调

本文提出的预训练策略是：首先进行节点级别的自监督预训练，然后进行图级别的多任务有监督的预训练。

GNN的预训练结束后，将预训练得到的GNN模型在下游任务中进行微调。图级别的表示经过线性分类器后预测下游任务的图标签。

4、相关工作

使用无监督的方法学习图上的节点表示大致可分为两类：

（1）使用局部的基于随机游走的方法，预测边是否存在，进而重构图的邻接矩阵；

（2）Deep Graph Infomax方法，最大化局部节点表示和池化后的全局图的表示之间的互信息，训练得到节点编码器。

这些方法都是使得邻近的节点有相似的表示，在节点分类和链接预测任务中取得了很好的效果。但这种方法对于图级别的预测任务，可能不是最优的方法。在图级别的预测任务中，捕获局部邻域的结构相似性通常比捕获图中节点的位置信息更重要。本文的方法同时考虑了节点级别和图级别的预训练任务，并且在实验中证明了，对预训练模型同时使用这两种类型的任务可以显著提高其性能。

也有一些工作对不同任务间节点嵌入的迁移进行了研究。但是提出的方法都是对不同的子结构使用不同的节点嵌入，没有进行参数共享。这种方法天然就是transductive的，不能实现不同数据集间的迁移，不能进行端到端的微调，由于数据的稀疏性也不能捕获到大量多样的邻居/上下文信息。

本文的GNN预训练方法解决了上述挑战，编码了图级别的和节点级别的依赖关系以及结构信息，并且可以共享参数。

5、实验

5.1、数据集

5.1.1、预训练数据集

1、在化学领域

从ZINC15数据集中采样了2 million个未标注的分子，用于节点级别自监督的预训练。
使用ChEMBL数据集进行图级别的多任务的有监督预训练。

2、在生物领域

使用从PPI网络中获得的395K个未标注的蛋白质ego-networks进行节点级别的自监督的预训练。
使用88K个标注的蛋白质ego-netowrks进行图级别的多任务的有监督预训练，预测5000个coarse-grained biological functions。

5.1.2、下游的用于分类任务的数据集

1、在化学领域

使用MoleculeNet中的8个二分类的数据集

2、在生物领域

从PPI网络中获取数据

5.2、实验任务

图分类（图级别的属性预测）

5.3、对比方法

将本文的预训练策略和两种朴素的基线策略进行比较：（1）在相关的图级别任务上进行有限度的多任务预训练；（2）节点级别的自监督预训练。

5.4、实验结果

6、总结

本文提出了GNN预训练的策略，这一策略成功的关键在于在节点级别和图级别进行预训练并使用了表示能力强的GNN。

这就确保了节点的嵌入捕获到了局部邻居的语义信息，这些语义信息被汇聚到一起以得到有意义的图级别的表示，而这些图级别的表示又被用于下游任务。

在多个数据集，多个下游任务，使用多种GNN进行了实验，结果表明这一训练策略比没有经过预训练的模型，具有更强的对out-of-distribution的泛化能力。

本文是第一个对图上的预训练进行研究的工作，在图上的迁移学习领域中迈出了重要的一步。

未来的研究方向有：

（1）改进GNN的结构以及预训练和微调的方法，以进一步提高泛化能力。

（2）研究预训练模型学习到了什么有用的信息。

（3）将这一方法应用于其他领域，例如物理、材料科学、生物结构等。

（4）图级别预测的预训练任务中，是否能增加图结构相似性的预测任务。

论文阅读笔记（十九）：YOLO9000: Better, Faster, Stronger __Sunshine__ 笔记 YOLO9000 detection classification
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning论文阅读笔记慘綠青年627 论文阅读笔记深度学习
SAFEFL:MPC-friendlyFrameworkforPrivateandRobustFederatedLearning适用于私有和鲁棒联邦学习的MPC友好框架SAFEFL，这是一个利用安全多方计算(MPC)来评估联邦学习(FL)技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。概述传统机器学习（ML）：集中收集数据->隐私保护问题privacy-preservingML(PPML)采
A Tutorial on Near-Field XL-MIMO Communications Towards 6G【论文阅读笔记】 Cc小跟班【论文阅读】相关论文阅读笔记
此系列是本人阅读论文过程中的简单笔记，比较随意且具有严重的偏向性（偏向自己研究方向和感兴趣的），随缘分享，共同进步~论文主要内容：建立XL-MIMO模型，考虑NUSW信道和非平稳性；基于近场信道模型，分析性能（SNRscalinglaws，波束聚焦、速率、DoF）XL-MIMO设计问题：信道估计、波束码本、波束训练、DAMXL-MIMO信道特性变化：UPW➡NUSW空间平稳–>空间非平稳（可视区域
时序预测相关论文阅读笔记能力越小责任越小YA 论文阅读笔记时序预测 Transformer
笔记链接：【有道云笔记】读论文（记录）https://note.youdao.com/s/52ugLbot用于个人学习记录。
Your Diffusion Model is Secretly a Zero-Shot Classifier论文阅读笔记 Rising_Flashlight 论文阅读笔记计算机视觉
YourDiffusionModelisSecretlyaZero-ShotClassifier论文阅读笔记这篇文章我感觉在智源大会上听到无数个大佬讨论，包括OpenAISora团队负责人，谢赛宁，好像还有杨植麟。虽然这个文章好像似乎被引量不是特别高，但是和AI甚至人类理解很本质的问题很相关，即是不是要通过生成来构建理解的问题，文章的做法也很巧妙，感觉是一些学者灵机一动的产物，好好学习一个！摘要这
Conditional Flow Matching: Simulation-Free Dynamic Optimal Transport论文阅读笔记猪猪想上树论文阅读笔记
ConditionalFlowMatching:Simulation-FreeDynamicOptimalTransport笔记发现问题连续正规化流（CNF）是一种有吸引力的生成式建模技术，但在基于模拟的最大似然训练中受到了限制。解决问题介绍一种新的条件流匹配（CFM)，一种针对CNFs的免模拟训练目标。具有稳定的回归目标，用于扩散模型中的随机流，但享有确定性流模型的有效推断。与扩散模型和CNF目
论文阅读笔记《SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning》深视论文阅读笔记 #小样本学习深度学习小样本学习
小样本学习&元学习经典论文整理||持续更新核心思想本文提出一种基于最近邻方法的小样本学习算法（SimpleShot），作者指出目前大量的小样本学习算法都采用了元学习的方案，而作者却发现使用简单的特征提取器+最近邻分类器的方法就能实现非常优异的小样本分类效果。本文首先用特征提取网络fθf_{\theta}fθ+线性分类器在一个基础数据集上对网络进行训练，将训练得到的特征提取网络增加一个简单的特征
【论文阅读笔记】（2015 ICML）Unsupervised Learning of Video Representations using LSTMs 小吴同学真棒学习人工智能 LSTM 动作识别无监督自监督 self-supervised
UnsupervisedLearningofVideoRepresentationsusingLSTMs（2015ICML）NitishSrivastava,ElmanMansimov,RuslanSalakhutdinovNotesContributionsOurmodelusesanencoderLSTMtomapaninputsequenceintoafixedlengthrepresent
使用动态网格的流体动画 Fluid Animation with Dynamic Meshes 论文阅读笔记 hijackedbycsdn Fluid Simulation 笔记
目录引言背景方法离散化离散化的导数算子速度插值广义的半拉格朗日步重新网格化双向流固耦合和质量守恒原文：Klingner,BryanM.,etal.“Fluidanimationwithdynamicmeshes.”ACMSIGGRAPH2006Papers.2006.820-825.引言使用[Alliezetal.,2005]的方法动态生成不规则的四面体网格根据边界的位置、边界的形状、基于流体和速
【论文阅读笔记】AutoAugment:Learning Augmentation Strategies from Data 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
AutoAugment:LearningAugmentationStrategiesfromData摘要研究方法:本文描述了一种名为AutoAugment的简单程序，通过这个程序可以自动寻找改进的数据增强策略。研究设计了一个策略空间，其中策略包含多个子策略，在每个小批量数据中针对每张图片随机选择一个子策略。每个子策略由两个操作组成，每个操作是图像处理函数（如平移、旋转或剪切），以及应用这些函数的概
【论文阅读笔记】Contrastive Learning with Stronger Augmentations 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
ContrastiveLearningwithStrongerAugmentations摘要基于提供的摘要，该论文的核心焦点是在对比学习领域提出的一个新框架——利用强数据增强的对比学习（ContrastiveLearningwithStrongerAugmentations，简称CLSA）。以下是对摘要的解析：问题陈述：表征学习（representationlearning）已在对比学习方法的推动
使用八叉树模拟水和烟雾 Simulating Water and Smoke with an Octree Data Structure 论文阅读笔记 hijackedbycsdn Fluid Simulation 笔记
原文：Losasso,Frank,FrédéricGibou,andRonFedkiw.“Simulatingwaterandsmokewithanoctreedatastructure.”Acmsiggraph2004papers.2004.457-462.引言这篇文章扩展了[Popinet2003]的工作，拓展到表面自由流，并且使得八叉树不受限制自适应网格划分的一个缺点是，它的模板不是均匀的，
PointMixer论文阅读笔记 ZHANG8023ZHEN 论文阅读笔记
MLP-mixer是最近很流行的一种网络结构，比起Transformer和CNN的节构笨重，MLP-mixer不仅节构简单，而且在图像识别方面表现优异。但是MLP-mixer在点云识别方面表现欠佳，PointMixer就是在保留了MLP-mixer优点的同时，还可以很好的处理点云问题。PointMixer可以很好的处理intra-set,inter-set,hierarchical-set的点云。
DCNNs之DNA论文阅读笔记苏十一0421
Article:DeepConvolutionalNeuralNetworkArchitectureWithReconfigurableComputationPatternsJournalTitle:IEEETransactionsonVeryLargeScaleIntegration(VLSI)SystemsIssue:No.08-Aug.(2017vol.25)ISSN:1063-8210pp
【论文阅读笔记】UNSUPERVISED REPRESENTATION LEARNING FOR TIME SERIES WITH TEMPORAL NEIGHBORHOOD CODING 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
UNSUPERVISEDREPRESENTATIONLEARNINGFORTIMESERIESWITHTEMPORALNEIGHBORHOODCODINGABSTRACT 本文提出了一种自监督框架，名为“时间邻域编码”（TemporalNeighborhoodCoding，TNC），用于学习非平稳时间序列的可泛化表示。该方法利用信号生成过程的局部平滑性来定义具有平稳性质的时间邻域。通过使用去偏差对
Deep Learning Workload Scheduling in GPU Datacenters:Taxonomy, Challenges and Vision 论文阅读牛码当驴云计算算法云计算论文阅读
【论文阅读笔记】DeepLearningWorkloadSchedulinginGPUDatacenters:Taxonomy,ChallengesandVision论文链接GPU数据中心的DL工作负载调度：分类、挑战、展望AbstractDeeplearning(DL)showsitsprosperityinawidevarietyoffields.ThedevelopmentofaDLmode
论文阅读笔记 RPT: Learning Point Set Representation for Siamese Visual Tracking faverr
论文阅读笔记RPT:LearningPointSetRepresentationforSiameseVisualTracking综合了可形变卷积、RepPoints检测、多层级卷积特征等思想论文地址代码地址现有跟踪方法中存在的问题现有的跟踪方法往往采用矩形框或四边形来表示目标的状态（位置和大小），这种方式忽略了目标自身会变化的特点（形变、姿态变化），因此作者采用表示点（Representative
SpanDB: A Fast, Cost-Effective LSM-tree Based KV Store on Hybrid Storage——论文泛读妙BOOK言论文阅读论文阅读 KV存储 lsm-tree
FAST2021Paper论文阅读笔记整理问题键值（KV）存储支持许多关键的应用和服务。它们在内存中执行快速处理，但通常受到I/O性能的限制。最近出现的高速NVMeSSD推动了新KV系统设计，以利用其低延迟和高带宽。挑战当前基于LSM树的KV存储未能充分发挥NVMeSSD的全部潜力。例如，在OptaneP4800X上部署RocksDB，相对于SATASSD，对于50%写入的工作负载，吞吐量仅提高了
DyTIS: A Dynamic Dataset Targeted Index Structure Simultaneously Efficient for Search, Inse...——论文泛读妙BOOK言论文阅读论文阅读 KV存储
EuroSys2023Paper论文阅读笔记整理问题在现实生活中，许多数据集都是复杂且动态的，即它们的键密度在整个键空间上变化，它们的键分布随时间变化。对于这样的动态数据集，使得索引结构能够高效支持数据管理中的所有关键操作，特别是搜索、插入和扫描，是一项具有挑战性的任务。挑战对于内存中的数据管理系统，例如内存数据库和键值存储[4,12,34,35,56]，索引结构的效率至关重要，强烈影响系统的最终
Gan论文阅读笔记 Alex·Fall 深度学习生成对抗网络论文阅读笔记
GAN论文阅读笔记2014年老论文了，主要记录一些重要的东西。论文链接如下：GenerativeAdversarialNets(neurips.cc)文章目录GAN论文阅读笔记出发点创新点设计训练代码网络结构代码测试代码出发点Deepgenerativemodelshavehadlessofanimpact,duetothedifficultyofapproximatingmanyintracta
PairLIE论文阅读笔记 Alex·Fall 低光增强论文阅读笔记
PairLIE论文阅读笔记论文为2023CVPR的LearningaSimpleLow-lightImageEnhancerfromPairedLow-lightInstances.论文链接如下：openaccess.thecvf.com/content/CVPR2023/papers/Fu_Learning_a_Simple_Low-Light_Image_Enhancer_From_Paire
点云transformer算法: FlatFormer 论文阅读笔记 zhaoyqcsdn 深度学习 transformer 算法论文阅读
代码：https://github.com/mit-han-lab/flatformer论文：https://arxiv.org/abs/2301.08739[FlatFormer.pdf]Flatformer是对点云检测中的backbone3d部分的改进工作，主要在探究怎么高效的对点云应用transformer具体的工作如下：一个缩写：**PCTs即pointcloudtransformers*
【论文阅读笔记】InstantID : Zero-shot Identity-Preserving Generation in Seconds LuH1124 论文阅读笔记图像编辑文生图论文阅读文生图扩散模型人脸识别
InstantID:秒级零样本身份保持生成理解摘要Introduction贡献RelatedWorkText-to-imageDiffusionModelsSubject-drivenImageGenerationIDPreservingImageGenerationMethod实验定性实验消融实验与先前方法的对比富有创意的更多任务新视角合成身份插值多身份区域控制合成结论和未来工作project：
【论文阅读笔记】Taming Transformers for High-Resolution Image Synthesis LuH1124 论文阅读笔记论文阅读 transformer cnn 图像生成
TamingTransformersforHigh-ResolutionImageSynthesis记录前置知识AbstractIntroductionRelatedWorkMethodLearninganEffectiveCodebookofImageConstituentsforUseinTransformersLearningtheCompositionofImageswithTransfo
【论文阅读笔记】Make-A-Character: High Quality Text-to-3D Character Generation within Minutes LuH1124 论文阅读笔记数字人 Relight 论文阅读 3d 数字人计算机图形学头发生成
【论文阅读笔记】分钟级别的高质量文本到3D角色生成AbstractIntroductionMethodLL/VM解析人脸面部属性并生成根据密集地标重建face/head形状几何生成纹理生成纹理提取漫反射反照率（DiffusionAlbedo）估计纹理矫正和补全头发生成（牛了）资产匹配实验未来工作paperhttps://arxiv.org/abs/2312.15430Demohttps://hug
【论文阅读笔记】Würstchen: AN EFFICIENT ARCHITECTURE FOR LARGE-SCALETEXT-TO-IMAGE DIFFUSION MODELS LuH1124 论文阅读笔记文生图论文阅读 text2img 扩散模型
WURSTCHEN：用于大规模文本到图像扩散模型的高效架构摘要贡献方法训练推理实验结论附录附录A附录B附录C附录D附录E这篇文章提出了一个高效的用于文本到图像生成模型架构，整体思路比较直白，在不损失图像生成质量的情况下，相比于现有T2I模型（SD1.4，SD2.1等）大大节约了成本。附录部分给了一些有趣的东西，比如FID的鲁棒性整篇文章还有点疑惑，比如阶段B的训练，使用的模型；节省成本主要是在说C
【论文阅读笔记】Advances in 3D Generation: A Survey LuH1124 论文阅读笔记 3DGeneration 论文阅读 3d 神经表示渲染
Advancesin3DGeneration:ASurvey挖个坑，近期填完摘要time：2024年1月31日paper：arxiv机构：腾讯挖个坑，近期填完摘要生成3D模型位于计算机图形学的核心，一直是几十年研究的重点。随着高级神经表示和生成模型的出现，3D内容生成领域发展迅速，能够创建越来越高质量和多样化的3D模型。该领域的快速增长使得很难跟上所有最近的发展。在本次调查中，我们旨在介绍3D生成
【论文阅读笔记】Transformer-XL 没啥信心
Paper:Transformer-XL:AttentiveLanguageModelsBeyondaFixed-LengthContext重点关注论文中的相对位置编码及提高融合了相对位置信息的attentionscore的计算效率的部分。AbstractTransformer具有学习长依赖的能力，但受限于语言模型固定长度上下文的限定。本文提出的Transformer-XL神经网络架构可以在不打破
【论文阅读笔记】Time Series Contrastive Learning with Information-Aware Augmentations 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimeSeriesContrastiveLearningwithInformation-AwareAugmentations摘要背景：在近年来，已经有许多对比学习方法被提出，并在实证上取得了显著的成功。尽管对比学习在图像和语言领域非常有效和普遍，但在时间序列数据上的应用相对较少。对比学习的关键组成部分：对比学习的一个关键组成部分是选择适当的数据增强（augmentation）方式，通过施加一些先
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D