angel_峰起云涌

Session-based Recommendation with Graph Neural Networks & GNN

最近在实验室组会主讲了一些关于GNN的理解并讨论了以篇发表于AAAI2019的关于门控图神经网络在推荐系统中应用的论文。现将相关内容予以记录。其中的截图有涉及到相关博主的博客，均已列于文献引用中，如有不当，请告知删除，谢谢！

1. “A Comprehensive Survey on Graph Neural Networks”

1.1 引言

像CNN、RNN这样的深度学习模型在图像、文本、音视频等欧式空间中的数据上取得了巨大的成就。但是因为图数据是不规则的，每个图的节点是无序的，且规模是可变的，同时每个节点的邻居节点数量也是不同的，因此一些重要的操作，如卷积操作，虽然能够很轻易的在图像或者文本数据中进行计算，但是却不能完全适应于图数据这样的非欧式空间的数据结构。此外，现有的机器学习方法都是基于数据是相互独立的假设的，但是图数据中的节点都是与其他节点相互连接的（孤岛情况不予考虑）。这些邻居节点的连接信息用于捕获数据之间的相互依赖关系。【这篇论文是从网络的角度对于图神经网络进行的综述性描述，与刘知远老师他们团队写的那篇图神经网络综述有所区别】

图1. 卷积算子计算示意图

但是很多领域的研究已经证明CNN、RNN等模型真的好用，所以为了将深度学习模型迁移于图数据中，提出了很多基于图的神经网络。图神经网络的提出主要动机是将2D的卷积算子操作（如上图左）用于图数据中（如上图右）。与图相似，图像可以认为是有多个像素点组成的图。像素的邻居节点是有一个n×n的滤波器所决定的。但是在图像中，滤波器选定的邻居节点是有序的且尺寸固定。而一个图的卷积算子的一个简单的方法就是取节点的邻居节点特征的平均值，值得注意的是，图中节点的邻居节点是无序的且尺寸不固定。

1.2 背景知识及分类

1.2.1 GNN vs. Network Embedding

GNN是一种深度学习模型，它旨在用端到端方式来解决图相关的任务，许多GNN算法都是尽可能的去提取更高层次的表示。而网络嵌入则是治理与在一个低维向量空间进行网络节点的向量表示，同时保护网络的拓扑结构和节点的内容信息，这些低维向量可以用于后续的很多任务，如图分类、节点聚类等。网络嵌入在形式上更倾向于一种二段式结构的算法体系。网络嵌入和GNN算法的分类大致可分为如图2所示[1]。左图为范畴分类，右图为论文中对每种框架下的文献总结。网络嵌入算法都是典型的无监督算法，可以大致分为三类，即矩阵分解、随机游走和图自动编码。基于深度学习的GAE属于图神经网络。

图2.网络嵌入和GNN的分类

1.2.2 GNN之GCN

GCN 最早是在一篇题为“Spectral networks and locally connected networks on graphs”的论文中进行应用的，这篇文章提出了一种基于谱的图神经网络模型，但是GCN真正走进学术研究的是2016年发表的“semi-supervised classification with graph convolutional network”论文，它提出了一种基于图的卷积神经网络用以图节点分类，如图3（左）所示，在节点层级上通过聚集节点的邻居信息来表示当前节点，从而实现节点分类。基于这种GCN的结构，通过增加一个POOLING操作来实现图分类，如图3（右）所示[2]。每一个POOLING层的作用是根据节点向量得到一个更为粗化的子图（称之为聚类图），然后使节点能够表示更深层次的图表示。最后经过一个softmax线性层输出每个图的标签类别。用于图分类的GCN论文可见参考文献[2]或参考我的上一篇博客[3]。

图3.节点分类GCN和图分类GCN

1.2.3 GNN之GAN （GAT）

GAN与GCN是类似的，都致力于寻找一个聚合函数，通过节点游走融合图中的相邻节点，来学习一种节点的表示。但是两者的区别是GAN（GAT）使用一种端到端的神经网络模型（注意力机制）来选择那些对于提取当前节点更为重要的节点，或者是给那条边赋以更为重要的权重。而GCN则是一种基于随机游走采样或者根据节点的度机制来选择节点。如图4所示。

图4. GCN和GAN(GAT)的节点选择机制的区别

1.2.4 GNN之GGNN

GGNN是将门控神经网络用于图中，这对于很多任务都是非常有帮助的，如图5所示。GGNN的输入是网络和它的邻接矩阵，但是这个邻接矩阵与GCN的矩阵输入有所区别。GGNN的矩阵是由出度矩阵和入度矩阵拼接而成的N×2D维矩阵（c）。图的卷积操作单元是GRU (b)。图5（a）表示输入，（c）表示根据输入构建的N×2D邻接矩阵。（b）表示GNN内部对节点信息的聚集过程，在显示边的基础上增加了与显示边方向相反的隐式边作为补充的信息传递方式，这主要是为了保证叶子节点与根节点的信息聚集的全面性。

图5.GGNN的输入矩阵和和门控机制

下面对门控机制的公式推理给出解释，如图6所示。式1表示节点的初始状态，D维向量，当节点的输入特征维度小于D时，后面补0。式（2）中，Av: 表示的是从图5（c）的矩阵A中选择对应与节点v的边信息，例如与节点2对应的边信息为“outgoing edges”的第4列和“incoming edges”的第1列和3列。[h1t-1T…hvt-1T]表示的是将t-1时刻所有节点的特征拼接在一起形成的向量。式（3）-（6）是GRU的传递过程，zvt 控制遗忘信息，rvt 控制新生信息。

图6.GGNN的公式推导

1.2.5 GNN之其他

1、GAE 是一种无监督的学习框架，称之为图自编码器。它通过编码器学习一种低维向量，然后通过解码器重构图数据，一般是重构图的邻接矩阵。GAE是一种常用的图嵌入方式，它既适应于普通的无属性图，又适应于带属性图。

2、STGNN 是一种基于时空的图神经网络，它旨在从时空图中学习那些隐式的不可见的特征模式，同时考虑节点在时间上的依赖性和空间上的依赖性。时空图是一个具有时间属性的分层网络模式，每个时间段内的邻接矩阵都是相互独立的，却是根据时间线进行关联和组织的，通过这种时间关联性来学习图的更深层次的表示。

基于以上GNN的背景知识介绍，我们介绍一篇将GGNN应用于推荐系统的工作。发表于AAAI2019。这是一篇基于会话的序列推荐工作，在通过与当前主要的推荐算法对比验证了算法的有效性和在序列推荐中的创新性。

2. Session-based Recommendation with Graph Neural Networks

2.1 引言

2.1.1 任务描述

推荐系统是为了帮助用户解决信息过载的问题。

Session-based Recommendation意为短序列推荐，或者是会话序列推荐。短序列推荐的意思是在一个时间窗口内连续的点击行为，比如，一位用户在登陆淘宝的这段时间里连续点击了10个商品，那么这10个商品就是一个短序列，着重点出了序列中最后一次点击的商品对于接下来需要预测商品的重要性。

2.1.2 现有算法的局限性

目前有很多研究都在解决这个问题，本文也是从不同的实验方法中选择了几类代表性的算法（其中与深度学习最相关的模型是将RNN引入到推荐任务中）。在这些方法中存在的局限有：

（1）当一个会话中的用户行为数量十分有限时，RNN就很难捕获用户的行为表示。因为使用RNN建模时，如果前面时序的动作项较少，最后一个输出产生推荐项时的准确性就比较低。

（2）会话过程中item之间的转移模式在会话推荐中是十分重要的，但是RNN和马尔科夫过程只对相邻物品的单向转移进行了建模，而忽略了会话中的其他item信息。

本文针对以上的两点局限性设计了名为SR-GNN的推荐框架，用于会话序列推荐。SR-GNN框架主要包括四个部分，下面将从总体框架和每一个部分进行介绍。以下内容除了对论文的总结学习以外，还主要参考了博客[4]和博客[5]。

2.2 SR-GNN算法框架

图7.SR-GNN框架图

SR-GNN框架主要由四个部分构成。第一部分是构图。出现在一个会话中的item根据点击的先后顺序被构建成有向图，然后将所有的session序列建模到一起形成item图。这个有向图体现了item的先后顺序关系。第二部分是item向量表示。所有的item都是有唯一标识的，它们在session有向图中是能够彼此区别的。然后使用GGNN对每个item进行Embedding，然后得到每个item的向量表示。但是在一个序列中，一个item可能重复出现多次，为此论文作者提出了一种新的矩阵构造方式来解决这个问题。第三个部分是session向量表示。Session向量可以作为当前会话序列中所有item的偏好或者兴趣，可以理解为一种商品的类别。作者通过两个线性层分别得到session的局部表示和全局表示，然后通过一个线性变换将局部表示和全局表示整合到一起，形成session的表示。第四个部分是预测模块，它使用交叉熵损失函数训练模型，对向量进行softmax操作，得到预测结果。

2.2.1 构图

每一个session序列中的item都根据它点击时间被建模成有向图，其中每个节点表示一个item，每条边表示用户的点击行为。这样，出现在不同session中的item都可以被建模成有向图。当然，正如前面所讲，在一个有向图中，同一个节点（item）是可能重复出现的。为此，作者提出了一种新的矩阵构造方式来解决这个问题，如下代码所示。

图8.重构矩阵代码示意图

从图8的代码中可以看出，在SR-GNN的构图中，它的邻接矩阵并不是简单的根据有连边为1，没有连边则为0的方式去构建邻接矩阵，而是使用了节点的出度特征来平衡权重的方法。作者在构建图的邻接矩阵时，对于序列中的每一个item连边进行了一个判断：如果一条连边在session有向图中已经出现过了，那么这条边的权重将会增加1。最后将session图中的所有边的权重和都除以该边起始节点的出度来获得该有向图的对应邻接矩阵。用图9来解释一下这个过程。

图9.SR-GNN构图部分邻接矩阵实例

图9中给出了[v1,v2,v3,v2,v4]的item序列，构建的session有向图如图9上所示。根据该session有向图所构建的邻接矩阵如图9下所示。其中节点2在item序列中出现了两次，所以它的出度为2，因此在构建的邻接矩阵中，节点2对应的出度矩阵和入度矩阵中的值为1/2。

2.2.2 item向量表示

SR-GNN中的向量表示模块主要采用GGNN，与上面所讲的GGNN是一样的训练过程，只不过输入的图矩阵是根据作者提出的构图方式进行的。

大致的训练过程是：

（1）提取邻居节点的潜在表示并将其作为图神经网络的输入。（初始向量为随机初始化的）。（2）遗忘门和重置门用于更新（决定）保留或删除哪些节点信息（3）通过previous状态、当前状态和重置门来构建候选状态（4）节点的终态是由前一时刻状态和候选状态组合形成的。

2.2.3 session向量表示

在得到每个item向量之后，利用这些item向量形成session向量用于基于会话的推荐。之前的研究都是假设每个session都会有一个不同的潜在用户表示，但是本文并没有基于这种假设，而是从已有的向量中获得这个向量。

Session向量的获得是由两个部分组成的，即局部表示和全局表示。局部表示是直接使用一个session中最后一次点击的item向量表示，即Sl=vn 。全局表示则是使用一种attention机制得到的。如下所示：

其中q∈Rd,W1 和 W2 是两个可以训练的矩阵。全局向量则是通过对么个item向量的加权求和得到。最后用于session序列中预测下一次item点击的session向量是将全局向量和局部向量拼接得到的，即Sh=W3Sl;Sg。

2.2.4 预测模块

最后，通过如公示所示的交叉熵损失函数来训练模型。

其中

2.3 数据集

论文使用了两个数据集，Yoochoose是取自RecSys challenge 2015, 它包含了一串用户点击；Diginitica 取自CIKM Cup 2016只使用了它的transactional数据。为了公平比较，作者对数据进行了清洗，过滤掉了长度为1的session和出现次数小于5的item，这样形成了如表1所示的数据集规模。

2.3 对比实验

POP-SPOP（传统方法）：推荐训练集中的TopN（点击率）和推荐session序列中的TopN。

Item-KNN：推荐与当前点击的item最相近的其他item，相似性的度量方式是cosine相似度。

BPR-MF：通过优化一个pairwise ranking目标函数进行item推荐（贝叶斯）

FPMC：基于马尔科夫链的序列预测问题

GRU4REC：这是推荐任务中的典型baseline，引入了RNN和attention 机制来捕获用户的主要目的。

STAMP：获取当前session中用户的一般兴趣和最后一次点击的当前兴趣。

2.4 实验结果

与各种baseline方法相比，SR-GNN在P@20和MRR@20可以达到目前最好的效果。其中Yoochoose 1/64是只选取Yoochoose中session出现时间最近的1/64个session作为训练集，Yoochoose 1/4是只选取Yoochoose中session出现时间最近的1/4作为训练集。实验结果表明，在这两种不同处理中，SR-GNN可以更好的学习到不同的出现时间的session特征。

3. 总结

以上是对GNN的简单介绍和基于session序列的推荐算法（SR-GNN）的简单总结。更多的内容可以参考列出的两篇论文和参考文献。

参考文献

[1] https://blog.csdn.net/weixin_35479108/article/details/86308808.

[2] Ying Z, You J, Morris C, et al. Hierarchical graph representation learning with differentiable pooling[C]//Advances in Neural Information Processing Systems. 2018: 4800-4810.

[3] https://blog.csdn.net/sinat_28978363/article/details/96478415.

[4] https://blog.csdn.net/yfreedomliTHU/article/details/91345348.

[5] https://blog.csdn.net/maqunfi/article/details/99703993.

「重磅」Sci.Robot最新封面：由多种人体肌肉组织驱动的生物混合手，人机融合取得新突破天机️灵韵具身智能人工智能硬件设备机器人生物信息学具身智能人工智能
ScienceRobotics查看原文：https://www.science.org/doi/10.1126/scirobotics.adr5512论文解析：《Biohybridhandactuatedbymultiplehumanmuscletissues》研究背景与目标本研究提出了一种基于生物混合技术的机械手，通过集成多个人体骨骼肌组织（MuMuTA，Multi-MaterialMulti-
【deepseek】论文笔记--DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 大表哥汽车人人工智能大语言模型学习笔记论文阅读人工智能 deepseek
DeepSeek-R1论文解析1.论文基本信息标题：DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning作者：DeepSeek-AI团队（联系邮箱：[email protected]）发表时间与出处：2024年，AIME2024（人工智能与数学教育国际会议）关键词：ReinforcementLe
每周编辑精选｜RJUA-QA 医疗数据集上线、 3D 分子生成模型 ResGen 论文解析 HyperAI超神经 AI for science
HyperAI超神经的新栏目来啦～每周一超神经编辑部会精选上一周更新在hyper.ai官网的内容（数据集、AI4S论文案例、百科词条）发布在这里。欢迎直接访问hyper.ai查看全部内容哦！1月15日-1月21日，hyper.ai官方网站更新速览：优质公共数据集：10个AI4S论文案例：2篇热门百科词条：10条访问官网：https://hyper.ai/公开数据集精选1.CrossDock2020
NeRF算法论文解析与翻译超爱吃小蛋糕的66 深度学习算法人工智能深度学习三维重建 NeRF
文章目录说明摘要一、简介二、相关工作2.1基于神经网络的3D形状表示2.2视图合成和基于图像的渲染三、基于神经辐射场的场景表示四、基于辐射场的体渲染五、神经辐射场优化5.1位置编码5.2分层体积采样5.3实施细则和损失函数说明NeRF：将场景表示为用于视图合成的神经辐射场本文主要对NeRF论文进行翻译(黑色字体)，同时对一些不理解的概念和算法进行相应批注(红色字体)了解NeRF之前需要了解一些关于
NeRF算法原理总结概述超爱吃小蛋糕的66 深度学习算法深度学习人工智能自动驾驶 NeRF 三维重建
简介本文旨在对NeRF算法进行总结。论文翻译见博客：《NeRF算法论文解析与翻译》参考链接：神经网络辐射场NeRF、实时NeRFBaking、有向距离场SDF、占用网络Occupancy、NeRF自动驾驶NeRF详解NeRF入门之体渲染(VolumeRendering)NeRF中的位置编码1.算法概述整体上NeRF干了这么一件事，输入一组静态场景的连续RGB图像和每帧图像对应的位姿，基于体渲染技术
Neural Tangent Kernel 理解（一）原论文解读 Bagba 机器学习深度学习神经网络机器学习 NTK
欢迎关注WX公众号，每周发布论文解析：PaperShare,点我关注NTK的理解系列暂定会从（一）论文解读，（二）kernelmethod基础知识，（三）神经网络表达能力，（四）GNN表达能力等方面去写。当然，可能有的部分会被拆开为多个小部分来写，毕竟每一个点拿出来都可以写本书了。（本人各个系列旨在让复杂概念通俗易懂，力求获得进一步理解）NeuralTangentKernel(NTK)理论由[1]
【Pytorch】学习记录分享11——GAN对抗生成网络大江东去浪淘尽千古风流人物 DeepLearning pytorch 学习生成对抗网络
PyTorchGAN对抗生成网络0.工程实现1.GAN对抗生成网络结构2.GAN构造损失函数（LOSS）3.GAN对抗生成网络核心逻辑3.1参数加载：3.2生成器：3.3判别器：0.工程实现原理解析：论文解析：GAN：GenerativeAdversarialNets1.GAN对抗生成网络结构2.GAN构造损失函数（LOSS）LOSS公式与含义：LOSS代码实现：importtorchfromto
从 YOLOv1 到 YOLO-NAS 的所有 YOLO 模型：论文解析 T1.Faker 深度学习 YOLO 目标检测
在计算机视觉的浩瀚领域，有一支耀眼的明星，她的名字传颂着革新与突破的传奇——YOLO（YouOnlyLookOnce）。回溯时光，走进这个引人注目的名字背后，我们仿佛穿越进一幅画卷，一幅展现创新魅力与技术风华的画卷。很久以前，CVPR2016是一个注定光芒万丈的时刻。在这个充满期待的舞台上，JosephRedmon为世界呈现了一种单阶段目标检测的奇迹，她名为YOLO。这并非仅是一个算法，更是一曲深
3D hand pose：MediaPipe Hands: On-device Real-time Hand Tracking AIRV_Gao 论文笔记深度学习计算机视觉手势姿态估计
MediaPipeHands:On-deviceReal-timeHandTracking论文解析0.摘要1.Introduction2.框架2.1BlazePalmDetector2.2HandLandmarkModel3.DatasetandAnnotation4.Results5.MediaPipegraphforhandtracking6.手势识别的应用论文链接：https://arxiv
MatchPyramid实现文本匹配愤怒的可乐 NLP项目实战 #文本匹配实战 MatchPyramid
引言今天利用MatchPyramid实现文本匹配。原论文解析→点此←。MatchPyramid核心思想是计算两段文本间的匹配矩阵，把它当成一个图形利用多层卷积网络提取不同层级的交互模式。匹配矩阵是通过计算两段输入文本基本单元(比如字或词)之间相似度得到的，作者提出了三种相似度计算函数。我们的实现采用余弦相似度。整体结构如上图所示。使用了两层卷积网络；每层卷积网络接一个最大池化层；最后利用两个全连接
Make Pixels Dance: High-Dynamic Video Generation论文解析江小皮不皮人工智能深度学习 PixelDance 文本生成视频计算机视觉动态视频生成
高动态视频生成的新进展MakePixelsDance:High-DynamicVideoGeneration高动态视频生成的新进展前言视频生成模式摘要论文十问实验数据集定量评估指标消融研究训练和推理技巧训练技术推理技术更多的应用MakePixelsDance:High-DynamicVideoGeneration高动态视频生成的新进展前言动态视频生成一直是人工智能领域的一个重要且富有挑战性的目标。
软考高级系统架构设计师论文真题分析系列之：论软件架构风格最笨的羊羊软考高级系统架构设计师考试软考高级系统架构设计师论文真题分析系列论软件架构风格
软考高级系统架构设计师论文真题分析系列之：论软件架构风格一、论软件架构风格二、论文解析三、详细介绍架构风格的模型和含义1.数据流风格2.调用/返回风格3.独立构件风格4.虚拟机风格5.仓库风格一、论软件架构风格软件架构风格是描述某一特定应用领域中系统组织方式的惯用方式，定义一个系统家族，即一个体系结构定义一个词汇表和一组约束。**词汇表中包含一些构件和连接件类型，而这组约束指出系统是如何将这些构件
车道线检测：LSTR论文解析 AIRV_Gao 论文笔记车道线检测 Transformers
车道线检测：End-to-endLaneShapePredictionwithTransformers论文解析1.Abstract2.Introduction3.RelatedWork4.Method4.1车道形状模型（LaneShapeModel）曲线的重新参数化4.2匈牙利拟合损失（HungarianFittingLoss）4.3网络结构4.3.1Backbone4.3.2Encoder4.3
Zephyr-7B论文解析及全量训练、Lora训练神洛华 LLMs llm nlp
文章目录一、Zephyr：DirectDistillationofLMAlignment1.1开发经过1.1.1Zephyr-7B-alpha1.1.2Zephyr-7B-beta1.2摘要1.3相关工作1.4算法1.4.1蒸馏监督微调（dSFT）1.4.2基于偏好的AI反馈(AIF）1.4.3直接蒸馏偏好优化（dDPO）1.4.4训练细节1.5实验二、alignment-handbook：低成本
【AlphaGo论文学习】Mastering the game of Go without human knowledge翻译及心得 PokiFighting 机器学习深度学习深度学习
原文地址：https://www.gwern.net/docs/reinforcement-learning/alphago/2017-silver.pdf参考的别人的学习解析：AlphaGoZero论文解析|蘑菇先生学习记更直接的论文翻译：【论文翻译】MasteringthegameofGowithouthumanknowledge(无师自通---在不借助人类知识的情况下学会围棋）_hwnbox
STD-Trees: Spatio-temporal Deformable Trees for Multirotors Kinodynamic Planning （论文解析）聪明小張路径规划算法人工智能
STD-Trees:Spatio-temporalDeformableTreesforMultirotorsKinodynamicPlanning（论文解析）动态变形树树边表示轨迹树变形数值结果仿真结果一般的轨迹优化方案中仅考虑到空间约束、障碍物约束、动力学约束等，本文的轨迹运动设计方案增加时间维度的优化设计，提出动力学规划中的时空变形方法，使生成的轨迹更偏向于最优轨迹。提出以变形单元的形式对树进
Fast R-CNN论文解析小毛激励我好好学习目标检测计算机视觉神经网络
文章目录一、介绍二、拟解决的关键问题三、FastR-CNN结构以及训练算法1.整体结构2.ROIPoolingLayer3.Pre-TrainedNetwork4.目标检测任务的微调5.尺度不变性四、总结五、参考文献本篇博客将要解析的论文是FastR-CNN，论文地址为：https://arxiv.org/abs/1504.08083一、介绍本文是RossGirshick于2015年发表的一篇文章
更快更准 | YOLOv3算法超详细解析（包括诞生背景+论文解析+技术原理等）小哥谈 YOLO算法：基础+进阶+改进 YOLO 目标检测人工智能机器学习深度学习 yolov3
前言：Hello大家好，我是小哥谈。YOLOv3是一种基于深度学习的目标检测算法，它可以快速而准确地在图像中检测出多个目标。它是由JosephRedmon和AliFarhadi在2018年提出的，是YOLO（YouOnlyLookOnce）系列算法的第三个版本。YOLOv3算法使用了Darknet-53网络作为其主干网络，并且采用了多尺度预测和多个尺度的边界框来提高检测效果。本篇文章就详细讲述一下
【阅读笔记】Federated Learning for Privacy-Preserving AI HERODING77 联邦学习人工智能机器学习深度学习联邦学习 PPFL
FederatedLearningforPrivacy-PreservingAI前言一、论文解析DefinitionCategorizationArchitectureApplicationExamplesUseCase1：FedRiskCtrlUseCase2：FedVisionOutlook二、论文总结三、个人感悟前言一篇来自CommunicationsofACM的文章，这类期刊相当于maga
Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection(论文解析) 黄阳老师目标检测人工智能计算机视觉
GroundingDINO:MarryingDINOwithGroundedPre-TrainingforOpen-SetObjectDetection:根据文字提示检测任意目标摘要1介绍2相关工作3.GroundingDINO3.1.特征提取和增强器3.2.语言引导的查询选择3.3.交叉模态解码器3.4.子句级别文本特征3.5.损失函数4实验4.1.设置4.2.Zero-ShotTransfer
Detecting Everything in the Open World: Towards Universal Object Detection(论文解析) 黄阳老师目标检测人工智能计算机视觉
DetectingEverythingintheOpenWorld:TowardsUniversalObjectDetection摘要1介绍2相关工作3准备工作4TheUniDetector框架4.1.异构标签空间训练4.2.开放世界推理5实验5.1.开放世界中的目标检测5.2.封闭世界中的目标检测5.3.广泛目标检测5.4开放词汇目标检测比较5.5.消融实验6结论摘要在本文中，我们正式探讨了通用
Incremental Object Detection via Meta-Learning【论文解析】黄阳老师目标检测人工智能计算机视觉
IncrementalObjectDetectionviaMeta-Learning摘要1介绍2相关工作3方法3.1问题描述3.2元学习梯度预处理3.3增量式目标检测器摘要摘要：在真实世界的情境中，目标检测器可能会不断遇到来自新类别的物体实例。当现有的目标检测器应用于这种情景时，它们对旧类别的性能会显著下降。已经有一些努力来解决这个限制，它们都应用了知识蒸馏的变体来避免灾难性遗忘。然而，我们注意到
论文解析——Implementing Precise Interrupts in Pipelined Processors KGback #论文解析 cpu pipeline interrupt
作者及发刊详情JamesE.SmithandAndrewR.Pleszkun.1988.ImplementingPreciseInterruptsinPipelinedProcessors.IEEETrans.Comput.37,5(May1988),562–573.https://doi.org/10.1109/12.4607摘要当一条指令执行结束另一条指令开始前，如果保存的进程状态和程序执行的
[卷积神经网络]FasterNet论文解析 ViperL1 神经网络学习笔记 1024程序员节
一、概述FasterNet是CVPR2023的文章，通过使用全新的部分卷积PConv，更高效的提取空间信息，同时削减冗余计算和内存访问，效果非常明显。相较于DWConv，PConv的速度更快且精度也非常高，识别精度基本等同于大型网络Swin-B，但是在GPU上可以提升36%的吞吐量。原文地址和代码地址如下：Run,Don'tWalk:ChasingHigherFLOPSforFasterNeura
Segment Anything（论文解析）黄阳老师目标检测计算机视觉
SegmentAnything摘要1.介绍2SAM任务SAM模型摘要我们介绍了“SegmentAnything”(SA)项目：这是一个新的任务、模型和数据集对于图像分割。使用我们高效的模型进行数据收集，我们构建了迄今为止最大的分割数据集（远远超过其他数据集），其中包含了超过10亿个掩膜，覆盖了1100万张经过许可和尊重隐私的图像。该模型被设计和训练为可提示的，因此可以实现零次学习，适用于新的图像分
Learning Open-World Object Proposals without Learning to Classify(论文解析) 黄阳老师目标跟踪人工智能计算机视觉
LearningOpen-WorldObjectProposalswithoutLearningtoClassify摘要1介绍2相关工作3方法3.1基线3.2基于纯定位的对象性3.3.对象定位网络(OLN)4实验4.1跨类泛化4.2.开放世界类不可知检测4.3更多的跨数据集泛化4.3.1Objects365泛化4.3.2EpicKitchens的泛化4.4.对长尾目标检测的影响5结论摘要物体提议已
论文解析——一种面向Chiplet互连的高效传输协议设计与实现 KGback #Chiplet #论文解析 chiplet D2D 接口协议
作者及发刊详情熊国杰,张津铭,贺光辉.一种面向Chiplet互连的高效传输协议设计与实现[J].计算机工程与科学,2023,45(08):1339-1346.XIONGGuo-jie,ZHANGJin-ming,HEGuang-hui.DesignandimplementationofanefficienttransmissionprotocolforChipletinterconnection[
论文解析-基因序列编码算法DeepSEA 平平无奇科研小天才论文人工智能深度学习
论文解析-DeepSEA参考亮点功能方法数据集来源数据实验评估评估DeepSEA预测染色质特征的性能评估DeepSEA在变异序列上的DHS预测性能数据集结果参考Zhou,J.,Troyanskaya,O.Predictingeffectsofnoncodingvariantswithdeeplearning–basedsequencemodel.NatMethods12,931–934(2015)
论文解析-moETM 平平无奇科研小天才论文人工智能深度学习
论文解析-moETM参考亮点动机发展现状现存问题功能方法Encoder改进Decoder改进评价指标生物保守性批次效应移除实验设置结果多组学数据整合cell-topicmixture可解释性组学翻译性能评估RNA转录本、表面蛋白、染色质可及域调控关系研究1.验证同一主题下，topgene可以映射到topprotein过程结果2.跨主题验证gene-protein、peak-gene的调控关系过程结
论文解析——AMD EPYC和Ryzen处理器系列的开创性的chiplet技术和设计 KGback #论文解析 #Chiplet chiplet AMD
ISCA2021摘要本文详细解释了推动AMD使用chiplet技术的挑战，产品开发的技术方案，以及如何将chiplet技术从单处理器扩展到多个产品系列。正文这些年在将SoC划分成多个die方面有一系列研究，MCM的概念也在不断更新，AMD吸收了chiplet架构的理论并应用到实际的设计中。II.chiplets驱动力A.计算的强大需求B.摩尔定律正在解体C.大芯片难以挽救大型SoC的Die大小在不
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多