ZZZ___bj

Socially-Aware Self-Supervised Tri-Training for Recommendation

摘要

自监督学习(SSL)可以从原始数据中自动生成真实样本，在改进推荐系统方面具有巨大的潜力。现有的基于ssl的方法通过节点/边dropout干扰原始数据图，生成新的数据视图，然后对不同视图进行基于对比学习的自识别，学习通用的表示。 在该模式下，只在两个不同视图的节点之间建立一个双射映射，说明忽略了来自其他节点的自监督信号。由于在推荐系统中被广泛观察到的同质性，我们认为来自其他节点的监督信号也很有可能有利于推荐的表示学习。为了捕获这些信号，本文提出了一种集成 tri-training的通用社交感知SSL框架。从技术上讲，我们的框架首先通过用户的社交信息来增强用户的数据视图。然后在多视图编码的tri-training机制下，该框架在增强视图上构建三个图编码器（只有一个编码器用于推荐），并利用其他两个编码器生成的其他用户的自监督信号对每个编码器进行迭代更新。由于tri-training是在自监督信号的相同数据源的增强视图上进行的，因此我们将其命名为 self-supervised tri-training。在多个真实数据集上进行的大量实验一致地验证了self-supervised tri-training框架改进推荐的有效性。代码： https://github.com/Coder-Yu/QRec.

1 介绍

自监督学习(SSL)是一种不需要人工标注标签的新型学习范式，最近在许多领域受到了相当广泛的关注。由于SSL的基本思想是从原始数据中学习自动生成的监督信号，可以解决推荐系统中的数据稀疏性问题，因此SSL在提高推荐性能方面具有巨大的潜力。自监督图表示学习的最新进展已经证明是一种有效的基于图的任务训练模式。也就是说，通过使用节点/边dropout或随机特征变换/掩蔽原始图来执行随机增强，以创建补充视图，然后最大化同一节点但从不同视图学习的表示之间的一致性，这称为图对比学习。受其有效性的启发，一些研究遵循这个训练模式，并致力于将其移植到推荐中。

通过这些研究的努力，自监督推荐领域最近已经被证明了一些有潜力的结果，表明从随机增强中挖掘监督信号是可取的。然而，与其他基于图的任务相比，推荐是截然不同的，因为在用户和商品之间有广泛观察到的同质性。大多数现有的基于ssl的方法是对增广视图进行基于自识别的对比学习，以学习针对原始数据的通用表示。在该方案下，在两个不同视图中的节点之间建立一个双射，一个给定的节点可以在另一个视图中从它本身挖掘信息。同时，将在潜在空间中的其他节点视为与给定节点被推开远离的负节点。一些节点是假负样本，由于同质性，它们与给定的节点相似，如果它们被识别为正样本，那么在推荐下，实际上可以有利于表示学习。相反，把它们粗略地归入负样本可能会导致性能下降。

为了解决这一问题，本文提出了一种将 tri-training（多视图共同训练）与SSL相结合的社交感知SSL框架。补充的视图可以捕获用户之间的同质性，从另一个隐式反映用户偏好的数据源中捕捉社交关系。由于在过去的十年中社交平台的流行，社交关系现在在许多推荐系统中都很容易获得。我们利用用户-用户和用户-项目交互中的三元结构来增强两个补充数据视图，并分别将其解释为用户在扩展社交圈的兴趣和向朋友分享项目的兴趣。考虑到用户-项目视图包含了用户的历史购买，我们有三个视图从不同的角度描述用户的偏好，并提供一个场景来融合 tri-training和SSL。

tri-training是一种流行的半监督学习算法，它使用三种分类器利用无标签数据。在本工作中，我们利用它来挖掘具有多视图编码的推荐系统中其他用户的自监督信号。从技术上讲，我们首先在三个视图上构建了三个非对称图编码器，其中两个仅用于学习用户表示和给出伪标签，另一个针对用户-项目视图完成生成推荐的任务。然后，我们动态地扰乱社交网络和用户-项目交互图，创建一个无标签的样本集。在tri-training机制下，在每轮期间，其他两个视图上的编码器预测当前视图中每个用户的无标签的样本集中最可能的语义正样本。然后，该框架通过所提出的基于邻居识别的对比学习细化用户表示，即最大化当前视图中有标签与无标签数据集的用户表示之间的一致性来细化用户表示。随着所有编码器在这个过程中不断改进，生成的伪标签也变得更丰富，这反过来又递归地使编码器再次受益。因此，与仅通过自识别SSL方案增强的推荐编码器相比，用户-项目视图上的推荐编码器变得更强。由于tri-training是基于同一数据源的补充视图来学习自监督信号，因此我们将其命名为自监督tri-training。

这篇论文主要的贡献总结如下：

我们提出了一个通用的社交意识自监督tri-training推荐框架。通过在此框架下统一推荐任务和SSL任务，推荐性能可以取得显著的改进。
我们提出从其他用户中挖掘积极自监督信号，并开发一种基于邻居识别的对比学习方法。
我们在多个真实数据集上进行了广泛的实验，以证明所提出的SSL框架的优势，并通过全面的消融研究来研究该框架中每个模块的有效性。

本文的其余部分的结构如下。第二节总结了推荐和SSL的相关工作。第3节介绍了所提出的框架。实验结果报告见第4节。最后，第5节总结了本文的结论。

2 相关工作

2.1 图神经推荐模型

近年来，图神经网络(GNNs)因其在解决图相关推荐任务的有效性而在推荐系统领域受到了广泛的关注。特别是，GCN，作为GNNs的普遍公式，即谱图卷积的一阶近似，已经驱动了大量的图神经推荐模型，如GCMC，NGCF和LightGCN。这些基于GCN的模型的基本思想是通过聚合邻居的嵌入来利用用户-项目图中的高阶嵌入来细化目标节点的嵌入。除了这些通用模型之外，GNNs也被使用到其他针对特定图的推荐方法中，如基于会话的图SR-GNN和DHCN，以及社交网络上的DiffNet和MHCN。值得一提的是，GNN经常被用于社交计算，因为GNN可以很好地捕获社交网络中的信息传播。这就是为什么我们利用社交网络由图神经编码器生成自监督信号的原因。

2.2 在社交推荐中的自监督学习
自监督学习(SSL)是一种新兴的范式，可以通过自动从原始数据中生成的真实样本进行学习。它首先被用于视觉表示学习和语言建模进行模型预训练。SSL的最新进展试图利用这种灵活的学习范式来进行图表示学习。图上的SSL模型主要是利用图的结构来挖掘自监督信号。这一研究方向的主要机制是图对比学习，它对比了同一个图的多个视图，其中不一样的视图是通过对原始图进行随机增强来建立的。常见的随机增强类型包括但不限于节点/边dropout、随机特征/属性变换和使用随机游走的子图采样。

受图对比学习成功的启发，最近有一些工作将同样的想法移植到推荐的场景中。Self-Supervised Learning for Sequential Recommendation with Mutual Information Maximization通过随机屏蔽项目的属性、跳过给定序列的项目和子序列来设计辅助的自监督目标，用于预训练顺序推荐模型。姚等人。[37]提出了一种具有统一特征掩蔽和退出的双塔DNN架构，用于自我监督的项目推荐。马氏等人。[19]通过观察长远的未来，挖掘额外的信号进行监控，重建未来的自我监控序列，本质上采用了特征掩蔽。吴等人。[29]总结了图上所有的随机增强，并将其统一为一个一般的自监督图学习框架进行推荐。此外，还有一些研究在集合间的互信息最大化来细化用户表示。

3 提出的框架

在本节中，我们将介绍我们的SElf-suPervised Tri-training 框架，称为SEPT。SEPT的模型如图1所示。

3.1 准备工作

3.1.1 符号

本文使用两个图作为数据源，包括用户-项目交互图 $G_$ 和用户社交网络 $G_$ 。U={1，2，…， $u_{m}$ }(|U|=)表示 $G_$ 和 $G_$ 上的用户节点，I={1，2，…， $i_{n}$ }(|I|=)表示 $G_$ 中的项目节点。由于我们关注项目推荐，∈ $R^{×}$ 是一个只有0和1填充的二进制矩阵，表示 $G_$ 中的用户-项目交互。对于中的每对（，），如果用户已购买/单击项目， $_{}$ =1，否则 $_{}$ =0。对于社会关系，我们使用∈ $R^{×}$ 来表示社交邻接矩阵，它是二元对称的，因为我们研究的是具有双向关系的无向社交网络。我们使用∈ $R^{×}$ 和∈ $R^{×}$ 分别表示学习到的供推荐的最终用户和项目嵌入。为了便于阅读，本文中矩阵以粗体大写字母表示，向量以粗体小写字母表示。

3.1.2 Tri-Training

Tri-Training是一种流行的半监督学习算法，它从co-training范式发展而来，解决了确定如何标记无标签数据以改进分类器的问题。与标准的co-training算法在理想情况下需要两个足够的、冗余的和有条件独立的数据样本视图来构建两个不同的分类器相比，通过解除对训练集的限制，可以很容易地使用 Tri-Training。它不假设数据属性之间有足够的冗余，并通过引导抽样在生成的三个不同的数据视图上初始化三个不同的分类器。然后，在 Tri-Training的标记过程中，对于任何一个分类器，只要其他两个分类器对这个例子的标记达成一致，就可以对一个未标记的例子进行标记。然后将生成的伪标签作为真实值，在下一轮标记中训练相应的分类器。

3.2 数据增强
3.2.1 视图增强
正如所讨论的，在推荐系统中存在广泛的同质性。也就是说，用户和项目有许多相似的对应物。为了获取自监督的同质性，我们利用用户的社交关系来增强数据，因为社交网络通常被称为同质性的反映。（即，有相似偏好的用户更有可能在社交网络中建立联系，反之亦然）。由于许多像Yelp这样的服务提供商鼓励用户在其平台上与他人互动，它为他们的推荐系统提供了利用丰富的社交关系的机会。然而，由于社会关系本质上是有噪声的，对于准确的补充监督信息，SEPT仅利用用户中普遍存在的三元闭合来使用可靠的社交关系。在社交软件推荐系统中，通过对齐用户-项目交互图 $G_$ 和社交网络 $G_$ ，我们可以很容易地得到两种三角形：三个用户之间的社交联系(如图1中的1、2和4)和两个购买相同项目的社交联系用户(如图1中的1、2和1)。前者被解释为描述用户在扩充社交圈中的兴趣，后者是描述用户对他的朋友分享物品的兴趣。直接认为三角形是加强的联系，因为如果现实生活中的两个人有共同的朋友或共同的利益，他们更有可能有亲密的关系。

根据我们之前的工作(MHCN)，上述两种三角形可以有效地提取为矩阵乘法的形式。设 $A_{f}$ ∈ $R^{×}$ 和 $A_{s}$ ∈ $R^{×}$ 表示包含这两种三角关系的用户邻接矩阵。它们可通过以下方法进行计算：

乘法（ $^⊤$ ）计算了通过共享好友（项目）连接两个用户的路径，而哈达玛积⊙将这些路径制成三角形。由于和都是稀疏矩阵，因此计算并不耗时。操作⊙确保 $A_{f}$ 和 $A_{s}$ 中的关系是中关系的子集。由于 $A_{f}$ 和 $A_{s}$ 不是二进制矩阵，等式(1)可以被看作基于来自的互补信息上的引导采样的特殊情况。鉴于 $A_{f}$ 和 $A_{s}$ 作为和的增强，我们有三个视图从不同的角度来描述用户的偏好，也为我们提供了一个融合tri-training和SSL的场景。为了便于理解，我们将用户-项目交互图的偏好视图由R表示、三角形社交关系朋友视图由 $A_{f}$ 表示，共享视图由 $A_{s}$ 表示。

3.2.2 无标签样本集。

要进行tri-training，需要一个无标签样本集。我们遵循现有的工作，以概率对原始图进行边dropout，创建一个被干扰的图，从中学习的用户表示被用作无标签的样本。此过程可表述为：

其中 $N_$ 和 $N_$ 为节点， $E_$ 和 $E_$ 是 $G_$ 和 $G_$ 中的边，∈ ${0,1}^{|E∪E|}$ 是边的掩码向量。在这里，我们同时干扰 $G_$ 和 $G_$ ，而不是只干扰G，因为社交信息包含在上述两个增强视图中。对于集成的自监督信号，扰动连接图是必要的。

3.3 SEPT：Self-Supervised Tri-Training

3.3.1 框架

使用增强视图和无标签的样本集，我们遵循Tri-Training的设置来构建三个编码器。在结构上，所提出的自监督训练框架可以与模型无关，从而促进大量的图神经推荐模型。 但对于一个易于遵循的具体框架，由于其简单性，我们采用了LightGCN作为编码器的基本结构。编码器的一般形式的定义如下：

其中为编码器，∈ $R^{×}$ 或 $R^{（+）×}$ 为节点的最终表示，相同大小的为三个编码器共享的初始节点嵌入，V∈{，，}为三个视图中的任何一个。需要注意的是，与普通的tri-training不同，SEPT是不对称的。两个编码器和工作在朋友视图、分享视图上，只负责通过图卷积学习用户表示给出伪标签，而编码器工作在偏好视图上，承担生成推荐的任务，从而学习用户和项目表示(如图1所示)。设为主编码器（推荐模型），和为辅助编码器。理论上，给定像LightGCN这样的具体，应该有和的最优结构。然而，探索辅助编码器的最优结构超出了本文的范围。为简单起见，我们将相同的结构分配给和。此外，**为了从扰乱的图˜G中学习无标签样本的表示，需要另一个编码器，但只做图卷积。**所有的编码器都共享初始嵌入，并使用LightGCN结构在不同的视图上构建编码器。

3.2.2 构造自监督信号
通过在这三个视图上进行图卷积，编码器学习了三组用户表示。由于每个视图都反映了用户偏好的不同方面，因此从其他两个视图中寻求监督信息，以改进当前视图的编码器。给定一个用户，我们使用来自其他两个视图的用户表示来预测它在无标签样本集中的语义上的正样本。以偏好视图中的用户为例子，表述为：

其中为余弦操作， $^_$ 和 $^_$ 分别为和学习到的用户的表示，˜为通过图卷积得到的无标签样本集中用户的表示， $^_{^+}$ 和 $^f_{^+}$ 表示每个用户在相应视图中为用户的语义正样本的预测概率。

在 tri-training方案下，为了避免噪声样本，只有和都同意将用户标记为正样本，才能在将用户进行标记。我们遵循这一规则，并将从这两个视图中得到的预测概率加起来，得到：

根据这些概率，我们可以选择可信度最高的个正样本。此过程可表述为：

在每次迭代中，通过随机边dropout进行˜G的重构，生成不同的用户表示。SEPT在每个视图中为每个用户在数据增强中动态的生成正向伪标签。然后，这些标签被用作监督信号来定义初始的底部表示。

3.3.3 对比学习

通过生成的伪标签，我们开发了邻居识别对比学习方法来实现SEPT中的自监督。给定某个用户，我们最大化它的节点表示和 $P^r_{+}$ 中的有标签用户表示之间的一致性，并最小化它的节点表示和无标签用户表示之间的一致性。邻居辨别的思想是，在当前视图中给定确定的用户，在其他两个视图中正向的伪标签在语义上表示它的邻居或潜在的邻居，由于不同视图的同质性，那么我们也应该把这些正对放到当前视图中。这可以通过邻居辨别对比学习来实现。形式上，我们遵循之前的研究，采用在互信息估计中有效的InfoNCE作为我们的学习目标，以最大化正对之间的一致性，最小化负对之间的一致性：

是一个辨别器函数，它输入两个向量，预估它们之间的一致性，是为了放大辨别效果的温度系数(在我们的实现中，=0.1是最佳的效果)。我们可以简单地通过应用余弦操作来实现辨别器。与自辨别器相比，邻居辨别器利用了来自其他用户的监控信号。当只使用一个正样本，并且如果在 $_{+}$ 中用户自身˜的得分最高时，邻居辨别器就会退化为自辨别器。因此，自辨别器可以看作是邻居辨别器的一种特例。但是，当使用足够数量的正样本时，这两种方法也可以同时被采用，因为˜中的用户本身通常很可能在Top-K类似的示例P+中。随着训练过程的进行，编码器不断改进，生成不断演化的伪标签，进而递归地使编码器再次受益。

与普通的tri-training相比，值得注意的是，在SEPT中，我们没有将伪标签添加到邻接矩阵中，用于后续的图卷积。相反，我们采用了一种灵活的方式，通过互信息最大化来指导用户表示，这不同于普通的tri-training训练，后者将伪标签添加到训练集中，以进行进一步的循环训练。这种建模的好处是有两方面的。首先，添加伪标签会导致每次迭代后重建邻接矩阵，这很耗时；其次，早期生成的伪标签可能没有信息；重复使用它们会误导框架。

3.3.4 优化器
SEPT的学习包括两个任务：推荐和基于邻居辨别的对比学习。设L为BPR成对损失函数，其定义为：

其中 $I (u)$ 是用户交互的项目集， $ˆ_{}$ = $_^⊤_$ 、和通过拆分 $Z^{r}$ 得到，是控制2正则化的系数。SEPT的训练分为初始化和联合学习两个阶段进行。首先，我们通过优化 $L_$ 的推荐任务来初始化框架。使用 $L_$ 进行训练，共享的底部比随机初始化的嵌入获得了更强的表示能力。然后，自监督tri-training如公式(4)-(7)中所述进行。辅助任务与主要任务被合并为联合学习目标，提高推荐任务的性能。联合学习的总体目标被定义为：

其中是一个超参数，用来控制self-supervised tri-training的大小。算法1给出了SEPT的总体过程。

3.4 讨论
3.4.1与社交正则化的联系

社会推荐将社会关系集成到推荐系统中，以解决数据稀疏性问题。社交推荐的一个常见思想是通过最小化社会连接用户之间的欧氏距离来规范用户表示，这被称为社会正则化。尽管提出的SEPT也利用了社交-感知监督信号来完善用户表示，它不同于社会的正规化。有两方面的差异。首先，社交正则化是一个静态的过程，它总是作用在有社会关联的用户上，而邻居辨别是动态的，并且迭代地改进对不确定用户施加监督信号；其次，负面的社会关系（不喜欢）不能在社会推荐中被轻易地检索到，因此社交正规化只能使有社会联系的用户保持接近。但SEPT也可以将那些在三种视图中语义不正向的用户分开。

3.4.2 复杂性

在结构上，SEPT可以是与模型无关的，其复杂性主要取决于所使用的编码器的结构。在本文中，我们提出了一个基于LightGCN的结构。给定O(||)作为图卷积的推荐编码器的时间复杂度，图卷积的总复杂度小于4O(||)，因为、和˜G通常比R更稀疏。另一个成本来自于等式(6)中标记过程的Top-K操作，通过使用最大堆,它通常需要O(log())。为了降低成本，加快训练速度，在每批训练中，一批随机选择个（≪，如1000）用户作为伪标签的无标签样本集，这种采样方法也可以防止过拟合。基于邻居辨别的对比学习的复杂度为O()。

4 实验

4.1 实验设置

数据集
三个真实的数据集：Last.fm，Douban-Book和Yelp在我们的实验中用来评估SEPT。SEPT旨在改进Top-N推荐，Douban-Book数据集包含1-5的评分，我们遵循之前研究的惯例，在豆瓣的数据集中省略小于4的评分，其余的赋值为1。数据集的统计数据如表1所示。为了进行精确的评估，对所有的实验都进行了5倍交叉验证，并给出了平均结果。

基线
将三种最近的图神经推荐模型与SEPT进行比较，以检验 self-supervised tri-training推荐的有效性：

LightGCN是一个基于GCN的通用推荐模型，它利用用户-项目的接近程度来学习节点表示并生成推荐，这被报告是最先进的方法。
DiffNet++是最新的一种基于GCN的社会推荐方法，它模拟了用户和项目空间中的递归动态社交扩散。
MHCN是一种最新的基于超图卷积网络的社交推荐方法，它用超边形成用户之间的复杂相关性，以提高推荐性能。

LightGCN是SEPT中的基本编码器。研究LightGCN和SEPT的性能至关重要。由于LightGCN是最近许多论文中报道的一个广泛公认的SOTA基线，我们没有将SEPT与其他弱基线如NGCF、GCMC和BPR进行比较。两种强的社交推荐模型也与SEPT进行了比较，以证明使用社交关系不是性能改进的主要驱动力。

Metrics
为了评估所有的方法，我们首先对所有的候选项目进行项目排序。然后是两个基于相关性的指标，Precision@10和Recall@10，以及一个基于排名的指标NDCG@10。

设置
为了进行公平的比较，我们参考基线原始论文中报告的最佳参数设置，然后微调基线的所有超参数，以确保它们的最佳性能。对于所有方法的一般设置，我们将潜在因素(嵌入)的维数设置为50，正则化参数设置为0.001，批处理大小设置为2000。在第4.4节中，我们研究了SEPT的参数敏感度，并在第4.2节和第4.3节中使用了最佳参数。我们使用Adam来优化所有这些模型，初始学习率为0.001。

4.2 总体性能比较

在这部分中，我们验证了SEPT是否可以改进推荐。性能比较如表2和表3所示。我们在表2中使用不同的层数进行了实验。

在表3中，所有方法都采用了两层设置，因为它们在此设置下在所使用的数据集上都达到了最好的性能。↑（↓）标记的性能提升(下降)是通过使用性能差除分来计算的。根据研究结果，我们可以得出以下观察结果和结论：

在所有不同的图层设置下，SEPT可以显著提高LightGCN。特别是在更稀疏的数据集上(Douban-Book和Yelp)，提升更大。最大的改进甚至可以达到11%。这可以是证明自监督学习有效性的一个证据。此外，虽然当层数为3时，LightGCN和SEPT都存在过平滑的问题，但SEPT的性能仍然优于LightGCN。我们认为可能的原因是，对比学习可以在一定程度上缓解过平滑的问题，因为动态生成的无标签的样本提供了足够的数据方差。

除了与LightGCN进行比较外，我们还将SEPT与社会推荐模型进行了比较，以验证 selfsupervised tri-training主要不是因为社会关系提升了推荐性能。由于MHCN也建立在LightGCN之上，因此比较这两种模型可以提供更多的信息。此外，2-MHCN是MHCN自监督的变体，通过比较SEPT和2-MHCN的结果，计算了性能提升(下降)。根据表3中的结果，我们有以下观察和结论：

虽然将社会关系整合到图神经模型中是有帮助的(比较MHCN和LightGCN)，但在SEPT方案下的学习可以获得更多的性能提高(比较SEPT和MHCN)。DiffNet++与其他三种方法相比没有竞争力。它的失败可以归因于其冗余和无用的参数和操作。在LastFM 和 Douban-Book上，SEPT的表现都优于2-MHCN。在Yelp上，2-MHCN的。比SEPT更好。SEPT和2-MHCN的优越性表明，自监督学习具有巨大的提升推荐的能力。此外，SEPT不需要学习除了底部嵌入之外的其他参数，而2-MHCN还需要学习许多其他参数。与此同时，SEPT的运行速度比2-MHCN快得多，这使得它更具竞争力，即使它在Yelp上被2-MHCN小幅度击败。

4.3 自识别 vs 邻居识别

在SEPT中，生成的正样本可以包括用户本身和无标签样本集的其他用户。目前还不清楚是哪一部分对推荐性能的贡献更大。在这部分中，我们研究了在没有用户本身的情况下，自我辨别和邻居辨别。

为方便起见，我们使用SEPT-SD表示自我辨别，使用SEPT-ND表示邻居辨别。还应该提到的是，仅对于SEPT-ND，=0.001可以在所有数据集上获得最好的性能。在本例中使用了两层设置。

根据图2，我们可以观察到，SEPT-SD和SEPT-ND都表现出比LightGCN更好的性能，这证明了来自用户本身和其他用户的监督信号都可以受益于自监督推荐模型。我们认为来自其他用户的自监督信号的想法得到了验证。此外，自我辨别和邻居辨别的重要性也因数据集而异。在LastFM上，他们的贡献几乎相同。在 Douban-Book上，自我辨别表现得更为重要。在Yelp上，邻居辨别更有效。

这种现象可以用图5来解释。随着正例的增加，我们看到SEPT在LastFM和Yelp上的表现几乎保持稳定，但在Douban-Book上逐渐下降。我们推测在LastFM和Yelp中存在广泛观察到的同质性，因此大量用户具有相似的偏好，这可能是这两个数据集中高质量的正例。然而，Douban-Book的用户可能会有更多样化的兴趣，当使用的正面例子数量增加时，就会导致性能下降。

4.4 视图研究

在SEPT中，我们构建了两个增强视图来对挖掘监控信号进行tri-training。在这部分中，我们研究每个视图的贡献。在本研究中使用了两层设置。在图3中，“Friend”或“Sharing”意味着对应的视图被分离。当只使用两个视图时，SEPT退化为自我监督的co-training。“Preference-Only”意味着只使用偏好视图，在这种情况下，SEPT进一步退化为 self-training。

从图3中，我们可以看到，在LastFM和Yelp上，所有的视图都有贡献，而在Douban-Book上，自监督的co-training设置表现最好。此外，当只使用Preference-Only视图时，SEPT的性能较低，但仍优于LightGCN。随着使用视图数的减少，SEPT在LastFM上的性能略有下降，而在Yelp上的性能明显下降。在Douban-Book上，当只有一种视图时，表现先略有上升，然后明显下降。结果表明，在半监督设置下，即使是一个单一的视图也能产生理想的自监督信号，因为社会关系或其他方面的信息在某些情况下并不总是可获得的。此外，增加视图的使用数量可能会带来更多的性能提高，但这并不是绝对正确的。

4.5 参数敏感性分析

在SEPT中使用了三个重要的超参数：是用于控制self-supervised tri-training的大小，是使用的正例的数量和是˜G的边dropout。我们选择了一些具有代表性的值来研究SEPT的参数敏感性。结果如图4 - 6.所示。在研究的影响时，我们固定了=10和=0.3。对于图5中的影响，我们在LastFM和Yelp上设置了=0.005，在Douban-Book上设置了=0.02，=0.3。最后，对于图6中的影响，=0.02，=10。在本研究中使用了两层设置。

从图4中可以看出。SEPT对很敏感。在不同的数据集上，我们需要选择不同的值以获得最佳性能。一般来说，一个小的值就会导致理想的性能，而一个大的值就会导致性能的巨大下降。图5已在第4.3节中进行了解释。根据图6中。我们看到SEPT对边dropout不敏感。即使是一个很大的值（例如，0.8）也可以创建提供信息的自监督信号，这对于SEPT可能的广泛使用是一个很好的特性。当被扰乱的图是高度稀疏时，它不能为自监督学习提供有用的信息。

5 结论和未来工作

自监督图对比学习被广泛应用于图表示学习领域，最近被移植到推荐学习中，以提高推荐性能。然而，大多数基于SSL的方法只通过自我识别来利用自监督信号，而SSL不能在推荐的场景中充分利用广泛观察到的同质性。为了解决这一问题，在本文中，我们提出了一个名为SEPT的社交-意识self-supervised tri-training框架，通过从原始数据的两个互补视图中发现自监督信号来改进推荐。在self-supervised tri-training方案下，提出了基于邻居识别的对比学习方法，利用邻居中的伪标签来细化用户表示。大量的实验证明了SEPT的有效性，并进行了彻底的消融研究来验证self-supervised tri-training的基本原理。

本文只利用了来自用户的自监督信号。然而，项目也可以类似地为自监督提供信息性的伪标签。这可以通过利用项目的多模式来实现。我们把它作为我们未来的工作。我们还相信，自我监督的多视图共同训练的想法可以推广到除推荐之外的更多的场景。

你可能感兴趣的:(论文,算法,智能推荐,推荐系统,自监督,对比学习)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
发票合并工具小朋的软件园前端 javascript java html 服务器
"发票合并工具"是一款专为高效整理票据设计的实用工具，支持将来自不同渠道的发票文件（如PDF文档、各类图片格式）快速整合为排版规范的PDF文件，尤其适用于财务报销场景下的批量票据处理需求。核心功能亮点多格式兼容：无缝导入PDF文件及常见图片格式（.png/.jpg/.jpeg/.bmp），适配多来源发票整合需求。智能布局配置：提供灵活的页面布局选项（每页2/3/4张发票），其中"2合1"模式针对报
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的渠道选择策略研究说私域人工智能小程序
摘要：在数字化商业环境下，品牌与产品的渠道选择对其市场推广和运营成功至关重要。本文聚焦于如何依据自身品牌和产品特性，结合开源AI智能名片链动2+1模式与S2B2C商城小程序，运用科学的渠道选择方法，慎重挑选1-2个适宜平台，集中资源发力并取得成绩后再拓展其他渠道。通过理论分析与案例研究，探讨该策略的有效性和可行性，为企业渠道布局提供参考。关键词：渠道选择；开源AI智能名片；链动2+1模式；S2B2
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
EMQX 社区版单机和集群部署 pcj_888 MQTT MQTT EMQ
EMQ支持Docker，宿主机，k8s部署；支持单机或集群部署。以下给出EMQX社区版单机和集群部署方法1.Docker单机部署官方推荐最小配置：2核4G下载容器镜像dockerpullemqx/emqx:5.3.2启动容器dockerrun-d--nameemqx\-p1883:1883\-p8083:8083\-p8883:8883\-p8084:8084\-p18083:18083\emqx
前端 NPM 包的依赖可视化分析工具推荐前端视界前端艺匠馆前端 npm arcgis ai
前端NPM包的依赖可视化分析工具推荐关键词：NPM、依赖管理、可视化分析、前端工程、包管理、依赖冲突、性能优化摘要：本文将深入探讨前端开发中NPM包依赖可视化分析的重要性，介绍5款主流工具的使用方法和特点，并通过实际案例展示如何利用这些工具优化项目依赖结构、解决版本冲突问题以及提升构建性能。文章将帮助开发者更好地理解和掌控项目依赖关系，提高开发效率和项目可维护性。背景介绍目的和范围本文旨在为前端开
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
EasyCwmp源码分析与接口实现详解：深入理解源码架构，掌握核心接口
EasyCwmp源码分析与接口实现详解：深入理解源码架构，掌握核心接口去发现同类优质开源项目:https://gitcode.com/在开源项目中，寻找一款能够提升开发效率、简化流程的工具是每个开发者的追求。今天，我们要介绍的这款开源项目EasyCwmp，正是为了帮助开发者深入了解源码架构，掌握核心接口实现，从而加速项目开发进程。以下是关于EasyCwmp源码分析与接口实现详解的项目推荐文章。项目
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
无线鼠标产品整体技术分析总结悟空胆好小计算机外设
无线鼠标产品对比分析，以小米为例文章目录无线鼠标产品对比分析，以小米为例一.小米无线鼠标产品对比1.1小米无线鼠标XMSMSB05YM2.4G单模款1.2小米无线鼠标XMSMSB01YM2.4G+BT双模款二.**单模鼠标与双模的区别****1.连接方式****2.通信性能与可靠性****3.功耗管理****4.适用场景****5.技术扩展性**6.**小结**三.无线鼠标产品技术重点分析3.1.
微软 Bluetooth LE Explorer 实用工具的详细使用分析悟空胆好小 microsoft
微软BluetoothLEExplorer实用工具的详细使用分析文章目录微软**BluetoothLEExplorer**实用工具的详细使用分析1.**工具定位与核心功能**2.**关键特性与更新**3.**使用场景示例**4.**系统要求与依赖**5.**与专业工具对比**6.**局限性**7.**实践建议**结论以下是微软BluetoothLEExplorer实用工具的详细使用分析：1.工具定
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin