努力学习的爽爽

GDSRec：Graph-Based Decentralized Collaborative Filtering for Social Recommendation(基于图的社交推荐分散协作过滤)

GDSRec：Graph-Based Decentralized Collaborative Filtering for Social Recommendation

摘要——基于 user-item interactions和user-user social relations生成推荐是基于 web 的系统中的常见用例。这些联系可以自然地表示为图结构数据，因此利用图神经网络（GNN）进行社会推荐已成为一个有前景的研究方向。然而，现有的基于图的方法无法考虑用户（项目）的偏差偏移。
例如，挑剔用户的低评级可能并不意味着对该项目持负面态度，因为用户在常见情况下倾向于给予低评级。
在图形建模过程中应考虑此类统计数据。虽然过去的一些工作考虑了这种偏差，但我们认为，这些提出的方法仅将偏差视为标量，无法捕获隐藏在数据中的完整偏差信息。此外，用户之间的社交关系也应该是可区分的，以便具有相似项目偏好的用户能够对彼此产生更大的影响。为此，我们提出了基于图的分布式协作过滤社交推荐（GDSRec）。
GDSRec 将偏差视为向量，并将其融合到学习用户和项目表示的过程中。通过分散的邻域聚集来捕获统计偏差偏移，而根据偏好相似性来定义社会连接强度，然后将其纳入模型设计中。

代码参考：https://github.com/MEICRS/GDSRec

- GDSRec：Graph-Based Decentralized Collaborative Filtering for Social Recommendation
1 简介
2 背景
- 2.1 相关工作
- 2.2 符号
3 拟议框架
- 3.1 问题制定
- 3.2 总体框架
- 3.3 用户建模
- 3.4 项目建模
- 3.5 社会建模
- 3.6 评级预测
- 3.7 模型培训
- 3.8 时间复杂性
4 实验
- 4.1 数据集
- 4.2 评估指标
- 4.3 基线
- 4.4 参数设置
- 4.5 性能比较（RQ1）
- - 4.5.1 评级预测
  - 4.5.2 项目排名
- 4.6 消融研究（RQ2）
- - 4.6.1 社交网络和用户评分的影响
  - 4.6.2 注意力网络的效果
  - 4.6.3 平均评级的影响
- 4.7 节点脱落的影响（RQ3）
- 4.8 阈值δ（RQ4）的影响
5 结论

1 简介

面对大量的网络用户和信息爆炸，推荐系统至关重要，它可以缓解信息过载，为用户提供更高效和高质量的服务。有效的推荐系统可以通过从大量信息中获取用户偏好的内容（例如电影、音乐、商品）而使用户受益，并通过降低促销成本使服务提供商受益。因此，近年来，推荐系统引起了广泛的兴趣。同时，随着社交媒体的发展，利用社交关系来提高推荐绩效也越来越受欢迎[1]–[3]。在社交网络中，连接的朋友之间存在信息流。用户的偏好与他/她周围的人相似或受其影响，这已被社会关联理论证明[4]，[5]。

最近，深度学习由于其高表达性和模型保真度而表现出了实现良好性能的强大能力。对于社交推荐领域，用户-项目交互和用户-用户友谊可以自然地表示为图形，其中用户和项目是节点，而交互（友谊）是边缘。基于这些观察，利用 GNN 的最新进展进行社会推荐已成为一个有前景的研究方向。

然而，几乎基于 GNN 的推荐方法都是从原始交互图中学习的，很少关注图的统计信息，这可能导致对真实用户偏好的误解。例如，从用户的角度来看，挑剔的用户可能倾向于对他观看的每一部电影给予低评级，那么 5 分之 3 的评级实际上可能表示该用户的积极偏好。从项目的角度来看，如果该项目的平均评分可以达到高分（例如 4.5 分），则评分为5 分之 4 也可以表示消极态度。这是隐藏在数据中的偏见，会误导用户和项目表示的培训。

基于这一观点，提出了 FunkSVD 和 SVD++，将这些用户和项目偏差建模为评分预测中的标量。然而，我们认为这些方法很简单，但没有捕捉到实践中隐藏的真正偏见。首先，我们认为使用标量不足以完全模拟用户和项目的真实偏差。其次，现有的方法没有明确地构建数据中的偏差，而是使用原始数据进行学习。这也导致无法很好地学习偏见。此外，社会联系强度也应该是可区分的。从[11]中可以看出，与那些关系薄弱的用户相比，拥有强大关系的用户更有可能分享相似的口味，从而平等对待所有社会关系也会导致次优解。

在本文中，我们设计了一个新的基于 GNN 的模型来解决上述社会推荐问题（GDSRec）。更准确地说，我们将偏差视为向量，并将其融合到所提出的模型中的用户/项目表示中。这种设计有助于我们了解真正的用户偏好。为此，我们设计了一个分散的交互图，以考虑用户（项目）的统计偏差偏移。该图通过显式提取偏差信息来构建，并帮助模型学习更好的表示。此外，我们根据偏好相似性对用户-用户连接重新加权，这有助于模型关注有用的友谊连接，同时对冗余聚集进行降噪。
我们的主要贡献总结如下：

我们将评分偏差视为向量，并将其融合到学习用户和项目表示的过程中。为此，我们引入了一个新的视角，将原始图处理为分散图，并从分散图中学习用户和项目表示。通过利用原始数据的统计信息获得分散图，从而在该图上明确地提取偏差信息。
给出了一个简单而有效的社交关系的显式强度，然后可以将其纳入最终预测规则，并有助于提高推荐性能。
我们提出了一种新的基于 GNN 的社交推荐协作过滤模型（GDSRec），该模型在具有显式可微社交连接强度的分散图上学习。
我们在两个真实世界数据集上进行实验，以验证所提出模型的有效性。
实验结果表明，GDSRec 优于比较的最新基线。

2 背景

2.1 相关工作

对于一般推荐任务，有两种主要类型的算法：基于内容的算法[12]和协作过滤算法[13]，[14]。。在这些方法中，协作过滤因其有效性和可扩展性而被广泛使用。

矩阵分解[15]–[17]是最重要的协作过滤方法之一，在各种场景中取得了巨大成功[18]，[19]。它将用户和项目映射到共享的潜在因素空间，用户和项目之间的交互由其潜在因素的内积建模。在[10]中，SVD++考虑了扩展矩阵分解模型的用户和项目偏差。此外，社交网络推荐的探索已被证明是有效的。在[20]中，作者发现，与两个随机选择的用户相比，具有以下关系的用户更有可能在主题上分享相似的兴趣。因此，社会关系在帮助用户过滤信息方面发挥着重要作用。基于这种观察，已经提出了许多基于社会的推荐算法[1]，[21]-[25]。在[21]中，提出了一种因子分解方法，通过使用用户的社交网络信息和评级记录来解决评级预测问题。

TrustMF[23]是通过使用社交互动中用户之间的信任网络的矩阵分解进行评级预测而引入的。TrustSVD[26]利用扩展 SVD++的信任信息。[24]和[25]中的作者利用贾卡德系数来计算社会关系的强度，但没有考虑评级。此外，一些其他工作利用辅助信息来改进推荐质量，例如[27]，[28]。最近，SREPS[29]学习了用户在不同场景中的多重偏好。

深度学习模型也被用来增强推荐的模型表达能力。由于推荐数据可以自然地组织为图表，因此也开展了利用 GNN[30]–[33]进行推荐的研究。GNN 的关键洞察力是通过聚集来自邻域的特征信息来学习节点的表示。这符合协作过滤的本质。

在[34]中，作者提出了一种称为图卷积矩阵完成（GCMC）的图自动编码器框架，该框架基于在用户-项目交互图上传递的可微消息，而不使用社交关系。提出了神经图协同过滤（NGCF）[35]，以将用户-项目交互集成到嵌入过程中。
引入知识图注意推荐网络（KGAT）[36]来显式建模知识图中的高阶连接性。
DiffNet[37]是通过使用分层影响扩散部分来建模用户的潜在偏好如何被可信用户递归影响而提出的。
[38]中引入了一种基于 GNN 的社交推荐算法 GraphRec。它提供了一种联合捕获交互和评级的方法，用于学习用户和项目的表示。此外，社交网络信息在 GraphRec 中用于学习用户的更好表示。
DANSER[39]提出了两个双图注意网络，以学习推荐系统中社会效果的深度表示。
Diffnet++[40]通过注入反映在用户项目图中的高阶用户潜在兴趣和反映在用户- 用户图中的高阶用户影响促进用户和项目表示。
LightGCN[41]通过去除图卷积网络中的非线性激活和特征变换简化了NGCF，并提高了推荐的性能。
ESRF[42]开发了一个基于图卷积网络的深度对抗框架，以应对社交推荐的挑战。
FBNE[43]通过折叠用户-项目二分图来改进社交推荐的性能，探索了隐含的高阶用户 -用户关系。
HOSR[44]是通过沿高阶社交邻居执行嵌入传播来生成用户嵌入。
然而，大多数这些方法没有考虑到图形数据中存在的统计偏移，同时也缺乏有效而简单的强度设计社会关系。

2.2 符号

用户集合，R（ui）是用户 ui 交互的项目集合。设 N（ui）是用户ui在社交网络中直接连接的用户集∈ RD 表示用户 ui 的嵌入，qvj∈ RD表示项目 vj 的嵌入，其中 D 是嵌入大小。E（ui）和 E（vj）分别表示用户 ui 和项目 vj 的平均评分。⌈ ·⌉ 和|·|分别是整数值函数和绝对值函数。⊕ 表示两个向量之间的连接操作。⟨ ·⟩ 用于获取数据集中的条目数。

3 拟议框架

我们首先给出了问题的公式，然后介绍了分散图和所提出的框架。稍后，我们详细介绍了如何获得预测的评分，并从所提出的模型中学习用户/项目潜在因素偏移。最后，我们解释了如何训练模型。

3.1 问题制定

假设有 N 个用户 U＝{u1，u2，···，uN}，M 个项目 V＝{v1，v2，···，vM}。如图 1（a）所示，每个用户对一些项目进行评分。如果可以观察到评级，则评级得分大于 0，否则存在缺失值。用户项目评级矩阵由 R∈RN×M。任务是预测 R 中未观察到的评分，然后返回项目的排序列表以供推荐。为此，使用用户的评级历史和社交关系来解决这个问题。

例如，我们假设项目 v2 和 v4 由图 1（a）中的用户 u1 评分，并且用户u1 直接与用户 u2 和 u4 有社交关系，如图 1（b）所示。图 1（b）的左侧部分包含用户和项目之间的交互，称为用户项目图，右侧部分包含用户之间的交互称为社交图。对于用户项目图边缘的值，它表示用户 ui对项目 vj 的评分 rij。对于社交图中的值，我们将其定义为用户 ui 和uj 之间的关系系数。

其中，当满足 x 时 I（x）=1，否则为零，δ是评估两个用户是否喜欢同一个项目的阈值。关系系数 Tij 表示用户之间的显式关系强度，并表示用户 ui 与社交连接用户 uj 的相似程度。关系系数越高，两个用户喜欢或不喜欢的共同项目就越多，换句话说，两个使用者之间的相似性就越高。为了预测用户 u1 对项目 v1、v3 的评分，我们使用图 1（b）中描述的数据，预测的评分可以通过使用 GDSRec 获得。

3.2 总体框架

通常，原始数据（如图 1）可以被视为二分图，如图 2 中的左侧，其中用户与其他用户有关系，与项目有交互。然而，直接从这些图中学习可能会导致对真实用户偏好的误解。考虑到来自挑剔用户的低评级可能并不表示对此项目的负面态度，因为用户倾向于将低评级分配给所有项目。这种现象并不少见。如果我们只使用原始数据来学习用户和项目的表示，这种偏差可能会导致次优解。为了缓解由于这些用户行为导致的上述问题，我们相信统计信息可以用于解决用户和项目的偏差偏移。出于这个想法，原始的二分图可以被处理为分散图，如图 2 右侧所示。对于每个用户-项目交互，我们从集中平均值中减去它。然后，利用分散图来训练我们的模型。我们将在下文中提供更多有关社会关系的细节。

在图 3 中，我们展示了所提出模型的概述。该模型包括四个部分：用户建模、项目建模、社交建模和偏好评级预测。对于用户建模，其目的是学习用户的潜在因素偏移。社交建模的功能类似于用户建模。两种建模的区别在于，用户建模只对一个用户建模，而社交建模需要同时集成对用户社交关系的学习。项目建模用于学习项目的潜在因素。

图 3：拟议框架概述。它包含四个组件：用户建模、项目建模、社交建模和偏好评级预测。

如前所述，我们通过利用由分散用户项目图和社交图组成的分散图数据来解决评分预测问题。直观地获得用户 ui 和项目 vj 之间的最终预测评级ˆrij，包括三个分量：用户 ui 的平均评级 E（ui）、项目 vj 的平均评级 E（vj）以及用户 ui 与项目 vj 间的最终偏好评级。

其中 E（ui）和 E（vj）为预测设置基准，f（ui，vj）计算用户 ui和项目 vj 之间的最终偏好评级。函数 f（ui，vj）可以表示为：

其中 rp-ij 是用户 ui 和项目 vj 之间的偏好评级。最终的预测偏好评级可以理解为包括用户自己的意见和对其社交用户评级的参考。由于很容易从原始数据中获得 E（ui）和 E（vj），因此关键问题是如何导出用户 ui 和项目 vj 之间的偏好评级 rp-ij。为此，我们利用分散的用户-项目图来学习用户和项目的表示。这些表示被称为潜在因素偏移，因为所提出的模型通过利用分散的图形数据将用户和项目映射到潜在因素空间中。为了获得用户和项目的潜在因素补偿，使用不同的数据来实现不同的目标。
在图 1 中的示例中，与用户交互的项目（即，v2 和v4 的项目聚合）用于学习用户 u1 的潜在因素偏移。对于项目 v4 的潜在因素，从与项目交互的用户处学习（即，u1 和 u2 的用户聚合）。通过在与 u1 社交连接的用户（即 u2 和 u4）之间执行社交聚合来学习 u1 的社交偏移。偏好评级预测组件是通过集成用户、项目和社交建模组件，通过预测来学习模型参数。应该注意的是，如果存在没有交互记录的新用户或项目，则该用户或项目的平均评级可以被全局平均值替换。下面讨论这些模型组件的细节。

3.3 用户建模

在本小节中，我们将详细介绍如何从项目聚合中建模用户ui的潜在因子偏移量（表示为hui∈RD）。
可以看出，去中心化的用户项目图包含用户和项目之间的交互历史，以及用户对这些项目的评分。在[38]中，作者提供了一种获取交互和评分的方法，用于学习用户界面的潜在因素。然而，这种方法并不能反映ui 和其他用户之间的统计差异。因此，我们不是直接使用评级，而是**在用户建模中利用评级差异r¯ij，**即，
我们创建了一个嵌入查找表，将每个差异映射到表中，我们可以很容易地获得该表中的差异表示r¯ij。我们不直接使用rij−E（vj）的原因是由于小数的原因，在代码中使用嵌入方法不方便。我们相信定量方法可以用来解决这个问题，我们将其留给未来的工作。

为了从数学上获得用户 ui 的潜在因子偏移量 hui，我们使用以下函数：

其中xil为表示用户ui与项目vl之间感知交互的表示向量，GI为项目聚合函数，W和b分别为神经网络的权重和偏差。
评分差异感知交互的目的是捕捉用户的偏好差异，这可以帮助我们对用户的潜在因素抵消进行建模。这与过去直接获取用户偏好不同[34]，[38]. 对于用户 ui 和具有评分差异的项目 vl 之间的交互，我们将该交互表示xil 建模为

其中 Lu 是多层感知器（MLP）。如引言中所述，该方法将偏差视为向量，并将其融合到学习用户表示的过程中。这样，我们可以更好地捕捉隐藏在用户交互记录中的偏见。
考虑到一个用户和交互项目之间的每次交互对用户潜在因素偏移的贡献是不同的。受注意力机制[45]、[46]的启发，我们将项目聚合函数 GI 定义为

其中，ηil是用户ui和项目vl之间交互的注意权重。这样，该模型就可以更好地捕捉到用户偏好中的差异。其核心问题是如何获得注意力的权重。我们采用以下的关注网络来解决这个问题。

注意力网络

这个网络的输入是交互表示 xil 和用户 ui 的嵌入向量 pui。根据[38]，我们开发了两层神经网络

其中 ReLU 是整流线性单位。注意力权重ηil 是通过使用 Softmax函数对上述注意力得分进行归一化而获得的。

最后，对用户ui的潜在因子偏移hui可以写为

3.4 项目建模

本部分旨在从分散用户项目图中的用户聚集中学习项目 vj 的潜在因素偏移 hvj。用户聚合包含与项目 vj 交互的所有用户，以及用户对vj 的评分。不同的用户可能对同一物品表达不同的态度。这可以在一定程度上帮助我们描述项目。为了描述项目在不同用户上的不同特征，我们修改了用户建模中使用评级的方式。用户ui和项目vj之间的新的评级差异r~ij定义为

利用这种类型的评分差异，我们使用该模型来学习来自不同用户的一个项目的潜在因素抵消。以下整个过程类似于用户建模。对于用户 uk和项目 vj 之间的交互评级差异r~kj，我们提出了一个由用户嵌入puk和评级差异嵌入s˜kj组成的评级差异感知交互表示yjk，即：

其中，LI是一个与LU相同的MLP，获得sr˜kj的方法与用户建模中的sr¯ij相同。为了学习潜在因子偏移量hvj，我们引入了该函数

其中，GU为用户聚合函数。在引入了区分用户交互对yjk的贡献的注意机制之后，我们就有了

其中，ξjk为使用以yjk和qvj为输入的双层神经注意网络获得的注意权值。它可以被写成

与hui相似，hvj可以表示为

3.5 社会建模

社会建模的功能与用户建模相似。当用户建模学习用户ui的潜在因素偏移时，该社会建模旨在学习ui的社会关联用户的潜在因素偏移。例如，在图3中，当用户建模学习用户u1的潜在因子偏移量时，社会建模分别以用户建模的方式学习u2和u4的潜在因子偏移量。因此，我们可以直接得到{huk，∀uk∈N（ui）}。需要注意的是，在这个模块中，数据仍然是分散的图数据。本模块的主要目的是帮助目标用户通过其社交用户来校准他们的评分。当计算用户和项目之间的评级时，该用户的社会联系用户的偏好是一个重要的参考。它可以帮助模型获得更准确的评级。

3.6 评级预测

在获得潜在因素补偿后，hui，hvj 和{huk，uk∈ N（ui）}的用户ui、项目 vj 和 ui 的社交连接用户，可以使用三层神经网络获得偏好评级。对于偏好评级 rp-ij，我们使用以下过程来获得它:

对于 ui 的社交用户，他们的偏好评级{rp-kj，∀Uk∈ N（ui）}以相同的方式导出。然后使用（2）–（4）中的表达式，我们可以获得用户 ui 和项目 vj 之间的最终评级预测。需要注意的是，在测试阶段，用户和项目的平均评分与培训阶段一致。

3.7 模型培训

我们从两个角度评估我们提出的模型，包括评级预测和排名预测。对于评级预测任务，有一个常用的目标函数：

其中 rij 是由用户 ui 对项目 vj 进行评级的地面真实评级。

学习排名的重点是为最终用户提供一个排名的项目列表，并在不同类型的推荐场景中广泛存在，如top-k推荐，顺序推荐[48]，[49]。在这个任务中，对于每个用户，如果评级等于或大于F，则交互项被标记为1（即正样本），如果评级不等于F，则标记为0（即负样本）。也就是说，用户想要点击或浏览评级等于或大于F的项目。由于我们实验中的两个数据集包含从1到5的评级，我们在实验中设置了两种情况，包括F = 3和F = 4。所有模型的输出预测分数都使用s型函数进行调整。对于排序任务，我们选择二元交叉熵损失作为目标函数。

其中，yij是一个样本的地面真实标签，yˆij是一个介于模型预测的（0,1）之间的值。
在目标函数的优化中，我们采用 RMSprop[50]作为优化器。它随机选择一个训练实例，并沿负梯度方向更新每个模型参数。所有嵌入向量都是随机初始化的，并在训练阶段学习。对于评级差异嵌入，它取决于评级规模。在我们的实验中，每个等级都在{1，2，3，4，5}。因此，可以将嵌入的输入维度设置为 5。
为了减少过拟合的影响并提高泛化性能，我们应用了丢弃策略[51]。特别是，我们引入了一种节点退出策略。

节点丢失
在分散的用户-项目图和社交图中，每个用户或项目都有不同数量的交互。
例如，一个用户可能与十几个项目进行了交互，但另一个用户只与几个项目进行了互动。为了防止过多交互对表征学习的过度拟合影响，我们需要在训练阶段减少一些交互。基于上述思想，提出了节点丢失。在[34]中，作者介绍了一种以概率丢弃节点的方法交互记录很少的节点。因此，在学习用户和项目的潜在因素偏移的过程中，我们为每个节点随机保留多达 K 个交互节点，这样我们可以保护学习资源较少的节点。
在下一节中，我们将在两个真实世界数据集上验证所提出的模型的性能。

3.8 时间复杂性

如第3.1节所述，有N个用户、M个项目和O个训练样本。我们使用节点退出，并为每个节点保留多达K个交互节点。在每个模块上，我们需要计算两个具有小层（例如，双层）的mlp。因此，三个建模模块的时间成本约为O（（N + M）KD）。对于评级预测模块，时间成本约为O（OD）。因此，总时间成本约为O（（（N+M）K+O）D)。在实际应用中，如K≪{N，M}，因此总时间复杂度是可以接受的。

4 实验

在本节中，我们进行了实验以验证所提出的 GDSRec 的有效性。我们旨在回答以下研究问题：

RQ1：在评分预测和项目排名方面，GDSRec 与现有方法相比表现如何？
RQ2：GDSRec 的具体设计如何影响模型性能？（即消融研究）
RQ3：节点脱落策略如何影响模型性能？
RQ4：阈值δ如何影响模型性能

4.1 数据集

我们在两个 benckmark 数据集 Ciao 和 Epinions1 上评估我们的模型。它们取自流行的社交网站。这两个数据集包含用户、项目、评分和社交关系。评分从 1 到 5。Ciao 和 Epinions 的统计数据如表1 所示。

4.2 评估指标

为了评估所提出模型的评级预测性能，我们采用了两个众所周知的指标，即平均绝对误差（MAE）和均方根以评估推荐算法的预测准确性。这两个指标定义为
其中 T 是测试数据集。MAE 和 RMSE 值越小，预测精度越高。
为了进一步验证评分预测的性能，我们将其扩展到项目排名评估。测试集包含两个积极的（即得分≥ F）和阴性样本（得分

4.3 基线

出于比较目的，考虑了以下方法。我们选择了四组具有代表性的方法，包括：

传统推荐算法：PMF[53]，它只使用评级信息；FunkSVD[10]，它基于矩阵分解方法考虑用户和项目偏差；
传统的社交推荐算法： TrustMF[23]，基于评级信息利用社交信息；
基于深度神经网络的推荐算法：NeuMF[52]、DeepSoR[54]，分别是典型的深度和深度社交推荐。
基于图神经网络的推荐算法：GCMC、GCMC+SN[34]、GraphRec[38]、LightGCN[41]和 Diffnet++[40]。

4.4 参数设置

我们提出的模型是在Pytorch2的基础上实现的。对于两个数据集，我们选择80%或60%作为训练集来学习参数，其余的数据集平均分为验证集和测试集。这个数据分割与[38]相一致。验证集用于调优超参数，而测试集用于最终的性能比较。阈值δ可以在{0、1、2、3}中进行选择。我们测试了Ciao上{16、32、64、128、256、512}中嵌入大小D的值，以及Ciao上{5、10、15、20}和{15、20、25、30}上的交互节点保留K。学习速率和批处理大小分别在{10−6、10−5、10−4、5×10−4}和{64、128、256}中进行搜索。如果MAE和RMSE的和在验证集上连续增加了10个时期，我们就停止训练。模型参数和所有嵌入向量默认初始化，在Pytorch中呈均匀分布。对于LightGCN [41]和Diffnet++ [40]，我们采用了两层图卷积的设置。这些方法的超参数可以通过网格搜索进行了调整。

4.5 性能比较（RQ1）

4.5.1 评级预测

表 2 显示了针对评级预测任务的不同模型之间的性能比较。比较方法的部分结果摘自[38]。据我们所知，带下划线的值表示基线之间的最佳性能。从表中可以看出，FunkSVD 优于 PMF，这表明在实践中存在用户和项目偏差。我们可以看到，传统方法 TrustMF 优于 PMF 和 FunkSVD。当 PMF 和 FunkSVD 仅使用评级信息时，传统的社交推荐算法表明，评级和社交信息的结合可以有效地提高推荐性能。这些结果支持，当我们使用深度神经网络解决评级预测问题时，可以利用社交网络信息。

NeuMF 利用神经网络架构来解决这个问题，它比 PMF 性能更好。这表明了神经网络模型在推荐算法中的威力。
DeepSoR 在神经网络的基础上结合了社会信息，表现比 NeuMF 更好。此外，比较 GCMC 和 GCMC+SN，也可以观察到社会信息的重要性。LightGCN 是最先进的基于 GNN 的推荐模型，具有隐式反馈，它对高阶用户项目交互进行建模，但不利用社交信息。一般来说，它的表现优于 GCMC，但不如 GCMC+SN。GraphRec 和Diffnet++都利用了 GNN，并将其与社交网络信息相结合以获得推荐。这两种方法表明，GNN 具有良好的表示学习能力。

从表 2 可以看出，我们的模型 GDSRec 优于所有其他基线方法。**与GraphRec 和 Diffnet++相比，我们的模型利用了用户和项目统计数据，这有助于获得评级预测基准。**然后通过学习用户和项目的潜在因素偏移来寻求偏好评级预测。此外，与 GraphRec 和 Diffnet++使用社交网络信息学习用户表示不同，我们的模型使用社交网络的信息作为校正最终评级预测的方法。当训练集占数据集的 60%时，可看出我们的模型比Diffnet++的平均性能提高了 1.75%。当训练数据是数据集的 80%时，我们的模型可以获得更多的性能改进。尽管相对改进的百分比很小，但Koren 在[55]中指出，即使是 MAE 和 RMSE 的微小改进也可能导致实践中建议的显著差异。

4.5.2 项目排名

在这一部分中，我们评估了所提出模型的项目排序性能。为了进行比较，我们选择了传统算法 PMF 和 FunkSVD、经典深度算法 NeuMF、基于 GNN 的模型（包括 LightGCN、GraphRec 和 Diffnet++）与我们的 GDSRec进行比较。结果如图 4 和图 5 所示。从图中我们可以看出，四种模型在召回评估指标上表现出相似的高性能。这是因为阳性标记在两个数据集中占据了很大的比例。这些模型的预测自然是有偏差的，对于负样本给出了高概率的正结果。这使得很难判断模型的性能。相比之下，NDCG上的模型性能不同。这表明四种模型的排名能力存在差异。总而言之，在 NDCG 方面， GDSRec 比其他同行表现更好，这进一步证明了 GDSRec更有效地将积极的项目推向高排名位置。

4.6 消融研究（RQ2）

在本小节中，我们进一步研究了拟议 GDSRec 的模型组件的影响。

4.6.1 社交网络和用户评分的影响

本小节介绍了拟议模型的有效性。我们的模型包含三个因素：
1）增加社会关系的关系系数；
2）使用社会关系来调整评级预测；
3）通过使用用户和项目的统计来学习潜在因素偏移。
为了更好地理解所提出的模型，我们制作了模型的几个变体，并比较了它们之间的性能。这些变量定义为：

GDSRec-RC：从拟议框架中删除社会关系的关系系数。这个变体意味着所有的社会关系都是平等和无差别的。换句话说，所有关系系数都是 1。
GDSRec-SN：GDSRec的社交网络信息被删除。该变量忽略了社会关系的偏好评级预测，只使用hui和hvj得到f（ui，vj），即f（ui，vj）=rp-ij。
GDSRec-RD：潜在因素的偏移量是从我们提出的框架中的评级差异中学习出来的。这种变异意味着潜在因素偏移是通过原始评级数据学习的，而不是评级差异。换句话说，在(5)和（12）中定义的评级差异（r¯ij，r˜ij）被rij所取代。

为了简单起见，我们在表 3 中总结了这些变体。在下文中，我们将这些变体的性能与 GDSRec 的性能进行了比较。

GDSRec与三个变量之间关于评级预测的性能比较如图6所示。

这些模型中的超参数被设置为相同的。从图中所示的结果中，我们可以得出以下结论：

社交网络的影响：我们现在分析社交网络对推荐绩效的影响。首先，我们可以从图6中看出，GDSRec-RC的性能略弱于GDSRec。虽然GDSRec-RC的RMSE与Ciao上的GDSRec相似，但MAE比GDSRec高0.9%。对于数据集epin，可以观察到，虽然GDSRec-RC的MAE接近GDSRec，但GDSRec-RC的RMSE高于GDSRec。这验证了该关系系数对该模型是有益的。另一方面，GDSRec-SN的RMSE比GDSRec高0.79%，而两种模型的MAE结果都很接近。也就是说，社交网络对推荐性能很重要。
评级差异的影响：当我们使用原始评级数据而不是评级差异来训练潜在因子偏移时，从图6中可以看到，GDSRec-RD在两个数据集上的MAE和RMSE都远远高于GDSRec。因此，GDSRec-RD的性能比GDSRec要差得多。它验证了我们的核心思想，即处理原始的评级数据，是非常有效的，这有助于提高推荐的性能。我们相信它可以直接应用于其他模型，并导致性能的改进，我们把它留给未来的工作。

4.6.2 注意力网络的效果

在本小节中，我们将评估注意网络的有效性。提出的GDSRec使用softmax来标准化注意力分数。在这里，我们设计了两种注意力权重的变体。一种变体是将（10）和（16）重写为
各自地另一个是，
我们分别使用GDSRec-avg和GDSRec-max来表示这两个变体。请注意，没有其他类似于GDSRec-max的变体，它用最大值替换最大值（27）。这是因为，如果有一个注意权重接近于零，它可能会导致注意网络的输出非常小。

关于评级预测的性能比较如表4所示。我们可以观察到，GDSRecavg在MAE上实现了与GDSRec相同的性能。GDSRec-max的性能总是最差的。我们可以将GDSRec-avg和GDSRec-max放在同一个类别中，因为这两个变体对于不同的输入注意分数都具有相同的输出权重。我们认为GDSRec-avg比GDSRec-max表现更好，因为GDSRec-avg的调整更为温和。总之，GDSRec在学习表示时为用户或项目分配不同的权重，因此具有更好的性能。

4.6.3 平均评级的影响

根据（2），最终预测取决于平均评级（即 e（ui）和 e（vj））。在这里，我们讨论了如果平均收视率发生变化，表现会如何。为此，我们改变了最终预测中平均评分的权重，表达式（2）改写为

其中α是超参数。
我们测试了｛0，0.2，0.4，0.6，0.8，1，1.2，1.4，1.6｝中的α值，并给出了图 8 中的结果。从图中我们可以看到，随着α从 1 降至0，性能显著下降。很容易解释，模型可以被认为是对分散训练数据的拟合。因此，一旦平均评分发生变化，最终预测将直接失去这些信息。这不可避免地会导致性能下降。随着α变大，性能相对恶化。这些结果表明了用户个性化偏好在预测中的重要性.

4.7 节点脱落的影响（RQ3）

现在，我们分析节点丢失对推荐性能的影响。节点丢失用于避免由于节点的交互过多而导致的过拟合问题。对于有限数量的 K 个交互节点，我们在图 7 中显示了结果，其中训练集占数据集的 60%，D=256。在数据集 Ciao 上，当 K 从 5 增加到 20 时，GDSRec 在 K=10 时达到最佳性能。对于数据集 Epinions，结果有些不同。当 K 从 15 到 30 时，我们可以清楚地看到 MAE 和 RMSE 在 K＝25 时都是最小的。它验证了交互节点数 K影响所提出模型的性能。对于一个新的数据集，需要对有限数量的交互节点 K 进行实验测试。
在表 5 中，我们给出了不同δ阈值的两个数据集的 MAE 和 RMSE 结果。通常，当δ为 1 时，Ciao 和 Epinions 的性能最好。当δ=0 时，社会关系的数据非常稀疏。因此，它不能帮助模型更好地学习。当δ大于1 时，它可能会在社会关系数据中引入一些噪声，并导致性能不佳。

4.8 阈值δ（RQ4）的影响

在表 5 中，我们给出了不同δ阈值的两个数据集的 MAE 和 RMSE 结果。通常，当δ为 1 时，Ciao 和 Epinions 的性能最好。当δ=0 时，社会关系的数据非常稀疏。因此，它不能帮助模型更好地学习。当δ大于1 时，它可能会在社会关系数据中引入一些噪声，并导致性能不佳。

5 结论

在本文中，我们提出了一个新的框架GDSRec，用于社会推荐中的评级预测问题。GDSRec将评级偏差视为向量，并将它们融合到学习用户和项目表示的过程中。最后，我们利用统计信息将原始图处理到分散图中，并明确地在图上提取偏差信息。它提供了一个分散的视角来学习潜在的因素抵消的用户和项目。
而统计信息也为评级预测提供了重要的基准。此外，我们还为用户区分了社会关系的明确优势，并将这些优势添加到最终的预测中。已经在两个真实世界的数据集上进行了实验。结果表明，该方法具有更好的评分预测性能。此外，我们还进行了实验，以验证了所提模型的排序能力。结果表明，该模型在评分预测和项目排名方面均有较好的性能。
代码参考链接: GitHub

你可能感兴趣的:(深度学习,人工智能,神经网络,推荐算法)

机器学习入门——机器学习基本概念四月是你的机器学习
@机器学习什么是机器学习机器学习(MachineLearning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎简单来说机器学习就是机
基于R-CNN深度学习的无人机目标检测系统：数据集、模型和UI界面的完整实现 2025年数学建模美赛 R-CNN检测系统深度学习 cnn 无人机计算机视觉目标检测人工智能
摘要随着无人机技术的迅猛发展，无人机在军事、农业、环境监测等多个领域的应用日益广泛。无人机目标检测系统的建设成为提升无人机自主飞行和环境感知能力的重要环节。本文将详细介绍如何构建一个基于深度学习的无人机目标检测系统，采用R-CNN（区域卷积神经网络）算法，通过用户界面设计和数据集处理，实现高效的目标检测功能。通过本项目，旨在为无人机目标检测提供一种可行的解决方案，并提高其在复杂环境下的工作效率。目
基于Multi-Agent的无人机集群体系自主作战系统设计龙腾亚太无人机
源自：系统工程与电子技术作者：张堃,华帅,袁斌林,杜睿怡“人工智能技术与咨询”发布摘要针对无人集群自主作战体系设计中的关键问题,提出基于Multi-Agent的无人集群自主作战系统设计方法。建立无人集群各节点的Agent模型及其推演规则;对于仿真系统模块化和通用化的需求,设计系统互操作式接口和无人集群自主作战的交互关系;开展无人集群系统仿真推演验证。仿真结果表明,所提设计方案不仅能够有效开展并完成
用 Neo4j GraphRAG 工具开启你的智能应用之旅步子哥 AGI通用人工智能 neo4j 人工智能
在这个人工智能飞速发展的时代，Neo4j带来了一项令人激动的创新——GraphRAG生态系统工具。这组开源工具为开发人员提供了一个全新的途径，以构建基于知识图谱的智能应用，让机器更好地理解和回应我们的查询。接下来，让我们一起探索这些工具如何帮助我们构建更智能、更准确的应用。什么是GraphRAG?GraphRAG是一种结合了检索增强生成（RAG）技术和知识图谱的解决方案。它不仅解决了大型语言模型常
探索未来对话的边界：Mixture-of-Agents（MoA）——大型语言模型的集体智慧引擎潘俭渝Erik
探索未来对话的边界：Mixture-of-Agents（MoA）——大型语言模型的集体智慧引擎项目地址:https://gitcode.com/gh_mirrors/mo/MoA在当前人工智能的浪潮中，我们迎来了一个令人兴奋的技术突破——Mixture-of-Agents(MoA)，它标志着大型语言模型（LLM）能力提升的新纪元。本文将引领您深入探索这一革命性项目，揭示其技术精粹，展望应用前景，并
【Python】已解决：error: subprocess-exited-with-error 屿小夏 python 开发语言 linux
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
探索人工智能在计算机视觉领域的创新应用与挑战戒了9 人工智能学习方法
一、引言1.1研究背景与意义在科技飞速发展的当下，人工智能（ArtificialIntelligence,AI）已然成为引领新一轮科技革命和产业变革的重要驱动力。作为AI领域的关键分支，计算机视觉（ComputerVision,CV）致力于让计算机具备像人类一样理解和解析图像、视频等视觉信息的能力，近年来取得了令人瞩目的进展。二者的深度融合，更是为众多领域带来了前所未有的变革与机遇。从技术发展历程
人工智能前沿技术进展与应用前景探究戒了9 人工智能搜索引擎百度
一、引言1.1研究背景与意义人工智能作为一门极具变革性的前沿技术，正深刻地改变着人类社会的各个层面。从其诞生之初，人工智能便承载着人类对智能机器的无限遐想与探索。自20世纪中叶起，人工智能踏上了它的发展征程，历经了多个重要阶段，每一阶段都伴随着理论的突破、技术的革新以及应用领域的拓展。在初级阶段（1943-1956），沃伦・麦卡洛克和沃尔特・皮茨提出的人工神经网络基本模型，为人工智能的发展奠定了初
chatGPT底层原理是什么，为什么chatGPT效果这么好？三万字长文深度剖析-中会写代码的孙悟空大模型从入门到放弃 chatgpt 人工智能深度学习机器学习 AIGC
导航chatGPT底层原理是什么，为什么chatGPT效果这么好？三万字长文深度剖析-上chatGPT底层原理是什么，为什么chatGPT效果这么好？三万字长文深度剖析-中chatGPT底层原理是什么，为什么chatGPT效果这么好？三万字长文深度剖析-下神经网络那么我们用于图像识别等任务的模型是如何工作的呢？目前最流行且最成功的方法是使用神经网络。神经网络在20世纪40年代就发明了——其形式与现
chatgpt赋能python：Python如何删除一个对象 atest166 ChatGpt chatgpt jvm java 计算机
Python如何删除一个对象Python是一种高级、面向对象、动态类型解释型语言，它有广泛的应用，尤其在数据分析、机器学习、人工智能和Web开发等领域。但是，在Python编程过程中，我们也可能需要删除对象。那么，Python如何删除一个对象呢？Python对象和变量在Python中，一切都是对象。对象是内存中的一块数据，有自己的身份、类型和值。变量是指向对象的引用，通过变量可以访问对象的属性和方
人工智能前沿技术进展与应用前景探究戒了9 搜索引擎
一、引言1.1研究背景与意义人工智能作为一门极具变革性的前沿技术，正深刻地改变着人类社会的各个层面。从其诞生之初，人工智能便承载着人类对智能机器的无限遐想与探索。自20世纪中叶起，人工智能踏上了它的发展征程，历经了多个重要阶段，每一阶段都伴随着理论的突破、技术的革新以及应用领域的拓展。在初级阶段（1943-1956），沃伦・麦卡洛克和沃尔特・皮茨提出的人工神经网络基本模型，为人工智能的发展奠定了初
探索 Meissonic：文本到图像生成的新星 zhangjiaofa 大模型文生图大模型 Meissonic
目录前言模型概述主要功能技术架构应用场景在线体验本地部署克隆存储库创建虚拟环境安装扩散器启动GradioWeb用户界面文本到图像生成结语项目地址一、前言在人工智能迅猛发展的今天，文本到图像生成技术已成为科技前沿的热点。从艺术创作到商业设计，从学术研究到工业应用，这一技术正以惊人的速度改变着我们与数字内容的交互方式。众多研究机构和企业纷纷投入这一领域，不断推动技术的边界。然而，尽管已有许多优秀的模型
AI在电商平台商品描述生成中的应用 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
AI在电商平台商品描述生成中的应用关键词：人工智能、电商平台、商品描述、自然语言处理、机器学习、深度学习摘要：本文深入探讨了人工智能在电商平台商品描述生成中的应用。首先，我们回顾了人工智能的概述和电商平台的发展背景。随后，分析了商品描述在电商平台中的重要性以及存在的问题。接下来，我们重点介绍了AI在商品描述生成中的应用技术，包括自然语言处理、机器学习和深度学习等。文章还通过实战案例展示了AI商品描
SpringAI基于API对大语言模型调用 _沉浮_ AI 语言模型人工智能 springAI
引言随着人工智能技术的迅猛发展，大型语言模型（LLM）在各个领域的应用越来越广泛。SpringAI作为一个旨在简化AI集成的框架，为开发者提供了高效、便捷的工具来连接和调用这些大模型。本文将详细探讨如何使用SpringAI整合通义千问等大语言模型，并通过实例演示这一过程，最后提供一些扩展建议。一、SpringAI简介SpringAI是一个专为AI工程设计的应用框架，旨在将Spring生态系统设计原
【Python】已解决：（cmd进入Python环境报错）No Python at ‘C:\Users…\Python\Python39\python.exe’ 屿小夏 python linux 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
深度学习之基于Django+YOLOv5商标识别 Q1744828575 python plotly python
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景在数字化时代，商标作为企业的重要资产，其保护和管理显得尤为重要。然而，传统的商标识别方法往往依赖于人工审查，效率低下且容易出错。随着深度学习技术的不断发展，尤其是目标检测领域的进步，自动化、高精度的商标识别成为可能。本项目旨在利用DjangoWeb框架和YOLO
ERROR: Could not install packages due to an OSError: [Errno 2] No such file or directory解决方案爱编程的喵喵 Python基础课程 python pip OSError 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ERROR:Couldnotinst
安装flash-attn出现RuntimeError current installed version g++ (4.8.5) is less than mininum version解决方案爱编程的喵喵 Python基础课程 python flash-attn g++RuntimeError
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。本文主要介绍了安装flash-attn出现RuntimeErrorcurrentinstalledversiong++(4.8.5)islessthanmininumversion解决方案
动手学深度学习-卷积神经网络-3填充和步幅像污秽一样动手学深度学习深度学习 cnn 人工智能神经网络
目录填充步幅小结在上一节的例子（下图）中，输入的高度和宽度都为3，卷积核的高度和宽度都为2，生成的输出表征的维数为2×2。正如我们在上一节中所概括的那样，假设输入形状为nh×nw，卷积核形状为kh×kw，那么输出形状将是(nh−kh+1)×(nw−kw+1)。因此，卷积的输出形状取决于输入形状和卷积核的形状。还有什么因素会影响输出的大小呢？本节我们将介绍填充（padding）和步幅（stride）
神经网络及其架构和模型的关系爱吃瓜的猹z 大模型神经网络架构人工智能
模型、架构、神经网络之间的关系可以理解为不同层次上的概念，它们分别涵盖了机器学习系统的不同方面。具体来说：1.神经网络神经网络是一种模型类型，基于生物神经系统的启发，用于模拟人脑的学习过程。它由**多个神经元（节点）**和连接权重组成，这些神经元组织成不同的层，通过输入数据进行学习和预测。神经网络的特点：基本组成单位：神经网络的基本单位是“神经元”（或节点），每个神经元接收输入，进行加权和激活，然
9.6 解锁 AI 潜力：GPT Builder 的强大能力与无限可能少林码僧 AI大模型应用实战专栏人工智能 gpt
解锁AI潜力：GPTBuilder的强大能力与无限可能引言：轻松打造智能应用的革命性工具在人工智能的浪潮中，GPTBuilder作为一款强大且易用的开发工具，让构建AI驱动的智能应用变得前所未有的简单。无论你是开发者、企业家，还是对技术一知半解的创作者，GPTBuilder都能帮助你快速将创意变为现实。从自动化客户支持到内容生成，从数据分析到智能助手，GPTBuilder提供了丰富的功能和灵活的设
RTX 4090D和A10和T4显卡差别、价格对比张3蜂软件安装部署开源神经网络人工智能深度学习机器学习
RTX4090D、NVIDIAA10和NVIDIAT4三款显卡在设计用途、性能、功耗、价格等方面都有显著差异，以下是它们的主要区别：1.设计用途：RTX4090D:面向高端消费者市场，主要用于游戏、内容创作和3D渲染，适合需要高图形性能的用户，如游戏玩家和内容创作者。NVIDIAA10:专为数据中心和企业应用设计，优化了AI推理、深度学习、虚拟桌面基础设施(VDI)以及多实例GPU（多用户共享显卡
【TVM教程】为 Mobile GPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：LianminZheng,EddieYan针对特定设备的自动调优对于获得最佳性能至关重要。本文介绍如何调优整个卷积网络。TVM中MobileGPU的算子实现是以template形式编写的。该template有许多可调参数（tile因子
Spring AI 更新：支持OpenAI的结构化输出，增强对JSON响应的支持 java后端
就在昨晚，SpringAI发了个比较重要的更新。由于最近OpenAI推出了结构化输出的功能，可确保AI生成的响应严格遵守预定义的JSON模式。此功能显着提高了人工智能生成内容在现实应用中的可靠性和可用性。SpringAI紧随其后，现在也可以对OpenAI的结构化输出完美支持了。下图展示了本次扩展的实现结构，如果对于当前实现还不够满意，需要扩展的可以根据此图来着手理解分析进行下一步扩展工作。使用样例
非凸科技招聘来啦！技术岗及非技术岗由你选！欢迎大家加入！招聘
公司介绍：非凸科技成立于2018年，是国内领先的智能算法和交易系统服务公司，专注于智能算法交易领域的研究和开发。公司特点：投研团队来自华尔街顶级资管公司BlackRock等，以及多位来自腾讯、字节跳动的顶尖工程师；在职员工100+，投研和技术团队占总人数比例75%，多位成员是ACM/ICPCWorldFinal选手；公司司正基于Rust生态，结合机器学习、深度学习等新兴技术，打造高效率、低延迟、高
深度学习-70-大语言模型LLM之基于大模型LLM与检索增强技术RAG的智能知识库皮皮冰燃深度学习人工智能深度学习语言模型
文章目录1RAG出现的背景2搭建过程2.1数据收集2.2数据处理2.2.1数据清洗与预处理2.2.2文本分块2.2.3微调数据格式统一2.3建立向量索引2.4大模型选择与微调3开源知识库项目3.1FastGPT3.2AnythingLLM3.3LangChain-Chatchat4商业化解决方案4.1百度智能云+千帆大模型知识库4.2阿里云PAI+向量检索5参考附录1RAG出现的背景自从2022年
Crawl4AI：用几行代码打造强大的网页爬虫海豹工匠爬虫
Crawl4AI：用几行代码打造强大的网页爬虫在人工智能和大数据时代，数据的获取和处理变得尤为重要。尤其是在大型语言模型（LLM）的研究和应用中，如何高效地抓取和整理网络数据成为了一个关键的挑战。为了解决这一问题，一个名为Crawl4AI的开源网页爬虫工具应运而生，它专为LLM优化，提供了一种简单易用且功能强大的数据抓取解决方案。什么是Crawl4AI？Crawl4AI是一个基于LLM的开源网页爬
transformer.js（一）：这个前端大模型运行框架的可运行环境、使用方式、代码示例以及适合与不适合的场景余生H 前端的AI工具书前端 transformer javascript hugginface webml web大模型
随着大模型的广泛应用，越来越多的开发者希望在前端直接运行机器学习模型，从而减少对后端的依赖，并提升用户体验。Transformer.js是一个专为前端环境设计的框架，它支持运行基于Transformer架构的深度学习模型，尤其是像BERT、GPT等广泛应用于自然语言处理（NLP）的模型。本文将全面解析Transformer.js的运行环境、使用方式、代码示例，以及其能够完成的功能与目前的限制，帮助
Python magenta库：一款人工智能生成音乐与艺术的创新工具程序员喵哥 python 人工智能开发语言
更多Python学习内容：ipengtao.com随着人工智能在创意领域的不断进步，音乐和艺术生成正成为一种新的可能性。Magenta是由Google推出的一个开源项目，它结合了深度学习与艺术创作，为开发者提供了一系列强大的工具，帮助他们创作音乐、绘画等艺术作品。基于TensorFlow，Magenta不仅适用于研究人员，也适合开发者和艺术家，提供了易于上手的API和丰富的模型。安装在使用Mage
Crawl4AI 人工智能自动采集数据葡萄爱人工智能 python 大数据
文章目录1使用Crawl的步骤2AI智能体应用实例3结语Crawl是一款免费的开源工具，利用AI技术简化网络爬取和数据提取，提高信息收集与分析的效率。它智能识别网页内容，并将数据转换为易于处理的格式，功能全面且操作简便。定位：开源AI工具Crawl，简化数据爬取和分析，助力高效提取网站定价信息。1使用Crawl的步骤步骤1：安装与设置pipinstall“crawl4ai@git+https://
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l