农场主

Interest-aware Message-Passing GCN for Recommendation WWW2021

ABSTRACT

图卷积网络(GCNS)在推荐方面显示出巨大的潜力。这归功于他们通过利用来自高阶邻居的协作信号来学习好的用户和项目嵌入的能力。与其他GCN模型一样，基于GCN的推荐模型也存在一个臭名昭著的过度平滑问题–当堆叠更多层时，节点嵌入会变得更加相似，最终无法区分，从而导致性能下降。最近提出的LightGCN和LR-GCN在一定程度上缓解了这一问题，然而，我们认为它们忽略了推荐中过度平滑问题的一个重要因素，即没有用户共同兴趣的高阶相邻用户也可以参与用户在图形卷积操作中的嵌入学习。因此，多层图卷积将使兴趣不同的用户具有相似的嵌入。本文提出了一种新的兴趣感知消息传递GCN推荐模型(IMP-GCN)，该模型在子图内部进行高阶图卷积。子图由具有相似兴趣的用户及其交互项目组成。为了形成子图，我们设计了一个无监督的子图生成模块，通过利用用户特征和图结构，可以有效地识别具有共同兴趣的用户。为此，我们的模型可以避免将来自高阶邻居的负信息传播到嵌入学习中。在三个大规模基准数据集上的实验结果表明，我们的模型可以通过堆叠更多的层来提高性能，并且性能明显优于现有的基于GCN的推荐模型。

1 INTRODUCTION

但我们认为它们仍然是从图卷积的角度来设计模型，而没有很好地考虑推荐领域的过平滑问题。

基于GCN的推荐模型建立在用户项图的基础上，其中用户和项根据用户与项的历史交互进行链接。用户嵌入是通过迭代聚合从相邻(用户和项目)节点传递的消息来学习的。请注意，传递的消息是从相邻节点的嵌入中提取的。当堆叠K层时，通过项目和用户间接连接的K顺序邻居的信息也参与到目标节点的嵌入学习中。一个潜在的假设是，来自高阶邻居的协作信号有利于嵌入学习。然而，并非所有来自高阶邻居的信息在现实中都是积极的。在用户-项目交互图中，高阶相邻用户可能与目标用户没有共同甚至矛盾的兴趣。这是非常可能的，特别是当图表是基于隐式反馈(例如，点击)构建的时候。事实上，在现代推荐系统中，隐式反馈比显式反馈被更广泛地使用。协作过滤背后的核心理念是相似的用户喜欢相似的项目。因此，我们想要利用的协作信号应该来自相似的用户(即兴趣相似的用户)。然而，现有的基于GCN的推荐模型并没有区分高阶邻居，而只是简单地聚合所有这些邻居的消息来更新用户嵌入。因此，不同用户的嵌入也会参与到目标用户的嵌入学习中，从而对性能产生负面影响。这也是基于GCN的推荐模型中过度平滑效应的一个原因–使得不同用户的嵌入是相似的。

基于上述考虑，本文提出了一种新的兴趣感知消息传递GCN推荐模型(IMP-GCN)，该模型将用户及其交互项目分组到不同的子图中，并在子图中进行高阶图卷积运算。更具体地说，我们采用了LightGCN的简化网络结构，因为它的有效性已经在[14]中得到了很好的证明，并且它可以在一定程度上缓解过平滑问题。一阶图卷积与LightGCN的卷积相同。**对于高阶图卷积，只利用来自同一子图中节点的消息来学习节点嵌入。子图由提出的图生成模块生成，该模块结合用户特征和图结构来识别具有相似兴趣的用户，然后通过保留这些用户及其交互项来构造子图。**为此，我们的模型可以过滤掉高阶图卷积运算中的负面信息传播进行嵌入学习，从而通过堆叠更多的图卷积层来保持用户的唯一性。在三个大规模的真实数据集上进行了大量的实验，以验证该模型的有效性。结果表明，我们的模型比现有的方法有很大的优势，并且在更多的层(直到7层)的情况下可以获得更好的性能1。这表明我们的模型可以通过排除负节点而受益于更高阶的邻居。此外，通过对结果的深入分析，我们发现嵌入传播中的负面信息是现有的基于GCN的深层次推荐模型性能下降的主要原因。我们发布了代码和相关的参数设置，以方便其他人重复此工作2。

综上所述，本工作的主要贡献如下：

针对现有基于GCN的推荐模型中存在的过度平滑问题，指出了一个被忽视的因素：不分青红皂白地利用高阶邻居，使得兴趣不同的用户嵌入相似。
我们提出了一种IMP-GCN模型，该模型利用来自同一子图的高阶邻居，其中用户节点与其他子图中的用户节点具有更多相似的兴趣。实践证明，该算法对缓解过平滑问题是有效的。
我们设计了一个子图生成模块，通过考虑用户特征和图的结构信息，对用户进行分组，并从用户-项目二部图生成子图。
我们在三个基准数据集上对所提出的IPM-GCN模型进行了实证研究。结果表明，IPMGCN可以通过层叠更多的层和学习更好的用户/项目嵌入来获得改进，从而比基于Sota GCN的推荐模型有更大的优势。

2 METHODOLOGY

2.1 Recap

将上述信息作为GCN模型的输入，通过迭代聚合二部图中相邻节点的特征来学习用户和项目表示。
这里我们以LightGCN为例来描述基于GCN的推荐模型，因为它以非常轻巧的设计实现了最先进的性能。我们的模型也是在其设计的基础上开发的。

$N_{u}$ :与用户U交互的项目集， $N_{i}$ 是与项目I交互的用户集

是对称归一化项，它可以避免嵌入规模随着图形卷积运算的增加而增加。

然后把每一层得到的embedding聚合到一起。
其中 $a_{k}$ ≥0是分配给第k层的超参数。它表示这一层在构成最终嵌入中的重要性。从方程。2、预计在对高阶邻域特征进行迭代聚合后，节点将不能保持自身的独特特征，并且它们的嵌入变得越来越相似，从而导致过平滑问题。此外，它没有区分高阶节点在聚合过程中的异构性。来自高阶邻居的噪声信息会影响嵌入学习。例如，将高阶邻居中没有共同兴趣甚至是相互矛盾兴趣的用户的嵌入聚合在一起，通过图卷积操作来学习目标用户的嵌入。

图1显示了通过将不同数量的层堆叠到图中的所有节点，目标节点在传播过程中到达的节点数的平均覆盖率。可以看出，在嵌入传播过程中，经过6层或7层图卷积后，一个节点几乎可以接收到来自所有其他节点的信息。因此，通过聚合所有连通高阶邻居的信息，在现有的基于GCN的模型中，在堆叠更多的层之后，节点嵌入变得同构是不可避免的，特别是对于密集连通的模型，其嵌入将变得越来越相似。在推荐场景中，这意味着在深层次上忽略了用户的唯一性

实际上，目前基于GCN的推荐模型最多只能达到3到4层的峰值性能[14，37]。除了过平滑效应外，我们认为节点在嵌入传播过程中还会携带噪声或负信息，这会损害最终的性能。这是因为用户的兴趣通常跨越一系列项目。不同的用户可能对某些项目有非常不同的兴趣，甚至表现出相互矛盾的态度。在不区分这些用户的情况下，嵌入传播可以在具有非常不同兴趣的用户之间执行，以了解他们在图形卷积运算中的嵌入。为了避免这种情况并缓解过平滑问题，重要的是将具有相似兴趣的用户(及其交互项目)分组到子图中，并约束嵌入传播在子图中进行操作。为了实现这一目标，我们提出了兴趣感知消息传递GCN模型。

2.2 IMP-GCN MODEL

2.2.1 Interest-aware Message-passing Strategy.

通过构造子图，我们希望一个子图中传播的所有信息都能有助于该子图中所有节点的嵌入学习。换言之，我们的目标是利用子图排除图卷积运算中的负信息传播。为了实现这一目标，我们依靠用户节点在用户-项目二部图中形成子图。其基本思想是将兴趣更相似的用户分组到一个子图中，与这些用户直接链接的项目也属于这个子图。因此，每个用户只属于一个子图，一个项目可以关联多个子图。

接下来，我们将在我们的模型中引入图的卷积运算。

由于用户与物品之间的直接交互提供了最重要、最可靠的用户兴趣信息，因此在一阶传播中，所有的一阶邻居都参与了图的卷积运算。(这是说一阶的时候不划分子图，全部放入到GCN中吗)

对于高阶图卷积，为了避免引入噪声信息，子图中的节点只能利用该子图中相邻节点的信息。因为用户交互的项目都属于该用户的子图，所以用户仍然可以从所有链接的项目接收信息。但是，对于项目节点，其直接用户邻居可以分布在不同的子图中。为了了解项i的嵌入，对于它所属的每个子图 $G_{s}$ ，我们学习该项的嵌入。 $e^{k}_{is}$ 表示项i经k层图卷积后嵌入到子图s中，其高阶传播定义为：

通过这种方式，我们保证在子图中学习的节点的嵌入只有助于该子图中其他节点的嵌入学习。这可以避免从无关节点传播的噪声信息。 $e^{.}_{is}$ 可以被认为是从对子图 $G_{s}$ 具有相似兴趣的用户学习的特征.这是有道理的，因为有相似兴趣的用户通常更喜欢同一项目的相同特征。项i在k层图形卷积之后的最终表示是其在不同子图中学习的嵌入的组合，即，

2.2.2 Layer Combination and Prediction.

我们将在每一层获得的嵌入组合在一起，以形成用户u和项i的最终表示为Eq。2.与LightGCN类似， $a_{k}$ 统一设置为1/(k+1)[14]。

内积计算用户对物品的喜爱度。请注意，还可以应用其他交互函数，例如欧几里得距离。由于本工作的重点是研究基于GCN的推荐模型中图形卷积对区分用户兴趣的影响，因此在实证研究中，我们采用与前人工作相同的内积[2，33，42]进行公平比较。

2.2.3 Matrix-form propagation rule

我们使用矩阵形式的传播规则来实现我们的算法(更多细节见[33])，通过它我们可以以一种相当有效的方式同时更新所有用户和项目的表示。使图卷积网络适用于大规模图是一种常用的方法[26，33]。

我的理解就是L就是一个卷积。

当我们涉及高阶图卷积层中的子图时，子图上的嵌入传播公式如下：

2.2.4 Optimization

优化：在这项工作中，我们以TOP-K推荐为目标，旨在推荐一组符合目标用户偏好的K排名靠前的项目。与评级预测相比，这在真实的商业系统中是一项更实际的任务[27]。类似于其他面向排名的推荐工作[33，42]，我们采用成对学习方法进行优化。

2.3 Subgraph Generation Module

在本节中，我们将介绍我们提出的子图生成模块，该模块用于从给定的输入图G构造子图。请注意，在我们的模型中，子图用于对具有共同兴趣的用户进行分组。我们将用户分组描述为一个分类任务，即每个用户被分类到一个组中。具体地说，每个用户由一个特征向量表示，该特征向量是图结构和ID嵌入的融合：

采用LeakyReLU[24]，因为它既可以对正信号进行编码，也可以对小的负信号进行编码。为了将用户分类到不同的子图中，我们使用两层神经网络将获得的用户特征映射到预测向量。

预测向量维度的维度与子图的数量相同，子图是预先选择的超参数。

请注意，这是一种将用户分类到不同组的无监督方法，因此不需要地面事实标签。对于具有类似嵌入的用户，公式为：14将生成相似的预测向量，即，它们将被归入同一组。子图生成的目的是根据用户分组结果和原始用户-项目图的拉普拉斯矩阵，构造一个矩阵来表示子图中的用户-项目邻接关系。对于每个子图的矩阵，如果对应的用户不在用户组中，则根据获取的用户组信息，过滤出原始用户-项目图的拉普拉斯矩阵中的用户-项目邻接关系。

3 EXPERIMENTS

3.1 Experimental Setup

3.1.1 Data Description.

为了评估IMP-GCN的有效性，我们在亚马逊Kindle商店、Amazon-Home&Kitchen和Gowalla三个基准数据集上进行了实验。前两个数据集来自公开的Amazon Review数据集4，该数据集在以前的研究中被广泛用于推荐评估。第三个数据集是从Gowalla收集的签到数据集，在Gowalla，用户通过签到共享他们的位置。我们遵循推荐中的一般设置来过滤交互较少的用户和项目。对于所有数据集，我们使用10个核心设置，即保留至少有10个交互的用户和项目。表1显示了三个数据集的统计数据，我们可以看到，这些数据集的大小和稀疏程度不同，这对于分析我们的方法和竞争对手在不同情况下的性能是很有用的。

对于每个数据集，我们将其随机分为训练集、验证集和测试集，每个用户的比率为80：10：10。观察到的用户-项目交互被视为正面实例。对于采用成对学习策略的方法，我们随机抽取一个用户以前没有消费过的负实例，与每个正实例进行配对

3.1.2 Evaluation Metrics

对于测试集中的每个用户，我们将用户未交互的所有项目视为负面项目。我们的评估采用了两个广泛使用的TOP-K推荐评估指标：召回率和归一化折扣累积收益[13]。对于每个指标，性能都是根据前20个结果计算的。请注意，报告的结果是所有测试用户的平均值

3.1.3 Experimental Settings.

我们使用Tensorflow 5实现了我们的模型，并仔细调整了关键参数。对于所有模型，嵌入大小固定为64，并且嵌入参数用Xavier方法[39]初始化。我们使用ADAM[17]优化了我们的方法，并使用默认学习率0.001和默认小批量大小1024(在Gowalla上，我们将小批量大小增加到2048以提高速度)。l2正则化系数휆在{1e−6，1e−5，···，1e−2}的范围内搜索。早期停止和验证策略与LightGCN中的相同

3.2 Study of IMP-GCN

在这一部分中，我们首先评估了我们的IPM-GCN模型在图形卷积中堆叠不同层时的性能。这是为了检验我们的利益感知信息传递策略是否能够缓解过度平滑的问题。接下来，我们研究了子图数目对模型性能的影响。

3.2.1 Effect of Layer Numbers.

为了考察IMP-GCN在更深层结构中的有效性，我们增加了模型深度，并与LightGCN进行了详细的比较。由于所采用的消息传递策略在一阶卷积层与LightGCN相同，因此我们将层数从2层增加到7层。实验结果如图3所示，其中IMP-GCN2、IMPGCN3和IMP-GCN4分别用2、3和4个子图表示模型。由于空间限制，我们省略了home&kitchen上的结果，因为它们显示了完全相同的趋势。从结果中，我们发现了一些有趣的观察结果。

首先，当两个数据集叠加超过2或3层时，IMP-GCN的性能一致优于LightGCN。这表明我们的模型可以通过兴趣感知消息传递策略学习更好的嵌入。其次，LightGCN的性能在堆叠3层或4层时达到峰值，增加更多的层会导致性能急剧下降，说明LightGCN在深层结构中存在过平滑问题。相比之下，IMP-GCN继续以更深的结构获得更好的性能(请注意，当堆叠超过7层时，一个节点已经从几乎所有节点聚合了信息，见图1。结果表明我们的模型在缓解过度平滑问题方面的能力。此外，它还证明了我们的观点，即不加区别地利用所有节点的信息会导致基于GCN的推荐模型中的过度平滑，以及2)验证了我们的子图生成算法在对具有共同兴趣的用户进行分类方面的有效性。

3.2.2 Effect of Subgraph.

图3还可以观察到不同子图数目(即{2，3，4})的IPM-GCN的性能。从结果可以看出，(1)具有2个子图的IMP-GCN2在堆叠不超过3层时可以获得最好的结果。这是因为在嵌入传播操作中，IMP-GCN2的子图中的节点可以比IMP-GCN3或IMP-GCN4中的ON在短距离内到达更多的节点。(2)当叠加3层以上时，IMP-GCN3的性能最好。经过三层图卷积后，嵌入传播中涉及的节点数急剧增加(参见图1中的示例)。平均而言，IMP-GCN2中的每个节点应该比IMP-GCN3和IMP-Gcn4中的节点到达更多的节点，但是IMP-GCN2的性能提高(在Kindle商店上)比IMP-GCN3和IMP-Gcn4要小，甚至是负的。这表明在粗略水平(即2个子图)区分用户兴趣的嵌入传播中仍然存在噪声信息，从而对性能产生负面影响。请注意，IMP-GCN3仍然可以受益于高阶邻居。(3)IMP-GCN4具有更多的子图，一方面可以在更精细的层次上区分兴趣相似的用户，从而更好地从高阶邻居中提取信息；另一方面，它还切断了与其他节点的连接，特别是距离较短的节点，为嵌入学习提供了更有价值的信息。因此，当堆叠更多层时，其性能仅可与IMP-GCN2相媲美。因此，在选择子图的数量时需要权衡。基于LightGCN和我们的IPM-GCN模型，通过分析每个节点的平均复盖率和相应的性能，进一步研究了子图的影响。由于篇幅所限，我们仅在Kindle Store上提供搜索结果，并省略了与召回趋势相似的ndcg。在本实验中，我们使用了4层的LightGCN和3个子图6层的IPM-GCN，这是它们在Kindle商店上的最佳设置。图4(A)和图4(B)分别显示了基于LightGCN和IPM-GCN的子图中每个用户的平均召回率和平均覆盖率。值得注意的是，通过将对子图有相似兴趣的用户分组，使信息只在子图中传播，IPM-GCN可以受益于更多层的图卷积，并从高阶邻居中提取正信息。相反，LightGCN受到来自高阶邻居的负面信息的限制，只能在4层上获得改善。通过比较不同子图的性能可以看出，随着覆盖率的提高，IPM-GCN的性能明显提高。

另一个有趣的发现是，通过堆叠6层，子图中的一个用户节点几乎连接到整个图中的所有其他节点。这表明一个子图中的用户几乎交互了该图中的所有项目(否则，覆盖率不可能那么高)。更重要的是，IPM-GCN在没有过度平滑的情况下，仍然可以在如此高的覆盖率下实现改进。这表明在图中学习的项的嵌入有助于用户在该图中的嵌入学习，而在图卷积过程中在子图中提取的信息对于该子图中所有节点的嵌入学习是有用的。验证了兴趣感知消息传递策略和子图生成算法的有效性。

3.3 Comparison with SOTA Methods

3.4 Ablation Study

在本节中，我们通过将IMP-GCN与以下两种变体进行比较，研究了模型中不同组件对最终性能的贡献：

这部分是公式的替换，还要仔细看看文章了

【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
李宏毅2025《机器学习》第四讲-Transformer架构的演进
Transformer架构的演进与替代方案：从RNN到Mamba的技术思辨Transformer作为当前AI领域的标准架构，其设计并非凭空而来，也并非没有缺点。本次讨论的核心便是：新兴的架构，如MAMA，是如何针对Transformer的弱点进行改进，并试图提供一个更优的解决方案的。要理解架构的演进，我们必须首先明确一个核心原则：每一种神经网络架构，都有其存在的技术理由。CNN（卷积神经网络）：为
条件概率：不确定性决策的基石大千AI助手人工智能 Python #OTHER 决策树算法机器学习人工智能条件概率概率论
条件概率是概率论中的核心概念，用于描述在已知某一事件发生的条件下，另一事件发生的概率。它量化了事件之间的关联性，是贝叶斯推理、统计建模和机器学习的基础。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、定义与公式设(A)和(B)是两个随机事件，且(P(B)>0)：条件概率(P(A\midB))表示
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
《支持向量机（SVM）在医疗领域的变革性应用》 CodeJourney. 支持向量机算法机器学习
在医疗科技日新月异的今天，先进的数据分析与机器学习技术正逐渐成为提升诊疗水平、助力医学研究的关键力量。支持向量机（SVM），凭借其独特的优势，在医疗这片复杂且对精准度要求极高的领域崭露头角，带来诸多令人瞩目的应用成果。一、疾病诊断：癌症早期筛查的“火眼金睛”癌症，作为全球健康的“头号杀手”，早期诊断对提升患者生存率意义非凡。在乳腺癌筛查领域，SVM发挥着重要作用。医疗科研人员收集大量乳腺组织的影像
机器学习20-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习20-线性网络思考针对线性网络的基础问题，使用基础示例进行解释1-核心知识点1-线性模型家族的线性回归和逻辑回归分别是什么，线性模型家族还有没有其他的模型线性模型家族是一系列基于线性假设的统计模型，它们假设因变量和自变量之间存在线性关系。线性模型家族中的两个最常见模型是线性回归和逻辑回归。线性回归（LinearRegression）:线性回归是一种用于预测连续因变量的模型。它假设因变量yy
机器学习18-强化学习RLHF 坐吃山猪机器学习机器学习人工智能
机器学习18-强化学习RLHF1-什么是RLHFRLHF（ReinforcementLearningfromHumanFeedback）即基于人类反馈的强化学习算法，以下是详细介绍：基本原理RLHF是一种结合了强化学习和人类反馈的机器学习方法。传统的强化学习通常依赖于预定义的奖励函数来指导智能体的学习，而RLHF则通过引入人类的反馈来替代或补充传统的奖励函数。在训练过程中，人类会对智能体的行为或输
机器学习19-Transformer和AlexNet思考坐吃山猪机器学习机器学习 transformer 人工智能
Transformer和AlexNet思考关于Transformer和AlexNet发展的一些思考1-核心知识点Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？AlexNet的主要核心思路是什么，为什么表现那么好？现在有什么比AlexNet更优秀的算法2-思路整理1-Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？Word2Vec的作用Word2
机器学习21-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习21-线性网络思考针对线性网络的发展问题，进行补充学习1-核心知识点1-传统机器学习针对线性分类算法求解的方式有哪些？请详细列举不同的算法对应的损失函数和计算思路在传统机器学习中，线性分类算法是一种非常重要的方法，用于将数据划分为不同的类别。以下是几种常见的线性分类算法，包括它们的损失函数和计算思路：1.感知机（Perceptron）损失函数感知机的损失函数是基于误分类点的，其目标是最小化
Spring AI 第二讲之 Chat Model API 第五节HuggingFace Chat
HuggingFaceInferenceEndpoints允许您在云中部署和提供机器学习模型，并通过API对其进行访问。开始使用有关HuggingFaceInferenceEndpoints的更多详细信息，请访问此处。前提条件添加spring-ai-huggingface依赖关系：org.springframework.aispring-ai-huggingface获取HuggingFaceAPI
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
结构型智能科技的关键可行性——信息型智能向结构型智能的转变（修改提纲）刘海东刘海东人工智能机器学习算法
结构型智能科技的关键可行性——信息型智能向结构型智能的转变1.信息型智能科技概述1.1传统计算机科技的信息型继承者1.2信息型智能环境1.3信息型智能主体1.4机器学习创造的智能1.5信息型智能科技的缺陷2.结构型智能科技概述2.1传统计算机科技向生命结构的发展2.2结构型智能科技的环境2.3结构型智能科技创造的机器生命2.4结构型智能科技的科学性3.结构型智能科技的关键可行性——信息型智能向结构
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
【机器学习|学习笔记】组合特征（Feature Combinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。努力毕业的小土博^_^ 机器学习学习笔记机器学习学习笔记人工智能神经网络深度学习
【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。文章目录【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达
R语言的软件开发工具纪霁然包罗万象 golang 开发语言后端
R语言的软件开发工具引言R语言因其强大的数据分析能力和丰富的统计包，自发布以来便广受欢迎。随着数据科学和分析的迅猛发展，R语言也逐渐成为数据分析、机器学习和统计建模领域的重要工具。为了更好地利用R语言进行软件开发，许多软件开发工具和环境应运而生。本文将深入探讨R语言的主要开发工具，帮助开发者更高效地进行数据处理和分析。1.R和RStudio基础R语言本身是一个用于统计计算和图形绘制的编程语言，而R
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
Jupyter安装指南及Python配置 CodeWG python jupyter ide Python
Jupyter是一个非常流行的交互式计算环境，广泛用于数据分析、机器学习和科学计算等领域。本文将详细介绍如何安装Jupyter并配置Python环境。步骤1：安装Python首先，我们需要安装Python。请按照以下步骤进行操作：打开Python官方网站（https://www.python.org）并下载适用于您操作系统的最新版本的Python。运行下载的安装程序，并按照向导的指示进行安装。在安
Python scikit-learn 【机器学习库】全面讲解
让AI成为我们的得力助手：《用Cursor玩转AI辅助编程——不写代码也能做软件开发》scikit-learn（简称sklearn）是Python最流行的机器学习库之一，提供简单高效的数据挖掘和数据分析工具。它基于NumPy、SciPy和Matplotlib构建，广泛应用于工业界和学术界。核心优势统一API设计：所有模型使用一致的接口（fit()、predict()、score()）丰富的算法：覆
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，