林若漫空

【KDD2021】Are we really making much progress? Revisiting, benchmarking, and refining HGNNs

文章目录

摘要
1 引言
- 3 现有异构GNN的问题
- 3.1 节点分类
- - 3.1.1 [HAN](https://blog.csdn.net/yyl424525/article/details/103804574)
  - 3.1.2 [GTN](https://blog.csdn.net/qq_36291847/article/details/115731620)
  - 3.1.3 [RSHN](https://blog.csdn.net/qq_36291847/article/details/118224354)
  - 3.1.4 [HetGNN](https://blog.csdn.net/qq_36291847/article/details/115719021)
  - 3.1.5 [MAGNN](https://blog.csdn.net/qq_36291847/article/details/116612454)
  - 3.1.6 HGT
  - 3.1.7 [HetSANN](https://blog.csdn.net/qq_36291847/article/details/116495890)
- 3.2 链接预测
- - 3.2.1 R-GCN
  - 3.2.2 GATNE
- 3.3 知识感知的推荐
- 3.4 小结
4 异构图基线
- 4.1 动机和概览
- 4.2 数据集构建
- - 4.2.1 节点分类
  - 4.2.2 链路预测
  - 4.2.3 知识感知推荐
- 4.3 特征预处理
- 4.4 下游解码器和损失函数
5 一个简单的异构GNN
- 5.1 可学习的边类型嵌入
- 5.2 残差连接
- 5.3 L2正则
6 实验
7 讨论和总结

论文链接： Are we really making much progress? Revisiting, benchmarking, and refining heterogeneous graph neural networks
论文作者：来自清华大学、中科院、阿里
打脸HGNNs研究之作

摘要

异构图神经网络(hgnn)近年来蓬勃发展，但每项工作使用的独特数据处理和评估设置阻碍了对其进展的充分理解。在这项工作中，我们使用官方代码、数据集、设置和超参数对12个最近的HGNN进行了系统的复制，揭示了关于HGNNs进展的惊人发现。我们发现，简单的同构GNNs，如GCN和GAT，由于设置不当而大大低估了。具有适当输入的GAT通常可以在各种情况下匹配或超过所有现有的HGNNs。为了促进HGNN研究的健壮性和可重现性，我们构建了异构图基准(HGB)1，由11个不同的数据集组成，有三个任务。HGB规范了异构图数据分割、特征处理和性能评估的过程。最后，我们引入了一个简单但非常强的基线Simple-HGN，它显著优于之前所有的HGN模型，以加速未来HGN的发展。

1 引言

由于图神经网络(GNNs)[2,21]近年来已经占据了图挖掘研究的中心阶段，研究者开始关注其在异构图(即异构信息网络)上的潜力[8,12,19,36,40,43]。异构图由具有不同边信息的多种类型节点和边组成，将新颖有效的图学习算法与嘈杂复杂的工业场景(如推荐)连接起来。
为了应对异质性的挑战，人们提出了各种异构gnn (hgnn)[36, 40, 43]来解决相关任务，包括节点分类、链接预测和知识感知推荐。以节点分类为例，HAN[36]、GTN[43]、RSHN[45]、HetGNN[44]、MAGNN[12]、HGT[20]、HetSANN[17]等众多hgnn都是在近两年发展起来的。
尽管开发了各种各样的新模型，但我们对它们如何实际取得进展的理解迄今为止一直受到每个模型所采用的独特数据处理和设置的限制。为了全面描绘这一领域的进展，我们利用12个最流行的HGNN模型的原始论文发布的代码、数据集、实验设置、超参数全面重现了它们的实验。令人惊讶的是，我们发现这些最先进的hgnn生成的结果并没有预期的那么令人兴奋(Cf. Table 1)，即:

简单同构gnn，即GCN[21]和GAT[32]的性能被严重低估。在大多数情况下，只要有适当的输入，即使是原始GAT也能超过现有的HGNN。
由于设置不当或数据泄漏，导致之前部分工作的性能报告错误。

我们的进一步调查还表明:

在大多数异构数据集中不需要元路径。
HGNNs仍有相当大的改进空间。

我们认为，出现上述情况很大程度上是因为每项工作的单个数据和实验设置阻碍了不同技术的公平和一致的验证，从而极大地阻碍了HGNNs的发展。

为了促进健壮和开放的HGNN开发，我们构建了异构图基准(HGB)。HGB目前包含11个异构图数据集，这些数据集的异构性(节点和边缘类型的数量)、任务(节点分类、链接预测和知识感知推荐)和领域(例如，学术图、用户项目图和知识图)各不相同。HGB为数据加载、特征处理和评价提供了统一的接口，为HGNN模型的比较提供了方便和一致的方法。与OGB[18]类似，HGB也有一个排行榜(https://www.biendata.xyz/hgb)，用于发布可复用的最先进的HGNNs。

综上所述，本工作有以下贡献:

我们重新审视HGNNs，找出阻碍进展的问题;
我们通过HGB对HGNNs进行基准测试，以获得稳健的发展;
我们通过设计Simple-HGN模型来改进HGNN。

3 现有异构GNN的问题

我们分析了流行的异构gnn (hgnn)，由它们旨在解决的任务组织。对于每个HGNN，我们将重点分析其在使用其官方代码、与原始论文相同的数据集、设置和超参数复制其结果的过程中发现的缺陷，如表1所示。

3.1 节点分类

3.1.1 HAN

异构图注意网络(HAN)是处理异构图的早期尝试之一。首先，HAN需要人类专家选择多个元路径。然后HAN使用分层注意机制来捕获节点级和语义级的重要性。对于每个元路径，节点级的注意力由GAT在其相应的元路径邻居图上实现。给出最终表示的语义级关注是指所有元路径邻居图的节点级结果的加权平均。
HAN的一个缺陷是它将HAN与GAT进行了不公平的比较。由于HAN可以被看作是许多元路径近邻图上GAT的加权集合，为了证明其有效性，必须与原始GAT进行比较。然而，本文的GCN基线和GAT基线仅以一个元路径邻居图作为输入，尽管它们报告了最佳元路径邻居图的结果，但却丢失了原始图中的大部分信息。
为了进行公平的比较，我们将原始图输入GAT，忽略类型，只保留目标类型节点的特征。我们发现这种简单的同构方法始终优于HAN，这表明同构GNN在很大程度上被低估了(详见表1)
接下来的大部分工作也都遵循HAN的设置，与同构GNN进行比较，同样存在“同构基线信息缺失”的问题，导致对HGNNs的性能进展存在积极的认知偏差。

3.1.2 GTN

图转换器网络(GTN)能够自动发现有价值的元路径，而不是像HAN那样依赖人工选择。直观地说，元路径邻接图可以由几个子图的邻接矩阵相乘得到。因此，GTN采用软子图选择和矩阵乘法步骤生成元路径近邻图，然后通过GCNs对其进行编码。
GTN的主要缺点是它消耗大量的时间和内存。例如，在DBLP上训练GTN需要120 GB内存和12小时，而DBLP只有18000个节点。相比之下，GCN和GAT只占用1gb内存和10秒的时间。
此外，我们使用GTN的官方代码对GTN和GAT进行了5次测试，从表1可以看出，虽然GTN消耗多于GAT400倍的时间和120倍的内存，但GTN和GAT的平均得分没有显著差异。

3.1.3 RSHN

关系结构感知异质图神经网络(RSHN)首先构建粗化的线图来获取边缘特征，然后使用一种新的消息传递神经网络(MPNN)[13]来传播节点和边缘特征。

根据官方规范，RSHN实验存在严重问题。首先，它不使用验证集，只是在测试集上调优超参数。其次，在论文中报告了在测试集上准确率最高的时代。如表1所示，在AIFB和BGS数据集上，我们调优的GAT在这种不恰当的设置下甚至可以达到100%的准确率，远远优于他们的论文中报道的91.67%和66.32%。

3.1.4 HetGNN

异构图神经网络(Heterogeneous graph neural network, HetGNN)首先使用带重启的随机游走为节点生成邻居，然后利用Bi-LSTM聚合每种类型和类型之间的节点特征。
HetGNN和HAN一样存在“同质基线中信息缺失”的问题:当与GAT比较时，将一个抽样图而不是原始的全图馈送给GAT。如表1所示，具有正确输入的GAT显然可以获得更好的性能。

3.1.5 MAGNN

元路径聚合图神经网络(MAGNN)是一种增强的HAN。其动机是，HAN在处理元路径邻居图时，只考虑元路径的两个端点，而忽略中间节点。MAGNN提出了几个元路径编码器来编码路径上的所有信息，而不仅仅是端点。
然而，在实验中存在两个问题。首先，MAGNN继承了HAN的“同质基线中信息缺失”问题，并且在正确输入的情况下也表现不佳。
更严重的是，MAGNN在链路预测中存在数据泄漏问题，因为它使用批量归一化，在训练和测试期间依次加载正链路和负链路。通过这种方式，小批中的样本要么全部为正，要么全部为负，批标准化中的均值和方差将提供额外的信息。如果我们洗牌测试集，使每个小批随机包含阳性和阴性样本，MAGNN的AUC在Last.fm数据集上从98.91急剧下降到71.49。

3.1.6 HGT

异构图转换网络(HGT)提出了一种基于transformer的处理具有异构子图采样的大型学术异构图的模型。由于HGT主要关注通过图抽样策略处理大规模的图[14,42]，其论文中使用的数据集(> 10,000,000节点)对于大多数hgnn来说是无法承受的，除非通过子图抽样来适应它们。为了消除子图采样技术对性能的影响，我们将HGT及其官方代码应用于其论文中没有使用的相对较小的数据集，与GAT相比，产生了混合的结果(见表3)。

【注】此处解释有点牵强，HGT本就是适应于大规模异构网络的

3.1.7 HetSANN

基于注意的异质结构学习图神经网络(HetSANN)利用特定类型的图注意层进行局部信息聚合，避免了人工选择元路径。HetSANN在论文中被指出有很好的表现。
然而，数据集和预处理细节并没有随官方代码发布，截止本作品提交时，作者的回复也没有收到。因此，我们直接将HetSANN与标准超参数调优相结合，在其他数据集中给出了不太理想的结果(见表3)。

3.2 链接预测

3.2.1 R-GCN

关系图卷积网络(RGCN)将GCN扩展到关系(多边类型)图。RGCN中的卷积可以解释为不同边类型的普通图卷积的加权和。对每个节点i，第l层的卷积可以定义如下：

3.2.2 GATNE

一般的属性多路异构网络嵌入(GATNE)利用图的卷积运算来聚合邻居的嵌入。它通过跳跃图分别学习一般的嵌入、特定的嵌入和属性的嵌入，最后融合所有的嵌入。实际上，GATNE更像是一种网络嵌入算法，而不是gnn式的模型。

3.3 知识感知的推荐

推荐是异构GNN的主要应用，但大多数相关工作[9,10,24,25]只关注其特定的工业数据，导致数据集不开放，模型可移植性有限。知识感知推荐是一个新兴的子领域，旨在通过将项目与开放知识图中的实体链接起来来改进推荐。在本文中，我们主要对这一主题的模型进行了综述和基准分析。

3.4 小结

总而言之，现有的hgnn的主要共同问题是缺乏与同构gnn的公平比较，在某种程度上，其他工作鼓励新模型装备新颖但冗余的模块，而不是更多地关注性能的进步。此外，不可忽视的一部分工作存在个别问题，例如，数据泄漏[12]，测试集的调优[45]，以及两个数量级的内存和时间消耗，但效率没有提高[43]。
鉴于这些差异，我们主动建立了异构图基准(HGB)，在不同的数据集上执行这三项任务，以进行开放的、可重复的异构图研究(见§4)。受简单GAT相对于专用和相对复杂的异构GNN模型的优势启发，我们提出了一个简单的异构GNN模型，以GAT为骨干，提供了HGB的有前景的结果(见§5)。

4 异构图基线

4.1 动机和概览

现有数据集的问题：几种类型的数据集——学术网络(如ACM、DBLP)、信息网络(如IMDB、Reddit)和推荐图(如Amazon、MovieLens)——是最常用的数据集，但详细的任务设置可能在不同的论文中有很大的不同。例如，HAN[36]和GTN[43]丢弃了ACM中的引文链接，而其他的则使用原始版本。此外，数据集的不同分割也导致了无法比较的结果。最后，最近的图基准测试OGB[18]主要集中于对同构图的图机器学习方法的基准测试，并没有专门针对异构图。

现有流水线的问题 为了完成任务，hgnn之外的组件也可以发挥关键作用。例如，MAGNN[12]发现并非所有类型的节点特征都是有用的，基于验证集的预选可能是有帮助的(参见§4.3)。RGCN[28]使用DistMult[39]代替点积进行链路预测训练。为了进行公平的比较，我们需要控制管道中的其他组件。

HGB 针对这些实际问题，我们提出了异构图基准(HGB)，用于开放、可复制的异构GNN研究。我们通过建立HGB“特征预处理→HGNN编码器→下游解码器”的流水线，规范了数据分割、特征处理、性能评价的流程。对于每个模型，HGB根据其在验证集上的性能选择最适合的特征预处理和下游解码器。

4.2 数据集构建

HGB收集了11个被广泛认可的中等规模的数据集，这些数据集具有预定义的元路径，可以用于各种类型的HGNNs。统计数据汇总于表2。

4.2.1 节点分类

4.2.2 链路预测

4.2.3 知识感知推荐

4.3 特征预处理

如§4.1所述，输入特征的预处理对性能有很大的影响。我们的预处理方法如下。
线性转换 由于不同类型节点的输入特征在维度上可能存在差异，我们使用对每个节点类型有偏差的线性层将所有节点特征映射到一个共享特征空间。这些线性层中的参数将随着下面的HGNN进行优化。
有用的特征选择 在许多数据集中，只有部分类型的特征对任务有用。我们可以选择一个节点类型子集来保留其特征，并将其他类型节点的特征替换为一个one-hot向量。结合线性变换，置换等价于对未选择类型的每个节点学习一个单独的嵌入。理想情况下，我们应该枚举类型的所有子集，并根据在验证集上的性能报告最佳的子集，然而由于训练时间问题，我们决定只枚举三种选择，即使用所有给定的节点特征，只使用目标节点类型的特征，或将所有节点特征替换为one-hot 向量。

4.4 下游解码器和损失函数

5 一个简单的异构GNN

受到简单GAT相对于高级专用异构gnn的优势的启发，我们提出了一种简单有效的异构图建模方法Simple-HGN。Simple-HGN采用GAT作为主干网，并对三种知名技术进行了改进：可学习的边类型嵌入，残差连接，输出嵌入的L2正则。

5.1 可学习的边类型嵌入

虽然GAT在异构图建模方面具有强大的能力，但由于忽略了节点或边类型，它可能不是异构图的最佳模型。为了解决这个问题，我们扩展了原来的图注意力机制，将边类型信息加入到注意力计算中。

5.2 残差连接

由于过度平滑和梯度消失的问题，gnn很难加深[23,38]。在计算机视觉中解决这一问题的一个著名的方法是残差连接[15]。而原始GCN论文[21]对图卷积的残差连接结果为负。最近的[22]研究发现，设计良好的预激活实现可以使gnn中的残差连接再次强大

5.3 L2正则

对于基于检索的任务，输出嵌入的归一化是非常常见的，因为归一化后的点积等价于余弦相似度。但我们也发现它在分类任务上的改进，这也在计算机视觉[26]中被观察到

6 实验

7 讨论和总结

在本文中，我们识别了异构gnn中被忽略的问题，建立了异构图基准(HGB)，并引入了一种简单的强基线simple - hgn。这项工作的目标是通过促进可重复性和健壮性的研究来理解和推进异构gnn的发展。
尽管得到了广泛和有前景的结果，但异构gnn和广泛异构图表示学习仍然存在一些问题。
显式类型信息有用吗? 表6的消融研究表明，类型嵌入只带来微小的改善。我们假设主要原因是节点特征的异质性已经暗含了不同的节点和边缘类型。另一种可能是当前的图注意力机制[32]太弱，无法将类型信息与特征信息融合。我们把这个问题留到以后研究
元路径或其变体在GNNs中仍然有用吗? 提出了元路径[29]来分离具有人类先验的不同语义。而(graph)神经网络的前提是通过提取数据隐含的有用特征来避免特征工程过程。前几节的结果还表明，基于元路径的GNN并不产生优于同质GAT的性能。是否有比现有方法更好的方法来利用异构gnn中的元路径?将来异构gnn是否仍然需要元路径?替代方法是什么?

总结：
这篇文章对于后续HGNN的研究具有很大的指导意义，有些打脸之前HGNN研究的意思哈

本篇文章具有极高的研究价值，值得仔细研读

HGB

Python机器学习元学习库higher 音程机器学习人工智能 python 机器学习
higher是一个用于元学习（Meta-Learning）和高阶导数（Higher-ordergradients）的Python库，专为PyTorch设计。它扩展了PyTorch的自动微分机制，使得在训练过程中可以动态地计算参数的梯度更新，并把这些更新过程纳入到更高阶的梯度计算中。一、主要用途higher主要用于以下场景：元学习（Meta-Learning）比如MAML（Model-Agnosti
Nagios监控系统插件套装：1.4.13版本深入解析 Kiki-2189
本文还有配套的精品资源，点击获取简介：Nagios是一款开源系统监控工具，用于实时监控网络服务、系统状态和IT基础设施，确保IT环境的稳定运行。本文详细解析了"Nagios-plugins-1.4.13.tar.gz"这个插件包，涵盖了Nagios核心功能、插件工作原理、安装配置、常见插件、自定义插件制作、故障报警与通知、性能数据记录以及扩展集成等方面。通过解压、编译安装和配置插件包中的内容，用户
Python 常用正则表达式大全朱公子的Note python 爬虫正则表达式
你是否在写Python爬虫时，总是卡在“正则提取”这一步？明明页面源码已经拿到，却怎么也匹配不到目标数据……不是提取失败，就是提取不全，搞得调试半天还抓不到核心字段？别急！今天我们就来一次**“正则一网打尽”**，专为爬虫而生的表达式宝典，让你写起爬虫来如虎添翼！在当下数据驱动时代，网络数据是企业的“金矿”，而Python爬虫则是挖掘这金矿的“利器”！从电商价格到社交媒体评论，爬虫技术让数据采集变
基于迁移学习的ResNet50模型实现石榴病害数据集多分类图片预测深度学习乐园深度学习实战项目迁移学习分类人工智能
完整源码项目包获取→点击文章末尾名片！番石榴病害数据集背景描述番石榴（Psidiumguajava）是南亚的主要作物，尤其是在孟加拉国。它富含维生素C和纤维，支持区域经济和营养。不幸的是，番石榴生产受到降低产量的疾病的威胁。该数据集旨在帮助开发用于番石榴果实早期病害检测的机器学习模型，帮助保护收成并减少经济损失。数据说明该数据集包括473张番石榴果实的注释图像，分为三类。图像经过预处理步骤，例如钝
四个机器学习模型对比道路裂缝检测识别分类模型深度学习乐园深度学习实战项目机器学习分类人工智能
完整源码项目包获取→点击文章末尾名片！一、课题综述1.1.课题简介在机器学习的研究领域中，传统分类算法模型数量众多，适合的应用场景也各不相同。1.2.课题目标（示例）本课题使用的数据集来自于数据分析与数据挖掘竞赛Kaggle，该竞赛为数据科学领域著名的国际性赛事之一。课题使用的数据集为带标签的图像数据集，包含带有裂痕和不带有裂痕的桥梁、墙和人行道图片。课题的目标为对于目标数据集，搭建相应的传统机器
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
Windows Server 2019 安装 Docker 完整指南 z日火 docker windows docker 容器
博主本人使用的是离线安装1.安装前准备系统要求操作系统：WindowsServer2019（或2016/2022）权限：管理员权限的PowerShell网络：可访问互联网（或离线安装包）启用容器功能Install-WindowsFeature-NameContainers如果提示需要重启，但Restart-Computer-Force失败，请手动重启服务器。2.安装Docker方法1：在线安装（推
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案 mmlihaio 数据库云原生 python
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案1.引言在当今的人工智能和大数据时代，高效的向量检索已成为许多应用场景的关键需求。Tair作为阿里云开发的云原生内存数据库服务，不仅提供了丰富的数据模型和企业级能力，还引入了基于非易失性内存(NVM)存储介质的持久内存优化实例。本文将深入探讨如何利用Tair向量数据库功能，实现高性能的向量存储和检索。2.Tair向量数据库概述Ta
全球覆盖与跨境网络优化：SD-WAN如何助力跨国企业应对通信挑战北极光SD-WAN组网网络
随着全球化的深入发展，跨国企业的业务布局日益广泛，但随之而来的跨境网络通信问题却成为企业数字化转型的难点之一。传统广域网（WAN）架构在面对复杂的跨境通信环境时，常常暴露出高延迟、不稳定以及数据隐私合规性不足的问题。而SD-WAN（软件定义广域网）作为一种新兴的网络解决方案，凭借其智能化、灵活性和安全性，逐渐成为跨国企业的首选方案。一、SD-WAN是否具备全球范围内的覆盖能力？SD-WAN通过其分
稳定性与高可用性：SD-WAN如何保障链路故障下的业务连续性
稳定性与高可用性是现代企业网络的核心要求，尤其是在数字化转型和全球化进程中，任何网络中断都可能导致业务停滞甚至经济损失。传统网络架构对链路故障和运营商问题的应对能力较弱，而SD-WAN（软件定义广域网）以其智能化的架构设计和实时动态管理能力，成为保障业务连续性的理想选择。本文将从以下几个方面探讨SD-WAN如何通过冗余、故障转移和快速恢复技术，确保企业网络的稳定性和高可用性。一、SD-WAN如何确
如何搭建分公司到总部的专线网络？（SD-WAN双链路冗余+加密隧道配置全流程）北极光SD-WAN组网网络
#如何搭建分公司到总部的专线网络？（以北京→上海为例）在现代企业的网络架构中，分支机构与总部之间的高效、安全、稳定的网络通信是至关重要的。构建一条可靠的专线网络不仅能保障业务数据的高效传输，还能提升整体运营效率。本文将以北京到上海的分公司到总部为例，详细解析搭建专线网络的四步流程：**选服务商**→**部署SD-WAN设备**→**配置加密隧道**→**设置业务优先级策略**。##一、选服务商：选
跨区域组网如何支撑多监控点高效运营？—智能SD-WAN技术解析北极光SD-WAN组网网络
在连锁门店、工业园区、物流仓储等场景中，跨区域部署监控系统已成为企业数字化转型的重要组成部分。要实现总部实时查看各地监控画面、保障数据传输的稳定性和安全性，并同时满足成本和扩展需求，传统的组网方式正逐渐显现其局限性。本文将从技术角度出发，深入解析跨区域组网的常见痛点，并探讨如何通过智能SD-WAN技术实现高效的多监控点管理，助力企业构建灵活可靠的监控网络。一、多监控点组网的核心痛点与解决思路随着企
SD-WAN在智能仓储与物流管理中的应用解析：赋能制造业数字化转型
随着工业4.0与供应链数字化的推进，制造业在仓储与物流管理方面面临着前所未有的挑战和机遇。为实现仓储系统与生产系统、供应链系统的高度联动，网络的可靠性、灵活性和实时性成为关键问题。SD-WAN（软件定义广域网）技术凭借其高效、智能的网络管理能力，为智能仓储与物流管理提供了全新解决方案。在制造业中，仓储与物流管理是连接生产系统与供应链系统的重要环节，其高效运作直接影响到企业的生产效率和市场竞争力。随
SD-WAN 是否支持固定 IP？深度解析企业网络架构中的关键问题北极光SD-WAN组网网络 tcp/ip 架构
近年来，随着企业数字化转型的深化，SD-WAN（软件定义广域网）因其灵活性、高效性和成本优化而备受关注。许多企业在部署SD-WAN时，会产生这样一个疑问：**SD-WAN是否提供固定IP？能否满足对固定IP的需求？**本文将从技术原理、应用场景和具体实现等角度深入探讨这个问题，帮助企业在网络架构设计中做出明智选择。##一、SD-WAN的技术背景与架构SD-WAN是一种基于软件定义网络（SDN）技术
远程光伏电站网络解决方案：SD-WAN与传统方式的双剑合璧北极光SD-WAN组网网络
在“双碳”目标驱动下，光伏行业迎来了爆发式增长。然而，光伏电站由于数量多、分布广且位置偏远，其远程运维管理面临巨大挑战。传统的网络接入方式（如VPN和专线）虽然成熟稳定，但在成本、灵活性和扩展性上存在明显不足。而近年来兴起的**SD-WAN（软件定义广域网）**技术，凭借其智能化、敏捷性和成本优势，为光伏行业提供了更为灵活高效的网络解决方案。但从实际场景来看，完全“抛弃”传统方式并不可取，而是需要
阿里云魔搭社区AIGC专区：中国AI创作的革命性平台 Liudef06小白阿里云 AIGC 人工智能
在生成式人工智能重塑全球数字创作版图的浪潮中，中国首个一站式AIGC开发平台——阿里云魔搭社区AIGC专区于2024年9月杭州云栖大会正式亮相。这一突破性进展不仅填补了国内全流程AI创作工具的空白，更以157款多模态开源模型和全免费GPU算力的开放姿态，为超过690万开发者提供了从模型调用到应用落地的完整生态支持。一、魔搭社区：中国AI模型生态的奠基者魔搭社区（ModelScope）作为阿里云在2
探秘阿里云Tair KVCache：大模型推理的加速引擎云资源服务商阿里云云计算人工智能
一、引言近年来，人工智能领域发展迅猛，大语言模型（LLM）不断取得突破，其应用场景也日益广泛。从智能客服到内容生成，从智能写作到智能翻译，大语言模型正在深刻地改变着我们的生活和工作方式。随着模型规模的不断扩大和推理需求的日益增长，大模型推理过程中的显存瓶颈问题逐渐凸显，成为制约其发展和应用的关键因素。在大模型推理中，KVCache技术作为一种优化手段，通过缓存历史Token的Key/Value向量
AI正在偷偷取代这10种职业，你的工作安全吗？
近年来，人工智能（AI）的飞速发展正在悄然改变我们的工作方式。从自动化客服到AI生成内容，许多传统职业正面临被取代的风险。虽然AI带来了更高的效率和便利，但也让不少人开始担忧：我的工作会被AI抢走吗？今天，我们就来盘点10种最容易被AI取代的职业，并探讨如何在这个AI时代保持竞争力。1.客服代表取代指数：★★★★★AI驱动的聊天机器人（如ChatGPT、GoogleBard）已经能够处理大部分基础
读芯片信息出错3_简单说说汽车MCU有关security信息安全功能 weixin_39617685 读芯片信息出错3
汽车生态系统正在快速发展，新的连接技术将推动汽车进入物联网领域，其好处与威胁并存。随着每辆车的电子控制单元(ECU)的数量增加，以及汽车与互联网，用户以及彼此之间的连接，其复杂性和攻击面呈指数级增长。空中远程诊断和软件更新，紧急呼叫，互联网服务，车载支付，移动应用以及信息娱乐和交通信息等新功能都增加了车辆的攻击面。汽车电子网络安全标准化白皮书(2018)中，通过对近年来出现的各类汽车安全事件的搜集
OKHttp框架一个快乐的小测试自动化测试 okhttp android java 自动化
一、OKHttp简介初识OKHttpOkHttp是一个处理网络请求的开源项目,是Android端一个较新的轻量级网络框架，支持HTTP/HTTPS协议、请求头设置、响应解析等功能，并且支持异步调用，因此在接口测试中也是一种非常优秀的选择。OkHttp是一个高效的HTTP客户端，其特性包括：支持HTTP/2,并且允许同一个主机地址的所有请求共享同一个socket连接，这样能减少服务器的请求次数通过连
C8051F单片机在三轴伺服转台动力学模型与伺服算法仿真中的应用【附设计】
自动化设计|控制系统|毕业设计指导|工业自动化解决方案✨专业领域：程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列编程三菱/欧姆龙应用PIC单片机触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以私信或查
基于PLC的自动化立体仓储系统设计【附数据】拉勾科研工作室自动化运维
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
STM32+ESP8266连接网络的几种方法 op:) stm32 stm32 嵌入式
1、SmartConfig上篇文章提到的2、连接固定的路由在程序中写死；例如：voidESP8266_Init_Fixed_WiFi(void){ESP8266_Clear();/*AT测试*/printf("0.AT\r\n");ESP8266_SendCmd("AT\r\n","");delay_ms(500);/*重启*/printf("1.RST\r\n");ESP8266_SendCmd
直播预告！探讨生成模型中的极简概念擦除青稞社区. 青稞Talk 人工智能图像处理
主页：http://qingkeai.online/原文：https://mp.weixin.qq.com/s/yc4whKbnVY8ho1w7rgFVGg6月16日20:00，青稞Talk第55期，新加坡国立大学博士生张扬，将直播分享《生成模型中的极简概念擦除》。分享嘉宾张扬，慕尼黑工业大学计算机专业硕士，新加坡国立大学人工智能专业博士。曾于牛津大学进行学术访问，并在微软亚洲研究院及美国运通新加
SocketDebuggerFree-v2_00 的使用教程 yunquantong socket
下面是SocketDebuggerFree-v2_00的使用教程，帮助你从零开始使用它来测试与调试网络Socket连接。什么是SocketDebuggerFree-v2_00？SocketDebuggerFree-v2_00是一款免费的网络调试工具，可以模拟TCP/UDP服务器或客户端，帮助你测试网络应用程序，分析数据传输，定位网络问题。功能概览✅模拟TCP/UDPServer或Client✅实时
机器学习5——非参数估计平和男人杨争争山东大学机器学习期末复习机器学习概率论算法
非参数估计在参数估计中我们已经提到，想要估计后验概率P(ωi∣x)=p(x∣ωi)p(ωi)p(x)P\left(\omega_i\midx\right)=\frac{p\left(x\mid\omega_i\right)p\left(\omega_i\right)}{p(x)}P(ωi∣x)=p(x)p(x∣ωi)p(ωi)，就需要估计类条件概率p(x∣ωi)p\left(x\mid\omega
机器学习4——参数估计之贝叶斯估计平和男人杨争争山东大学机器学习期末复习机器学习人工智能
贝叶斯估计问题建模：后验概率公式：P(ωi∣x,D)=P(x∣ωi,Di)P(ωi)∑j=1cP(x∣ωj,Dj)P(ωj)P\left(\omega_i\mid\mathbf{x},\mathcal{D}\right)=\frac{P\left(\mathbf{x}\mid\omega_i,\mathcal{D}_i\right)P\left(\omega_i\right)}{\sum_{j=1
[redis系列] redis脚本 en-route redis 数据库
介绍RedisLua脚本功能使得用户能够在Redis服务器端执行自定义的Lua脚本，从而实现更高效、更灵活的数据操作。Lua脚本运行在Redis服务器内部，这意味着你可以减少客户端与服务器之间的通信开销，并且可以通过原子操作确保多个Redis命令的执行一致性。组合功能：Lua脚本能够将Redis中的简单命令组合起来，从而实现复杂的业务需求，避免多次网络往返。数据操作原子性：通过Lua脚本，开发者可
【DeepSeek实战】3、Ollama实战指南：LobeChat+多网关架构打造高可用大模型集群无心水 Ollama实战指南 LobeChat实战 DeepSeek实战 DeepSeek全栈应用开发 AI入门大模型 CSDN技术干货
一、企业级大模型集群架构全景解析在人工智能落地应用的过程中，大模型服务的高可用性、成本控制和灵活扩展能力成为企业关注的核心痛点。本方案通过LobeChat前端、AI网关层和Ollama模型集群的三层架构设计，实现了无需复杂运维即可部署的生产级大模型服务体系。该架构不仅支持负载均衡、故障转移和模型热切换等企业级特性。还通过量化技术将硬件成本降低60%以上，为中小企业提供了与商业云服务相当的性能体验。
生成式人工智能实战 | 深度卷积生成对抗网络（Deep Convolutional Generative Adversarial Network, DCGAN）盼小辉丶生成式人工智能实战150讲人工智能生成对抗网络神经网络
生成式人工智能实战|深度卷积生成对抗网络0.前言1.模型与数据集分析1.1模型分析1.2数据集介绍2.构建DCGAN生成人脸图像2.1数据处理2.2模型构建2.3模型训练0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetworks,DCGAN)是基于生成对抗网络(ConvolutionalGenerativeAdversarialNet
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR