weixin_45519842

arXiv 最新速递| 异配图上的GNN该怎么设计？

作者：Mengying Jiang ；Guizhong Liu；Yuanchao Su ；Xinliang Wu

image-20210614235729928

论文标题：Structure Learning Graph Convolutional Networks for Graphs under Heterophily
论文地址：https://arxiv.org/abs/2105.13795
欢迎关注小编知乎：图子

传统的GNN往往聚合来自邻居节点的特征信息，但是在同配性较低的图上，相似的节点可能在图上距离很远。这篇论文是近几日最新发表在arXiv上，提供了另外一种思路，通过改变异配性高的图的拓扑结构，根据节点的相似度生成一个新的邻接矩阵，帮助 GNN 从同一类节点中获取信息。

异质性和异配性区别：

异质性(Heterogeneous)，强调节点类型和边类型的多样性。同配性，强调节点和边的类型单一。
异配性(Heterophily)，强调节点和其邻居的相似度较低(比如标签差异较大)。同配性，强调节点与其邻居特性较为吻合(向量表示或者标签较为接近)。

0. Abstract

GNN 的性能通常会受到图结构的限制，现实世界的图数据往往是有噪声或不完整的。论文提出了一种结构学习图卷积网(SLGCNs)，能够两个方面来缓解这个问题，并应用于节点分类。1）针对节点特征，论文设计了一种高效的带锚点的谱聚类方法，无论节点之间距离多远，都能够有效地聚合所有相似节点的特征表示。2）由于原始邻接矩阵在同配性低的图中为GCN的聚合提供误导信息，因此论文根据节点之间的相似性生成了一个重连接的邻接矩阵，并为下游预测任务进行了优化。重连接的邻接矩阵和原始邻接矩阵都被应用于SLGCNs，以聚合邻居节点的特征表示。SLGCNs 可以应用于具有不同程度同配性的图。在基准数据集上的实验结果表明，SLGCNs的性能优于最先进的GNN模型。

1. Introduction

1）GCN的局限性

GCN通过简单地将所有一跳邻居的归一化特征表示相加来更新节点的特征，这限制了GCN在图结构数据上的表示能力，即GCN无法捕获图中的长距离依赖关系，这一弱点在具有异配性或低/中度同配性的图中会被放大。

2）同配性(Homophily)

同配性是许多现实世界图的一个非常重要的原则，即链接的节点倾向于有类似的特征，属于同一类的节点有类似的特征。例如，论文更有可能引用同一研究领域的论文，而朋友往往有类似的年龄或政治信仰。然而，现实世界中也有关于 "异性相吸 "的设定，导致图的同配性很低，即距离近的节点通常来自不同的类别，并且具有不同的特征。例如，在交友网站中，大多数人倾向于与异性聊。大多数现有的GNN都假定有图很强的同配性，包括GCN，在高异配性下的图上泛化表现很差，甚至比只依靠节点特征进行分类的MLP还要差。

3）现有的解决办法

利用多层GCN来聚集来自远处节点的特征，而这种策略可能会导致过平滑和过拟合。最近有一些新的方法，如GEOM-GCN，H2GCN等，虽然GEOM-GCN提高了GCN的表示学习性能，但在低同配性的图上的节点分类的性能往往不佳。H2GCN改善了GCN的分类性能，但它只能聚合邻近节点的信息，导致缺乏捕捉距离较远但相似节点特征的能力。

4）SLGCNs

本文提出了一种新的GNN方法来解决上述问题，称为结构学习图卷积网络（SLGCNs）。按照谱聚类（SC）方法，图的节点被映射到一个新的特征空间，原始图中连接紧密或具有相似特征的节点在新的特征空间中通常是邻近的。如果采用SC来处理图结构数据，节点可以从相似的节点中聚集特征，从而使GCN能够捕获长距离的依赖关系。

然而，SC 的计算复杂度对于大规模图来说是非常高的，因此论文设计了一种高效的带锚点的谱聚类（ESC- ANCH）方法来有效地提取SC特征。然后，将提取的SC特征与原始节点特征相结合作为强化的特征（EF），并利用EF来训练GNN。

5）SLGCNs的贡献

将谱聚类集成到GNN中，用于捕捉图上的长距离依赖关系，并提出了ESC-ANCH算法，以便在图结构数据上有效地实现谱聚
SLGCNs可以学习重连接的邻接矩阵，这不仅与节点的相似性相关，更利于下游的预测任务；
SLGCNs分别从节点特征和边的方面提出了处理异配性的改进方案，并将两种改进结合起来，使之相互补充。

2. Related Work

2.1. Spectral Clustering

谱聚类（SC） 是一种从图论演变而来的算法，利用权重图对数据集进行分割。假设代表一个数据集。聚类的任务是将划分为个簇。聚类对齐矩阵表示为，其中是的簇对齐向量。从另一个角度来看， 可以被视为在维特征空间中的特征表示。

亲和矩阵

令表示一个无向的带权图，表示节点的集合，表示亲和矩阵，是中节点的数目，矩阵中的每一个元素表示图中一对节点的相似度。最常见的构建的方法是全连接方式。计算方式：

和表示两节点特征，可以控制节点之间相似性的程度。拉普拉斯矩阵，是度矩阵，即对角阵。

谱聚类的目标函数：

是簇指示矩阵，谱聚类目标函数重写为：

目标函数的最优解是由的个最大特征值所对应的特征向量构成。

不仅可以看作是节点聚类的结果，也可以看作是节点的新特征矩阵，其中的节点有个特征元素。即通过谱聚类我们可以得到一个新的维度更低的特征矩阵。

2.2. GCN

在GCN中，节点特征的更新采用了对一跳邻居特征的各向同性的平均化操作。设是第层GCN中节点的特征表示，有：

其中代表节点i的一跳邻居集合，是权重矩阵，ReLU是激活函数。注意，是第i个节点的入度。此外，2层GCN的前向模型可以表示为：

是节点的特征矩阵，也是第一层GCN的输入。

3. SLGCN 方法

本文提出结构学习图卷积网络（SLGCNs），用于图结构数据的节点分类。SLGCNs 的流程如图1所示。整体思路就是结合谱聚类和GCN，捕获距离较远但是特征相似的节点之间的依赖关系。

fig1

它由三个阶段组成。(S1)带锚的高效谱聚类，采用ESC-ANCH生成SC特征。(S2)重连接图，根据节点之间的相似性构建一个重连接的图，这个重连接的图可以随着SLGCNs模型的训练而逐渐优化。(S3)结构学习图卷积网络，将原始特征和SC特征合并为增强特征，并分别使用重新连接的邻接矩阵原始邻接矩阵对进行特征聚合。将聚合的结果和合并为，并使用权重向量来突出的重要维度，以使SLGCNs适应不同程度的同配性的图。

3.1. 利用锚点进行谱聚类

GCN只是简单地聚合了一跳邻居的信息，且GCN的深度通常是有限的。距离遥远且相似的节点的信息总是被忽略，而谱聚类可以根据节点之间的亲密关系来划分节点。具体来说，在新的特征空间中，联系紧密和相似的节点距离更近，反之亦然。因此，将GCN与SC结合起来，提取距离较远但相似的节点的特征是非常合适的。

根据第2.1小节，执行SC的目的是：为了生成簇对齐矩阵。

只能通过对归一化相似矩阵的特征值分解来计算，这需要的时间复杂度，其中和分别是节点和簇的数量，在大规模的图来上具有很大的计算复杂度。

高效谱聚类

为了克服计算复杂度的问题，论文提出了高效谱聚类（ESC）来有效地执行SC。采用内积法来构建亲和矩阵 。因此，ESC方法中的归一化相似矩阵G可以表示为：

定义，因此 . 的奇异值分解可以表示为：

，左奇异向量矩阵，奇异值矩阵和右奇异向量矩阵。的列向量就是G的特征向量。因此，可以很容易地通过使用的特征向量来构造，特征向量对应于中最大的个特征值。与直接对进行特征值分解相比，在上进行SVD的计算复杂度要低得多。

带锚节点的谱聚类

在许多图结构数据中，节点原始特征的维数通常很高，ESC 方法的效率仍有待提高。论文提出了ESC-ANCH，从节点集合中随机选择个节点作为锚节点，其中m<

3.2. 重连接图

大多数现有的GNN都是为具有高同配性的图而设计的，即链接的节点更有可能拥有相似的特征表示，并且属于同一类别，例如社区网络和引文网络。然而，现实世界中有大量的异配图，其中的链接节点通常拥有不同的特征，属于不同的类别，例如网页链接网络。这些在同配性假设下设计的GNN对于异配性下的图来说是非常不合适的。

fig1

无论图的同配程度如何，同一类的节点总是拥有高度相似的特征。如图2所示，为了帮助GCN从同一类的节点中获取信息，作者根据节点之间的相似性和下游任务学习一个重连接的邻接矩阵。

余弦相似度作为度量函数，一对节点之间的相似度可以表示为：

是可学习的权重向量，因此可以生成相似度矩阵，元素的取值范围是。但是邻接矩阵应该是非负的和稀疏的。因此，需要从中提取一个非负的、稀疏的邻接矩阵。定义一个非负的阈值，并将中那些小于置0。

3.3. 结构学习图卷积网络

首先利用原始特征和SC特征来构建EF

SLGCNs 的第一层表示为:

是可训练的权重矩阵。也可以使用和进行拼接：

如果使用平均方法则记为，如果使用拼接方法则记为。

在第一层构建完成后，使用重连接来聚合和更新节点的特征，以获得中间表征：

是行归一化邻接矩阵。

同样使用原始邻接矩阵来聚合和更新特征，获得节点的间接表征。

，表示特征聚合的时间，，经过几轮的特征聚合之后，组合几个最关键的间接表示，作为节点的新的嵌入：

对于具有高同配性的图，和足够来表征节点的嵌入。这可以由GCN和GAT证明。此外，可以被视为和的补充。对于异配性不足的图，和在学习特征表示上也能表现良好。为了充分发挥这些中间表征的优势，利用拼接方式来组合这些中间表征。

随后，生成一个与相同维度的可学习权重向量 ，并将和之间的哈达玛德积作为节点的最终特征表示。

这一步的目的是突出的重要部分。之后，根据最终嵌入Hfinal对节点进行分类，具体如下：

其中是最后一层的可训练权重矩阵，分类损失如下：

即交叉熵损失。

为防止过拟合，对学习到的图应用一个正则项。重连接的图的同配性很高，的连通性和稀疏性也很重要，定义正则项如下：

其中和β是非负的超参数。第一项通过对数项促进中的连接性，第二项促进变得稀疏。

最后的 loss 如下：

在本文中，使用的SLGCN被称为SLGCN ，使用的SLGCN为SLGCN 。算法1中给出了的SLGCN的伪代码。

fig3

4.实验

4.1 数据集

三个常用的引文数据集：Cora, Citeseer, and Pubmed，三个 WebKB 的子网络 Cornell, Texas, and Wisconsin，两个Wikipedia网络：Chameleon and Squirrel，来验证提出的 SLGCN。

fig4

对于所有的数据集，将每一类的节点随机分成48%、32%和20%，用于训练、验证和测试。测试是在每次运行中验证损失达到最小时进行的。所有数据集的特征概述见表1。

图的同配水平度量

利用边的同配性比率描述边的同配水平：

当h高时，图具有强的同配性（h→1），而当h低时，图具有强的异配性或弱的同配性（h→0）。表1中列出了每个图的同配水平 h，可以发现所有的引文网络都是高同配性的图，而所有的WebKB网络和维基百科网络都是低同配性的图。

4.4. Does Re-connected Adjacency Matrix Work?

首先验证 SLGCNs 的结构学习的有效性。图3展示了 WebKB 和 Wikipedia 网络中的原始图、初始化图和重连接图的同配性比率。可以观察到，在每个网络中，重连接的图的同配性比率都比原始图和随机初始化的图高很多。这是因为重连接的图是根据节点之间的相似性来构建的，而且在相似性学习中涉及的权重参数可以通过模型的训练来优化。因此，SLGCNs可以通过利用重连接的邻接矩阵来聚合具有相同类别的节点的特征。

fig5

通过消融研究探讨了所学的重连接图对所提出的SLGCNs的准确性的影响。

fig6

表2所示，原始邻接矩阵A对引文网络中的SLGCN非常重要。然而，在WebKB网络和维基百科网络中，A的影响非常有限，甚至很糟糕。这是因为引文网络是具有高度同配性的图，但WebKB网络和维基百科网络的同配性比例很低。

4.5. Effect of SC Feature on Accuracy

fig7

探讨所提出的ESC-ANCH方法提取的SC特征对SLGCN分类准确性的影响。图4可以看出，SLGCNcc和SLGCNav比没有SC特征的SLGCN获得更好的性能。这说明SC特征不仅反映了节点的ego-embedding，也反映了相似节点。

fig8

从表3中，可以看到ESC和ESC-ANCH比SC更有效率。同时，由于引入了锚节点，ESC-ANCH比ESC更快。

4.6. Comparison Among Different GNNs

fig9

图5中，在Cora数据集上实现了3层GCN、4层GCN、5层GCN以及提出的SLGCNcc和SLGCNav。GCN层数的增加会导致过拟合，SLGCNs不需要增加网络的深度来聚集更多的节点特征。因此，无论聚合多少节点特征，SLGCNs都可以免于过拟合。

fig10

表4所示，一些GNN模型在WebKB网络和维基百科网络中的表现甚至不如MLP，即GCN、GAT、Geom-GCN和MixHop。造成这种现象的主要原因是GNN模型从邻居聚集了无用的信息，并且没有分离ego-embedding和无用的邻居嵌入。无论采用哪种图，H2GCN和SLGCNs都能获得良好的结果。同时，SLGCNs的结果相对比H2GCN要好。这要归功于SLGCNs的重连接的图。此外，SC特征的引入可以通过将相似的节点聚在一起来改善节点的ego- embedding。

5. Conclusion

论文提出了一种有效的GNN方法，即SLGCNs。与其他GCNs相比，本文包括三个主要贡献。1）将谱聚类集成到GNN中，用于捕捉图上的长距离依赖关系，提出了一种ESC-ANCH算法，用于处理图结构的数据，效率很高；2）SLGCNs可以学习一个重连接的邻接矩阵，从边的方面改进SLGCNs；3）SLGCNs通过组合多个节点嵌入，适合于所有级别的同配性。

基于TableStore的海量气象格点数据解决方案实战阿里云云栖号数据存储与数据库 exception Java核心技术
前言气象数据是一类典型的大数据，具有数据量大、时效性高、数据种类丰富等特点。气象数据中大量的数据是时空数据，记录了时间和空间范围内各个点的各个物理量的观测量或者模拟量，每天产生的数据量常在几十TB到上百TB的规模，且在爆发性增长。如何存储和高效的查询这些气象数据越来越成为一个难题。传统的方案常常采用关系型数据库加文件系统的方式实现这类气象数据的存储和实时查询，这种方案在可扩展性、可维护性和性能上都
服务器、群晖，飞牛NAS等部署Whisper ASR教程来啦！让我们的Nas轻松实现音频转文字服务！ xiaoqiangclub 群晖助手服务器 whisper 音视频 ASR 语音转文字实用教程
文章目录介绍演示环境服务器/群晖/飞牛NAS部署WhisperASR，语音识别soeasy！准备部署使用Python调用示例注意事项⚓️相关链接⚓️介绍最近有人私信我，有没有什么办法能在NAS上搞个语音识别服务，实现将语音或开会录音自动转成文字？那么今天我们就一起来看看如何在服务器或群晖/飞牛等Nas上部署一个语音转文字的服务，让我们的NAS瞬间变身“听译”大师！演示环境本文演示环境如下：群晖系统
【MATLAB源码-第269期】基于matlab的鱼鹰优化算法(OOA)无人机三维路径规划，输出做短路径图和适应度曲线. Matlab程序猿小助手路径规划 matlab 算法开发语言人工智能无人机网络机器人
操作环境：MATLAB2022a1、算法描述鱼鹰优化算法（OspreyOptimizationAlgorithm，简称OOA）是一种新兴的基于自然界生物行为的智能优化算法，其灵感来自于鱼鹰这种海鸟在捕猎过程中的独特行为。鱼鹰是一种生活在全球范围内的猛禽，以鱼类为主食。它们的捕猎方式非常高效和精准，能够通过快速调整飞行路径和俯冲角度来捕捉猎物。鱼鹰的捕猎行为不仅表现出高度的灵活性，还能在不同环境中表
【MATLAB源码-第164期】基于matlab的轴承故障三种谱图：细化谱，功率谱，倒谱对比分析仿真。 Matlab程序猿小助手通信原理 matlab 开发语言算法机器人人工智能机器学习计算机视觉
操作环境：MATLAB2022a1、算法描述轴承故障分析是一种重要的维护和监控手段，能够帮助工程师及时发现和解决轴承在运行中可能遇到的各种问题。在轴承故障诊断中，通常会使用到三种谱图分析方法：细化谱（FineSpectrum）、功率谱（PowerSpectrum）和倒谱（Cepstrum）分析。这三种方法各有特点，适用于不同的故障类型和分析场景。以下是对这三种谱图的详细描述。细化谱分析理论基础细化
【华为OD机试真题E卷】54、统一限载货物数最小值 | 机试真题+思路参考+代码解析（C++、Java、Py） KFickle Java Py）华为od c++java 华为OD机试真题统一限载货物数最小值
文章目录一、题目题目描述输入输出样例1样例2二、代码与思路参考C++代码Java代码Python代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题D、E卷，每题都使用C++，Java，Python语言进行解答，每个题目的思路分析都非常详细，持续更新，支持在线OJ刷题，订阅后评论获取权限，有代码问题随时解答，代码仅供学习参考一、题目题目描述火车站附近
【MATLAB源码-第128期】基于matlab的雷达系统回波信号仿真，输出脉压，MTI,MTD等图像。 Matlab_猿助手调制解调通信原理 MATLAB matlab 开发语言信息与通信
操作环境：MATLAB2022a1、算法描述雷达（RadioDetectionandRanging）是一种使用无线电波来探测和定位物体的系统。它的基本原理是发射无线电波，然后接收这些波从目标物体上反射回来的信号。通过分析这些反射波，雷达能够确定物体的位置、速度、方向和其他特性。历史背景雷达技术起源于20世纪初。最初的发展动机主要是军事上的需求，特别是在第二次世界大战期间，雷达在侦测敌机和舰船上发挥
大数据与物联网（IoT）的完美融合：驱动智能新时代 Echo_Wish 大数据高阶实战秘籍大数据物联网 python 人工智能
大数据与物联网（IoT）的完美融合：驱动智能新时代大家好，我是你们的大数据探索者Echo_Wish。今天，我们将深入探讨大数据与物联网（IoT）整合的重要性及其在现代科技中的应用。物联网通过连接大量智能设备，生成海量数据；而大数据技术则赋予我们从这些数据中提取有价值信息的能力。当两者结合在一起时，能够为各行各业带来革命性的变化，推动智能时代的到来。一、大数据与物联网的基本概念1.物联网（IoT）物
基于NLP的客户意见分析：从数据到洞察 Echo_Wish Python 算法 Python 笔记自然语言处理人工智能
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
使用Python构建去中心化社交网络：打破信息垄断的新思维 Echo_Wish Python！实战！python 去中心化网络
使用Python构建去中心化社交网络：打破信息垄断的新思维大家好，我是你们的技术伙伴Echo_Wish。今天，我们来探讨如何使用Python构建一个去中心化的社交网络。在这个以数据为王的时代，中心化平台掌控着大量用户数据，这不仅对隐私保护带来挑战，也容易形成信息垄断。而去中心化的社交网络，通过分布式技术，将数据的控制权交还用户，打破信息垄断，提升隐私安全性。本文将详细介绍如何使用Python实现这
python数据集_保存和使用python绘制多个数据集 weixin_39640085 python数据集
Iraninonemoreproblem-Ihavemultiplefileswiththefollowingformat:FreqAB10001.20.00141001.20.00013101.20.0012allfilesareinthesamefolder;uptonowIamabletoreadallfiles,dothecalculationsIwant,andthensaveonela
（视频演示）基于OpenCV的实时视频跟踪火焰识别软件V1.0源码及exe下载是刃小木啦~ opencv 人工智能计算机视觉
本文介绍了基于OpenCV的实时视频跟踪火焰识别软件，该软件通过先进的图像处理技术实现对实时视频中火焰的检测与跟踪，同时支持导入图片进行火焰识别。主要功能包括相机选择、实时跟踪和图片模式。软件适用于多种场合，用于保障人民生命财产安全。源码及exe文件可通过蓝奏云网盘下载。软件简介《基于OpenCV的实时视频跟踪火焰识别软件》是一款创新的计算机视觉应用软件，旨在通过先进的图像处理技术实现对实时视频中
三维模型点云化工具V1.0使用介绍：将三维模型进行点云化生成是刃小木啦~ python pyqt 工业软件软件工程
三维软件绘制的三维模型导入之后，可以生成点云，用于替代实际的激光扫描过程，当然，主要是用于点云算法的测试和验证，没法真正模拟扫描的效果，因为太过于理想化了。功能介绍将三维软件绘制的三维模型变成点云，并且支持不同的点云密度。支持添加不同的噪声，高斯噪声比较柔和，随机噪声比较明显。功能视频介绍三维模型点云化工具V1.0使用介绍：将三维模型进行点云化生成，支持不同的分辨率，支持添加噪声下载地址三维模型点
用Python画一只溜达小狗——turtle库基础入门编程大本营 python python
一只脑门有点方的小狗，其实还可以把脑门和后脑勺完善一下，更圆润一些。但这样也挺可爱，就保有这样不完美但独一无二的它吧。绘制过程主要就是拼接和调整圆弧，尽量做到过度自然。小狗的绘制主要使用了turtle库的circle()函数，初接触时可能会略有不适应，但用起来之后会发现它很强大！对circle()函数用法还不熟悉的同学可参考这篇博客：《如何用Python画一只兔子——turtle库circle()
Python Turtle绘图：重现汤姆劈树的经典瞬间栗子风暴 Python的Turtle绘画 python 开发语言
PythonTurtle绘图：重现汤姆劈树的经典瞬间前言往期绘画>>点击进所有绘画效果图代码前言《汤姆与杰瑞》（TomandJerry）是我们小时候经常看的一部经典的动画作品。自播出以来就受到了广大观众的喜爱和追捧。它不仅成为了一部经典的动画作品，还衍生出了众多周边产品和续集作品。该动画获得了七项奥斯卡大奖，成为了华纳旗下当之无愧的看家明星。其中汤姆飞行劈树的画面记忆犹新，让我们使用Python的
Python Turtle召唤童年：喜羊羊与灰太狼之喜羊羊绘画栗子风暴 Python的Turtle绘画 python 开发语言
PythonTurtle召唤童年：喜羊羊与灰太狼之喜羊羊绘画前言往期绘画>>点击进所有绘画效果图代码前言小时候，每次打开电视，看到喜羊羊机智对抗灰太狼的情景，总能让人捧腹大笑，回忆满满。今天，我们用Python的turtle模块，带大家一起重温这份童年快乐！通过简单的代码与绘图，我们将把喜羊羊生动地呈现在屏幕上。往期绘画>>点击进所有绘画序号链接01用Python与Turtle创作属于你的“冰墩墩
Python Turtle召唤童年：小猪佩奇的涂鸦乐园栗子风暴 Python的Turtle绘画 python 开发语言
PythonTurtle召唤童年：小猪佩奇的涂鸦乐园前言往期绘画>>点击进所有绘画效果图代码前言欢迎来到《佩奇的画笔世界》！这里是一个充满色彩与欢笑的创意天地，在这个博客里，我们将跟随小猪佩奇一起，拿起画笔，探索属于她的卡通世界。每一笔、每一画，都是对童真与快乐的表达，都是一次绘画与创造的冒险。你是否也曾被小猪佩奇的简单而纯粹的可爱风格所吸引？在这里，我们不仅会画出佩奇的故事，还会将她的每个表情、
PCL 最小二乘拟合空间曲线点云侠点云进阶算法 c++计算机视觉 3d 开发语言
目录一、曲线拟合1、算法原理2、参考文献二、代码实现三、结果展示四、测试数据本文由CSDN点云侠原创，原文链接。如果你不是在点云侠的博客中看到该文章，那么此处便是不要脸的爬虫与GPT。博客长期更新，最近一次更新时间为：2024年7月14日。①代码在PCL1.14.1中运行；②完善代码；③新增标准测试数据一、曲线拟合1、算法原理电力线三维重建指将提取得到的单根电力线进行精确矢量化。在理想情况下，
DeepSeek开源技术全景解析：从硬件榨取到AI民主化革命大刘讲IT 开源人工智能
DeepSeek开源技术全景解析：从硬件榨取到AI民主化革命一、开源周核心成果概览2025年2月24日启动的"开源周"计划，DeepSeek团队连续发布三项底层技术突破：FlashMLA（2.24）：动态资源调度算法，Hopper架构GPU性能榨取专家DeepEP（2.25）：全球首个MoE全流程通信优化库DeepGEMM（2.26）：300行代码重构矩阵计算范式三项技术构成完整技术栈，覆盖大模型
分布式基本理论 - CAP,BASE 和 RAFT 算法 Yellow明算法分布式
分布式基本理论-CAP,BASE和RAFT算法1.分布式基本理论1.1CAP理论在理论计算机科学中，CAP定理（CAPtheorem），又被称作布鲁尔定理（Brewer’stheorem），它指出对于一个分布式计算系统来说，不可能同时满足以下三点：[1][2]一致性（Consistency）（等同于所有节点访问同一份最新的数据副本）可用性（Availability）（每次请求都能获取到非错的响应—
Python数据可视化 Pyecharts 制作 Scatter3D 3D散点图 Mr数据杨 Python 数据可视化数据可视化 python 数据分析 echarts
三维散点图是展示具有三个维度数据的有效工具，通过对数据点在三维空间中的分布进行可视化，可以直观地观察数据间的关系与趋势。借助pyecharts库的Scatter3D类，用户能够快速生成3D散点图，并自定义图表的各项参数，使图表更加符合展示需求。结合强大的视觉映射和交互功能，三维散点图不仅提升了数据分析的精度，还增强了用户与数据之间的互动性。文章目录Scatter3D：3D散点图Demo总结Scat
AdaBoost算法 Mr终游机器学习算法决策树
目录一、核心原理：二、算法步骤三、关键优势：四.局限与解决五、代码示例（鸢尾花数据集）AdaBoost（AdaptiveBoosting）是一种经典的集成学习算法，通过组合多个弱分类器（如决策树）来构建强分类器。其核心思想是通过迭代优化残差（错误）和动态调整样本权重，逐步提升模型性能。以下是对AdaBoost的简明总结和关键要点：一、核心原理：提升法：通过顺序训练多个弱分类器，每轮专注修正前一个模
【华为OD技术面试手撕真题】113、组合总和 | 手撕真题+思路参考+代码解析（C & C++ & Java & Python & JS） KJ.JK 华为OD技术面试手撕真题华为od 面试 c语言华为od机试E卷华为od机试真题组合总和
文章目录一、题目题目描述样例1二、代码参考C语言思路C语言代码C++语言思路C++代码Java语言思路Java代码Python语言思路Python代码JS语言思路JS代码作者：KJ.JK个人博客首页：KJ.JK专栏介绍：本专栏更新每年华为OD机试的高频手撕代码题，每个题目都会使用五种语言进行解答（C&C++&Java&Python&JS），思路分析都非常详细，争取实现最低的时间复杂度和高通过率，每
OpenCV 100道面试题及参考答案（7万字长文）大模型大数据攻城狮大厂面试大厂面经 android面试计算机视觉 opencv 实时互动 webrtc
OpenCV简介OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉库，它提供了丰富的函数和工具，用于处理图像和视频。OpenCV最初由英特尔公司开发，现在由一个开源社区维护和发展。主要功能和用途OpenCV的主要功能包括图像和视频处理、特征提取、目标检测、人脸识别、物体跟踪等。它可以用于各种领域，如机器人技术、医学影像、安全监控、自动驾驶等。在图像
python: DDD using postgeSQL and SQL Server geovindu Python python java 前端数据库 postgresql sqlserver mssql
postgreSQL注意：#psycopg2驱动的连接字符串#engine=create_engine('postgresql://post:geovindu@localhost:5433/TechnologyGame')#Session=sessionmaker(bind=engine)#使用psycopg3驱动的连接字符串#engine=create_engine('postgresql+ps
R语言机器学习系列-随机森林回归代码解读 Mrrunsen R语言大学作业机器学习回归 r语言
回归问题指的是因变量或者被预测变量是连续性变量的情形，比如预测身高体重的具体数值是多少的情形。整个代码大致可以分为包、数据、模型、预测评估4个部分，接下来逐一解读。1、包部分，也就是加载各类包，包括随机森林包randomForest，数据相关包tidyverse、skimr、DataExplorer，模型评估包caret。2、数据部分，主要是读取数据，处理缺失值，转换变量类型。3、模型部分。为了对
常见的限流算法有哪些涛粒子算法 java 网络
计数器算法原理：在固定的时间窗口内，对请求进行计数，当请求数量达到设定的阈值时，就开始限流，拒绝多余的请求。例如，设定1分钟的时间窗口内允许最多100个请求，那么在这1分钟内每来一个请求，计数器就加1，当计数器达到100后，后续的请求就会被拒绝，直到下一个1分钟开始，计数器重置为0重新计数。优点：实现简单，易于理解和部署，在一些对精度要求不是特别高的场景下能很好地控制流量。缺点：存在临界问题，比如
探索数据仓库自动化：ETL流程设计与实践 Echo_Wish 大数据高阶实战秘籍数据仓库自动化 etl
探索数据仓库自动化：ETL流程设计与实践在大数据时代，数据仓库已成为企业数据管理和决策支持的核心工具。如何高效地提取、转换和加载数据（ETL），是数据仓库建设中的重要环节。本文将围绕数据仓库自动化的ETL流程设计展开，结合实际代码示例，探讨如何构建高效、稳定和可扩展的ETL解决方案。什么是ETL？ETL（Extract,Transform,Load）是指数据抽取、转换和加载，是数据仓库建设的重要步
llama-factory 记录嘟嘟Listing llama
GitHub-hiyouga/LLaMA-Factory:UnifiedEfficientFine-Tuningof100+LLMs&VLMs(ACL2024)安装gitclonehttps://github.com/hiyouga/LLaMA-Factory.gitcondacreate-nllama_factorypython=3.10condaactivatellama_factorycdL
用 Python Turtle 绘制一只可爱的小狗：用代码捕捉狗狗的萌态栗子风暴 Python的Turtle绘画 python 开发语言
用PythonTurtle绘制一只可爱的小狗：用代码捕捉狗狗的萌态前言往期绘画>>点击进所有绘画效果图代码前言小狗，作为人类最忠实的朋友之一，总是以它们可爱的模样和活泼的性格，赢得了无数人的喜爱。从呆萌的小狗眼神到摇晃的尾巴，每一处细节都充满了温暖和快乐。今天，我们将用PythonTurtle模块，绘制一只可爱的小狗，捕捉它那份纯真与活力。往期绘画>>点击进所有绘画序号链接01用Python与Tu
代码随想录算法训练营第七天|Leetcode 344.反转字符串 541. 反转字符串II 卡码网：54.替换数字昂子的博客算法 leetcode java 数据结构
344.反转字符串建议：本题是字符串基础题目，就是考察reverse函数的实现，同时也明确一下平时刷题什么时候用库函数，什么时候不用库函数题目链接/文章讲解/视频讲解：代码随想录思路非常简单，两个指针一个指向头一个指向尾巴，对于字符串，我们定义两个指针（也可以说是索引下标），一个从字符串前面，一个从字符串后面，两个指针同时向中间移动，并交换元素。classSolution{publicvoidre
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio