不知道叫啥好一点

A Comprehensive Survey on Graph Neural Networks论文阅读笔记

A Comprehensive Survey on Graph Neural Networks

- 细节点
- 摘要
- 介绍部分
- - 将机器学习应用到Graph领域的问题
  - 2D卷积和Graph卷积相似之处和区别
  - 文章的贡献之处
  - 文章框架
- GNNs背景
- - GNNs和network embedding
  - GNNs和graph kernel methods
- GNNs 符号
- - notations
  - Spatial-Temporal Graph定义
- GNNs分类框架
- - 网络结构划分
  - - RecGNNs：学习节点表示
    - ConvGNNs：将网格数据的卷积推广到Graph
    - Graph autoencoders(GAEs):将nodes/Graphs编码到latent vector空间，接着重构
    - - 用处：
      - 学习网络嵌入表示
    - Spatial-temporal graph neural networks (STGNNs)
    - - 应用场景
  - 按不同图分析任务划分
  - - Node-level
    - Edge-level
    - Graph-level
  - 按训练框架划分
  - - Semi-supervised learning for node-level classification
    - Supervised learning for graph-level classification.
    - Unsupervised learning for graph embedding
    - RecGNN和ConvGNN模型总结和复杂度分析
- RGNN
- - 论文阅读顺序
  - 发展过程
- RGNN 和 ConvsGNN区别
- ConvGNNs
- - 基于谱 VS 基于空间，空间Win!!!
  - - overall
  - 谱方法GCN
  - - 论文阅读顺序
    - 发展过程
  - 空间方法
  - - overall
    - 论文阅读顺序
    - 发展过程
    - 提升计算效率的一些方法
  - 图Pooling模块
  - - overall
    - paper
    - 发展过程
  - 理论方面的讨论
  - - Shape of receptive field
    - VC维
    - Graph isomorphism
    - Equivariance and invariance
    - Universal approximation
- GAE（Graph Autoencoders）
- - Network Embedding
  - - overall
    - paper
    - 发展过程
  - Graph Generation
  - - overall
    - paper
    - 发展过程
- SPATIAL-TEMPORAL GRAPH NEURAL NETWORKS
- - overlall
  - paper
  - 发展过程
  - - RNN-based
    - CNN-based
- 应用
- - 应用领域
  - - Computer vision
    - Natural language processing
    - Traffic
    - 推荐系统
    - Chemistry
    - 其他
- 未来方向

细节点

非欧几里得域：图(Graph)和流形(mainfolds)
Thenotion of graph neural networks was initially outlined in Gori
et al. (2005) [14] and further elaborated in Scarselli et al.
(2009) [15], and Gallicchio et al. (2010) [16].
特征分解时间复杂度 $O(N^3)$ ，节点对之间最短路径计算时间复杂度 $O(N^3)$
图卷积与其他神经网络的合成更加高效和方便。
不知道平衡二叉树是什么
injective 函数(单射函数)：如果所有x,y∈A,且x≠y，都有f(x)≠f(y),则称f为由A到B的单射
图的稀疏性导致positive node pairs(临近的节点对)数量远远少于负节点对的数量

摘要

在越来越多的应用中，使用从非欧式空间生成的数据
本文是一篇概述图神经网络在数据挖掘和机器学习中的应用
图神经网络的分类：recurrent graph neural networks,convolutional graph neural networks,graph autoencoders,spatial-temporal graph neural networks。

介绍部分

将机器学习应用到Graph领域的问题

图可能是不规则的，一个图可能有大小不等的无序节点，而来自图的节点可能有不同数量的邻居，这导致一些重要的操作(比如卷积)在image域中容易计算，但很难应用到graph域中
现有的机器学习假设实例(Instances)之间是相互独立的，然而在图中节点和节点之间是相关联的

2D卷积和Graph卷积相似之处和区别

文章的贡献之处

提出图神经网络的分类方法
对每个类别的GNN代表模型进行了详细的描述，比较
收集了大量的资源，包括最新的模型、基准数据集、开源代码和实际应用程序
给出现有方法的局限性，同时提出未来的研究方向：模型深度，scalability trade-off，异构性和动态性。

文章框架

第2节概述了GNNs的背景，列出了常用的notations，并定义了Graph相关的概念。
第3节阐明了图形神经网络的分类。
第4-7节提供了GNNs模型的概述。
第8节介绍了GNNs在不同领域的应用的集合。
第9节讨论了当前的挑战并提出了未来的方向。第X节对本文进行了总结。

GNNs背景

早期研究集中在recurrent graph neural networks用于学习节点的表示，迭代的方法直到达到一个稳定点。
出现了许多种重新定义图卷积的方法，主要两个派系：spectral-based，和spatial-based方法

GNNs和network embedding

GNNs的研究和graph embedding/network embedding（将网络节点表示为低维向量表示）有着密切的关系，GNN强调使用端到端方式开展图相关任务，GNNs是用于解决各种各样任务的一组神经网络模型。另一方面，网络嵌入还包括其他非深度学习方法：matrix factorization(矩阵分解)，随机游动(random walks)。

GNNs和graph kernel methods

graph kernel 是用于解决图分类问题的主要技术

使用一个核函数来度量图对之间的相似性
图核可以通过确定性映射函数将图或节点嵌入到向量空间中

gnn直接基于图表示进行图分类，比图核方法更加高效。

GNNs 符号

notations

Spatial-Temporal Graph定义

是属性图，并且节点属性随时间动态变化，
时空图的定义： $G^{(t)}=\left(\mathbf{V}, \mathbf{E}, \mathbf{X}^{(t)}\right)$ ,并且 $\mathbf{X}^{(t)} \in \mathbf{R}^{n \times d}$ ,图节点特征随时间发生改变

GNNs分类框架

网络结构划分

RecGNNs：学习节点表示

它们假设图中的一个节点不断地与它的邻居交换信息/消息，直到到达一个稳定的平衡状态，

ConvGNNs：将网格数据的卷积推广到Graph

堆叠多个图卷积层以提取高层的节点特征表示，有基于节点的分类和基于图的分类：

这里的池化操作是将图粗化为子图使得在粗化后的子图上的节点表示更高层次的特征，

Graph autoencoders(GAEs):将nodes/Graphs编码到latent vector空间，接着重构

用处：

学习网络的嵌入表示和Graph generative distributions,网络嵌入涉及到通过重构图的邻接矩阵来学习latent node的表示

学习网络嵌入表示

压缩和重构的是图的邻接矩阵

Spatial-temporal graph neural networks (STGNNs)

学习spatial-temporal graphs的隐模式(hidden patterns),同时考虑空间依赖性和时间依赖性，和CNN或者RNN结合获取时间和空间信息。

应用场景

traffic speed forecasting
driver maneuver anticipation
human action recognition

按不同图分析任务划分

Node-level

用于节点回归和分类任务，代表网络：RecGNNs，ConvGNNs首先提取节点的high-level表示，然后使用一个MLP或者softmax实现端到端训练。

Edge-level

用于edge的分类和link预测，利用GNNs提取的节点的hidden表示作为输入，使用相似性函数或者神经网络来预测edge的标签/连接强度

Graph-level

用于图分类任务，经常与pooling和readout操作结合在一起

按训练框架划分

Semi-supervised learning for node-level classification

针对单个网络中部分节点被标记而其余节点未标记的情况，通过叠加GC layers并后面跟着一个softmax层实现多类别分类。

Supervised learning for graph-level classification.

利用GC layers 池化和/或读出层实现图的端到端学习，网络框架可以参考graph-level 的图卷积。

Unsupervised learning for graph embedding

两种类型：

embed the graph into the latent representation，使用GC layers来实现
使用negative sampling approach采样节点作为负样本对，剩下的点作为正样本对，接着使用a logistic regression layer去区分正样本和负样本[42],这里没有理解这样做的原因。

RecGNN和ConvGNN模型总结和复杂度分析

RGNN

论文阅读顺序

[15] $GNN^*$ ->[16]GraphESN（改进不明显）->[17]Gated Graph Neural Network (GGNN)

发展过程

仅用于有向无环图

由于计算能力受限。
无环图、循环图、有向图和无向图

基于information diffusion mechanism，迭代直到达到稳定状态。

$\mathbf{h}_{v}^{(t)}=\sum_{u \in N(v)} f\left(\mathbf{x}_{v}, \mathbf{x}^{\mathbf{e}}(v, u), \mathbf{x}_{u}, \mathbf{h}_{u}^{(t-1)}\right)$

对参数方程 $f$ 的要求是收缩映射，当f(·)为神经网络时，参数的雅可比矩阵必须加一个惩罚项（正则化项）。当满足收敛准则时，将最后一步节点隐藏状态转发到读出层。节点的状态传播(直到稳定)和计算参数梯度(一次梯度)是交替进行的。

在GraphESN中，由一个编码层和一个输出层组成，这里使用编码层代替压缩状态函数来递归地更新节点状态(编码器不需要训练)最终得到一个不动点，接着作为输入进行训练。

在Gated Graph Neural Network (GGNN) 中，使用GRU作为递归函数，解决了 $f$ 收缩映射的条件，节点状态更新方程：使用当前节点和邻居节点的状态更新。并且使用BPTT进行参数的训练，但是对于大型图来说是一个问题。
$\mathbf{h}_{v}^{(t)}=G R U\left(\mathbf{h}_{v}^{(t-1)}, \sum_{u \in N(v)} \mathbf{W h}_{u}^{(t-1)}\right)$
在SSE中提出了一种可以扩展到large graphs的思路：它交替抽取一批节点进行状态更新，抽取一批节点进行梯度计算。为了保证收敛性，SSE是对历史状态和新状态的一个加权平均。
$\mathbf{h}_{v}^{(t)}=(1-\alpha) \mathbf{h}_{v}^{(t-1)}+\alpha \mathbf{W}_{1} \sigma\left(\mathbf{W}_{2}\left[\mathbf{x}_{v}, \sum_{u \in N(v)}\left[\mathbf{h}_{u}^{(t-1)}, \mathbf{x}_{u}\right]\right]\right)$

RGNN 和 ConvsGNN区别

ConvGNNs

基于谱 VS 基于空间，空间Win!!!

overall

基于频谱的方法从Graph信号处理的角度通过引入滤波器来定义Graph卷积[82]，其中，Graph卷积操作被解释为从Graph信号中去除噪声。

基于空间的方法继承了RecGNNs的思想，通过信息传播（Aggregation邻居信息）来定义图形卷积。

基于空间的方法由于其具有吸引力的效率、灵活性和通用性，最近得到了迅速发展。

谱模型的效率低于空间模型，谱模型要么需要进行特征向量计算，要么同时处理整个图。空间模型对大型图具有更大的可伸缩性，因为它们通过信息传播直接在Graph中执行卷积，并且计算可以在一批节点中进行，而不是在整个图中进行。
其次，依赖于图傅里叶基的谱模型很难推广到新的图。假设有一个固定的图形。对图的任何扰动都会导致特征基的改变
基于空间的模型在每个节点上执行局部的图形卷积，在不同位置和结构之间可以轻松地共享权值
基于空间的模型更灵活地处理多源图输入，如边输入[15]、[27]、[86]、[95]、[96]、有向图[25]、[72]、有符号图[97]和异构图[98]、[99]，因为这些图输入可以很容易地合并到聚合函数中。

谱方法GCN

论文阅读顺序

Spectral Convolutional Neural Network (Spectral CNN)[19] ->ChebNet[21]->GCN[22]->CayleyNet[23] ->GCN[22]->Adaptive Graph Convolutional Network (AGCN) [40] -> Dual Graph Convolutional Network(DGCN)[41]->Mixture Model Network (MoNet) [44]

发展过程

在Spectral CNN中，定义谱的GCL为：

$\mathbf{H}_{:, j}^{(k)}=\sigma\left(\sum_{i=1}^{f_{k-1}} \mathbf{U} \Theta_{i, j}^{(k)} \mathbf{U}^{T} \mathbf{H}_{:, i}^{(k-1)}\right) \quad\left(j=1,2, \cdots, f_{k}\right)$

由于公式比较复杂，这里我们做详细地说明：

${(k)}$ 是GCL层的索引号，这里图的隐状态是 $\mathbf{H}^{(k)}\in R^{n*f_k}$ , $n$ 表示节点数， $f_k$ 表示通道数，在前向计算时，通道数会发生改变。 $\mathbf{H}^{(0)} = X \in R^{n*d}$ 是图的初始状态,计算 $\mathbf{H}^{(k)}$ 的一个通道的状态时，使用了前一层所有通道的状态都做了一次图卷积并求和，这里不清楚的一点就是 $g_\theta = \Theta_{i, j}^{(k)}$ 是一个矩阵的话，那么每一层是否是有很多的 $\Theta_{i, j}^{(k)}$ ( $f_{k-1}*f_k$ 个 $n * n$ 的矩阵)呢？

上述方法存在的问题是：

	1. 对图的任何扰动都会导致特征基$U$的变化.

其次，学习过滤器是依赖于邻域的，这意味着它们不能应用于具有不同结构的图
3. 计算特征分解需要 $O(n^3)$

在Chebyshev Spectral CNN (ChebNet) 中，使用Chebyshev polynomials of the diagonal matrix of eigenvalues对 $g_\theta$ 做近似。
$\mathbf{x} *_{G} \mathbf{g}_{\theta}=\mathbf{U}\left(\sum_{i=0}^{K} \theta_{i} T_{i}(\tilde{\boldsymbol{\Lambda}})\right) \mathbf{U}^{T} \mathbf{x}$
其中 $\tilde{\boldsymbol{\Lambda}}=2 \mathbf{\Lambda} / \lambda_{\max }-\mathbf{I}_{\mathbf{n}}$ ,使得 $\tilde{\boldsymbol{\Lambda}}$ 的取值范围为 $[- 1, 1]$ ,切比雪夫多项式定义：

$T_{i}(\mathbf{x})=2 \mathbf{x} T_{i-1}(\mathbf{x})-T_{i-2}(\mathbf{x})$

并且 $T_{0}(\mathbf{x})=1,T_{1}(\mathbf{x})=x$ ,又由于 $T_{i}(\tilde{\mathbf{L}})=\mathbf{U} T_{i}(\tilde{\boldsymbol{\Lambda}}) \mathbf{U}^{T}$ ,其中 $\tilde{\mathbf{L}}=2 \mathbf{L} / \lambda_{\max }-\mathbf{I}_{\mathbf{n}}$ ,可以将图卷积的式子进行化简，从而得到：
$\mathbf{x} *_{G} \mathbf{g}_{\theta}=\sum_{i=0}^{K} \theta_{i} T_{i}(\tilde{\mathbf{L}}) \mathbf{x}$
这样的修改使得卷积仅仅是在局部定义，意味着滤波器可以独立了于图的大小提取局部特征

CayleyNet

使用Cayley多项式，是参数化的有理复函数，可以捕获窄带信号其卷积的定义为：
$\mathbf{x} *_{G} \mathbf{g}_{\theta}=c_{0} \mathbf{x}+2 \operatorname{Re}\left\{\sum_{j=1}^{r} c_{j}(h \mathbf{L}-i \mathbf{I})^{j}(h \mathbf{L}+i \mathbf{I})^{-j} \mathbf{x}\right\}$
ChebNet可以看作是CayleyNet的一种特殊情况。
Graph Convolutional Network (GCN)

GCN对ChebNet进行简化，假定 $1,\lambda_{max} = 2$ ,这样的话，卷积公式简化为：
$\mathbf{x} *_{G} \mathbf{g}_{\theta}=\theta_{0} \mathbf{x}-\theta_{1} \mathbf{D}^{-\frac{1}{2}} \mathbf{A} \mathbf{D}^{-\frac{1}{2}} \mathbf{x}$
同时为了限制参数数量同时便面过拟合，假设 $\theta = \theta_0 = -\theta_1$ ,从而推导出接下来的卷积式：

$\mathbf{x} *_{G} \mathbf{g}_{\theta}=\theta\left(\mathbf{I}_{\mathbf{n}}+\mathbf{D}^{-\frac{1}{2}} \mathbf{A} \mathbf{D}^{-\frac{1}{2}}\right) \mathbf{x}$

输入信号为矩阵 $X$ 时,将上述式整理为：
$\mathbf{H}=\mathbf{X} *_{G} \mathbf{g}_{\Theta}=f(\overline{\mathbf{A}} \mathbf{X} \Theta)$
但是不清楚这个 $\Theta$ 的表达式是什么，其中 $\overline{\mathbf{A}}=\mathbf{I}_{\mathbf{n}}+\mathbf{D}^{-\frac{1}{2}} \mathbf{A} \mathbf{D}^{-\frac{1}{2}}$ ,不过这个式子很容易造成GCN的不稳定，使用normalization技巧取代替 $\overline{\mathbf{A}}$ ,其中$ \overline{\mathbf{A}}=\tilde{\mathbf{D}}^{-\frac{1}{2}} \tilde{\mathbf{A}} \tilde{\mathbf{D}}^{-\frac{1}{2}} $,$ \tilde{\mathbf{A}}=\mathbf{A}+\mathbf{I}{\mathbf{n}} $,$ \tilde{\mathbf{D}}{i i}=\sum_{i} \tilde{\mathbf{A}}_{i j}$,将上式表示为空间形式为：
$\mathbf{h}_{v}=f\left(\mathbf{\Theta}^{T}\left(\sum_{u \in\{N(v) \cup v\}} \bar{A}_{v, u} \mathbf{x}_{u}\right)\right) \quad \forall v \in V$

AGCN
DGCN

空间方法

overall

The spatial graph convolutional operation essentially propagates node information along edges.(空间卷积操作实质上是沿着edge传递节点信息)

论文阅读顺序

GCN -> Neural Network for Graphs (NN4G) [24]->Contextual Graph Markov Model (CGMM)[24]->DCNN[25]-DGC[72]-> PGC-DGCNN[46]->Partition Graph Convolution (PGC) [75] ->Message Passing Neural Network (MPNN) [27]->Graph Isomorphism Network (GIN)[57]->GrapphSage[42]->Graph Attention Network (GA T) [43]->Mixture Model Network (MoNet) [44]->PA TCHY -SAN [26] -> Large-
scale Graph Convolutional Network (LGCN) [45] -》Fast Learning with Graph Convolutional Network (Fast-GCN) [49]->Huang et al. [51] ->Stochastic Training of Graph Convolutional Networks (StoGCN) [50]

发展过程

Neural Network for Graphs (NN4G) [24]

在文中使用了residual connections和skip connections
$\mathbf{h}_{v}^{(k)}=f\left(\mathbf{W}^{(k)^{T}} \mathbf{x}_{v}+\sum_{i=1}^{k-1} \sum_{u \in N(v)} \Theta^{(k)^{T}} \mathbf{h}_{u}^{(k-1)}\right)$
其中 $\mathbf{h}_{v}^{(0)}=\mathbf{0}$ ,将等式写成矩阵形式为:

$\mathbf{H}^{(k)}=f\left(\mathbf{X} \mathbf{W}^{(k)}+\sum_{i=1}^{k-1} \mathbf{A} \mathbf{H}^{(k-1)} \mathbf{\Theta}^{(k)}\right)$

其中A是使用的是非规范化的邻接矩阵

Contextual Graph Markov Model (CGMM)具有概率可解释性的优点
Diffusion Convolutional Neural Network (DCNN)

将图卷积看作是一个扩散过程，假设信息以一定概率从一个节点转移到相邻节点，并最终达到均衡，文中定义的扩散图卷积为：
$\mathbf{H}^{(k)}=f\left(\mathbf{W}^{(k)} \odot \mathbf{P}^{k} \mathbf{X}\right)$
其中 $f(\cdot)$ 是一个激活函数， $\mathbf{P} \in \mathbf{R}^{n \times n}$ , $\mathbf{P}=\mathbf{D}^{-1} \mathbf{A}$ ,从上式中可以看出 $\mathbf{H}^{(k)}$ 是和 $\mathbf{H}^{(k-1)}$ 没有关系的，DCNN中将 $H^{(1)}$ ,…, $H^{(K)}$ 连接到一起作为输出。
Diffusion Graph Convolution(DCG)将每一步扩散输出做了一个求和(这样做的原理是：扩散过程的平稳分布是概率转移矩阵的幂级数的和)

$\mathbf{H}=\sum_{k=0}^{K} f\left(\mathbf{P}^{k} \mathbf{X} \mathbf{W}^{(k)}\right)$

使用转移概率矩阵的幂意味着遥远的邻居对中心节点贡献很少的信息

PGC-DGCNN

基于最短路径增加遥远邻居的贡献。增加了一个shortest path
adjacency matrix $S^{(j)}$ 。计算最短路径复杂度为 $O(n^3)$ ,如果u节点到v节点最短距离为j，则 $S^{(j)}_{u,v}=1$ ，否则为0.同时引入超参数

$\mathbf{H}^{(k)}=\|_{j=0}^{r} f\left(\left(\tilde{\mathbf{D}}^{(j)}\right)^{-1} \mathbf{S}^{(j)} \mathbf{H}^{(k-1)} \mathbf{W}^{(j, k]}\right),$

Partition Graph Convolution (PGC) [75]

根据特定的标准将节点的邻居划分为Q组，每一组使用不同的邻接矩阵，接着使用不同的参数矩阵，并将最终得到的结果相加。
$\mathbf{H}^{(k)}=\sum_{j=1}^{Q} \overline{\mathbf{A}}^{(j)} \mathbf{H}^{(k-1)} \mathbf{W}^{(j, k)}$
$\mathbf{H}^{(0)}=\mathbf{X}, \overline{\mathbf{A}}^{(j)}=\left(\tilde{\mathbf{D}}^{(j)}\right)^{-\frac{1}{2}} \tilde{\mathbf{A}}^{(j)}\left(\tilde{\mathbf{D}}^{(j)}\right)^{-\frac{1}{2}}$ , $\tilde{\mathbf{A}}^{(j)} = {\mathbf{A}}^{(j)}+\mathbf{I}$
Message Passing Neural Network (MPNN)

将谱域的卷积看成是空间域的消息传递，因此这边消息传递的函数为：

$\mathbf{h}_{v}^{(k)}=U_{k}\left(\mathbf{h}_{v}^{(k-1)}, \sum_{u \in N(v)} M_{k}\left(\mathbf{h}_{v}^{(k-1)}, \mathbf{h}_{u}^{(k-1)}, \mathbf{x}_{v u}^{e}\right)\right)$ ,

其中 $\mathbf{h}_{v}^{(0)}=\mathbf{x}_{v}, U_{k}(\cdot), M_{k}(\cdot)$ 都是要学习的参数，读出(readout)函数 $\mathbf{h}_{G}=R\left(\mathbf{h}_{v}^{(K)} \mid v \in G\right)$ ,是关于最后一层节点的函数
Graph Isomorphism Network (GIN)解决无法使用他们产生的图嵌入来区分不同结构的图

中心节点的权值由一个可学习参数 $\epsilon^{(k)}$ ,得到图卷积/消息传递表达为:
$\mathbf{h}_{v}^{(k)}=M L P\left(\left(1+\epsilon^{(k)}\right) \mathbf{h}_{v}^{(k-1)}+\sum_{u \in N(v)} \mathbf{h}_{u}^{(k-1)}\right)$
GraphSage不使用所有的邻域节点，而是对于每一个节点采样固定数量的邻居

$\mathbf{h}_{v}^{(k)}=\sigma\left(\mathbf{W}^{(k)} \cdot f_{k}\left(\mathbf{h}_{v}^{(k-1)},\left\{\mathbf{h}_{u}^{(k-1)}, \forall u \in S_{\mathcal{N}(v)}\right\}\right)\right)$

$f_{k}$ 是节点的Aggregation函数，要求具有不变性，为什么那？

Graph Attention Network (GA T) [43]

假设相邻节点对于邻居节点的贡献是不相同的，因此学习两个连接节点之间的相对权值，GAT的图卷积/消息传递定义为：
$\mathbf{h}_{v}^{(k)}=\sigma\left(\sum_{u \in \mathcal{N}(v) \cup v} \alpha_{v u}^{(k)} \mathbf{W}^{(k)} \mathbf{h}_{u}^{(k-1)}\right)$
$\mathbf{h}_{v}^{(0)}=\mathbf{x}_{v}$ ,其中注意力系数的计算为:
$\alpha_{v u}^{(k)}=\operatorname{softmax}\left(g\left(\mathbf{a}^{T}\left[\mathbf{W}^{(k)} \mathbf{h}_{v}^{(k-1)} \| \mathbf{W}^{(k)} \mathbf{h}_{u}^{(k-1)}\right)\right)\right.$
同时，使用了multi-head attention，提高了模型的表达能力

此外：图注意力模型有:GeniePath [55]
Mixture Model Network (MoNet) [44]

引入节点的伪坐标，并将两节点的相对位置映射为两节点之间的权重，实现不同位置参数的共享，使用带有可学习参数的高斯核来自适应学习权重函数。
PA TCHY -SAN [26]

PA TCHY -SAN[26]根据每个节点的图标签对其邻居进行排序，并选择顶部的q邻居。图标签本质上是节点评分，可以通过节点度、中心性和Weisfeiler-Lehman 来推导.

使用标准的1-D卷积聚合邻域信息，在图的数据处理上需要花费大量的时间。
Largescale Graph Convolutional Network (LGCN) [45]

采用不同的方法对邻域进行排序

提升计算效率的一些方法

GraphSage [42]

提出了一种a batch-training algorithm for ConvGNNs.
Fast Learning with Graph Convolutional Network (Fast-GCN) [49]

为每个图的卷积层采样固定数量的节点，并不处理所有的节点。它将图的卷积解释为节点嵌入函数在概率测度下的积分变换。
Huang et al. [51]

自适应的层采样方法，底层节点的采样是条件在高层节点的采样上的，具有更高的精度比Fasst-GCN
Stochastic Training of Graph Convolutional Networks (StoGCN) [50]

利用历史节点表示作为控制变量，将图卷积的接受野减小到任意小的规模,但是，StoGCN仍然需要保存所有节点的中间状态，这对于大型图来说是消耗内存的。
Cluster-GCN [58]

ConvGCNs训练算法的时间和内存复杂度比较([58]总结)。n是节点的总数。m是边的总数。K是层数。s为批大小。r是每个节点采样的邻居的数量.Cluster-GCN具有最小的内存消耗。

图Pooling模块

overall

直接使用所有的这些特征在计算上是很具有挑战性的，需要进行下采样策略，

两种策略

down-sampling the nodes to generate samller representations,避免过拟合
readout: 得到graph-level表示

paper

[23]使用Graclus algorithm 算法来对图节点聚类，从而实现图的粗化。

[17],[27],[46]使用注意力机制来增强mean/sum池化

set2set[101]->ChebNet->DGCNN->differentiable pooling (DiffPool) [54] ->SAGPool[102]

发展过程

图粗化算法使用特征分解来根据图的拓扑结构进行粗化。问题：时间复杂度太高
Graclus algorithm对原始图进行聚类得到粗化后的图
对得到的最后一层节点的隐特征，求统计特征(mean/max/sum)

$\mathbf{h}_{G}=\operatorname{mean} / \max / \operatorname{sum}\left(\mathbf{h}_{1}^{(K)}, \mathbf{h}_{2}^{(K)}, \ldots, \mathbf{h}_{n}^{(K)}\right)$
[17],[27],[46]使用注意力机制来增强mean/sum池化
Set2Set在reduction之前增加新的信息。
Defferrard et al. [21]，提出了更加高效的pooling策略：Craclus algorithm+balanced binary tree
DGCNN中提出SortPooling。
differentiable pooling (DiffPool) [54] 生成图的分层表示，不是直接对节点进行聚类，而是学习一个cluster assignment matrix $S$ .

$\mathbf{S}^{(k)} \in \mathbf{R}^{n_{k} \times n_{k+1}}$ ,其中 $n_{k}$ 是第 $k$ 层节点数。
$\mathbf{S}^{(k)}=\operatorname{softmax}\left(\operatorname{Conv} G N N_{k}\left(\mathbf{A}^{(k)}, \mathbf{H}^{(k)}\right)\right)$
缺点是计算复杂度会变成 $O(n^3)$ ,
SAGPool[102]既考虑节点特征，又考虑图拓扑，学习以一个self-attention的方式学习池化。

理论方面的讨论

Shape of receptive field

节点的接收野是最后一层节点能够接收到的所有节点的信息，就和CNN相同，

Micheli证明有限层的空间图卷积层可以cover图中的所有节点

VC维

什么是VC维？衡量研究对象(数据集与学习模型)可学习的指标，一个假设空间H的VC dimension，是这个H最多能够shatter掉的点的数量，记为dvc(H)：翻译成人话是，不管数据是怎样分布的，H最多能区分多少个数据。我们可以想像，越是复杂的H能够区分的数据点就越多，VC维也就越大。

VC维和模型复杂度是正相关的
VC维的大小：与学习算法A无关，与输入变量X的分布也无关，与我们求解的目标函数f 无关。它只与模型和假设空间有关(模型复杂度和数据量)

GNN VC维的分析

如果使用sigmoid或正切双曲激活, $GNN^*$ 的VC维为 $O(p^4n^2)$

如果使用分段多项式激活函数，VC维为 $O(p^2n)$

Graph isomorphism

GNN将两个不同的Graph映射到不同的Embeddings，可以通过Weisfeiler-Lehman (WL) test两个图的非同构性。

为了实现等方差或不变性，GNN的组成部分必须对节点顺序保持不变。

Equivariance and invariance

执行节点级任务时，GNN必须是等变函数;执行图形级任务时，GNN必须是不变函数。

Universal approximation

众所周知，具有一隐层的多感知器前馈神经网络可以近似任何Borel可测函数.
Maron等[104]证明了不变图网络可以近似定义在图上的任意不变函数

GAE（Graph Autoencoders）

Network Embedding

overall

网络嵌入是节点的低维向量表示，它保留节点的拓扑信息

paper

DNGR[59]->SDNE[60]->Graph Autoencoder（ $GAE^*$ ）[61]->Varia-
tional Graph Autoencoder (VGAE) [61]

发展过程

DNGR

利用多层感知器，堆叠降噪自编码器来对PPMI矩阵进行编码和解码
SDNE

在encode和decode上分别使用了两个loss函数：

第一损失函数使已学习的网络嵌入通过最小化节点嵌入网络之间的距离来保持节点的一阶邻近性： $L_{1 s t}=\sum_{(v, u) \in E} A_{v, u}\left\|\operatorname{enc}\left(\mathbf{x}_{v}\right)-\operatorname{enc}\left(\mathbf{x}_{u}\right)\right\|^{2}$

其中$\mathbf{x}{v} =A{v, :} $,相当于是在对邻接矩阵进行encode

第二损失函数使学习到的网络嵌入通过最小化节点的输入与其重构输出之间的距离来保持节点的二阶接近性

上述的DNGR和SDNE仅仅考虑节点的结构信息，而没有考虑节点包含的特征信息(feature information),

$GAE^*$ 同时encode节点的结构信息和特征信息，并且由两个图卷积层构成：
$\mathbf{Z}=\operatorname{enc}(\mathbf{X}, \mathbf{A})=\operatorname{Gconv}\left(f\left(\operatorname{Gconv}\left(\mathbf{A}, \mathbf{X} ; \mathbf{\Theta}_{1}\right)\right) ; \mathbf{\Theta}_{2}\right)$
$\mathbf{Z}$ 就是图的Embedding表示, $\cdot )$ 表示ReLU激活函数

解码器：再现图的邻接矩阵 $\hat{\mathbf{A}}_{v, u}=\operatorname{dec}\left(\mathbf{z}_{v}, \mathbf{z}_{u}\right)=\sigma\left(\mathbf{z}_{v}^{T} \mathbf{z}_{u}\right)$ ,

训练目标：最小化真实邻接矩阵和重构邻接矩阵的negative cross entropy，

不过简单重构图的邻接矩阵很容易造成过拟合，由于自编码器的容量(过大还是过小？)

Variational Graph Autoencoder (VGAE) [61]

变分自编码器：优化变分下界：
$L=E_{q(\mathbf{Z} \mid \mathbf{X}, \mathbf{A})}[\log p(\mathbf{A} \mid \mathbf{Z})]-K L[q(\mathbf{Z} \mid \mathbf{X}, \mathbf{A}) \| p(\mathbf{Z})]$
假定经验分布 $q(\mathbf{Z} \mid \mathbf{X},\mathbf{A})$ 和先验分布 $p(\mathbf{Z})$ 接近
Adversarially Regularized V ariational Graph Autoencoder (ARVGA) [62],

采用GAN的方式，生成器生成经验分布 $q(\mathbf{Z} \mid \mathbf{X},\mathbf{A})$ ,判别器要努力将生成器生成的分布和真实的先验分布 $p(\mathbf{Z})$ 区别开来。
GraphSage[42]

定义loss函数的思路：强制接近的节点具有相似的表示，而距离较远的节点具有不同的表示
$L\left(\mathbf{z}_{v}\right)=-\log \left(\operatorname{dec}\left(\mathbf{z}_{v}, \mathbf{z}_{u}\right)\right)-Q E_{v_{n} \sim P_{n}(v)} \log \left(-\operatorname{dec}\left(\mathbf{z}_{v}, \mathbf{z}_{v_{n}}\right)\right)$
对于节点 $v$ 来说，他的Embedding表示 $\mathbf{z}_{v}$ , $u$ 是 $v$ 的近邻节点， $v_n$ 是远离 $v$ 节点的，并且是通过negative sampling distribution得到的
DGI[56]利用网络嵌入通过最大化局部互信息来实现全局结构信息的捕获
Deep Recursive Network Embedding (DRNE)

假设节点的network embedding 近似其邻居节点网络嵌入的Aggregation，集成方法采用LSTM：
$L=\sum_{v \in V}\left\|\mathbf{z}_{v}-L S T M\left(\left\{\mathbf{z}_{u} \mid u \in N(v)\right\}\right)\right\|^{2}$
LSTM网络采用节点v的邻居按节点度排序的随机序列作为输入
Network Representations with Adversarially Regularized Autoencoders (NetRA) [64]

NetRA的编码器和解码器为LSTM网络，每个节点 $v$ ∈ $V$ 作为随机游动的起点，将游动结果输出到LSTM中。同时采用对抗训练的方法

Graph Generation

overall

思想：通过GAE编码，解码过程来学习图的生成过程，

研究前景：解决分子图生成问题，这在药物发现中具有很高的实用价值

生成图的方式:全局方式/序列方式(sequential manner)

paper

序列方法：Gomez et al. [111], Kusner et al. [112],and Dai et al. [113] ，Deep Generative Model of Graphs (DeepGMG) [65]，GraphRNN
全局方法:Graph V ariational Autoencoder (GraphV AE) [67] ，(RGV AE) [68]，(MolGAN) [69] ，NetGAN [70]

发展过程

Gomez et al. [111], Kusner et al. [112],and Dai et al. [113] 使用CNN和RNN作为编码器和解码器生成分子图的string representation

选择的方法适用于一般的图，迭代地向图中增加节点和边
Deep Generative Model of Graphs (DeepGMG) [65]

假定图的概率是所有可能的节点排列的和，通过一系列决策来生成图，即是否添加节点，添加哪个节点，是否添加一条边，以及哪个节点连接到新节点。
GraphRNN

一个graph-level神经网络(在节点序列中添加一个新节点)和一个edge-level神经网络(生成二进制序列表示新节点与之前生成节点之间的连接)来建模节点和边的生成过程。

Graph Variational Autoencoder (Graph VAE) [67]

将节点和边建模成独立的随机变量。优化变分下界
$L(\phi, \theta ; G)=E_{q_{\phi}(z \mid G)}\left[-\log p_{\theta}(G \mid \mathbf{z})\right]+K L\left[q_{\phi}(\mathbf{z} \mid G) \| p(\mathbf{z})\right]$

使用ConvGNN作为编码器，MLP作为解码器，输出生成图的邻接矩阵，节点分布和边分布
Regularized Graph V ariational Autoencoder (RGV AE) [68]

对图变分自编码器施加有效性约束，以规范解码器的输出分布。
Molecular Generative Adversarial Network (MolGAN) [69]

集成convGNNs[114]、GANs[115]和强化学习目标，来生成期望的Graph
MolGAN由一个生成器和一个鉴别器组成，相互竞争以提高生成器的真实性。

生成器试图提出一个伪图及其特征矩阵，而鉴别器则试图从经验数据中区分出伪样本。此外，在鉴别器的基础上，还引入了一个奖励网络，以鼓励生成的图具有一定的属性。
NetGAN [70]

将LSTMs [7]和Wasserstein GANs [116] 结合to generate graphs。然后利用判别器识别fake random walks

Sequential VS global

顺序方法将图线性化为序列。由于周期的存在，它们可能会丢失结构信息。
全局方法一次生成一张图，但是无法扩展到大型Graph上。

SPATIAL-TEMPORAL GRAPH NEURAL NETWORKS

overlall

在许多实际应用中的Graph在Graph structure和Graph input方面都是动态的，Spatial-temporal graph neural networks (STGNNs)用于捕获图的动态特性(同时捕获图的时间和空间依赖),
方法思路：对图的动态输入进行建模，同时假设连接节点之间的依赖关系
实现方法：RNN-based，CNN-based
实现任务: 预测未来节点值或标签，预测时空图形标签

paper

RNN-based方法 [48], [71], [72].GCRN，DCRNN，Structural-RNN
CNN-based方法：CGCN ；ST-GCN；Graph WaveNet [76]

发展过程

RNN-based

标准的RNN：
$\mathbf{H}^{(t)}=\sigma\left(\mathbf{W} \mathbf{X}^{(t)}+\mathbf{U H}^{(t-1)}+\mathbf{b}\right)$
使用图卷积:
$\mathbf{H}^{(t)}=\sigma\left(\operatorname{Gconv}\left(\mathbf{X}^{(t)}, \mathbf{A} ; \mathbf{W}\right)+\operatorname{Gconv}\left(\mathbf{H}^{(t-1)}, \mathbf{A} ; \mathbf{U}\right)+\mathbf{b}\right)$

Graph Convolutional Recurrent Network (GCRN) 将LSTM结合ChebNet。
Diffusion Convolutional Recurrent Neural Network (DCRNN) 将diffusion graph convolutional layer和GRU结合
DCRNN采用编解码框架来实现对节点未来K步值的预测

Structural-RNN[73]包括两种RNN:node-RNN 和 an edge-RNN分别传递节点信息和边信息，整合信息是通过将edge-RNN的输出作为node-RNN输入。由于对不同的节点和边采取不同的RNN增加了模型的复杂度，划分语义组，同一语义组中节点和边共享同一个RNN模型

CNN-based

由于基于RNN的方法存在耗时的迭代传播和梯度爆炸/消失问题
基于CNN的方法：非递归处理，可并行计算、能稳定梯度、低内存需求
网络的输入为： $\mathcal{X} \in R^{T \times n \times d}$ ,图卷积层聚合在每一个时间步的空间信息( $\mathcal{X}_{[i, :,:]}$ )，1D-CNN延时间轴滑动 $\mathcal{X}_{[:, i,:]}$ 聚合时间信息。

预先定义的图结构

CGCN [74]

交叉ChebNet和1D-CNN，搭建spatial-temporal块(1D convolutional layer, a graph convolutional layer and another gated 1D convolutional layer )，
ST-GCN [75]

使用一维卷积层和PGC层组成spatial-temporal块

利用时空图的snapshots(快照，相当于动态图的某些时刻的图)学习latent静态图结构

Graph WaveNet [76]

提出自适应邻接矩阵（self-adaptive adjacency matrix）定义:
$\mathbf{A}_{a d p}=\operatorname{SoftMax}\left(\operatorname{ReLU}\left(\mathbf{E}_{1} \mathbf{E}_{2}^{T}\right)\right)$
SoftMax函数是沿着行维计算的, $E_1$ 表示源节点嵌入， $E_2$ 表示带有可学习参数的目标节点嵌入。通过将 $E_1$ 与 $E_2$ 相乘，可以得到源节点与目标节点之间的依赖权值,在没有给出邻接矩阵的情况下表现也相当不错

学习潜在的动态空间依赖关系可以进一步提高模型的精度
GaAN [48] RNN-based

注意力机制学习动态空间依赖关系，在给定当前节点输入的情况下，使用注意力函数更新两个连接节点之间的边权值。
ASTGCN [77] CNN-based

更进一步，空间注意函数和时间注意函数，学习潜在的动态空间依赖和时间依赖

不过学习节点的空间依赖，需要计算每对节点的权重，时间复杂度为 $O(n^2)$ .

应用

As graph-structured data are ubiquitous, GNNs have a wide variety of applications.

在评估节点分类时的两个缺陷：

所有实验中使用相同的训练/有效/测试分割会低估泛化误差。
不同的方法采用不同的训练技术，如超参数调优、参数初始化、学习率衰减和早期停止。

为了更公平的比较，参考：Shchur et al. [131].

图分类中:使用双cv交叉验证法：(使用外部的k次折叠cv进行模型评估，使用内部的k次折叠cv进行模型选择)

应用领域

Computer vision

scene graph generation, (图像解析为由对象及其语义关系组成的语义图)

论文: [137], [138], [139].

论文: [140]给定场景图，生成真实图，利用文本描述生成场景图，接着生成真实图
point clouds classification, and

[141], [142],[143] 将点云转化为k近邻图或者超点图，利用图卷积研究其拓扑结构
action recognition

识别视频中包含的人类动作，一些解决方案可以检测视频剪辑中人体关节的位置，[73], [75] 使用 STGNNs学习人类的动作模式。

人-物交互[144]、少镜头图像分类[145]、[146]、[147]、语义分割[148]、[149]、视觉推理[150]、问题回答[151]。

Natural language processing

文本分类，利用文档或单词之间的相互关系来推断文档标签[22]、[42]、[43]
自然语言数据虽然是顺序结构的，但是也包含一个内部图结构(syntactic dependency tree.)

Traffic

在智能交通系统中，预测交通网络中的交通速度、交通量或道路密度是至关重要的。[48]，[72]，[74]使用STGNNs解决流量预测问题。

出租车需求预测。根据历史出租车需求、位置信息、天气数据和事件特征，从而预测某一时段内某一位置的出租车需求数量。

Chemistry

其他

program verification [17],
program reasoning [166],
social influence prediction [167],
adversarial attacks prevention [168],
electrical health records modeling [169], [170],
brain networks [171],
event detection [172], and
combinatorial optimization [173].

未来方向

Model depth

由于图卷积将相邻节点的表示法推得更近，理论上，在无限个图卷积层的情况下，所有节点的表示法都将收敛于一个单点。这就提出了一个问题：对于学习图表数据来说，深入学习是否仍然是一个很好的策略。
Scalability trade-off

破坏图的完整性为代价，获得的GNN的可扩展性，无论是抽样还是聚类，模型都会丢失部分图的信息：抽样，一个节点可能会错过它的有影响的邻居；聚类，一个图可能被剥夺了一个独特的结构模式。、
Heterogenity异构性

当前大多数GNN采取同构图，很难将当前的GNNs应用到异构图中，需要开发新的方法来发展解决异构图处理。
动态图

STGNNs可以解决部分的图的动态性，但是很少考虑在动态空间关系下进行图卷积.

你可能感兴趣的:(图神经网络,GNN综述,论文笔记)

Transformer与图神经网络的融合与应用 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer与图神经网络的融合与应用关键词：Transformer,图神经网络,注意力机制,图结构数据,图表示学习,图分类,图生成1.背景介绍近年来，深度学习技术在各个领域取得了显著的进展。其中，Transformer模型和图神经网络（GraphNeuralNetworks,GNNs）是两个备受关注的研究方向。Transformer最初应用于自然语言处理领域，通过自注意力机制实现了并行计
DeepSeek混合专家架构赋能智能创作智能计算研究中心其他
内容概要在人工智能技术加速迭代的当下，DeepSeek混合专家架构（MixtureofExperts）通过670亿参数的动态路由机制，实现了多模态处理的范式突破。该架构将视觉语言理解、多语言语义解析与深度学习算法深度融合，构建出覆盖文本生成、代码编写、学术研究等场景的立体化能力矩阵。其核心优势体现在三个维度：精准化内容生产——通过智能选题、文献综述自动生成等功能，将学术论文写作效率提升40%以上；
多机器人系统感知能力和控制体系结构综述罗伯特之技术屋人工智能与智能系统专栏机器人
摘要:为了促进多机器人系统(multirobotsystem,MRS)的智能化、无人化发展，并提升MRS在不同工作环境中的探测能力和系统的灵活性，本文从MRS的感知能力及其控制系统架构的角度出发，深度调研并分析了MRS相关的研究与工作，重点探讨了空中、地面、水面、水下4种应用环境下的MRS感知能力与控制系统架构，并对未来的研究方向进行展望。本文的结果可对于后续MRS在感知方法和控制系统的选用上提供
《基于图神经网络的安卓应用检测系统设计与实现》开题报告大数据蟒行探索者毕业论文/研究报告神经网络 android 人工智能机器学习大数据深度学习 python
个人主页：@大数据蟒行探索者目录一、课题的研究目的和意义1.研究目的2.研究意义二、国内(外)研究现状及分析1.国内研究现状2.国外研究现状3.研究分析三、课题主要研究内容及可行性分析1.研究内容2.可行性分析四、研究方案和技术途径1.研究方案2.技术途径五、外部条件及解决办法1.开发环境2.解决办法六、主要参考文献一、课题的研究目的和意义1.研究目的随着智能手机的普及，安卓操作系统成为全球最为广
使用Deepseek书写一篇综述论文，如何提示？学术乙方小知识经验分享
使用DeepSeek撰写综述论文时，可以通过以下提示和步骤来高效完成任务：明确研究主题与范围在开始撰写之前，首先需要明确研究主题、文献综述的时间跨度、地理范畴和文献类型。这有助于聚焦研究方向，避免偏离主题。制定详细的提示词提示词的设计是高效利用DeepSeek的关键。可以参考以下模板：研究背景与现状：请帮我梳理XXX领域的研究背景与现状，包括国内外的主要研究成果和研究热点。文献筛选与阅读：请帮我筛
A Survey of Large Language Models大模型综述论文章节总结 WhyteHighmore 论文语言模型人工智能自然语言处理论文笔记
ASurveyofLLM人大译ASurveyofLargeLanguageModels这篇论文全面回顾了大型语言模型(LLM)的最新进展，重点关注其发展背景、关键发现和主流技术。文章主要围绕LLM的四个主要方面展开：1引言自从1950年图灵测试被提出以来，人类一直在探索机器掌握语言智能的方法。语言本质上是一种受语法规则支配的复杂、精细的人类表达系统，这使得开发能够理解和掌握语言的强大人工智能(AI
A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用王金-太想进步了语言模型人工智能自然语言处理
应用尽管预训练为大型语言模型（LLMs）赋予了强大的基础能力，但在部署于专业领域时，LLMs仍经常遇到持续的限制，包括上下文长度受限、容易产生幻觉（hallucination）、推理能力欠佳和固有的偏见。在现实世界的应用中，这些不足显得尤为重要，因为在这些场景中，精确性、可靠性和伦理一致性是至关重要的。这些问题引发了一些根本性的探讨：(1)如何系统地提高LLM的表现以满足特定领域的需求？(2)在实
论文笔记-Contrastive Learning for Unpaired Image-to-Image Translation kingsleyluoxin 计算机视觉论文笔记深度学习 python 计算机视觉机器学习人工智能深度学习
论文信息标题：ContrastiveLearningforUnpairedImage-to-ImageTranslation作者：TaesungPark,AlexeiA.Efros,RichardZhang,Jun-YanZhu机构：UniversityofCalifornia,Berkeley;AdobeResearch代码链接https://github.com/taesungp/contra
DeepSeek高能低耗AI创作突破智能计算研究中心其他
内容概要随着人工智能技术向垂直领域加速渗透，生成式模型的应用边界正经历革命性拓展。DeepSeek系列产品通过670亿参数混合专家架构，构建起覆盖学术研究、内容创作与编程开发的多模态解决方案。该架构融合视觉语言理解与多语言处理能力，在保持高响应速度的同时，显著降低算力消耗，其单位计算成本仅为同类产品的三分之一。值得关注的是，系统搭载的DeepSeekProver学术引擎可自动生成文献综述框架，而D
论文笔记：Deep Algorithm Unrolling for Blind Image Deblurring 爱学习的小菜鸡论文笔记去模糊图像处理神经网络
这是一篇CVPR2020的去模糊论文，主要是通过传统与深度相结合，将迭代次数变成神经网络的层数，使网络结构的网络结构更加具有解释性。主要贡献：DeepUnrollingforBlindImageDeblurring(DUBLID)：提出一种可解释的神经网络结构叫做DUBLID，首先提出一种迭代算法，该算法被认为是梯度域中传统的广义全变分正则方法(generalizedTV-regularizeda
中国智能汽车行业市场需求趋势与发展战略规划建议报告2022-2028年版 qq_1106715599 postman
中国智能汽车行业市场需求趋势与发展战略规划建议报告2022-2028年版【撰写单位】：鸿晟信合研究院【报告目录】:第1章：智能汽车行业发展综述1.1智能汽车的界定1.1.1智能汽车的概念1.1.2智能汽车结构1.1.3智能汽车的体系架构1.1.4智能汽车核心价值分析1.1.5《国民经济行业分类与代码》中智能汽车行业归属1.2智能汽车的等级划分1.2.1美国标准1.2.2中国标准（1）驾驶自动化等级
A survey on instance segmentation: state of the art——论文笔记栀子清茶 1024程序员节论文阅读计算机视觉人工智能笔记学习
摘要这篇论文综述了实例分割的研究进展，定义其为同时解决对象检测和语义分割的问题。论文讨论了实例分割的背景、面临的挑战、技术演变、常用数据集，并总结了相关领域的最新成果和未来研究方向。实例分割的发展从粗略的对象分类逐步演变为更精细的像素级别推理，广泛应用于自动驾驶、机器人等领域。论文为研究人员提供了对实例分割领域的全面了解和有价值的参考。一、简介第一部分“简介”主要介绍了实例分割的背景、定义和挑战。
如何快速写开题报告？我是宝库人工智能经验分享学习方法毕业论文开题报告毕业设计毕设
又到了毕业季，你是不是内心已经十分捉急？开题报告还没开始写？该怎么写？写好开题报告，就是论文成功的开始！开题报告越细致，论文的写作就越有方向和思路。每个学校都会出台关于开题报告的相关要求也会给到相关模板，同学们可以自己到学校的官网下载相关模板。一般而言，开题报告包括以下六个部分的内容：1.研究背景和意义2.文献综述3.研究提纲及预期贡献4.研究进度5.拟采用的研究方法、手段及采取的措施6.可能遇见
MATLAB算法实战应用案例精讲-【深度学习】归一化林聪木 matlab 算法深度学习
目录为什么要做特征归一化/标准化？常用featurescaling方法计算方式上对比分析featurescaling需要还是不需要什么时候需要featurescaling？什么时候不需要FeatureScaling？归一化基础知识点1.什么是归一化2.为什么要归一化3.为什么归一化能提高求解最优解的速度4.归一化有哪些类型5.不同归一化的使用条件6.归一化和标准化的联系与区别层归一化综述提出背景概
[论文解读] 多机器人系统动态任务分配综述「已注销」算法
https://www.emerald.com/insight/content/doi/10.1108/IR-04-2020-0073/full/html多机器人/多智能体动态环境任务分配决策动态任务调度策略该文章主要是想对目前stateoftheart多机器人动态任务调度策略做一个全面的评价，注意定语挺多的，里面的方法也较多为近几年的智能调度那些算法。衡量方法主要考虑到了应用场景、限制、目标方程
图神经网络学习笔记—高级小批量处理（专题十四） AI专题精讲图神经网络入门到精通人工智能
小批量（mini-batch）的创建对于让深度学习模型的训练扩展到海量数据至关重要。与逐条处理样本不同，小批量将一组样本组合成一个统一的表示形式，从而可以高效地并行处理。在图像或语言领域，这一过程通常通过将每个样本缩放或填充为相同大小的形状来实现，然后将样本在一个额外的维度中分组。该维度的长度等于小批量中分组的样本数量，通常称为batch_size。由于图是能够容纳任意数量节点或边的最通用的数据结
学习面向对象编程之前的准备工作（二）笺上山河梦 C++学习 c++算法开发语言
综述本次学习的所有知识点如下：/**C++struct使用*//**Filename:StructDemo.cpp*AuthorName:xxx*Date:2025.3.10*Email:xxxxxxxxxxxxxx*Function:DemonstrationtohowtousethestructureofC++.*/#include#includeusingnamespacestd;//结构体
React Native 性能调试指南一个前端人 react-native react native react.js javascript
写在前面在开发ReactNative应用时，性能优化是一个至关重要的环节。良好的性能不仅可以提升用户体验，还能减少应用的资源消耗，提高应用的稳定性。本文将详细介绍如何对ReactNative应用进行性能调试和优化，包括性能综述、编译速度优化、列表配置优化、JavaScript加载优化以及Profiling。一、性能综述在开始性能调试之前，了解一些基本概念和工具是非常重要的。以下是一些关键点：FPS
Nature：OpenAI的deep research工具对科研人员有用吗？迪娜学姐人工智能论文阅读论文笔记 prompt
OpenAI的deepresearch工具对科研人员有用吗？它有哪些优缺点？来看看全球学术界专家的评价。科技巨头OpenAI发布了一款名为“深度研究”的付费访问工具，该工具能够将来自数十乃至数百个网站的信息综合成一份数页长的引用报告。此工具与谷歌去年12月发布的同名“深度研究”功能类似，能在短短数十分钟内完成相当于数小时的工作量。许多科学家对其撰写文献综述或整篇综述论文的能力，甚至识别知识空白的能
基于多模态大模型的不完整多组学数据特征选择策略 m0_65156252 人工智能
基于多模态大模型的不完整多组学数据特征选择策略是当前生物信息学和精准医学领域的一个前沿问题。在多组学数据中，通常包括不同层次的生物信息（如基因组、转录组、蛋白质组、代谢组等），这些数据通常存在缺失、噪声或不一致的情况。因此，如何有效地在这些不完整的数据中进行特征选择，是实现精确疾病预测和个性化治疗的关键。结合多模态大模型（如自监督学习、图神经网络、Transformer等）可以有效解决这一问题。以
基于大模型预测的巨细胞病毒视网膜炎诊疗全流程研究报告 LCG元围术期危险因子预测模型研究人工智能
目录一、引言1.1研究背景与意义1.2研究目的1.3研究方法与创新点二、巨细胞病毒视网膜炎概述2.1疾病定义与特点2.2流行病学分析2.3现有治疗手段综述三、大模型技术原理与应用现状3.1大模型介绍3.2在医疗领域的应用案例3.3选择大模型预测巨细胞病毒视网膜炎的原因四、术前预测与评估4.1数据收集与整理4.2大模型预测模型的构建4.3预测内容与指标4.4案例分析：术前预测实例展示五、术中方案制定
论文阅读笔记：Graph Matching Networks for Learning the Similarity of Graph Structured Objects 游离态GLZ不可能是金融技术宅知识图谱机器学习深度学习人工智能
论文做的是用于图匹配的神经网络研究，作者做出了两点贡献:证明GNN可以经过训练，产生嵌入graph-leve的向量可以用于相似性计算。作者提出了一种新的基于注意力的跨图匹配机制GMN(cross-graphattention-basedmatchingmechanism)，来计算出一对图之间的相似度评分。（核心创新点）论文证明了该模型在不同领域的有效性，包括具有挑战性的基于控制流图(control
【存储中间件】MongoDB最热门NoSql数据库（一）：NoSQL、MongoDB介绍道友老李架构师进阶-存储中间件 nosql mongodb 中间件
文章目录1.MongoDb综述1.1.什么是Nosql1.2.什么是MongoDb**1.2.1核心特性****1.2.2典型应用场景****1.2.3与关系型数据库对比****1.2.4局限性及使用建议**个人主页：道友老李欢迎加入社区：道友老李的学习社区1.MongoDb综述1.1.什么是NosqlNoSQL（NotOnlySQL）是一类非关系型数据库的统称，其核心特征在于突破传统关系型数据库
计算机视觉图像处理面试笔试题整理——边缘检测 fpga和matlab 图像处理计算机视觉图像面试笔试计算机视觉面试笔试
目录1.边缘检测综述2.Roberts算子3.Prewitt算子4.Sobel算子5.Laplace算子6.Canny1.边缘检测综述边缘检测是图像处理和计算机视觉中，尤其是特征提取中的一个研究领域。图像边缘检测大幅度地减少了数据量，并且剔除了可以认为不相关的信息，保留了图像重要的结构属性。图像边缘是图像最基本的特征，所谓**边缘**(Edge)是指图像局部特性的不连续性。灰度或结构等信息的突变处
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 音视频机器学习人工智能深度学习计算机视觉 transformer
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
高斯Splatting：3D 重建与新视图合成的综述三谷秋水人工智能机器学习计算机视觉计算机视觉人工智能深度学习
24年5月来自挪威大学的论文“GaussianSplatting:3DReconstructionandNovelViewSynthesis,aReview”。基于图像的3D重建是一项具有挑战性的任务，涉及从一组输入图像中推断出目标或场景的3D形状。基于学习的方法因其直接估计3D形状的能力而备受关注。这篇论文重点介绍3D重建的最新技术，包括生成新的、未见过的视图。高斯Splatting方法的最新发
中国团体保险行业发展规模及投资发展趋向研究报告2021-2027年 Le9420 电子商务
第1章：中国团体保险行业发展综述1.1团体保险行业定义及特点1.1.1团体保险行业的定义1.1.2团体保险行业产品/业务特点（1）团体保险与个人保险（2）团体保险与社会统筹保险1.2团体保险行业统计标准1.2.1团体保险行业统计口径1.2.2团体保险行业统计方法1.2.3团体保险行业数据种类1.2.4团体保险行业研究范围（1）团体人寿保险（2）团体健康保险（3）团体意外伤害保险第2章：美国团体健康
10.【线性代数】—— 四个基本子空间 sda42342342423 math 线性代数基本子空间
十、四个基本子空间1.列空间C(A)C(A)C(A)inRmR^mRm2.零空间N(A)N(A)N(A)inRnR^nRn3.行空间C(AT)C(A^T)C(AT)inRnR^nRn4.左零空间N(AT)N(A^T)N(AT)inRmR^mRm综述5.新的向量空间讨论矩阵Am∗nA_{m*n}Am∗n的四个基本空间，m行n列1.列空间C(A)C(A)C(A)inRmR^mRm[col11col21
LLM论文笔记 20: How to think step-by-step: A mechanistic understanding of chain-of-thought reasoning Zhouqi_Hua 大模型论文阅读人工智能 chatgpt 论文阅读机器学习深度学习语言模型
Arxiv日期：2024.5.16机构：IIT关键词CoT本质LLM推理本质核心结论1.CoT推理的功能组件尽管不同阶段的推理任务具有不同的推理需求，模型内部的功能组件几乎是相同的（共享而非独享）不同的神经算法实际上是由类似归纳头（inductionheads）等机制组合而成2.注意力机制中的信息流动attentionheads在不同的模型层之间传递信息，特别是当它们涉及到本体论相关（ontolo
基于信息间隙决策理论的碳捕集电厂调度(Matlab代码实现）砌墙_2301 matlab 算法人工智能
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述基于信息间隙决策理论（IGDT）的碳捕集电厂调度研究综述一、信息间隙决策理论（IGDT）的定义与核心原理二、碳捕集电厂调度的主要研究方向与挑战三、IGDT在碳捕集电厂调度中的模型框架四、现有调度方法的局限性及IGDT的改进五、实证研究案例分析六、总结与
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

A Comprehensive Survey on Graph Neural Networks论文阅读笔记

A Comprehensive Survey on Graph Neural Networks

细节点

摘要

介绍部分

将机器学习应用到Graph领域的问题

2D卷积和Graph卷积相似之处和区别

文章的贡献之处

文章框架

GNNs背景

GNNs和network embedding

GNNs和graph kernel methods

GNNs 符号

notations

Spatial-Temporal Graph定义

GNNs分类框架

网络结构划分

RecGNNs：学习节点表示

ConvGNNs：将网格数据的卷积推广到Graph

Graph autoencoders(GAEs):将nodes/Graphs编码到latent vector空间，接着重构

用处：

学习网络嵌入表示

Spatial-temporal graph neural networks (STGNNs)

应用场景

按不同图分析任务划分

Node-level

Edge-level

Graph-level

按训练框架划分

Semi-supervised learning for node-level classification

Supervised learning for graph-level classification.

Unsupervised learning for graph embedding

RecGNN和ConvGNN模型总结和复杂度分析

RGNN

论文阅读顺序

发展过程

RGNN 和 ConvsGNN区别

ConvGNNs

基于谱 VS 基于空间，空间Win!!!

overall

谱方法GCN

论文阅读顺序

发展过程

空间方法

overall

论文阅读顺序

发展过程

提升计算效率的一些方法

图Pooling模块

overall

paper

发展过程

理论方面的讨论

Shape of receptive field

VC维

Graph isomorphism

Equivariance and invariance

Universal approximation

GAE（Graph Autoencoders）

Network Embedding

overall

paper

发展过程

Graph Generation

overall

paper

发展过程

SPATIAL-TEMPORAL GRAPH NEURAL NETWORKS

overlall

paper

发展过程

RNN-based

CNN-based

应用

应用领域

Computer vision

Natural language processing

Traffic

推荐系统

Chemistry