文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS

文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS_第1张图片
[ 文献阅读·图卷积网络 ] SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS [1]

推荐理由:用巧妙的方法推出层与层之间的传播规则,很好地实现了半监督节点分类。

1.摘要&简介

  • 本文的“半监督”,首先体现在损失函数上,加入监督损失的损失函数长这样:
    L = L 0 + λ L r e g \mathcal{L}=\mathcal{L}_{0}+\lambda \mathcal{L}_{\mathrm{reg}} L=L0+λLreg
    其中, L 0 \mathcal{L}_{0} L0为监督损失项,而 L reg  \mathcal{L}_{\text {reg }} Lreg 的其具体表达式为:
    L reg  = ∑ i , j A i j ∥ f ( X i ) − f ( X j ) ∥ 2 = f ( X ) ⊤ Δ f ( X ) \mathcal{L}_{\text {reg }}=\sum_{i, j} A_{i j}\left\|f\left(X_{i}\right)-f\left(X_{j}\right)\right\|^{2}=f(X)^{\top} \Delta f(X) Lreg =i,jAijf(Xi)f(Xj)2=f(X)Δf(X)
  • 本文的工作有两部分组成:
    1. 提出一种简单且性能良好的直接作用于图的神经网络模型的逐层传播规则,并展示了如何从谱图卷积的一阶近似中激发它。
    2. 这种基于图的神经网络模型用于图中节点的快速和可伸缩的半监督分类。

2. 图的快速近似卷积

  • 首先来看一下本文的层与层的传播规则:
    H ( l + 1 ) = σ ( D ~ − 1 2 A ~ D ~ − 1 2 H ( l ) W ( l ) ) (2) H^{(l+1)}=\sigma\left(\tilde{D}^{-\frac{1}{2}} \tilde{A} \tilde{D}^{-\frac{1}{2}} H^{(l)} W^{(l)}\right)\tag{2} H(l+1)=σ(D~21A~D~21H(l)W(l))(2)
    其中 A ~ = A + I N \tilde{A}=A+I_{N} A~=A+IN D ~ i i = ∑ j A ~ i j \tilde{D}_{i i}=\sum_{j} \tilde{A}_{i j} D~ii=jA~ij H ( 0 ) = X H^{(0)}=X H(0)=X σ ( ⋅ ) \sigma(\cdot) σ()代表任何激活函数,比如ReLU等等。

2.1.谱图卷积

  • 谱图卷积一般定义为信号 x ∈ R N x \in \mathbb{R}^{N} xRN,与参数为 θ ∈ R N \theta \in \mathbb{R}^{N} θRN的滤波器 g θ = diag ⁡ ( θ ) g_{\theta}=\operatorname{diag}(\theta) gθ=diag(θ)的乘积:
    g θ ⋆ x = U g θ U ⊤ x (3) g_{\theta} \star x=U g_{\theta} U^{\top} x\tag{3} gθx=UgθUx(3)
    其中 U U U是标准化图拉普拉斯的特征向量, Λ \Lambda Λ是其特征值, U ⊤ x U^{\top} x Ux是信号x的图傅里叶变换。
  • 标准化的图拉普拉斯的定义为: L = I N − D − 1 2 A D − 1 2 = U Λ U ⊤ L=I_{N}-D^{-\frac{1}{2}} A D^{-\frac{1}{2}}=U \Lambda U^{\top} L=IND21AD21=UΛU,那 g θ g_{\theta} gθ就可以理解为L特征值的函数 g θ ( Λ ) g_{\theta}(\Lambda) gθ(Λ)
  • 但是式3的计算时间复杂度确实很高,所以本文引用了一个近似方法-切比雪夫多项式截断:
    g θ ′ ( Λ ) ≈ ∑ k = 0 K θ k ′ T k ( Λ ~ ) (4) g_{\theta^{\prime}}(\Lambda) \approx \sum_{k=0}^{K} \theta_{k}^{\prime} T_{k}(\tilde{\Lambda})\tag{4} gθ(Λ)k=0KθkTk(Λ~)(4)
    其中 Λ ~ = 2 λ max ⁡ Λ − I N \tilde{\Lambda}=\frac{2}{\lambda_{\max }} \Lambda-I_{N} Λ~=λmax2ΛIN,而切比雪夫多项式被定义为一种递归式: T k ( x ) = 2 x T k − 1 ( x ) − T k − 2 ( x ) T_{k}(x)=2 x T_{k-1}(x)-T_{k-2}(x) Tk(x)=2xTk1(x)Tk2(x),且 T 0 ( x ) = 1 T_{0}(x)=1 T0(x)=1以及 T 1 ( x ) = x T_{1}(x)=x T1(x)=x
  • 则易得:
    g θ ′ ⋆ x ≈ ∑ k = 0 K θ k ′ T k ( L ~ ) x (5) g_{\theta^{\prime}} \star x \approx \sum_{k=0}^{K} \theta_{k}^{\prime} T_{k}(\tilde{L}) x\tag{5} gθxk=0KθkTk(L~)x(5)
    其中 L ~ = 2 λ max ⁡ L − I N \tilde{L}=\frac{2}{\lambda_{\max }} L-I_{N} L~=λmax2LIN,其时间复杂度直接从 O ( N 2 ) \mathcal{O}\left(N^{2}\right) O(N2)降为 O ( ∣ E ∣ ) \mathcal{O}(|\mathcal{E}|) O(E)

2.2.层层递进的线性模型

  • 近似到 λ max ⁡ ≈ 2 \lambda_{\max } \approx 2 λmax2时,式5可以被简化为:
    g θ ′ ⋆ x ≈ θ 0 ′ x + θ 1 ′ ( L − I N ) x = θ 0 ′ x − θ 1 ′ D − 1 2 A D − 1 2 x (6) g_{\theta^{\prime}} \star x \approx \theta_{0}^{\prime} x+\theta_{1}^{\prime}\left(L-I_{N}\right) x=\theta_{0}^{\prime} x-\theta_{1}^{\prime} D^{-\frac{1}{2}} A D^{-\frac{1}{2}} x\tag{6} gθxθ0x+θ1(LIN)x=θ0xθ1D21AD21x(6)
    则进一步有:
    g θ ⋆ x ≈ θ ( I N + D − 1 2 A D − 1 2 ) x (7) g_{\theta} \star x \approx \theta\left(I_{N}+D^{-\frac{1}{2}} A D^{-\frac{1}{2}}\right) x\tag{7} gθxθ(IN+D21AD21)x(7)
    这种形式就是一开始展现过的层与层之间传递的形式。

3.半监督节点分类

3.1.Example

文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS_第2张图片

  • 首先计算: A ^ = D ~ − 1 2 A ~ D ~ − 1 2 \hat{A}=\tilde{D}^{-\frac{1}{2}} \tilde{A} \tilde{D}^{-\frac{1}{2}} A^=D~21A~D~21,然后便是前向传播:
    Z = f ( X , A ) = softmax ⁡ ( A ^ ReLU ⁡ ( A ^ X W ( 0 ) ) W ( 1 ) ) (9) Z=f(X, A)=\operatorname{softmax}\left(\hat{A} \operatorname{ReLU}\left(\hat{A} X W^{(0)}\right) W^{(1)}\right)\tag{9} Z=f(X,A)=softmax(A^ReLU(A^XW(0))W(1))(9)
    在此基础上规定一个Cross-entropy loss:
    L = − ∑ l ∈ Y L ∑ f = 1 F Y l f ln ⁡ Z l f (10) \mathcal{L}=-\sum_{l \in \mathcal{Y}_{L}} \sum_{f=1}^{F} Y_{l f} \ln Z_{l f}\tag{10} L=lYLf=1FYlflnZlf(10)

4.论文实验

文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS_第3张图片
文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS_第4张图片
文献阅读19期:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS_第5张图片

参考文献

[1] Kipf T N, Welling M. Semi-supervised classification with graph convolutional networks[J]. arXiv preprint arXiv:1609.02907, 2016.

你可能感兴趣的:(每日一文,神经网络,机器学习,深度学习,人工智能)