公众号:图与推荐

[万字长文] 图神经网络的解释性综述

图神经网络的可解释性是目前比较值得探索的方向，今天解读的2021最新综述，其针对近期提出的 GNN 解释技术进行了系统的总结和分析，归纳对比了该问题的解决思路。作者还为GNN解释性问题提供了标准的图数据集和评估指标，将是这一方向非常值得参考的一篇文章。

fig1

论文标题：Explainability in Graph Neural Networks: A Taxonomic Survey
论文地址：https://arxiv.org/pdf/2012.15445.pdf

2万字长文，建议收藏慢慢看~

0.Abstract
1. Introduction
2. 总体框架
3.方法介绍
- 3.1 基于梯度/特征的方法（Gradients/Features-Based Methods）
- 3.2 基于扰动的方法（Perturbation-Based Methods）
- 3.3 基于代理的方法（Surrogate Methods）
- 3.4 分解方法（Decomposition Methods）
4. 模型级方法
5. 评估模型
- 5.1. Datasets
- 5.1.1. Synthetic data
- 5.1.2 Sentiment graph data
- 5.1.3 Molecule data
- 5.2 Evaluation Metrics
- 5.2.1 Fidelity/Infidelity
- 5.2.2 Sparsity
- 5.2.3 Stability
- 5.2.4 Accuracy
6. Conclusion
参考文献

0.Abstract

近年来，深度学习模型的可解释性研究在图像和文本领域取得了显著进展。然而，在图数据领域，既没有针对GNN可解释性的统一处理方法，也不存在标准的 benchmark 数据集和评估准则。在这篇论文中，作者对目前的GNN解释技术从统一和分类的角度进行了总结，阐明了现有方法的共性和差异，并为进一步的方法发展奠定了基础。此外，作者专门为GNN解释技术生成了 benchmark 图数据集，并总结了当前用于评估GNN解释技术的数据集和评估方法。

1. Introduction

解释黑箱模型是十分必要的：如果没有对预测背后的底层机制进行推理，深层模型就无法得到完全信任，这就阻碍了深度模型在与公平性、隐私性和安全性有关的关键应用程序中使用。为了安全、可信地部署深度模型，需要同时提供准确的预测和人类能领会的解释，特别是对于跨学科领域的用户。

深层模型的解释技术通常从研究其预测背后的潜在关系着手，解释技术大致可分为两类：

1）input-dependent explanations（依赖输入的解释方法）

该类方法从特征的角度出发，提供与输入相关的解释，例如研究输入特征的重要性得分，或对深层模型的一般行为有高水平的理解。论文 [10]，[11]，[18]通过研究梯度或权重，分析预测结果相对于输入特征的敏感程度。论文 [12]，[13]，[19] 通过将隐藏特征映射到输入空间，从而突出重要的输入特征。[14] 通过遮蔽不同的输入特征，观察预测的变化，以识别重要的特征。

2）input-independent explanations（独立于输入的解释方法）

与依赖特征的解释方法不同，该类方法从模型角度出发，提供独立于输入的解释，例如研究输入 patterns，使某类的预测得分最大化。论文[17]，[22]通过探究隐藏神经元的含义，进而理解的整个预测过程。论文[23]，[24]，[25]，[26] 对近期的方法进行了较为系统的评价和分类。然而，这些研究只关注图像和文本领域的解释方法，忽略了深度图模型的可解释性。

GNN 的可解释性

与图像和文本领域相比，对图模型解释性的研究较少，然而这是理解深度图神经网络的关键。近年来，人们提出了几种解释 GNN 预测的方法，如XGNN[41]、gnexplainer[42]、PGExplainer[43]等。这些方法是从不同的角度提供了不同层次的解释。但至今仍然**缺乏标准的数据集和度量来评估解释结果。**因此，需要对GNN解释技术和其评估方法进行系统的研究。

本文

本研究提供了对不同GNN解释技术的系统研究，目的对不同方法进行直观和高水平的解释，论文贡献如下：

对现有的深度图模型的解释技术进行了系统和全面的回顾。
提出了现有GNN解释技术的新型分类框架，总结了每个类别的关键思想，并进行了深刻的分析。
详细介绍了每种GNN解释方法，包括其方法论、优势、缺点，与其他方法的区别。
总结了GNN解释任务中常用的数据集和评价指标，讨论了它们的局限性，并提出了几点建议。
通过将句子转换为图，针对文本领域构建了三个人类可理解的数据集。这些数据集即将公开，可以直接用于GNN解释任务。

名词解释：Explainability versus Interpretability

在一些研究中，“explainability” 和 “interpretability”被交替使用。本文作者认为这两个术语应该被区分开来，遵循论文[44]来区分这两个术语。如果一个模型本身能够对其预测提供人类可理解的解释，则认为这个模型是 "interpretable"。注意，这样的模型在某种程度上不再是一个黑盒子。例如，一个决策树模型就是一个 "interpretable“的模型。同时，"explainable "模型意味着该模型仍然是一个黑盒子，其预测有可能被一些事后解释技术所理解。

2. 总体框架

目前存在一系列针对深度图模型解释性问题的工作，这些方法关注图模型的不同方面，并提供不同的观点来理解这些模型。它们一般都会从几个问题出发实现对图模型的解释：哪些输入边更重要？哪些输入节点更重要？ 哪些节点特征更重要？什么样的图模式会最大限度地预测某个类？为了更好地理解这些方法，本文为GNNs的不同解释技术提供了分类框架，结构如图1所示。根据提供什么类型的解释，解释性技术被分为两大类：实例级方法和模型级方法。本文接下来的部分将针对图1的各个分支展开讲解，并作出对比。

图1 GNN 解释性方法分类框架

1）实例级方法

实例级方法与特征工程的思想有些类似，旨在找到输入数据中最能够影响预测结果的部分特征，为每个输入图提供 input-dependent 的解释。给定一个输入图，实例级方法旨在探究影响模型预测的重要特征实现对深度模型的解释。根据特征重要性分数的获得方式，作者将实例级方法分为四个不同的分支：

基于梯度/特征的方法[49]，[50]，采用梯度或特征值来表示不同输入特征的重要程度。
基于扰动的方法[42]，[43]，[51]，[52]，[53]，监测在不同输入扰动下预测值的变化，从而学习输入特征的重要性分数。
基于分解的方法[49]，[50]，[54]，[55]，首先将预测分数，如预测概率，分解到最后一个隐藏层的神经元。然后将这样的分数逐层反向传播，直到输入空间，并将分解分数作为重要性分数。
基于代理的方法[56]，[57]，[58]，首先从给定例子的邻居中抽取一个数据集的样本。接下来对采样的数据集合拟合一个简单且可解释的模型，如决策树。通过解释代理模型实现对原始预测的解释。

2）模型级方法

模型级方法直接解释图神经网络的模型，不考虑任何具体的输入实例。这种 input-independent 的解释是高层次的，能够解释一般性行为。与实例级方法相比，这个方向的探索还比较少。现有的模型级方法只有XGNN[41]，它是基于图生成的，通过生成 graph patterns使某一类的预测概率最大化，并利用 graph patterns 来解释这一类。

总的来说，这两类方法从不同的角度解释了深度图模型。实例级方法提供了针对具体实例的解释，而模型级方法则提供了高层次的见解和对深度图模型工作原理的一般理解。

fig1

"Type "表示提供什么类型的解释，"Learning "表示是否涉及学习过程，"Task "表示每种方法可以应用于什么任务（GC表示图分类，NC表示节点分类），"Target "表示解释的对象（N表示节点，E表示边，NF表示节点特征，Walk表示图游走），"Black-box "表示在解释阶段是否将训练好的GNNs作为黑盒处理，"Flow "表示解释的计算流程，"Design "表示解释方法是否有针对图数据的具体设计。

3.方法介绍

3.1 基于梯度/特征的方法（Gradients/Features-Based Methods）

采用梯度或特征来解释深度模型是最直接的解决方案，在图像和文本任务中被广泛使用。其关键思想是将梯度或隐藏的特征图值作为输入重要性的近似值。一般来说，在这类方法中，梯度或特征值越大，表示重要性越高。需要注意的是，梯度和隐藏特征都与模型参数高度相关，那么这样的解释可以反映出模型所包含的信息。本文将介绍最近提出的几种方法，包括：SA[49]、Guided BP[49]、CAM[50]和Grad-CAM[50]。这些方法的关键区别在于梯度反向传播的过程以及如何将不同的隐藏特征图结合起来。

1）SA

SA[49]直接采用梯度的平方值作为不同输入特征的重要性得分。输入特征可以是图节点、边或节点特征。它假设绝对梯度值越高，说明相应的输入特征越重要。虽然它简单高效，但有几个局限性：1）SA方法只能反映输入和输出之间的敏感程度，不能很准确地表达重要性(敏感度不等于重要性)。2）还存在饱和问题[59]。即在模型性能达到饱和的区域，其输出相对于任何输入变化的变化都是十分微小的，梯度很难反映输入的贡献程度。

2）Guided BP

Guided BP[49]与SA有着相似的思想，但修改了反向传播梯度的过程。由于负梯度很难解释，Guided BP只反向传播正梯度，而将负梯度剪成零。因此Guided BP与SA有着相同的局限性。

3）CAM

CAM [50] 将最后一层的节点特征映射到输入空间，从而识别重要节点。它要求GNN模型采用全局平均池化层和全连接层作为最终分类器。CAM将最终的节点嵌入，通过加权求和的方式组合不同的特征图，从而获得输入节点的重要性分数。权重是从与目标预测连接的最终全连接层获得的。该方法非常简单高效，但仍有几大限制：1）CAM对GNN结构有特殊要求，限制了它的应用和推广。2）它假设最终的节点嵌入可以反映输入的重要性，这是启发式的，可能不是真的。3）它只能解释图分类模型，不能应用于节点分类任务中。

4）Grad-CAM

Grad-CAM [50] 通过去除全局平均池化层的约束，将CAM扩展到一般图分类模型。同样，它也将最终的节点嵌入映射到输入空间来衡量节点重要性。但是，它没有使用全局平均池化输出和全连接层输出之间的权重，而是采用梯度作为权重来组合不同的特征图。与CAM相比，Grad-CAM不需要GNN模型在最终的全连接层之前采用全局平均池化层。但它也是基于启发式假设，无法解释节点分类模型。

3.2 基于扰动的方法（Perturbation-Based Methods）

基于扰动的方法[14]，[15]，[60]被广泛用于解释深度图像模型。其根本动机是研究不同输入扰动下的输出变化。当重要的输入信息被保留（没有被扰动）时，预测结果应该与原始预测结果相似。论文 [14]，[15]，[60]学习一个生成器来生成掩码，以选择重要的输入像素来解释深度图像模型。然而，这种方法不能直接应用于图模型，图数据是以节点和边来表示的，它们不能调整大小以共享相同的节点和边数，结构信息对图来说至关重要，可以决定图的功能。

fig3

图2 基于扰动方法的一般流程

基于扰动的方法采用不同的掩码生成算法来获得不同类型的掩码。需要注意的是，掩码可以对应节点、边或节点特征。在这个例子中，我们展示了一个节点特征的软掩码，一个边的离散掩码和一个节点的近似离散掩码。然后，将掩码与输入图结合起来，得到一个包含重要输入信息的新图，遮蔽掉不需要的信息。最终将新图输入到训练好的GNN中，评估掩码并更新掩码生成算法。本文将介绍几种基于扰动的方法，包括：GNNExplainer[42]、PGExplainer[43]、ZORRO[51]、GraphMask[52]，Causal Screening[53]。直观地讲，掩码捕捉到的重要输入特征应该传达关键的语义意义，从而得到与原图相似的预测结果。这些方法的区别主要在于三个方面：掩码生成算法、掩码类型和目标函数。

软掩码包含[0，1]之间的连续值，掩码生成算法可以直接通过反向传播进行更新。但软掩码存在 "introduced evidence "的问题[14]，即掩码中任何非零或非一的值都可能给输入图引入新的语义或新的噪声，从而影响解释结果。同时，离散掩码只包含离散值0和1，由于没有引入新的数值，可以避免 "introduced evidence "问题。但是，离散掩码总是涉及到不可微的问题，如采样。主流的解决方法是策略梯度技术[61]。论文[45]，[62]，[63]提出采用重参数化技巧，如Gumbel-Softmax估计和稀疏松弛，来逼近离散掩码。需要注意的是，输出的掩码并不是严格意义上的离散掩码，而是提供了一个很好的近似值，这不仅可以实现反向传播，而且在很大程度上缓解了”introduced evidence“的问题。

接下来将详细的介绍目前存在的几种基于扰动的解释性方法，我们可以重点关注它们的作用对象（节点或边或节点特征），以及它们的掩码生成算法、掩码类型和目标函数。

1）GNNExplainer

GNNExplainer [42] 学习边和节点特征的软掩码，通过掩码优化来解释预测。软掩码被随机初始化，并被视为可训练变量。然后通过元素点乘将掩码与原始图结合。最大化原始图的预测和新获得的图的预测之间的互信息来优化掩码。但得到的掩码仍然是软掩码，因此无法避免 "introduced evidence"问题。此外，掩码是针对每个输入图单独优化的，因此解释可能缺乏全局视角。

2）PGExplainer

PGExplainer[43]学习边的近似离散掩码来解释预测。它训练一个参数化的掩码预测器来预测边掩码。给定一个输入图，首先通过拼接节点嵌入来获得每个边的嵌入，然后预测器使用边嵌入来预测边掩码。预测器使用边嵌入来预测每个边被选中的概率（被视为重要性分数）。通过重参数化技巧对近似的离散掩码进行采样。最后通过最大化原始预测和新预测之间的相互信息来训练掩码预测器。需要注意的是，即使采用了重参数化技巧，得到的掩码并不是严格意义上的离散掩码，但可以很大程度上缓解 "introduced evidence"的问题。由于数据集中的所有边都共享相同的预测器，因此解释可以提供对训练好的GNN的全局理解。

3）GraphMask

GraphMask[52]是一种事后解释GNN各层中边重要性的方法。与PGExplainer类似，它训练一个分类器来预测是否可以丢弃一条边而不影响原来的预测。然而，GraphMask为每一层GNN获取边掩码，而PGExplainer只关注输入空间。此外，为了避免改变图结构，被丢弃的边被可学习的基线连接所取代，基线连接是与节点嵌入相同维度的向量。需要注意的是，采用二进制Concrete分布[63]和重参数化技巧来近似离散掩码。此外，分类器使用整个数据集通过最小化一个散度项来训练，用于衡量网络预测之间的差异。与PGExplainer类似，它可以很大程度上缓解 "introduced evidence"问题，并对训练后的GNN进行全局理解。

3）ZORRO

ZORRO[51]采用离散掩码来识别重要的输入节点和节点特征。给定一个输入图，采用贪心算法逐步选择节点或节点特征。每一步都会选择一个fidelity score最高的节点或一个节点特征。通过固定所选节点/特征，并用随机噪声值替换其他节点/特征，来衡量新的预测与模型原始预测的匹配程度。由于不涉及训练过程，因此避免了离散掩码的不可微限制。此外，通过使用硬掩码，ZORRO不会受到 "introduced evidence "问题的影响。然而，贪婪的掩码选择算法可能导致局部最优解释。此外，由于掩码是为每个图形单独生成的，因此解释可能缺乏全局的理解。

4）Causal Screening

Causal Screening[53]研究输入图中不同边的因果归因。它为 explanatory subgraph 确定一个边掩码。关键思想是：研究在当前 explanatory subgraph 中增加一条边时预测的变化，即所谓的因果效应。对于每一步，它都会研究不同边的因果效应，并选择一条边添加到子图中。具体来说，它采用个体因果效应(ICE)来选择边，即测量在子图中添加不同边后的互信息(原图与解释子图的预测之间)差异。与ZORRO类似，Causal Screening是一种贪心算法，不需要任何训练过程就能生成离散掩码。因此，它不会受到 "introduced evidence "问题的困扰，但可能缺乏全局性的理解，而停留在局部最优解释上。

3.3 基于代理的方法（Surrogate Methods）

由于输入空间和输出预测之间的复杂和非线性关系，深度模型的解释具有挑战性。代理方法能够为图像模型提供实例级解释。其基本思想是化繁为简，既然无法解释原始深度图模型，那么采用一个简单且可解释的代理模型来近似复杂的深层模型，实现输入实例的邻近区域预测。需要注意的是，这些方法都是假设输入实例的邻近区域的关系不那么复杂，可以被一个较简单的代理模型很好地捕获。然后通过可解释的代理模型的来解释原始预测。将代理方法应用到图域是一个挑战，因为图数据是离散的，包含拓扑信息。那么如何定义输入图的相邻区域，以及什么样的可解释代理模型是合适的，都是不清楚的。

fig4

图3 代理模型的一般框架

给定一个输入图及其预测，它们首先对一个局部数据集进行采样，以表示目标数据周围的关系。然后应用不同的代理方法来拟合局部数据集。需要注意的是，代理模型一般都是简单且可解释的ML模型。最后，代理模型的解释可以看作是对原始预测的解释。本文将介绍最近提出的几种代理方法，包括：GraphLime[56]、RelEx[57]和PGM-Explainer[58]。这些方法的一般流程如图3所示。为了解释给定输入图的预测，它们首先获得一个包含多个相邻数据对象及其预测的局部数据集。然后拟合一个可解释模型来学习局部数据集。来自可解释模型的解释被视为原始模型对输入图的解释。不同代理模型关键的区别在于两个方面：如何获得局部数据集和选择什么代理模型。

1）GraphLime

GraphLime[56]将LIME[64]算法扩展到深度图模型，并研究不同节点特征对节点分类任务的重要性。给定输入图中的一个目标节点，将其N-hop 邻居节点及其预测值视为局部数据集，其中N的合理设置是训练的GNN的层数。然后采用非线性代理模型HSIC Lasso[65]来拟合局部数据集。根据HSIC Lasso中不同特征的权重，可以选择重要的特征来解释HSIC Lasso的预测结果。这些被选取的特征被认为是对原始GNN预测的解释。但是，GraphLime只能提供节点特征的解释，却忽略了节点和边等图结构，而这些图结构对于图数据来说更为重要。另外，GraphLime是为了解释节点分类预测而提出的，但不能直接应用于图分类模型。

2）RelEx

RelEx[57]结合代理方法和基于扰动的方法的思想，研究节点分类模型的可解释性。给定一个目标节点及其计算图(N-hop邻居)，它首先从计算图中随机采样连接的子图，获得一个局部数据集，并将这些子图喂入训练好的GNN，以获得其预测结果。从目标节点开始，它以BFS的方式随机选择相邻节点。采用GCN模型作为代理模型来拟合局部数据集。与GraphLime不同，RelEx中的代理模型是不可解释的。训练后，它进一步应用前述基于扰动的方法，如生成软掩码或Gumbel-Softmax掩码来解释预测结果。该过程包含了多个步骤的近似，比如使用代理模型来近似局部关系，使用掩码来近似边的重要性，从而使得解释的说服力和可信度降低。由于可以直接采用基于扰动的方法来解释原有的深度图模型，因此没有必要再建立一个不可解释的深度模型作为代理模型来解释。

3）PGM-Explainer

PGM-Explainer[58]建立了一个概率图形模型，为GNN提供实例级解释。局部数据集是通过随机节点特征扰动获得的。具体来说，给定一个输入图，每次PGM-Explainer都会随机扰动计算图中几个随机节点的节点特征。然后对于计算图中的任何一个节点，PGM-Explainer都会记录一个随机变量，表示其特征是否受到扰动，以及其对GNN预测的影响。通过多次重复这样的过程，就可以得到一个局部数据集。通过Grow-Shrink(GS)算法[66]选择依赖性最强的变量来减小局部数据集的大小。最后采用可解释的贝叶斯网络来拟合局部数据集，并解释原始GNN模型的预测。PGM-Explainer可以提供有关图节点的解释，但忽略了包含重要图拓扑信息的图边。此外，与GraphLime和RelEx不同的是，PGM-Explainer可以同时用于解释节点分类和图形分类任务。

3.4 分解方法（Decomposition Methods）

分解方法是另一种比较流行的解释深度图像分类器的方法，它通过将原始模型预测分解为若干项来衡量输入特征的重要性。然后将这些项视为相应输入特征的重要性分数。这些方法直接研究模型参数来揭示输入空间中的特征与输出预测之间的关系。需要注意的是，这些方法要求分解项之和等于原始预测得分。由于图包含节点、边和节点特征，因此将这类方法直接应用于图域是具有挑战性的。很难将分数分配给不同的边，图数据边包含着重要的结构信息，不容忽视。

图5 分解方法的一般流程

本文将介绍最近提出的几种用于解释深层图神经网络泛读分解方法，包括：Layerwise Relevance Propagation（LRP）[49]、[54]、Excitation BP[50]和GNN-LRP[55]。这些算法的主要思想是建立分数分解规则，将预测分数分配到输入空间。这些方法的一般流程如图4所示。以反向传播的方式逐层分发预测得分，直到输入层。从输出层开始，将模型的预测结果作为初始目标分数。然后将分数进行分解，并按照分解规则分配给上一层的神经元。通过重复这样的过程，直到输入空间，它们可以得到节点特征的重要性分数，这些分数可以组合起来表示边重要性、节点重要性和游走重要性。但是这些算法都忽略了深度图模型中的激活函数。不同分解方法的主要区别在于分数分解规则和解释的目标。

1）LRP

LRP[49]，[54]将原来的LRP算法[67]扩展到深度图模型。它将输出的预测分数分解为不同的节点重要性分数。分数分解规则是基于隐藏特征和权重制定的。对于一个目标神经元，其得分表示为上一层神经元得分的线性近似。目标神经元激活贡献度较高的神经元获得的目标神经元得分比例较大。为了满足保守属性，在事后解释阶段将邻接矩阵作为GNN模型的一部分，这样在分数分配时就可以忽略它，否则，邻接矩阵也会收到分解后的分数，从而使保守属性失效。由于LRP是直接根据模型参数开发的，所以其解释结果更具有可信度。但它只能研究不同节点的重要性，不能应用于图结构，如子图和游走。该算法需要对模型结构有全面的了解，这就限制了它对非专业用户的应用，如跨学科研究人员。

2）Excitation BP

Excitation BP[50]与LRP算法有着相似的思想，但它是基于全概率法则开发的。它定义了当前层中一个神经元的概率等于它输出给下一层所有连接神经元的总概率。那么分数分解规则可以看作是将目标概率分解为几个条件概率项。Excitation BP的计算与LRP中的z+规则高度相似。因此它与LRP算法有着相同的优点和局限性。

3）GNN-LRP

GNN-LRP[55]研究了不同图游走的重要性。由于在进行邻域信息聚合时，图游走对应于消息流，因此它对深层图神经网络更具有一致性。得分分解规则是模型预测的高阶泰勒分解。研究表明，泰勒分解（在根零处）只包含T阶项，其中T是训练的GNN的层数。那么每个项对应一个T阶图游走，可以视为其重要性得分。由于无法直接计算泰勒展开给出的高阶导数，GNN-LRP还遵循反向传播过程来逼近T阶项。GNN-LRP中的反向传播计算与LRP算法类似。然而，GNN-LRP不是将分数分配给节点或边，而是将分数分配给不同的图游走。它记录了层与层之间的消息分发过程的路径。这些路径被认为是不同的游走，并从它们对应的节点上获得分数。虽然GNN-LRP具有坚实的理论背景，但其计算中的近似值可能并不准确。由于每个游走都要单独考虑，计算复杂度很高。此外，对于非专业人员来说，它的使用也具有挑战性，尤其是对于跨学科领域。

4. 模型级方法

与实例级方法不同，模型级方法旨在提供一般性的见解和高层次的理解来解释深层图模型。它们研究什么样的输入图模式可以导致GNN的某种行为，例如最大化目标预测。输入优化[16]是获得图像分类器模型级解释的一个热门方向。但是，由于图拓扑信息的离散性，它不能直接应用于图模型，从而使GNN在模型层面的解释更具挑战性。它仍然是一个重要但研究较少的课题。据我们所知，现有的解释图神经网络的模型级方法只有XGNN[41]。

1）XGNN

XGNN[41]提出通过图生成来解释GNN。它不是直接优化输入图，而是训练一个图生成器，使生成的图能够最大化目标图预测。然后，生成的图被视为目标预测的解释，并被期望包含判别性的图模式。在XGNN中，图形生成被表述为一个强化学习问题。对于每一步，生成器都会预测如何在当前图中增加一条边。然后将生成的图输入到训练好的GNN中，通过策略梯度获得反馈来训练生成器。此外，还加入了一些图规则，以鼓励解释既有效又能被人类理解。XGNN是一个生成模型级解释的通用框架，因此可以应用任何合适的图生成算法。该解释是通用的，并且提供了对训练的GNNs的全局理解。然而XGNN只证明了其在解释图分类模型方面的有效性，XGNN是否可以应用于节点分类任务还不得而知，这是未来研究中需要探索的重要方向。

5. 评估模型

由于缺乏 ground truths，因此不容易对解释方法的结果进行评估，作者讨论并分析了几种常用的数据集和度量标准。

5.1. Datasets

需要选择合适的数据集来评估不同的解释技术，并且希望数据是直观的，易于可视化的。应该在数据实例和标签之间蕴含人类可以理解的理由，这样专家就可以验证这些理由是否被解释算法识别。为了评估不同的解释技术，通常采用几种类型的数据集，包括合成数据、情感图数据和分子数据。

5.1.1. Synthetic data

利用现有的合成数据集来评估解释技术[42]，[43]。在这样的数据集中，包含了不同的 graph motifs，可以通过它们确定节点或图的标签。数据实例和数据标签之间的关系由人类定义。即使经过训练的GNNs可能无法完美地捕捉到这样的关系，但graph motifs 可以作为解释结果的ground truths 的合理近似值。这里我们介绍几种常见的合成数据集。

BA-shapes：它是一个节点分类数据集，有4个不同的节点标签。对于每个图形，它包含一个基础图（300个节点）和一个类似房子的5节点 motif。需要注意的是，基础图是由Barab´asi-Albert（BA）模型获得的，它可以生成具有优先附加机制的随机无标度网络[68]。motif 被附加到基图上，同时添加随机边。每个节点根据其是否属于基础图或motif 的不同空间位置进行标注。

BA-Community：这是一个有8个不同标签的节点分类数据集。对于每个图，它是通过组合两个随机添加边的BA-shapes图获得的。节点标签由BA-shapes图的成员资格及其结构位置决定。

Tree-Cycle：它是一个有两个不同标签的节点分类数据集。对于每个图，它由深度等于8的基平衡树图和6节点周期 motif 组成。这两部分是随机连接的。基图中节点的标签为0，否则为1。

Tree-Grids：它是一个有两个不同标签的节点分类数据集。它与 Tree-Cycle 数据集相同，只是Tree-Grids数据集采用了9节点网格 motifs 而不是周期 motifs 。

BA-2Motifs：它是一个具有2种不同图标签的图形分类数据集。有800个图，每个图都是通过在基础BA图上附加不同的motif来获得的，如house-like motif 和 five-node cycle motif。不同的图是根据motif 的类型来标注的。

在这些数据集中，所有节点特征都被初始化为全1向量。训练好的GNNs模型要捕捉图结构来进行预测。然后根据每个数据集的构建规则，我们可以分析解释结果。例如，在BA-2Motifs数据集中，我们可以研究解释是否能够捕获motif结构。然而，合成数据集只包含图和标签之间的简单关系，可能不足以进行综合评估。

5.1.2 Sentiment graph data

由于人类只有有限的领域知识，传统的图数据集在理解上具有挑战性，因此需要构建人类可理解的图数据集。文本数据具有人类可理解的语义的单词和短语组成，因此可以成为图解释任务的合适选择，解释结果可以很容易地被人类评估。因此我们基于文本情感分析数据构建了三个情感图数据集，包括SST2[69]、SST5[69]和Twitter[70]数据集。

fig7

图5 文本情感图

对于每个文本序列，将其转换为一个图，每个节点代表一个单词，而边则反映不同单词之间的关系。作者采用Biaffine解析器[71]来提取词的依赖关系。图5中展示了生成的情感图的一个例子。生成的图是有向的，但边标签被忽略了，因为大多数GNNs不能捕获边标签信息。用BERT[72]来学习单词嵌入，并将这种嵌入作为图节点的初始嵌入。建立一个模型，采用预训练好的BERT作为特征提取器，采用一层平均池化的GCN作为分类器。最后预训练的BERT为每个词提取768维的特征向量，作为情感图数据中的节点特征。

作者建立了三个情感图数据集，分别为Graph-SST2、Graph-SST5和Graph-Twitter ，并即将公开，可以直接用于研究不同的可解释技术。这些数据集的统计和属性如表2所示。为了验证本文生成的情感数据集具有可解释信息，作者分别再新生成的情感数据集和原始数据集进行实验。作者展示了两层GNNs在这些数据集上的预测精度，包括GCNs、GATs和GINs。还展示了使用原始句子数据集的预训练的BERT[72]的微调精度。结果表明，与原始句子数据集相比，作者构建的情感图数据集可以达到具有竞争力的性能这些数据集是实现图模型解释的合理选择。根据不同词的语义和情感标签，我们可以研究可解释方法是否能识别出具有关键意义的词以及不同词之间的关系

5.1.3 Molecule data

分子数据集也被广泛用于解释任务，如MUTAG[73]、BBBP和Tox21[74]。这类数据集中的每个图对应一个分子，其中节点代表原子，边是化学键。分子图的标签一般由分子的化学功能或性质决定。采用这样的数据集进行解释任务需要领域知识，例如什么化学基团对其官能性更具有鉴别性。例如，在数据集MUTAG中，不同的图形是根据它们对细菌的诱变作用来标注的。例如，已知碳环和NO2化学基团可能导致诱变效应[73]，那么可以研究可解释方法是否能识别出对应类别的 patterns

（在不同的领域中，不同的局部结构是具有区分力的，可解释方法是否能够识别这些模式？）

5.2 Evaluation Metrics

即使可视化的结果可以让人理解解释性方法是否合理，但由于缺乏 ground truths，这种评估并不完全可信。为了比较不同的解释性方法，我们需要研究每个输入样例的结果，这很耗时。因此评估度量对于研究可解释方法至关重要。好的度量方法应该从模型的角度来评估预测结果，比如解释是否忠实于模型[75]，[76]。作者将介绍最近提出的几种针对解释性问题的评估度量方法。

5.2.1 Fidelity/Infidelity

首先，从模型的预测结果上分析解释性方法的性能，解释应该忠于模型，解释方法应该识别对模型重要的输入特征。为了评估这一点，最近提出了Fidelity[50]度量方法。关键思想在于如果解释技术所识别的重要输入特征（节点/边/节点特征）对模型具有判别力，那么当这些特征被移除时，模型的预测结果应该会发生显著变化。因此，Fidelity被定义为原始预测与遮蔽掉重要输入特征后的新预测之间的精度之差[50]，[77]，即衡量两种预测结果的差异性。

可解释方法可以看作是一个硬重要性映射，其中元素为 0（表示特征不重要）或1（表示特征重要）。对于现有方法，例如ZORRO[51] 和 Causal Screening[53] 等方法，生成的解释是离散掩码，可以直接作为重要性映射。对于 GNNExplainer[42] 和 GraphLime[56] 等方法，重要性分数是连续值，那么可以通过归一化和阈值化得到重要性地映射。最后，预测精度的Fidelity得分可以计算为:

其中是图的原始预测，是图的数量。表示去掉重要输入特征的补全掩码，是将新图输入训练好的GNN 时的预测值。指示函数如果和相等则返回1，否则返回0。注意，指标研究的是预测精度的变化。通过对预测概率的关注，概率的Fidelity可以定义为:

其中，代表基于互补掩码，保留的特征得到的新图。需要注意的是，监测的是预测概率的变化，比更敏感。对于这两个指标来说，数值越高，说明解释结果越好，识别出的判别特征越多。

Fidelity度量通过去除重要节点/边/节点特征来研究预测变化。相反，Infidelity度量通过保留重要的输入特征和去除不重要的特征来研究预测变化。直观地讲，重要特征应该包含判别信息，因此即使去掉不重要的特征，它们也应该导致与原始预测相似的预测。从形式上看，度量Infidelity可以计算为：

其中是根据映射保留的重要特征时的新图，是新的预测值。需要注意的是，对于和来说，数值越低，说明去掉的特征重要信息越少，这样解释结果越好

5.2.2 Sparsity

从输入图数据的角度来分析解释性方法的性能，解释性方法应该是稀疏的，这意味着它们应该捕捉最重要的输入特征，而忽略不相关的特征，可以用稀疏度（Sparsity）指标衡量这样个特性。具体来说，它衡量的是被解释方法选择为重要特征的分数[50]。形式上，给定图和它的硬重要性映射，稀疏度度量可以计算为：

其中表示中识别的重要输入特征（节点/边/节点特征）的数量，表示原始图中特征的总数。请注意，数值越高表示解释方法越稀疏，即往往只捕捉最重要的输入信息。

5.2.3 Stability

好的解释应该是稳定的。当对输入施加小的变化而不影响预测时，解释应该保持相似。最近提出的稳定性度量标准来衡量一个解释方法是否稳定[78]。给定一个输入图，它的解释被认为是真实标签。然后对输入图进行小的改变，比如附加新的节点/边，得到一个新的图。需要注意的是，和需要有相同的预测。然后得到的解释，表示为。通过比较和之间的差异，我们可以计算出稳定性得分。请注意，数值越低表示解释技术越稳定，对噪声信息的鲁棒性越强。

5.2.4 Accuracy

针对合成数据集提出了精度度量方法[42]、[78]。在合成数据集中，即使不知道GNN是否按照我们预期的方式进行预测，但构建这些数据集的规则，如 graph motifs，可以作为 ground truths 的合理近似。然后对于任何输入图，我们都可以将其解释与这样的 ground truths进行比较。例如，在研究重要边的时候，可以研究解释中的重要边与 ground truths 的边的匹配率。这种比较的常用指标包括一般精度、F1得分、ROC-AUC得分。匹配率数值越高，说明解释结果越接近于 ground truths，认为是较好的解释方法。

6. Conclusion

图神经网络近来被广泛研究，但对图模型的可解释性的探讨还比较少。为了研究这些黑箱的潜在机制，人们提出了几种解释图模型的方法，包括XGNN、GNNExplainer等。这些方法从不同的角度和动机来解释图模型，但是缺乏对这些方法的全面研究和分析。在这项工作中，作者对这些方法进行了系统全面的调研。首先对现有的GNN解释方法进行了系统的分类，并介绍了每一类解释方法背后的关键思想。然后详细讨论了每一种解释方法，包括方法、内涵、优势和缺点，还对不同的解释方法进行了综合分析。并且介绍和分析了常用的数据集和GNN解释方法的评价指标。最后从文本数据出发，建立了三个图形数据集，这些数据集是人类可以理解的，可以直接用于GNN解释任务。

参考文献

[10] K. Simonyan, A. Vedaldi, and A. Zisserman, “Deep inside convolutional networks: Visualising image classification models and saliency maps,” arXiv preprint arXiv:1312.6034, 2013.
[11] D. Smilkov, N. Thorat, B. Kim, F. Viegas, and M. Wattenberg, ´ “Smoothgrad: removing noise by adding noise,” arXiv preprint arXiv:1706.03825, 2017.
[12] B. Zhou, A. Khosla, A. Lapedriza, A. Oliva, and A. Torralba, “Learning deep features for discriminative localization,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016, pp. 2921–2929.
[13] R. R. Selvaraju, M. Cogswell, A. Das, R. Vedantam, D. Parikh, and D. Batra, “Grad-cam: Visual explanations from deep networks via gradient-based localization,” in 2017 IEEE International Conference on Computer Vision (ICCV). IEEE, 2017, pp. 618–626.
[14] P. Dabkowski and Y. Gal, “Real time image saliency for black box classifiers,” in Advances in Neural Information Processing Systems, 2017, pp. 6967–6976.
[15] H. Yuan, L. Cai, X. Hu, J. Wang, and S. Ji, “Interpreting image classifiers by generating discrete masks,” IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020.
[17] C. Olah, A. Satyanarayan, I. Johnson, S. Carter, L. Schubert, K. Ye, and A. Mordvintsev, “The building blocks of interpretability,” Distill, 2018, https://distill.pub/2018/building-blocks.
[18] F. Yang, S. K. Pentyala, S. Mohseni, M. Du, H. Yuan, R. Linder, E. D. Ragan, S. Ji, and X. Hu, “Xfake: explainable fake news detector with visualizations,” in The World Wide Web Conference, 2019, pp. 3600–3604.
[19] M. Du, N. Liu, Q. Song, and X. Hu, “Towards explanation of dnnbased prediction with guided feature inversion,” in Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 2018, pp. 1358–1367.
[22] H. Yuan, Y. Chen, X. Hu, and S. Ji, “Interpreting deep models for text analysis via optimization and regularization methods,” in AAAI-19: Thirty-Third AAAI Conference on Artificial Intelligence. Association for the Advancement of Artificial Intelligence, 2019.
[23] M. Du, N. Liu, and X. Hu, “Techniques for interpretable machine learning,” Communications of the ACM, vol. 63, no. 1, pp. 68–77, 2019.
[24] A. Rai, “Explainable ai: From black box to glass box,” Journal of the Academy of Marketing Science, vol. 48, no. 1, pp. 137–141, 2020.
[25] F. K. Dosilovi ˇ c, M. Br ´ ciˇ c, and N. Hlupi ´ c, “Explainable artificial ´ intelligence: A survey,” in 2018 41st International convention on information and communication technology, electronics and microelectronics (MIPRO). IEEE, 2018, pp. 0210–0215. [26] C. Molnar, Interpretable Machine Learning, 2019, https:// christophm.github.io/interpretable-ml-book/.
[41] H. Yuan, J. Tang, X. Hu, and S. Ji, “XGNN: Towards model-level explanations of graph neural networks,” ser. KDD ’20. New York, NY, USA: Association for Computing Machinery, 2020, p. 430–438. [Online]. Available: https://doi.org/10.1145/3394486.3403085
[42] Z. Ying, D. Bourgeois, J. You, M. Zitnik, and J. Leskovec, “Gnnexplainer: Generating explanations for graph neural networks,” in Advances in neural information processing systems, 2019, pp. 9244– 9255.
[43] D. Luo, W. Cheng, D. Xu, W. Yu, B. Zong, H. Chen, and X. Zhang, “Parameterized explainer for graph neural network,” in Advances in neural information processing systems, 2020.
[44] C. Rudin, “Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead,” Nature Machine Intelligence, vol. 1, no. 5, pp. 206–215, 2019.
[45] J. Chen, L. Song, M. J. Wainwright, and M. I. Jordan, “Learning to explain: An information-theoretic perspective on model interpretation,” in International Conference on Machine Learning, ser. Proceedings of Machine Learning Research, vol. 80. PMLR, 2018, pp. 882–891.
[46] U. Alon, “Network motifs: theory and experimental approaches,” Nature Reviews Genetics, vol. 8, no. 6, pp. 450–461, 2007.
[47] R. Milo, S. Shen-Orr, S. Itzkovitz, N. Kashtan, D. Chklovskii, and U. Alon, “Network motifs: simple building blocks of complex networks,” Science, vol. 298, no. 5594, pp. 824–827, 2002.
[48] U. Alon, An introduction to systems biology: design principles of biological circuits. CRC press, 2019.
[49] F. Baldassarre and H. Azizpour, “Explainability techniques for graph convolutional networks,” in International Conference on Machine Learning (ICML) Workshops, 2019 Workshop on Learning and Reasoning with Graph-Structured Representations, 2019.
[50] P. E. Pope, S. Kolouri, M. Rostami, C. E. Martin, and H. Hoffmann, “Explainability methods for graph convolutional neural networks,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2019, pp. 10 772–10 781.
[51] Anonymous, “Hard masking for explaining graph neural networks,” in Submitted to International Conference on Learning Representations, 2021, under review. [Online]. Available: https: //openreview.net/forum?id=uDN8pRAdsoC
[52] M. S. Schlichtkrull, N. De Cao, and I. Titov, “Interpreting graph neural networks for nlp with differentiable edge masking,” arXiv preprint arXiv:2010.00577, 2020.
[53] Anonymous, “Causal screening to interpret graph neural networks,” in Submitted to International Conference on Learning Representations, 2021, under review. [Online]. Available: https: //openreview.net/forum?id=nzKv5vxZfge
[54] R. Schwarzenberg, M. Hubner, D. Harbecke, C. Alt, and L. Hennig, ¨ “Layerwise relevance visualization in convolutional text graph classifiers,” arXiv preprint arXiv:1909.10911, 2019.
[55] T. Schnake, O. Eberle, J. Lederer, S. Nakajima, K. T. Schutt, K.-R. ¨ Muller, and G. Montavon, “Higher-order explanations of graph ¨ neural networks via relevant walks,” 2020.
[56] Q. Huang, M. Yamada, Y. Tian, D. Singh, D. Yin, and Y. Chang, “Graphlime: Local interpretable model explanations for graph neural networks,” arXiv preprint arXiv:2001.06216, 2020.
[57] Y. Zhang, D. Defazio, and A. Ramesh, “Relex: A model-agnostic relational model explainer,” arXiv preprint arXiv:2006.00305, 2020.
[58] M. N. Vu and M. T. Thai, “Pgm-explainer: Probabilistic graphical model explanations for graph neural networks,” in Advances in neural information processing systems, 2020.
[59] A. Shrikumar, P. Greenside, and A. Kundaje, “Learning important features through propagating activation differences,” in International Conference on Machine Learning, 2017, pp. 3145–3153.
[60] J. Chen, L. Song, M. Wainwright, and M. Jordan, “Learning to explain: An information-theoretic perspective on model interpretation,” in Proceedings of the 35th International Conference on Machine Learning, ser. Proceedings of Machine Learning Research, J. Dy and A. Krause, Eds., vol. 80. Stockholmsmassan, Stockholm ¨ Sweden: PMLR, 10–15 Jul 2018, pp. 883–892. [Online]. Available: http://proceedings.mlr.press/v80/chen18j.html
[61] R. S. Sutton, D. McAllester, S. Singh, and Y. Mansour, “Policy gradient methods for reinforcement learning with function approximation,” Advances in neural information processing systems, vol. 12, pp. 1057–1063, 1999.
[62] E. Jang, S. Gu, and B. Poole, “Categorical reparameterization with gumbel-softmax,” in International Conference on Learning Representations, 2016.
[63] C. Louizos, M. Welling, and D. P. Kingma, “Learning sparse neural networks through l 0 regularization,” arXiv preprint arXiv:1712.01312, 2017.
[64] M. T. Ribeiro, S. Singh, and C. Guestrin, “” why should i trust you?” explaining the predictions of any classifier,” in Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining, 2016, pp. 1135–1144.
[65] M. Yamada, W. Jitkrittum, L. Sigal, E. P. Xing, and M. Sugiyama, “High-dimensional feature selection by feature-wise kernelized lasso,” Neural computation, vol. 26, no. 1, pp. 185–207, 2014.
[66] D. Margaritis and S. Thrun, “Bayesian network induction via local neighborhoods,” Advances in neural information processing systems, vol. 12, pp. 505–511, 1999.
[67] S. Bach, A. Binder, G. Montavon, F. Klauschen, K. Muller, and ¨ W. Samek, “On pixel-wise explanations for non-linear classifier decisions by layer-wise relevance propagation,” PLoS ONE, vol. 10, no. 7, p. e0130140, 2015.
[68] R. Albert and A.-L. Barabasi, “Statistical mechanics of complex ´ networks,” Reviews of modern physics, vol. 74, no. 1, p. 47, 2002.
[69] R. Socher, A. Perelygin, J. Wu, J. Chuang, C. D. Manning, A. Y. Ng, and C. Potts, “Recursive deep models for semantic compositionality over a sentiment treebank,” in Proceedings of the 2013 conference on empirical methods in natural language processing, 2013, pp. 1631–1642.
[70] L. Dong, F. Wei, C. Tan, D. Tang, M. Zhou, and K. Xu, “Adaptive recursive neural network for target-dependent twitter sentiment classification,” in Proceedings of the 52nd annual meeting of the association for computational linguistics (volume 2: Short papers), 2014, pp. 49–54.
[71] M. Gardner, J. Grus, M. Neumann, O. Tafjord, P. Dasigi, N. Liu, M. Peters, M. Schmitz, and L. Zettlemoyer, “Allennlp: A deep semantic natural language processing platform,” arXiv preprint arXiv:1803.07640, 2018.
[72] J. Devlin, M.-W. Chang, K. Lee, and K. Toutanova, “Bert: Pretraining of deep bidirectional transformers for language understanding,” arXiv preprint arXiv:1810.04805, 2018.
[73] A. K. Debnath, R. L. Lopez de Compadre, G. Debnath, A. J. Shusterman, and C. Hansch, “Structure-activity relationship of mutagenic aromatic and heteroaromatic nitro compounds. correlation with molecular orbital energies and hydrophobicity,” Journal of medicinal chemistry, vol. 34, no. 2, pp. 786–797, 1991.
[74] Z. Wu, B. Ramsundar, E. N. Feinberg, J. Gomes, C. Geniesse, A. S. Pappu, K. Leswing, and V. Pande, “Moleculenet: a benchmark for molecular machine learning,” Chemical science, vol. 9, no. 2, pp. 513–530, 2018.
[75] A. Jacovi and Y. Goldberg, “Towards faithfully interpretable nlp systems: How should we define and evaluate faithfulness?” arXiv preprint arXiv:2004.03685, 2020.
[76] S. Wiegreffe and Y. Pinter, “Attention is not not explanation,” arXiv preprint arXiv:1908.04626, 2019.
[77] S. Hooker, D. Erhan, P.-J. Kindermans, and B. Kim, “A benchmark for interpretability methods in deep neural networks,” in Advances in Neural Information Processing Systems, 2019, pp. 9737–9748.
[78] B. Sanchez-Lengeling, J. Wei, B. Lee, E. Reif, P. Wang, W. W. Qian, K. McCloskey, L. Colwell, and A. Wiltschko, “Evaluating attribution for graph neural networks,” Advances in Neural Information Processing Systems, vol. 33, 2020.

你可能感兴趣的:(大数据,算法,编程语言,python,计算机视觉)

Conda常用命令耘田 conda 人工智能
查看Conda的完整帮助文档conda-h显示当前安装的Conda版本号conda-V列出所有已创建的Conda虚拟环境（标记*表示当前激活的环境）。condaenvlist删除所有缓存文件（包括未使用的包、临时文件等），释放磁盘空间condaclean--all新建名为ai-knowledge-mgr的虚拟环境，并安装Python3.8版本condacreate-nai-knowledge-mg
主流编程语言全景图：从Python到Rust的深度解析万能小贤哥 python rust 开发语言
2024年编程语言生态报告显示，全球开发者使用的语言数量已达260+，但真正主导行业的不到20种。本文带你穿透技术迷雾，掌握8大核心语言的本质差异。一、选择编程语言的黄金标准图表代码二、八大主流语言对比解析1.Python-通用胶水语言特性：动态类型+缩进语法丰富的库生态（20万+包）GIL全局锁限制并发适用场景：python#机器学习示例（TensorFlow）importtensorflowa
DAOS系统架构-JumpMap 付兄 daos DAOS 分布式存储
1.概述JumpPlacementMap是使用跳跃一致性哈希算法，以便在不同的故障域之间伪随机地分布对象。这样做是为了尽可能将他们分散到相互距离较远地故障域中，从而避免在当某个故障影响了整个故障域的情况下造成数据丢失。2.跳跃一致性哈希算法（JumpConsistentHashing）跳跃一致性哈希算法是一种一致性哈希算法，它能将keys均匀的分布在一定数量的buckets中。即使buckets的
DAOS系统架构-Placement
1.概述DAOS使用poolmap来创建一系列placementmaps，这些maps被用于计算对象布局的算法中。该算法是基于一致性哈希算法，使用对象的ID、对象的概要、以及其中一个placementmap来生成对象的布局。DAOS使用一种模块化方法，允许不同的对象使用不同的placementmap来获得应用程序所需的性能特征。2.PoolMap在DAOS中，poolmap被组织为一种树形结构，维
PTA数据结构与算法-第一章——褚论 ?Suki PTA习题算法数据结构 c++
文章目录第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题单选题程序填空题第一章——褚论第二章——线性表第三章——栈与队列第四章——字符串第五章——树与二叉树第六章——图第七章——排序第八章——检索判断题(neuDS)数据的物理结构是指数据在计算机中的实际存储形式。T(neuDS)数据的物理结构是指数据在计算机中的实际
使用Python实现的Excel像素画
简介：本项目主要使用python语言，将图片转为Excel，图片中的每一个像素转化为Excel中的每一个单元格。主要使用pillow和xlsxwriter这两个模块。项目使用一个python文件即可。一：项目功能和流程介绍项目的主要功能：就是将一张人脸图像，画在Excel表格上，图片的每一个像素点对应Excel的一个格子，俗称像素画。流程：创建Excel表，并设置行高和列宽打开图片遍历图片每一个像
排序算法之【归并排序】丶小鱼丶算法排序算法 java
目录实现归并排序【MergeSort】并提供升序和降序方法归并排序方法测试LeetCode-215题实现归并排序【MergeSort】并提供升序和降序方法/***归并排序*/publicclassMergeSort{//升序排列privatestaticfinalintUP_SORT_TYPE=1;//降序排列privatestaticfinalintDOWN_SORT_TYPE=-1;/***升
python高并发web框架_Python3中tornado高并发框架 weixin_39788969 python高并发web框架
1.单线程tornado.web：基础web框架模块tornado.ioloop：核心IO循环模块，高效的基础。封装了:1.asyncio协程，异步处理2.epoll模型：水平触发（状态改变就询问，select(),poll()），边缘触发（一直询问，epoll()）3.poll模型：I/O多路复用技术4.BSD（UNIX操作系统中的一个分支的总称）的kqueue（kueue是在UNIX上比较高效
基于python的文字识别系统_基于Python的图片文本识别系统的研究 weixin_39683368 基于python的文字识别系统
龙源期刊网http://www.qikan.com.cn基于Python的图片文本识别系统的研究作者：韩琳来源：《科学与财富》2019年第20期近年来随着计算机技术的不断发展，OpticalCharacterRecognition（光学字符识别，简称“OCR”）应用的领域更加的广泛，而图片文字识别就是其中重要的一个。目前图片文字识别的准确率并没有达到100%，这也成为了图片文字识别发展领域的一大瓶
基于python的图像识别_基于PYTHON的图片文字识别
文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。一般包括以下几个过程：图像输入、图像前处理、预识别：1图像输入：对于不同的图像格式，有着不同的存储格式，不同的压缩方式，目前有OpenCV、CxImage等开源项目。2预处理：主要包括二值化，噪声去除，倾斜较正等。2.1二值化：对摄像头拍摄的图片，大多数是彩色图像，彩色图像所含信息量巨大，对于图片的内容，我们可以简单的分为前景与背景，为
仓库货物检测：基于YOLOv5的深度学习应用与UI界面开发 YOLO实战营 YOLO 深度学习 ui 目标跟踪目标检测人工智能
一、引言随着电商和物流行业的快速发展，仓库货物管理已经成为企业运营中至关重要的环节。为了提高仓库管理的效率和准确性，越来越多的企业开始应用自动化技术来完成货物的盘点、分类、分拣等任务。传统的货物管理方式通常依赖人工检查，不仅效率低下，而且容易出现误差。为了克服这些问题，利用计算机视觉和深度学习技术来实现仓库货物的自动化检测成为了一种有效的解决方案。本博客将介绍如何使用YOLOv5进行仓库货物检测，
【云原生】Helm来管理Kubernetes集群的详细使用方法与综合应用实战景天科技苑云原生K8S 零基础到进阶实战云原生 kubernetes 容器 Helm k8s k8s集群
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，linux，she
什么是java IT界小新学姐
Java属于一种计算机语言，计算机语言的种类非常多，总的来说可以分成机器语言、汇编语言、高级语言三大类。Java是一种高级计算机语言。Java是由SunMicrosystems在1995年首先发布的编程语言和计算平台。有许多应用程序和Web站点只有在安装Java后才能正常工作，而且这样的应用程序和Web站点日益增多。Java快速、安全、可靠。从笔记本电脑到数据中心，从游戏控制台到科学超级计算机，从
Python类中魔术方法(Magic Methods)完全指南：从入门到精通盛夏绽放 python 开发语言
文章目录Python类中魔术方法(MagicMethods)完全指南：从入门到精通一、魔术方法基础1.什么是魔术方法？2.魔术方法的特点二、常用魔术方法分类详解1.对象创建与初始化2.对象表示与字符串转换3.比较运算符重载4.算术运算符重载5.容器类型模拟6.上下文管理器7.可调用对象三、高级魔术方法1.属性访问控制2.描述符协议3.数值类型转换四、魔术方法最佳实践五、综合案例：自定义分数类Pyt
Python面向对象编程(OOP)详解：通俗易懂的全面指南盛夏绽放 python 开发语言有问必答
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章目录Python面向对象编程(OOP)详解：通俗易懂的全面指南一、OOP基本概念1.什么是面向对象编程？2.OOP的四大支柱3.核心概念对比表二、类和对象1.类(Class)vs对象(Object)2.类结构详解三、OOP三大特性详解1.封装(Encapsulation)2.继承(Inherita
〖Python 数据库开发实战 - Redis篇②〗- Linux系统下安装 Redis 数据库哈哥撩编程 #⑤ -数据库开发实战篇 Python全栈白宝书 python 数据库数据库开发实战 linux安装redis
订阅Python全栈白宝书-零基础入门篇可报销！白嫖入口-请点击我。推荐他人订阅，可获取扣除平台费用后的35%收益，文末名片加V！说明：该文属于Python全栈白宝书专栏，免费阶段订阅数量4300+，购买任意白宝书体系化专栏可加入TFS-CLUB私域社区。福利：加入社区的小伙伴们，除了可以获取博主所有付费专栏的阅读权限之外，还有机会加入星荐官共赢计划，详情请戳我。作者：不渴望力量的哈士奇(哈哥)，
java语言程序设计基础篇课后答案第八版_Java语言程序设计-基础篇-第八版-复习题-第一章...
1.1计算机是一种电子装置，存储和处理数据。一台计算机包括硬件和软件。在一般情况下，硬件是可以看到的计算机的物理方面的，而软件是无形的指令，控制硬件和它的工作。1.2一台计算机的硬件包括一个CPU，高速缓存，内存，硬盘，软盘，显示器，打印机，通信设备。1.3机器语言是每个计算机中内置的一组基本指令。汇编语言是一种低级别的编程语言，是用一个助记符来表示各机器语言指令。高级程序设计语言是像英语那样的易
python分布式爬虫打造搜索引擎--------scrapy实现 weixin_30515513 爬虫 python 开发工具
http://www.cnblogs.com/jinxiao-pu/p/6706319.html最近在网上学习一门关于scrapy爬虫的课程，觉得还不错，以下是目录还在更新中，我觉得有必要好好的做下笔记，研究研究。第1章课程介绍1-1python分布式爬虫打造搜索引擎简介07:23第2章windows下搭建开发环境2-1pycharm的安装和简单使用10:272-2mysql和navicat的安装
day9｜学习前端打卡 universe_01 前端算法
时间复杂度，O（1）的时间复杂度没有for循环O（N）O（logN）并列循环，加起来N+N嵌套循环NlogN时间复杂度和运行时间是不一样的东西空间复杂度：算法存储空间和输入值之间的关系array数组：在连续的内存空间中，储存一组相同类型的元素访问：通过索引去取的index搜索：直接去找元素enumerate（index，element）函数，遍历索引和元素数组排序的时间复杂度是NlogN声明式渲染
上传文件csv并解析list_基于PyQt5表格控件TableWidget的csv文件内容显示
(70后红太阳2020年4月写于成都)一、配置环境开发环境：Win7；开发工具：Python3.8.2IDLE，QtDesigner5.13.2；Python安装目录：D:python；文件保存目录：D:python基于PyQt5表格控件TableWidget的csv文件内容显示；路径配置：在cmd下，运行path=%path%;Dpythonpython38-32scripts;D:python
读《原则》随笔-1 kavern
最近在看RayDlio的《原则》，受益颇多。作为对冲基金界神一样存在的人物，RayDlio通过本书讲述了他的成长历程，如何一手创办了桥水，如何取得了今天的成就。贯穿始终的，是所谓的“原则”，即做任何事情，都要有的标准、准则。这不禁让我想起了罗胖在2018跨年演讲上讲的“人生算法”（附上当时的感悟“算法”的力量）。无论是“原则”，还是“算法”，说白了，都是一系列可表达、可重复执行的指令。要想与众不同
前端面试十一之TS 闲蛋小超人笑嘻嘻前端
TS是TypeScript的缩写，是一种由微软开发的开源编程语言，它是JavaScript的一个超集，为JavaScript添加了类型系统和对ES6+的支持。以下是关于TypeScript的详细介绍：一、特点类型系统：TypeScript引入了类型注解，允许开发者为变量、函数参数、返回值等添加类型信息。这有助于在编译阶段发现潜在的类型错误，提高代码的健壮性和可维护性。例如：letmessage:s
C++数据结构————二叉树 Гений.大天才 C++语言入门以及基础算法 c++数据结构开发语言
【前言】在数据结构与算法的世界里，二叉树（BinaryTree）始终占据着核心地位。它既是众多高级树形结构（B+树、红黑树、线段树、字典树……）的“基因”，又是面试、竞赛与工程实战中绕不开的考点。本文将用大约2万字的篇幅，从“零”开始，把C++二叉树的所有常见形态、常见算法、常见坑点与常见优化一次性讲透。全文配套可编译运行的C++17/20代码2000余行，所有示例均在GCC13/Clang17/
JavaScript 性能优化实战指南
JavaScript性能优化实战指南一、引言JavaScript是一种广泛使用的编程语言，尤其在前端开发中占据重要地位。随着Web应用的复杂度不断增加，性能优化成为开发过程中不可或缺的一部分。性能优化不仅可以提升用户体验，还能减少服务器负载，提高应用的响应速度。本文将从多个方面详细探讨JavaScript性能优化的实战技巧，包括代码优化、内存管理、异步编程、资源加载优化等，旨在为开发者提供一份全面
React--Fiber 架构前端_学习之路 React.js react.js 架构前端
React的Fiber架构是React16.x版本引入的核心更新，旨在解决大型应用中渲染性能瓶颈的问题。它重新设计了协调算法（Reconciliation），使渲染过程更加可控和高效。核心设计目标1.可中断渲染：将渲染工作拆分成多个小任务，允许浏览器中断渲染进程，优先处理高优先级事件（如用户输入、动画）。2.优先级调度：为不同类型的更新分配不同优先级，紧急更新（如动画）可以插队执行。3.增量渲染：
告别内存焦虑！用Dask打开Python大数据并行计算的“任意门“ 小张在编程 python 大数据开发语言
引言当你在Jupyter里用Pandas读取20GB的CSV文件，看到内存占用率从10%飙升到90%，最后弹出"MemoryError"时；当你想对亿级数据做分组聚合，却发现单线程计算要等上半小时——这些场景是不是像极了用小推车搬运万吨货物？Python生态中，Dask库就像一台"并行计算推土机"，能把大数据拆分成小块并行处理，让你的普通电脑也能拥有分布式计算的能力。本文将从原理到实战，带你掌握这
Django项目运行报错：ModuleNotFoundError: No module named ‘MySQLdb‘
解决方法：在__init__.py文件下，新增下面这段代码importpymysqlpymysql.install_as_MySQLdb()注意：确保你的python有下载pymysql库，没有的话可以使用pipinstallpymysql安装原理：用pymysql来代替mysqlLab__init__.py文件大致位置在：
[Py026]Snakefile灵活传递param 安哥生个信
snakemake是用python编写的，最近串流程用的比较频繁，所以也归纳在python实用技巧里面。现在需要实现的一个功能是——根据每一个input自身的特点，返回一个值（可能是固定，也可能是随机）；然后将这个返回值传递给下面的运行代码。举例：现在有两个fastq文件20192.fastq.gz20193.fastq.gz，需要通过seqkit转换为fasta文件；如果文件名是奇数，则转换出来
Python日志终极指南：深入探索logging日志管理模块 c01dkit python python 开发语言
在任何一个严谨的软件开发项目中，日志（Logging）都是不可或缺的一环。它不仅是调试代码的利器，更是线上问题追踪、性能分析和数据监控的重要依据。相比于随处可见的print()语句，Python内置的logging模块提供了更为强大、灵活且标准化的解决方案。[1][2]这篇博客将带你由浅入深，全面掌握logging模块的使用，从基础配置到高级技巧，再到企业级项目的最佳实践。一、告别print()：
数据结构错题收录（十）程序员丶星霖
1、下列关于广度优先算法的说法中，正确的是（）。Ⅰ.当各边的权值相等时，广度优先算法可以解决单源最短路径问题Ⅱ.当个边的权值不等时，广度优先算法可用来解决单源最短路径问题Ⅲ.广度优先遍历算法类似于树中的后序遍历算法Ⅳ.实现图的广度优先算法时，使用的数据结构是队列•A：Ⅰ、Ⅳ•B：Ⅱ、Ⅲ、Ⅳ•C：Ⅱ、Ⅳ•D：Ⅰ、Ⅲ、Ⅳ解析广度优先搜索以起始结点为中心，一层一层地向外层扩展遍历图的顶点，因此无法考虑到
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe