Eastmount

[论文阅读] (22)图神经网络及认知推理总结和普及-清华唐杰老师

《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座，并分享给大家，希望您喜欢。由于作者的英文水平和学术能力不高，需要不断提升，所以还请大家批评指正，非常欢迎大家给我留言评论，学术路上期待与您前行，加油。

前一篇从个人角度介绍S&P21的离地攻击（Living-Off-The-Land）系统分析，这是一篇非常经典的论文。这篇文章将带来清华唐杰老师的分享“图神经网络及认知推理总结和普及”或“Graph Neural Networks and Applications—A Review”。唐老师也是学术界大牛，真心值得我们学习。同时文章融合了自己十年NLP的理解及相关资料补充，只希望帮助更多初学者，且看且珍惜，写得不好的地方请海涵。这些大佬是真的值得我们去学习，献上小弟的膝盖~fighting！

在此感谢B站的“感谢吕同学”老师的视频，同时文章中插入了很多原文链接，感谢哪些大牛和老师们。

https://www.bilibili.com/video/BV1mJ411q7gy
唐杰老师PPT：https://pan.baidu.com/s/1Q3tX6wnQYcvBV3eSymbrKg 密码:8thm
唐杰老网站：http://keg.cs.tsinghua.edu.cn/jietang

文章目录

一.Networked World
- 1.背景知识
- 2.相关工作
二.start with an example
三.表示学习：Representation Learning on Networks
- 1.表示学习
- 2.DeepWalk
- 3.Node2vec
- 4.LINE：Information Network Embedding
- 5.我们的工作：Unifying DeepWalk, LINE, PTE, and node2vec into Matrix Forms
- 6.我们的工作：NetMF
- 7.我们的工作：NetSMF
- 8.我们的工作：ProNE: Fast and Scalable Network Embedding
四.图神经网络：Revisiting Graph Neural Networks
- 1.总体概述
- 2.GCN
- 3.GraphSage
- 4.Graph Attention Networks
- 5.我们的工作：NRGCN（Node Ranking-aware GCN）
- 6.我们的工作：NSGCN（Network Sampling GCN）
五.Applications
- App1: Social Prediction
- App2: Recommendation in E-commerce
六.总结及感受

前文赏析：

[论文阅读] (01) 拿什么来拯救我的拖延症？初学者如何提升编程兴趣及LATEX入门详解
[论文阅读] (02) SP2019-Neural Cleanse: Identifying and Mitigating Backdoor Attacks in DNN
[论文阅读] (03) 清华张超老师 - GreyOne: Discover Vulnerabilities with Data Flow Sensitive Fuzzing
[论文阅读] (04) 人工智能真的安全吗？浙大团队外滩大会分享AI对抗样本技术
[论文阅读] (05) NLP知识总结及NLP论文撰写之道——Pvop老师
[论文阅读] (06) 万字详解什么是生成对抗网络GAN？经典论文及案例普及
[论文阅读] (07) RAID2020 Cyber Threat Intelligence Modeling Based on Heterogeneous GCN
[论文阅读] (08) NDSS2020 UNICORN: Runtime Provenance-Based Detector for Advanced Persistent Threats
[论文阅读] (09)S&P2019 HOLMES Real-time APT Detection through Correlation of Suspicious Information Flow
[论文阅读] (10)基于溯源图的APT攻击检测安全顶会总结
[论文阅读] (11)ACE算法和暗通道先验图像去雾算法（Rizzi | 何恺明老师）
[论文阅读] (12)英文论文引言introduction如何撰写及精句摘抄——以入侵检测系统(IDS)为例
[论文阅读] (13)英文论文模型设计（Model Design）如何撰写及精句摘抄——以入侵检测系统(IDS)为例
[论文阅读] (14)英文论文实验评估（Evaluation）如何撰写及精句摘抄（上）——以入侵检测系统(IDS)为例
[论文阅读] (15)英文SCI论文审稿意见及应对策略学习笔记总结
[论文阅读] (16)Powershell恶意代码检测论文总结及抽象语法树（AST）提取
[论文阅读] (17)CCS2019 针对PowerShell脚本的轻量级去混淆和语义感知攻击检测
[论文阅读] (18)英文论文Model Design和Overview如何撰写及精句摘抄——以系统AI安全顶会为例
[论文阅读] (19)英文论文Evaluation（实验数据集、指标和环境）如何描述及精句摘抄——以系统AI安全顶会为例
[论文阅读] (20)USENIXSec21 DeepReflect：通过二进制重构发现恶意功能（恶意代码ROI分析经典）
[论文阅读] (21)S&P21 Survivalism: Systematic Analysis of Windows Malware Living-Off-The-Land (经典离地攻击)
[论文阅读] (22)图神经网络及认知推理总结和普及-清华唐杰老师

一.Networked World

1.背景知识

主要分享我们在图神经网络相关的研究以及分享一些思考和发展。

从整个相关的研究往前看上20年，会发现整个大的背景是由许多网络化的数据组成，比如阿里巴巴、facebook、微博、头条、微信等都会产生海量的网络数据。现在数据隐私保护越来越好，但这些公司会有大量的比赛，提供数据供我们做科学研究。

这里面有大量的工作可以做，除了社交媒体数据，我们放大看，还会看到各种各样的网络数据，比如：经济方面的数据、生命科学和医学方面的数据，即研究不同药物成分和基因间的关系，有时候这些与人类生活息息相关的数据反而影响更大；还有底层的Internet，我们现在的互联网太关注上层，但事实上整个互联网发展，如可信验证或其他底层机理也非常重要；当然还有神经本身的网络，很多人可能觉得我们已经将DNN、CNN研究透了，会觉得直接这么使用就好了，但我们不应该单纯研究DNN，是不是还应该研究生物神经网络，从中学习新的知识。

大家知道生物神经网络和人工神经网络的区别吗？
生物神经网络和人工神经网络差别非常大，我们这种可计算的神经网络是生物神经网络的简化，神经网络里面有很多神经元、突触，其机理非常复杂，并且突触数量远大于神经元，那里面甚至产生化学物质和刺激。那里面的机理我们也不清楚，我们更多是通过输入构建模型，然后判断输出好。生物神经网络能从另一个角度理解人的机理，神经网络是在模拟人的计算，现在虽然效果好，但是如果未来想继续提高一个数量级，怎么做呢？因此，很多人在研究(生物)神经网络本身形成网络的机理。

生物神经网络(Biological Neural Network)：一般指生物的大脑神经元、细胞、触点等组成的网络，用于产生生物意识，帮助生物进行思考和行动。每个神经元可以看做一个小的处理单元，这些处理单元按照某种方式相互连接起来，构成了大脑内部的生物神经元网络，这些神经元之间连接的强弱，按照外部的激励信号作自适应变化，而每个神经元又随着接收到的多个激励信号的综合大小，呈现兴奋或抑制状态。本质上，人工神经网络是一个能让计算机处理和优化的数学模型，而生物神经网络是通过刺激，产生新的联结，让信号能够通过新的联结传递而形成反馈。

2.相关工作

机器学习中的网络分类如下：

Machine Learning with Networks

ML tasks in networks
– Node classification（节点分类或排序）
Predict a type of a given node
– Link prediction（节点之间的关系预测）
Predict whether two nodes are linked
在社交网络中是朋友关系推荐，在知识图谱中比如概念之间关系寻找
– Community detection（社区检测）
Identify densely linked clusters of nodes
寻找类簇或群体
– Network similarity（网络相似度）
How similar are two (sub)networks?

所以，网络化的学习做了大量的研究。图神经网络的发展历程如下图所示：

(1) Hinton早期（1986年）
图神经网络最早也不是这样的，从最早期 Hinton 做了相关的思路，并给出了很多的ideas，他说“一个样本可以分类成不同的representation，换句话，一个样本我们不应该去关注它的分类结果是什么，而更应该关注它的representation，并且它有很多不同的representation，每个表达的意思可能不同” ，distributed representation 后接着产生了很多相关的研究。

(2) 扩展（Bengio到Word2Vec）
Andrew Ng 将它扩展到网络结构上（结构化数据），另一个图灵奖获得者Yoshua Bengio将它拓展到了自然语言处理上，即NLP领域如何做distributed representation，起初你可能是对一个样本representation，但对自然语言处理来讲，它是sequence，需要表示sequence，并且单词之间的依赖关系如何表示，因此2003年Bengio提出了 Nerual Probabilistic Language Model，这也是他获得图灵奖的一个重要工作。其思路是：每个单词都有一个或多个表示，我就把sequence两个单词之间的关联关系也考虑进去。

Yoshua Bengio, Rejean Ducharme, Pascal Vincent, and Christian Jauvin. A neural probabilistic language model. Journal of Machine Learning Research (JMLR), 3:1137–1155, 2003.
原文地址：https://www.jmlr.org/papers/volume3/bengio03a/bengio03a.pdf

但是，当时做出来后由于其计算复杂度比较高，很多人无法fellow。直到谷歌2013年提出 Word2Vec，基本上做出来一个场景化算法，之后就爆发了，包括将其扩展到paragraph、文档（Doc2Vec）。补充一句，Word2Vec是非常经典的工作或应用，包括我们安全领域也有相关扩展，比如二进制、审计日志、恶意代码分析的Asm2Vec、Log2Vec、Token2Vec等等。

Efficient Estimation of Word Representations in Vector Space
原文地址：https://arxiv.org/abs/1301.3781v3

(3) 网络化数据时期（Deepwalk）
此后，有人将其扩展到网络化的数据上，2014年Bryan做了 Deepwalk 工作。其原理非常建立，即：原来大家都在自然语言处理或抽象的机器学习样本空间上做，那能不能针对网络化的数据，将网络化数据转换成一个类似于自然语言处理的sequence，因为网络非常复杂，网络也能表示成一个邻接矩阵，但严格意义上没有上下左右概念，只有我们俩的距离是多少，而且周围的点可多可少。如果这时候在网络上直接做很难，那怎么办呢？

通过 随机游走 从一个节点随机到另一个节点，此时就变成了了一个序列Sequence，并且和NLP问题很像，接下来就能处理了。

原文地址：https://dl.acm.org/doi/10.1145/2623330.2623732

随后又有了LINE（2015）、Node2Vec（2016）、NetMF（2018）、NetSMF（2019）等工作，它们扩展到社交网络领域。我们的工作也给了证明，这些网络本质上是一个Model。

(4) 图卷积神经网络（GCN）时期
2005年，Marco Gori 实现了 Graph Neural Networks。2014年，Yann Lecun 提出了图卷积神经网络 Graph Convolutional Networks。2017年，Max Welling将图卷积神经网络和图数据结合在一起，完成了 GCN for semi-supervised classification，这篇文章引起了很大关注。还有很多不做卷积工作，因此有很多Graph Neural Networks和Neural Message Passing（一个节点的分布传播过去）的工作。Jure针对节点和Transductive Learning又完成了 Node2vec 和 grahpSAGE 两个经典工作。我们最近也做了一些工作，包括 Graph Attention Network。

GraphSAGE 是 2017 年提出的一种图神经网络算法，解决了 GCN 网络的局限性: GCN 训练时需要用到整个图的邻接矩阵，依赖于具体的图结构，一般只能用在直推式学习 Transductive Learning。GraphSAGE 使用多层聚合函数，每一层聚合函数会将节点及其邻居的信息聚合在一起得到下一层的特征向量，GraphSAGE 采用了节点的邻域信息，不依赖于全局的图结构。

Hamilton, Will, Zhitao Ying, and Jure Leskovec. “Inductive representation learning on large graphs.” Advances in neural information processing systems. 2017.

原文地址：https://proceedings.neurips.cc/paper/2017/file/5dd9db5e033da9c6fb5ba83c7a7ebea9-Paper.pdf

Data Mining over Networks

DM tasks in networks:
– Modeling individual behavior
– Modeling group behavioral patterns
– Reveal anomaly patterns
– Deal with big scale

第一部分花费大量时间介绍了研究背景，接下来我们讲讲为什么网络化数据或社交网络中要做这样的工作呢？

二.start with an example

Let us start with an example — Social influence and prediction
原来在机器学习中也可以做，比如社交网络中信息的传播以及热点事件的情感预测。

我们第一个思路是将内容数据提取，然后每个节点内容做相关的features，然后再用Word2Vec转换向量，再构建模型做分类。
我们今天先不讨论内容，更多讨论结构。比如：这个节点影响另一个节点，这个节点为什么会被它影响而不被其他节点影响。

因此，需要做很多相关的研究。节点之间可能会相互影响，也可能节点邻居都做Negative，也许我也会做Negative，这就是Conformity（一致性），它也是社交网络或现实社会中的现象。还有就是Structural influence，很多时候不是简单地重做，有时候有逆反心理。

Peer influence
Conformity influence
Structural influence

以《王者荣耀》为例，v1和v2周围都有6个节点，这6个节点都在玩王者荣耀，这两个图的区别是什么？主要是边不同，对v1和v2虽然都有6个用户在玩，但v1形成了三个小的子图（C、AD、BEF）。

假设现在v1和v2都不玩了，现在要发条信息给v1和v2，告诉他们还有6个朋友在玩？大家觉得v1回来的概率高，还是v2？

其结果显示：在社交网络中，人被影响的恰恰是你的潜意识。v2的潜意识是这些人都不相关，我的不同的朋友都还在玩，觉得大家都在玩，就跟着玩；v1觉得他们都认识，比如就高中朋友在玩。

回到本质，你在机器学习中要把它转换成features，你需要去定义，但过程很麻烦。刚才只是几个节点，尤其是需要泛化到更多节点时，就非常麻烦。

三元组 Influence Learning

原来的机器学习方法会通过以下工作实现。

Influence features
Hand craft features
predictive mode

但是，特征定义是非常乏味和低效的。

所以，最近可以通过表示学习、Embedding、图神经实现，它们都在做一件事，即：

自动将复杂的图或case表示或映射成向量，再扔给机器学习完成剩下的任务
How to automate the representation of each user?

所以接下来唐老师将给大家介绍表示学习进展和GNN的知识，包括一些应用。

Representation Learning on Networks
Revisiting Graph Neural Networks
Applications
Conclusion and Q&A

三.表示学习：Representation Learning on Networks

1.表示学习

(1) 首先，我们看看网络中的表示学习，我们应该做什么事情。
本质上，给定一个网络，我们需要学习一个表示，这个表示在d维空间（如二维）找到两个节点之间的距离，如果两个节点label一样，则距离越近，反之越远。

(2) 为什么这个问题很难呢？
如果是sequence，还是比较简单，NLP可以直接处理。但如果是网络，它很难用数学模型描述，并且不同网络会有不同的属性，比如社交网络的社交属性，如三角关系，朋友的朋友是朋友，但这用一般的模型就描述不了，而这个属性又非常强。如果描述好了，社交网络的效果会大大提高。这个属性在公用网络中又不适用，它适用中心节点的属性。所以比较难。

Modern deep learning toolbox is designed for simple sequences or grids.
– CNNs for fixed-size images/grids…
– RNNs or word2vec for text/sequences…
But networks are far more complex!
– Complex topographical structure (i.e., no spatial locality like grids)
– No fixed node ordering or reference point (i.e., the isomorphism problem)
– Often dynamic and have multimodal features.

(3) 大家可能看的第一篇引起关注的就是Word2Vec，早期主要应用在自然语言处理中。

补充：其实我是2014年接触这个工作的，自己阅读量最高的博客还是C语言实现Word2Vec，后面随着深入了解，有了更多的用法，但仍然有很多疑惑，希望未来能更深入地理解和运用。

Word2Vec：给定一个单词，提取其上下文单词，然后组成一个向量。基于这样的向量做一个表示学习，学习的本质和原来的NLP思路一样。如下图所示，如果两个单词一样或很相似，则组成的向量也很相似（上下文相似），如“stars”。

(4) 然而，向量模型必须要用严格的单词组成，缺乏语义信息，比如有个单词和某个植物单词很相似，但是无法描述。那怎么办呢？
我们需要将其映射到隐空间上，我们将每个单词映射到d维的空间上，如果两个单词很相似，其距离很近，反之距离越远。

(5) 那么，如果给定一个图，又该如何表示呢？
我们同样可以做类似的事情，图中每个节点都有context（上下文），它周围的节点就是context，我们可以用一个单词周围的节点来组成一个向量。如果两个节点很相似的话，它邻居节点也很相似。

此时遇到一个新的问题：网络跟上下文不一样，因为网络很难说有2度、3度纳入图，如果设置成6会将全世界都纳入进来。Facebook之前发过Nature，世界是由3点多度组成，所以很难直接引用这种思路。

为了解决这个问题，随机游走的思路被提出并被大量引用。

2.DeepWalk

2014年，Bryan做了DeepWalk工作。既然直接计算节点的邻居无法做，那能不能通过游走实现。DeepWalk和graphSAGE的思路都是随机，之后再网络化数据中有大量的使用。此外，网络化数据中有大量的冗余，只要捕获其中一个信息，也许就能影响到其它信息。

B. Perozzi, R. Al-Rfou, and S. Skiena. 2014. Deepwalk: Online learning of social representations. KDD, 701–710

DeepWalk怎么做的呢？
从任意节点跑一个Random walk，形成一个path，这个path与文本上那个一样。有了该结果后，剩下的事就很简单。假设每个节点学到d维的表示刚开始是随机的，通过随机结果和SkipGram来判断v3、v5能不能出现，最后的学习就用这个结果来预测单词是否存在，可以通过Softmax提升结果。

(1) Random walk
Random Walk生成如下图所示的结果：

(2) Representation Mapping
随机路径生成：

向量表征过程如下：

(3) SkipGram with Hierarchical softmax

(4) 参数学习
包括随机初始化权重，使用SGD（随机梯度下降）来更新分类器的权重和节点表示

实验结果如下图所示，比如给BlogCatalog数据打标签，一定程度提高聚类效果。

同时也在YouTube数据集进行测试。

贡献：这篇文章给了一个初始的案例，通过随机游走的方式对网络化数据先做一个表示学习，用表示学习的结果再去做预测，更多是提供新的思路。

后续的用法越来越多，同时研究DeepWalk存在什么问题。

缺点：DeepWalk是利用固定长度、乱随机游动为每个节点生成上下文
DeepWalk utilizes fixed-length, unbiased random walks to generate context for each node, can we do better?

对应的优化工作如下：

LINE：显式地保留一阶和二阶的相似性
如图5和6应该更相似，但先前的方法可能学出来6和7更相似，在具体的实例中，7可能是房屋中介，8、9、10是卖家，5和6是买家，因此6和7相似度很低，除了买房的时候有关系，DeepWalk就存在这个问题。因此，LINE能解决该类问题。

PTE：继续扩展到异构文本网络上

Node2vec：use a biased random walk to better explore node’s neighborhood.
社交网络中存在三阶关系，即朋友的朋友是朋友。V在X1和X2中的相似度不一样，他们做了一个biased的工作，使用有偏随机游走来更好地探索节点的邻域。

接下来我们将详细介绍。

3.Node2vec

Node2vec定义了两种Random walk不一样，从程序角度变成了BFS和DFS两种遍历方式。

local view
global view
A. Grover and J. Leskovec. 2016. node2vec: Scalable feature learning for networks. KDD, 855–864.

具体定义如下所示：

BFS：Local microscopic view（局部微观视图）
DFS：Global macroscopic view（全局宏观视图）

Biased Random Walk计算如下：

具体示例如下：

4.LINE：Information Network Embedding

LINE实现过程如下：

J. Tang, M. Qu, M. Wang, M. Zhang, J. Yan, and Q. Mei. 2015. Line: Large-scale information network embedding. WWW, 1067–1077.

(1) Line: First-order Proximity
首先定义一个一阶相似度，有关系存在。

(2) LINE: Second-order Proximity
然后定义一个二阶相似度，通过共同邻居实现。

表征如下：

接下来将两个函数combine。

(3) Combining first-order and second-order proximities

一种简单有效的方法：训练LINE模型分别将一阶相似度和二阶相似度写在一起，然后同时优化，将两种方法训练的embeddings连接起来
一个更有原则的方法是联合训练两个目标函数

模型优化如下：

LINE采用C++实现，其速度很快，很多人fellow，而且效果比DeepWalk更好。

5.我们的工作：Unifying DeepWalk, LINE, PTE, and node2vec into Matrix Forms

后来我们的研究中，考虑了两个问题。即：

What are the fundamentals underlying the different models?
这些方法存在哪些本质的区别？
Can we unify the different network embedding approaches?
我们能统一不同的网络嵌入方法吗？

我们就做了一些很有意思的工作，通过一些数据分析发现这些不同的方法在做什么。

DeepWalk、LINE、PTE和Node2Vec本质上都在做矩阵分解
– D是diagonal矩阵；A是邻接矩阵；T是随机游走步数；
Qiu et al. Network embedding as matrix factorization: unifying deepwalk, line, pte, and node2vec. WSDM’18. The most cited paper in WSDM’18 as of May 2019 5

(1) DeepWalk
DeepWalk从原始网络进行随机游走，再做Skip-gram，输出节点Embedding。整个思路比较简单。

实现算法如下，每个节点Random Walk后，中间节点构建它的context。

Skip-gram with Negative Sampling如下：两个节点有无边的Objective function不同。

在我们的场景下，从a到e的Random Walk问题更复杂。因为它里面有方向性，比如c节点有左边的context和右边的context，并且windows是1或2的结果不一样。

扩展后的函数如下，简写为： $P=D^{-1}A$

进一步扩展后得到如下两个式子。

最终得到如下的矩阵式子。

DeepWalk is factorizing a matrix

(2) LINE
同样的方法我们推到LINE方法，LINE是DeepWalk的特例。

LINE is a special case of DeepWalk T=1

(3) PTE
PTE是将LINE扩展到异构文本网络上。

word-word network、word-document network、word-label network

PTE是三个不同的邻接矩阵，本质是LINE的特例。

(4) Node2vec
Node2vec本质上是二阶的，原来是2度从这个节点随机游走到任何邻居节点；而Node2vec是从任意节点游走时，要考虑三个节点，w考虑w+1和w-1，它其实是原来随机游走的特例。

贡献：最终我们得到一个结论，所有这些方法都是DeepWalk矩阵分解的特例。

同时，它给我们另一个启示，既然这些方法都是在做矩阵分解，那么我们能不能就用矩阵分解来做。

6.我们的工作：NetMF

NetMF: explicitly factorizing the DW matrix
我们干脆将原来的Random Walk用矩阵分解来做，因此产生了NetMF，并引起了广泛的关注。

Qiu et al. Network embedding as matrix factorization: unifying deepwalk, line, pte, and node2vec. WSDM’18. The most cited paper in WSDM’18 as of May 2019

具体工作如下：

A unified algorithm NetMF to explicitly factorizes the derived matrix

构造矩阵分解，过程中使用了 Arnoldi算法，其做矩阵分解速度较快。它会将一些低质的节点消除，从而提升实验结果。

代码地址：

https://github.com/xptree/NetMF

实验结果如下：

接下来是Sparsify S。

7.我们的工作：NetSMF

NetSMF增加了Sparse（稀疏），提出了大规模网络嵌入算法作为稀疏矩阵分解（NetSMF）。NetSMF利用spectral sparsification理论有效地稀疏密集矩阵，从而提高嵌入学习的效率。

J. Qiu, Y. Dong, H. Ma, J. Li, C. Wang, K. Wang, and J. Tang. NetSMF: Large-Scale Network Embedding as Sparse Matrix Factorization. WWW’19.

具体过程如下图所示：

代码下载地址如下：

https://github.com/xptree/NetSMF

然而，多项式随机游走重构稀疏矩阵也非常花时间，内存开销很大，只是解决了问题。因此我们有了后续的工作。

8.我们的工作：ProNE: Fast and Scalable Network Embedding

ProNE：给定一个网络，首先构建一个超级稀疏的矩阵，然后进行矩阵分析（tSVD），再增加一个Spectral Propagation操作。相当于每个节点分解完后，应该有对应的向量，然后在图上或分解结果上增加一个Propagation，类似于卷积网络中的卷积操作，线性算法的向量相加，从而防止高阶信息丢失（如边）。

因此，ProNE通过在频谱调制空间（spectrally modulated space）中传播嵌入增强了Embedding，它是一个快速、可伸缩和有效的模型。

J. Zhang, Y. Dong, Y. Wang, J. Tang, and M. Ding. ProNE: Fast and Scalable Network Representation Learning. IJCAI’19.

NE as Sparse Matrix Factorization如下：

Propagation原理解释：Higher-order Cheeger’s inequality

原来卷积网络能映射低通滤波，而这里的本质是带通滤波，从而避免丢失高阶信息

贡献：原来的SVD稀疏矩阵分解是一个线性算法，增加Spectral Propagation也是线性算法，所以整个算法非常快。

实验结果如下，我们只用单线程，其它算法用20个线程，我们的效果比其它最快的也快一个数量级。

代码地址：https://github.com/THUDM/ProNE

上亿的图速度也非常快，性能也好。

Spectral Propagation在其他算法上均有提高，包括ProDeepWalk、ProLINE、ProNode2vec、ProGraRap和ProHOPE。

NetMF vs. ProNE

贡献&总结：我们的工作可以用下图显示，包括NetMF S=f(A)、NetSMF Sparsify S和ProNE Fast RLN。其输入是邻接矩阵，输出是向量。

四.图神经网络：Revisiting Graph Neural Networks

1.总体概述

刚才介绍的很多模型其实还是Shallow Model，Shallow层面做表示和矩阵分解。

但在神经网络中会更深的模型，尤其是图神经网络。例如，encoder是一个依赖图结构的复杂函数。

那么，我们怎么把它变成一个更深层呢？

GCN的基本思路：给定一个网络，这个网络中有很多属性，可以构造一个矩阵（如相似矩阵或邻接矩阵），再进行卷积操作，并做全连接和label分类。

下图展示了GCN的相关研究，包括GCN、GraphSAGE、GAT、FastGCN和GraphSGAN等，后续我们将详细介绍。

2.GCN

图卷积网络的架构如下图所示：

Kipf et al. Semi-supervised Classification with Graph Convolutional Networks. ICLR 2017

GCN核心是：每个节点都有一个隐向量，这里有个卷积函数，使得所有的隐向量就映射到中间节点v上，再对v学习一个新的向量。

卷积操作如下图所示，可以参考作者之前CNN博客。

[Python人工智能] 八.卷积神经网络CNN原理详解及TensorFlow编写CNN

GNN的基本思路是把邻居节点的相关信息都接入（Neighborhood Aggregation）到当前节点。

Aggregate neighbor information and pass into a neural network
It can be viewed as a center-surround filter in CNN—graph convolutions!

其计算公式如下所示：

它既可以捕获当前节点的信息，也可以捕获邻居节点的信息，因此公式展开如下。

Aggregate from v’s neighbors
Aggregate from itself

同时可以增加两个权重。

有趣的是，邻接矩阵也可以写成一个矩阵分解式。

注意，Shallow是一个矩阵分解，现在的卷积还是一个矩阵分解，就可以将公式写在一起。

GCN模型架构的推导过程如下：

性能比较如下：

下面是一些传统GCN的扩展，第一个扩展是GraphSage。

3.GraphSage

GraphSage又是Jure Leskovec他们提出来的。
GraphSAGE 是 2017 年提出的一种图神经网络算法，解决了 GCN 网络的局限性: GCN 训练时需要用到整个图的邻接矩阵，依赖于具体的图结构，一般只能用在直推式学习 Transductive Learning。

GraphSAGE 使用多层聚合（aggregate）函数，每一层聚合函数会将节点及其邻居的信息聚合在一起得到下一层的特征向量，GraphSAGE 采用了节点的邻域信息，不依赖于全局的图结构。

Hamilton, Will, Zhitao Ying, and Jure Leskovec. “Inductive representation learning on large graphs.” Advances in neural information processing systems. 2017.
原文地址：https://proceedings.neurips.cc/paper/2017/file/5dd9db5e033da9c6fb5ba83c7a7ebea9-Paper.pdf

其计算过程如下，比如将当前节点v的邻居节点的信息聚合在一起。

其性能如下图所示：

然而，事实上邻居节点会有不同的影响或重要性不一样。那怎么办解决呢？

4.Graph Attention Networks

GAN被提出，它是在刚才模型的基础上，每两个节点之间增加一个权重，编程了Attention Model。

Velickovic et al. Graph Attention Networks. ICLR 2018

此时的性能又会有提升。

此外，不同模型背后的基本原理是什么呢？
每一层都是一个矩阵分解，GCN可以看作是多层图卷积网络，其propagation规则如下：

5.我们的工作：NRGCN（Node Ranking-aware GCN）

那么，我们能不能在矩阵操作的基础上做一些事情呢？
我们直接在矩阵上对A进行操作，左乘一个矩阵，右乘一个矩阵，将网络中每个节点的重要性和边的影响补充进来。

通过这种方式（简单的矩阵相乘），我们就可以将很多不一样的Attention机制增加进来。

贡献：整个模型变成了如下图所示的样子，将不同的Attention机制增加到式子中，实现了一个统一（unify）。

Node attention
Edge attention
K-hop edge attention
Path attention

6.我们的工作：NSGCN（Network Sampling GCN）

第二个工作是图形结构化数据中的结构依赖性和信息冗余性分析，通过采样（Sampling）来帮助探索网络信息。

给定一个矩阵，我们实现砍掉一半的信息再做Predict。我们发现学出来的结果与先前的结果比较接近，因此我们思考，如何优美地将信息利用起来，说不定结果还更好。

因此，我们构造了这个模型，利用Sampling思想，我们将图看成两个图，各学各的，然后将它们加到一起；继续二分，就可以构造多个图，即NSGCN(dp)。

第二种，我们想能不能互相让两部分相互学习，并且让两部分的loss更小，就构造了NSGCN(dm)，即Disagreement Minimization。

整个模型如下所示：

实验结果如下图所示，效果更好。

同时支持inductive的实验。

五.Applications

最近，大家可能非常关心GNN的实际应用。我们也探讨了一些应用。

App1: Social Prediction

我们探讨了《王者荣耀》的信息探测。

J. Qiu, J. Tang, H. Ma, Y. Dong, K. Wang, and J. Tang. DeepInf: Social Influence Prediction with Deep Learning. KDD’18.

我们构建了 End-2-End Behavior Prediction Framework，通过该模型预测节点本身的信息。原来只通过拓扑结构学习一个表示，但是它在真实场景是很难用的，因为真实场景往往会添加很多属性，比如性别、职位、位置等。所以，我们的模型中允许它添加很多属性，最终来预测它的行为。

实验结果如下图所示：

App2: Recommendation in E-commerce

接着我们做了推荐系统：用户和商品的关系。

Y. Cen, X. Zou, J. Zhang, H. Yang, J. Zhou and J. Tang. Representation Learning for Attributed Multiplex Heterogeneous Network. KDD’19.

分析结果如下图所示：

整个模型如下图所示：

数据分析和代码如下：

https://github.com/THUDM/GATNE

分析的结果如下图所示：

同时在真实场景做了A/B测试，推荐系统上提高了点击率。

六.总结及感受

这次分享主要从背景知识、表示学习、图神经网络和真实场景应用四个方面介绍，下图是经典工作的总结和我们的相关工作。本来还想讲一些推理的事情，即ACL19的Cognitive Graph，根据兴趣来推理转换为决策过程，并且可以回溯和可解释；但看到另一位老师也在，他后续会补充。

一.Networked World
1.背景知识
2.相关工作
二.start with an example
三.表示学习：Representation Learning on Networks
1.表示学习
2.DeepWalk
3.Node2vec
4.LINE：Information Network Embedding
5.我们的工作：Unifying DeepWalk, LINE, PTE, and node2vec into Matrix Forms
6.我们的工作：NetMF
7.我们的工作：NetSMF
8.我们的工作：ProNE: Fast and Scalable Network Embedding
四.图神经网络：Revisiting Graph Neural Networks
1.总体概述
2.GCN
3.GraphSage
4.Graph Attention Networks
5.我们的工作：NRGCN（Node Ranking-aware GCN）
6.我们的工作：NSGCN（Network Sampling GCN）
五.Applications
App1: Social Prediction
App2: Recommendation in E-commerce

同时，推荐大家关注唐老师和B站的UP老师。

http://keg.cs.tsinghua.edu.cn/jietang
https://www.bilibili.com/video/BV1mJ411q7gy

个人感受简单总结下：

图神经网络和知识推理越来越重要，在各个领域都有应用，包括安全领域的知识表示（Asm2vec、log2vec、token2vec等）和图神经网络及知识图谱应用（溯源图、恶意代码检测、入侵检测等）。这篇博客作为一个入门，从唐老师的视角，能让大家更清晰整个领域的发展及应用。
唐老师的分享很棒，从经典的工作到存在的问题以及后续工作的改进，梳理了整个领域的知识点，也包括他们的现有工作，这种逐层改进能让我们更好地阅读论文和发散思维。其中两个知识点的结论如下：
– (1) 表示学习：这些经典方法（DeepWalk、LINE、PTE、Node2vec）都是由DeepWalk矩阵分解得到，因此实现了矩阵分解的统一；
– (2)图神经网络：该模型可以将不同的Attention机制增加到式子中，实现了统一（unify），包括GCN、GraphSage、GAN。同时，NSGCN通过采样提升性能。
在传统机深度学习模型中，Word2Vec发挥了极其重要的作用，甚至导致了NLP的快速发展。那么，图结构能不能构建类似的模型呢？因此，我们要解决的第一个问题是如何将图表征为向量，然后更好地学习知识和实现预测。在图结构中，它会将邻接节点映射成NLP中上下文的信息，从而转换成类似NLP的问题，基于此（DeepWalk、LINE、PTE、Node2vec）有了后续的工作，这也体现了表示学习的重要性。
只有不断地向这些大牛和老师学习，阅读经典的顶会顶刊论文，探索不同方向论文的发展趋势及Motivation和Insight，才能更好地提升自己。这些知识不仅仅在AI和NLP中有应用，在安全四大顶会中我也看到了很多，在生物医学方面更多，所以学吧，学无止境！再次感谢唐老师的分享，以及B站的UP主。
虽然自己很菜，但会努力的，每天前进一小步，足矣！秀璋，加油。

这篇文章就写到这里，希望对您有所帮助。由于作者英语实在太差，论文的水平也很低，写得不好的地方还请海涵和批评。同时，也欢迎大家讨论，继续加油！感恩遇见，且看且珍惜。

(By:Eastmount 2022-05-28 周六夜于武汉 http://blog.csdn.net/eastmount/ )

你可能感兴趣的:(娜璋带你读论文,神经网络,深度学习,人工智能,论文分享,GNN)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
读《人世间》有感一0一
这个寒假，就如同朋友圈中的一段话：一闭眼，一睁眼假期还有5天，在一闭眼一睁眼假期还有12天；再一闭眼一睁眼假期还有20天；不敢睡，不敢睡啊……受疫情影响，这个假期变得漫长又煎熬，我也无时无刻不关注着疫情的变化。当然这样的一个假期，我还真得要感谢周翔，因为他有个爱看书的习惯，所以家里有不少他看过的书，可以让我随意挑选，因此也让我的假期不至于那么无所事事。这次我选了一本梁晓声的《人世间》，作为一名语文
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
自我意识徐立华
----读帕克.帕尔默《教学勇气》（P18----19）5.铸造我们的学科帕克.帕尔默说学科知识对我们的自身认同和外部世界有启发意义。学科会铸造我们。“在我们与学科的命题概念和学科的生活框架相遇之前，自我意识知识处于潜伏状态，通过回想学科是怎样唤醒自我意识，我们就可以找回教学心灵。”《教学勇气》（P18）我们的自我意识像冰山表面下无限延伸的冰层，常常处于潜伏状态。但是在我们对所教授的学科进行深入思
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
读《人间鲁迅》有感琳语读书
上周读完《闻一多传》后，我对中国近代知识分子产生了兴趣，这周继续读了《人间鲁迅》。厚厚的两本书，记录了一个人的一生，苦痛，彷徨和挣扎，虽然只读了一小部分，却也心潮澎湃。闻一多和鲁迅是完全不同的。鲁迅是沉郁的，现实的，寂寞的，抗争的。除了天生性格的不同外，环境的塑造也是非常之大。鲁迅少年经历了家庭的变故，看尽了人间冷暖，世态炎凉。这种经历促使他很早就观察思考人生，立志用文学来改变中国国民的劣根。闻一
女儿考研完报考雅思捡拾流年
是否我过于焦虑？会不会无形间让女儿觉得压力太大了啊。2022年对于我们家来说是不平常的一年。女儿今年大四，为了准备考研，暑假也没回家，年初去了学校到了年末才回家。女儿自己一个人面对考研，没有参加培训，大四学校作业论文等课业也多，她同时也是很努力复习考研的。在疫情开放很多羊的时期，女儿终于顺顺利利参加12月24、25号的考研，我们和家人都觉得女儿回家来要好好休息调养。可女儿回到家，我再查阅考研信息，
希望和悲伤都是照亮我们人生的一缕光山月映雪
我开始并不想读《云边有个小卖部》，但看到好几个学生就都在读这本书，为了了解学生的阅读实际，我就拿起这本书翻看起来。读了十几页，发现小说的语言中不时有一些粗俗的字眼，感觉自己读不下去了。小说一开始把云边镇风景写的特别的美好，我错判为脱离现实的鸳鸯蝴蝶派小说，对于人为制造的童话世界的人与物，我真的不太感兴趣，所以就没有再读了。有天在教室闲转，顺手又拿起了这本书看了起来，这次我才真的看进去了。这部小说除
一颗小桃树李蓉乐平市湾头中小学
当“凹”同“洼”的时侯，才读(wa，平声)，他不叫贾平洼(贾，原名贾平娃)，非要写作贾平凹。为了表示对他的尊重，对文学的尊重，对文化人的尊重。如果不是帮闺蜜的儿子修改作文，我也不会发现贾平凹叫贾平娃。以下是摘选他的文章《一棵小桃树》：可我的小桃树儿，一颗“仙桃”的种子，却开得太白了，太淡了，那瓣片儿单薄得似纸做的，没有肉的感觉，没有粉的感觉，像患了重病的少女，苍白白的脸，又偏苦涩涩地笑着。雨还在下
C语言判断回文数 Y雨何时停T c语言学习
一，回文数概念“回文”是指正读反读都能读通的句子，它是古今中外都有的一种修辞方式和文字游戏，如“我为人人，人人为我”等。在数学中也有这样一类数字有这样的特征，成为回文数。设n是一任意自然数。若将n的各位数字反向排列所得自然数n1与n相等，则称n为一回文数。例如，若n=1234321，则称n为一回文数；但若n=1234567，则n不是回文数。二，判断回文数实现思路一：数组与字符串将数字每一位按顺序放
如何培养兴趣绽蕊向阳
今天读李笑来的书《与时间做朋友》，读到有关兴趣部分，深有感触。书中提到，好多人说对某事没有兴趣，实际上是没有能力把这件事做好，做这件事时的感受很不好，有挫败感，每个人对自己不擅长做不好的事情，都本能的容易逃避，所以就以为自己对这件事不感兴趣，他们真正感兴趣的是其他事情。可事实上，出现这种感觉应该仅仅是因为还没有开始做那件事情，也还没有在那件事情上遭受挫折而已。其实，很多人真的放弃原来做的事情，转去
如何用matlab灵活控制feko的求解 NingrLi matlab 开发语言
https://bbs.rfeda.cn/read.php?tid=3778Feko中的模型和求解设置等都可以通过editfeko进行设置，其文件存储为.pre文件，该文件可以用文本打开，因此，我们可以通过VB、VC、matlab等工具对.pre文件进行读写操作，以达到更灵活的使用feko。同样，对于.out文件，我们也可以进行读操作。熟练使用对.pre文件和.out文件的操作后，我们可以方便的计
读《房思琪的初恋乐园》——林奕含芥末绿zq
小说的描写就像一座文字殿堂一样，将每个细节都堆砌得如此繁复精美，我读不懂，我只拣了其中粗暴恶俗、直扎人心的现实。强暴、诱奸、家暴、冷漠、助纣为虐……，故事里全是罪恶的词，不管用什么贬义的词都无法形容。文中无限重复的文学素养，譬喻就像作者无声的哀嚎，撞进我的心头。脑子里无限重复着“温良恭俭让”。就像她在采访里说的，她最痛苦的一点就是，一个真正相信文学的人，他怎么可以背叛这个浩浩汤汤已经超过五千年的语
买书与美好同行
今天真是痛快，连收三个快递，十本书。周三时，薛老师讲课说让准备大字注音版的《左传》，因为《史记》的读书纵轴上开始串上《左传》这一横轴了。《史记》已经读到了《秦本纪》，里面有关晋文公部分，老师说结合《左传》里面的相关具体内容读更精彩更明白，于是大家纷纷移步淘宝或者拼多多，寻找大字注音版《左传》。两个网上都有，且都在搞活动，于是找好了果断下单。去年在群里和大家一块儿买《史记》时，已经同时买了中华书局三
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
自动写论文的网站推荐这5款实用类工具小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款实用类工具推荐，特别是千笔-AIPassPaper。1.千笔-AIPassPaper千笔-AIPassPaper是一款功能强大且全面的AI论文写作助手，用户只需输入基本的研究需求和关键词，便能迅速生成一篇完整的论文。该工具利用先进的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
4款毕业论文参考文献格式生成器（附加详细步骤）小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在撰写毕业论文时，参考文献的格式规范是至关重要的。为了帮助学生和学者们更高效地生成符合要求的参考文献格式，本文将详细介绍四款推荐的参考文献格式生成器，并提供详细的使用步骤。1.千笔-AIPassPaper千笔-AIPassPaper是一款先进的AI辅助论文写作工具，不仅能够自动生成大纲、开题报告，还能一键生成参考文献。AI论文，免费大纲，10分钟3万字https://www.aipaperpass
AI论文写作推荐哪个好？分享5款AI论文写作带数据图表网站小猪包333 写论文人工智能深度学习计算机视觉
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款推荐的AI论文写作工具，包括千笔-AIPassPaper。千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文写作助手，旨在帮助用户快速生成高质量的论文内容。AI论文，免费大纲，10分钟3万字https:
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
《 C++ 修炼全景指南：四》揭秘 C++ List 容器背后的实现原理，带你构建自己的双向链表 Lenyiin 技术指南 C++修炼全景指南 c++list 链表 stl
本篇博客，我们将详细讲解如何从头实现一个功能齐全且强大的C++List容器，并深入到各个细节。这篇博客将包括每一步的代码实现、解释以及扩展功能的探讨，目标是让初学者也能轻松理解。一、简介1.1、背景介绍在C++中，std::list是一个基于双向链表的容器，允许高效的插入和删除操作，适用于频繁插入和删除操作的场景。与动态数组不同，list允许常数时间内的插入和删除操作，支持双向遍历。这篇文章将详细
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
读《红楼梦》第十九回情切切良宵花解语意绵绵静日玉生香梦一场_c315
元春回宫，贾府上下又忙碌了二三日，方收拾停当，个个是累得人仰马翻。王熙凤为了不落人口舌也只能硬撑着，凡事冲在前头。袭人的母亲来面见贾母，将袭人接回去吃年饭，晚上才会回来，宝玉甚觉无聊。宁府这边唱戏，贾珍来邀宝玉过府观赏，刚欲出门，元春赐了糖蒸酥酪来，宝玉想着平日里袭人最爱吃，便留给袭人，自己出门看戏去了。到了宁府，只闻锣鼓喧天，热闹非凡，宝玉稍坐了片刻，忽想起一间小书房里挂着一张美人图，今日府上这
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite