An_27

论文翻译-Learning Deep Network Representations with Adversarially

利用对抗性正则化自编码器学习深层网络表示

摘要
暂时没时间整理公式，后面有时间改公式
1 绪论
2 准备工作
- 2.1 自动编码器神经网络
- 2.2 生成对抗网络
- 2.3 网络嵌入
3 途径
- 3.1 随机生成器
- 3.2 反向正则化自动编码器的嵌入
4 评估
- 4.1 数据集
- 4.2 比较算法
- 4.3 可视化
- 4.4 链路预测
- 4.5 网络重构
- 4.6 多标记分类
- 4.7 参数敏感性
5 相关工作
6 结论
鸣谢
参考文献
总结与体会

WenchaoYu1,ChengZheng1,WeiCheng2,CharuC.Aggarwal3,DongjinSong2,BoZong2, HaifengChen2,andWeiWang1
1加州大学洛杉矶分校计算机科学系
2NEC美国实验室公司
3IBM AI研究部
{wenchaoyu,chengzheng,weiwang}@cs.ucla.edu,{weicheng,bzong,dsong,haifeng}@nec-labs.com,[email protected]

摘要

网络表示学习的问题，也称为网络嵌入，产生于许多学习任务，假设在顶点表示中存在少量可变性，这些可变性可以捕获原始网络结构的“语义”。具有浅层或深层体系结构的模型，从低维嵌入、局部可重构性和全局可重构性中学习顶点表示从输入网络中取样的序列。同样地，通过学习概率密度函数和取样序列来处理生成顶点表示的问题。然而，由于输入网络采样序列的固有稀疏性，所得到的结果很难在形式上加以推广。因此，通过学习概率密度泛函数在样本序列上生成顶点表示来处理问题。在本研究中，我们建议学习使用反向正则化自编码器（NETRA）的网络表示。NETRA学习了通过联合考虑局部性和全局重构约束来捕获结构的描述。我们实证地演示了网络结构的关键特性是如何被捕获的，以及NETRA在多种任务上的有效性，包括网络重构、链路预测和多标签分类。

关键词：网络嵌入、自动编码器、通用对抗网络

暂时没时间整理公式，后面有时间改公式

1 绪论

网络分析在挖掘有用信息方面具有巨大的潜力，这些有用信息对诸如链接预测、社区检测和社会网络异常检测[34]、生物网络[31]和语言网络[28]、语言网络等下游任务有利。

在分析工作数据时，一个基本的问题是超顶点的低维向量表示，即网络结构被应用到向量空间[23]。问题是，有两个主要挑战：(1)复杂结构性质的保持。嵌入网络的目的在于“适合”训练网络，从而保留网络的结构性质[23，26]。然而，这个复合体的潜在结构却以概率密度的显式形式表现出来，而这种概率密度又能反映局部网络邻域信息和全局网络结构。(2)网络抽样的稀疏性。目前主要采用抽样技术，包括随机游走抽样、广度优先搜索等，来导出约束数据集的外部序列。然而，抽样只占全部顶点序列的很小一部分。另一种方法是构造连续码空间[37]。不幸的是，由于在许多情况下，在低维流形中可能不存在先验分布，因此学习连续离散案例的潜在表示仍然是一个具有挑战性的问题[26]。

近来，网络嵌入在复杂网络的顶点表示方面取得了长足的进展[23，26，37]。这些表示采用非线性变换来捕捉原始网络的“语义”。大多数表示方法首先采用从输入网络开始的遍历，然后建立具有最优允许维顶点嵌入顺序的模型。由于顶点序列的总数非常大，因此采样策略会遇到数据稀疏问题。随后，在稀疏样本集上的学习倾向于产生一个过于复杂的模型来解释采样数据集，最终导致过拟合。流形仍是不相关流形。理想情况下，可以用单重分布实现连续的顶点表示。然而，在很多情况下，在低维流形中，先验分布的形式是不确定的、不可能的、完全定义的。例如，Dai等人[6]建议训练鉴别器来辨别。由固定的先验分布和输入编码产生的区别的样本，并由此将嵌入分布推向固定的先验分布。虽然它具有更大的灵活性，但是它受到模型崩溃问题的困扰[16]。此外，大多数具有深结构的模型通常不考虑先验分布。采样的顶点序列的顶点信息[37]。因此，不能很好地考虑邻近的信息。

为解决上述问题，在本研究中，我们提出了一个新的模型，它用逆规则描述子(NETRA)来表示，NETRA联合地将局部保持最小化，并把自编码器的构造误差与短期记忆法(LSTM)结合起来。将输入序列映射到固定长度表示的编码器。联合推理用于对抗性训练过程，以避开重复优先分配的要求。如图1所示，我们的模型使用离散LSTM自动编码器来学习控制该模型不仅使LSTM自编码器的构造误差最小化，而且使LSTM自编码器中的局部保持损失也同时减小。生成性对抗训练可以作为网络嵌入过程的补充规则器。

图1：具有异常正则化自编码器的深度网络嵌入架构的图示

NETRA具有网络嵌入模型所要求的不可分割性：1)结构特性保持，NETRA利用了网络拓扑结构之间的LSTM，以及网络拓扑结构的特征。2)泛化能力，泛化能力，等同于泛化能力，使分布和人口之后的非顶点序列得以生成。明确密度分布克服了输入顶点之间的矛盾。实验结果表明网络重构、链路预测和多标签分类等算法具有较强的嵌入能力。综上所述，本工作的主要贡献如下：

我们利用生成对抗训练过程，通过联合最小化局部保持损失和全局重构误差，提出了一种具有通用规则零树编码NETRA的深度网络嵌入模型。

从网络上看，NETRA学会了从离散输入中产生有用的顶点表示，而不需要定义间接隐含空间先验知识。

我们利用真实世界信息网络进行了网络重构、链接预测和多标记分类的广泛实验。实验结果表明NETRA的有效性和高效性。

在第二节中，我们回顾了自编码器、生成对抗网络和网络嵌入算法的初步知识。在第三节，我们描述了利用生成对抗过程学习低维映射的NETRA框架。通过网络重构、链路预测、多标签分类等联合框架，实现了NETRA的性能。在第五节中，我们比较了NETRA框架和其他网络嵌入算法，讨论了相关的工作，最后，在第六节中，我们总结并提出了未来工作的方向。

2 准备工作

2.1 自动编码器神经网络

训练自动编码器神经网络以将目标值设置为等于输入。网络由两部分组成：编码器f_ϕ (·)，用于将输入(x∈R^n)映射到潜在的低维表示，以及解码器h_ψ (·)，用于产生输入的重建。具体来说，给定一个数据分布P_data，从中得出x，即x~P_data (x)，我们想学习表示f_ϕ (x)，使得输出假设h_ψ 〖(f〗_ϕ (x))近似等于x。学习过程简单地描述为最小化成本函数，

minE_(x~P_data (x)) [dist(x,h_ψ (f_ϕ (x)))]， (1)

dist(·)是数据空间中的某种相似性度量。在实践中，距离测量有很多选择。例如，如果我们使用l2范数来测量重建误差，那么目标函数可以定义为L_LE(φ,ψ;x)= E_(x~P_data (x) ) ||x-h_ψ (f_ϕ (x)))〖||〗^2。类似地，交叉熵损失的目标函数可以定义为，

-E_(x~P_data (x) ) [xlogh_ψ (f_ϕ (x))+(1-x)log(1-h_ψ (f_ϕ (x)))]， (2)

编码器f_ϕ (·)和解码器h_ψ (·)的选择可能因不同的任务而异。在本文中，我们使用LSTM自动编码器[27]，它能够处理序列作为输入。

2.2 生成对抗网络

生成对抗网络(GANs)[11]为两个玩家建立一个对抗训练平台，即生成器g_θ (·)和鉴别器d_w (·)，以进行极小极大值游戏。

■(min@θ)■(max@w)■(E@x~P_data (x))[logd_w (x)]+■(E@z~P_g (z))[log⁡(1-d_w (g_θ (z)))] (3)

发生器g_θ (·)试图将噪声映射到输入空间，使数据更接近，而鉴别器d_w (x)则表示从数据到噪声的概率，其目的是区分真实数据分布P_data (x)和伪样本分布P_g (z)，如z~N(0，I)。Wasserstein GANs [1]用Earth-Mover距离(Wasserstein-1)代替Jensen-Shannon发散,克服了训练不稳定的问题,解决了这个问题。

■(min@θ)■(max@wϵW)■(E@x~P_data (x))[d_w (x)]-■(E@z~P_g (z))[d_w (g_θ (z))] (4)

通过截断判别器的权重，在连续空间[-c，c]中保持了判别器上的Lipschitz约束W。

2.3 网络嵌入

网络嵌入方法寻求学习编码关于网络的结构信息的表示。这些方法学习了将顶点嵌入到低维空间中的映射。给定编码顶点集{x^{((1))，…，x}((n))}，找到每个x^((i))的嵌入f_ϕ (x^((i) ) )可以形式化为最优化问题[39，41]，

■(min@ϕ)∑_(1≤i

其中f_ϕ (x)ϵR^{d是给定输入x。L(·)是输入之间的损失函数。φij是x}((i))与x^((j))之间的权重。

我们考虑的拉普拉斯特征映射(LE)可以很好地适应这个框架，LE可以通过网络结构来保留网络结构的属性。通常，可以通过最小化以下目标函数来获得嵌入，

L_LE (ϕ;x)=∑_(1≤i

3 途径

在本节中，我们介绍了NETRA，一种深度网络嵌入模型，使用了多个规范的自动编码器，能够平滑地将顶点序列作为输入进行正则化的顶点表示。结果表示可用于下游任务，例如，链接预测，网络重构和多类别分类。

3.1 随机生成器

在给定网络G(V,E)的情况下,利用DeepWalk[23]中的随机游动生成器,得到以每个顶点v∈V 在G(V,E)为根的截断随机游动(即序列化顶点)。

图2：网络采样的稀疏性

图解：在图2(a)中，深入探讨了它们对行走路径长度的影响。理由是，如果窗口设置为小于长度路径，那么它就会相当于增加样本的数量，从而减少行程长度。在图2(b)中，我们通过大幅度的方向减少了大小的变化[2]。

随机游走采样技术在网络嵌入研究中被广泛采用[12,23,37],但存在网络采样的稀疏性问题。对于给定网络中的每个顶点，如果假设平均节点度为d ̅，遍历长度为l，样本数为k，则可以计算遍历的采样率。

P_frac∝(|V|×K)/(|V|×d ̅^l )=k/d ̅^l ×100% (7)

采样分数的影响如图2所示。在本例中，DeepWalk用于在4.1节中描述的UCI消息网络上执行链接预测任务。从图2(a)和图2(b)可以看出，当遍历长度或平均顶点度增加时，性能显著下降1。根据Eq(7),很明显,当l或d ̅增加,游走的抽样比例越来越小。因此，由于输入稀疏，训练后的模型容易出现过拟合。相反，如果样本k的数量增加，性能会越来越好，如图2©所示。然而，更多的采样遍历也需要更多的模型训练的计算负担。因此，开发具有较强稀疏采样网络游动泛化能力的有效模型是十分必要的。

3.2 反向正则化自动编码器的嵌入

在本文中，我们提出了NETRA，它是一个具有对抗性规则的编码结构的模型，用于解决数据嵌入问题。自动编码器被广泛用于数据嵌入，例如图像和文档。它通过把输入数据映射到潜在空间来提供输入数据的信息量级的表示。正因为如此，如果编码器和解码器被允许过大的容量，那么复制任务就变成了学习任务，而没有提取出关于数据分布的有用信息[10]。我们建议使用弱的对抗性处理和互补性管理器。此外，生成性对抗训练提供了更鲁棒的离散空间表示，以了解稀疏采样步道上的过装配问题[19]。具体地说，在NETRA中，鉴别器通过比较来自自动编码器的潜在空间的样本和来自生成器的伪样本来更新，如图1所示。自编码器的潜在空间为网络中的顶点提供了最佳的嵌入，同时更新了编码器和鉴别器，由于LSTM考虑了采样步长的信息，因此本文使用LSTM作为编码器和解码器网络[27]。

这个联合体构造需要对每个部分进行培训。自动编码器可以通过最小化负的日志重建的可能性来解决这个问题，这可以通过实施的交叉点来实现。

L_AE (ϕ,ψ;x)=-Ε_(x~P_data (x) ) [dist(x,h_ψ (f_ϕ (x))]， (8)

其中dist(x,y)=xlogy+(1-x)log(1-y)。这里x是来自训练数据的抽样批次。f_ϕ (x)是x的嵌入潜在表示，它也是鉴别器的正样本，在图1中用箭头表示“+”，φ和ψ分别是编码器和解码器功能的参数。在自动编码器的训练迭代中，不仅更新编码器和解码器，而且联合最小化保持位置损失(等式(6))。

如图1所示，NETRA最小化了来自编码器函数f_ϕ (x)~Ρ_ϕ (x)的学习表示与来自连续基因的表示之间的分布，和来自连续发生器模型的表示g_θ (z)~Ρ_θ (z)。Ρ_ϕ (x)和Ρ_θ (z)之间的地球移动距离的双重形式可以通过以下方式描述[1]，

W(Ρ_ϕ (x),Ρ_ϕ (z))=■(sup@||d(·)||(L≤1) )Ε(y~Ρ_ϕ (x)) [d(y)]-Ε_(y~Ρ_ϕ (z)) [d(y)] (9)

其中||d(·)||_(L≤1)是Lipschitz连续性约束(Lipschitz常数1)。如果我们有一个函数族{d_w (·)}w∈W对于某些K都是K-Lipschitz，那么我们有，

W(Ρ_ϕ (x),Ρ_ϕ (z))∝■(max@wϵW) ■(Ε@x~P_data (x) )[d_w (f_ϕ (x))]-■(Ε@z~P_g (x) )[d_w (g_θ (z))] (10)

我们可以分离生成器和鉴别器。对于生成器，成本函数可以定义为，

L_GEN (θ;x,z)=Ε_(X~Ρ_data (X) ) [d_w (f_ϕ (x))]-Ε_(Z~P_g (z) ) [d_w (g_θ (z))] (11)

而鉴别器的成本函数是，

L_DIS (w;x,z)=-Ε_(X~Ρ_data (X) ) [d_w (f_ϕ (x))]+Ε_(Z~P_g (z) ) [d_w (g_θ (z))] (12)

NETRA通过联合最小化自组织编码器重建错误和对抗训练过程中的局部保留损失来学习平滑表示。具体来说，我们考虑用目标函数求解联合优化问题，

L_NETRA (ϕ,ψ,θ,w)=L_AE (ϕ,ψ,x)+λ_1 L_LE (ϕ,x)+λ_2 W(Ρ_ϕ (x),Ρ_θ (z)) (13)

定理3.1，设Ρ_ϕ (x)为任意分布。设Ρ_θ (z)为g_θ (z)的分布，其中z是从分布P_g (z)绘制的样本，而g_θ (·)是满足局部Lipschitz常数的函数E_(z~P_g (z) ) [L(θ,z)]<+∞。然后我们有：

∇_θ L_NETRA=-λ_2 ∇_θ Ε_(Z~P_g (Z) ) [d_w (g_θ (z))] (14)

∇_θ L_NETRA=-λ_2 ∇_w Ε_(X~P_data (X) ) [d_w (f_ϕ (x))]+λ_2 ∇_w Ε_(Z~P_g (z) ) [d_w (g_θ (z))] (15)

∇_ϕ L_NETRA=λ_1 ∇_ϕ ∑_(1≤i

∇_ψ L_NETRA=-∇_ψ Ε_(X~P_data (X) ) [dist(x,h_ψ (f_ϕ (x)))] (17)

证明 LetX⊆R^n是一个紧凑的集合，并且

V(d ̃,θ)=Ε_(y~Ρ_ϕ (x) ) [d ̃(y)]-Ε_(y~Ρ_θ (z) ) [d ̃(y)]
=Ε_(y~Ρ_ϕ (x) ) [d ̃(y)]-Ε_(z~Ρ_g (z) ) [d ̃(g_θ (z)] (18)

其中d ̃位于D = {d ̃：X→R，d ̃是连续的有界||d ̃||≤1}。由于X是紧致的，我们通过Kantorovich-Rubinstein二元性[1]知道存在一个d∈D获得价值

W(Ρ_ϕ (x),Ρ_θ (z))=■(sup@d ̃ϵD)⁡V (d ̃,θ)=V (d ̃,θ) (19)

并且D^* (θ)={d∈D：V(d,θ)= W(Ρ_ϕ (x)，Ρ_θ (z))}是非空的。根据包络定理[21]，我们有：

∇_θ W(Ρ_ϕ (x),Ρ_θ (z))=∇_θ V(d,θ) (20)

对于任何d∈D^* (θ),我们可以得到：

∇_θ W(Ρ_ϕ (x),Ρ_θ (z))=∇_θ V(d,θ)=〖∇_θ Ε〗(y~Ρ_ϕ (x) ) [d(y)]-Ε(z~Ρ_g (z) ) [d(g_θ (z)]
=〖-∇_θ Ε〗_(z~Ρ_g (z) ) [d_w (g_θ (z)] (21)

因此，我们有∇_θ L_NETRA=-λ_2 ∇_θ Ε_(Z~P_g (Z) ) [d_w (g_θ (z))]。方程(15)-(17)是衍生定义的直接应用。

我们现在拥有所需的所有衍生物。为了训练模型，我们使用块坐标下降来优化模型的不同部分之间的交替：(1)局部保持损失和自动编码器重建误差(更新φ和ψ)，(2)对抗训练过程中的鉴别器(更新w)，和(3)生成器(更新θ)。算法1给出了完整方法的伪代码。

NETRA的训练过程包括以下步骤：首先，给定网络G(V，E)，我们运行随机游走生成器获取长度l的随机游走。然后，将每个顶点的一个热表示x^((i))作为LSTM单元的输入。我们通过编码层传递随机遍历并获得顶点的矢量表示。在解码器网络之后，顶点表示将被转换回n维。通过最小化自动编码器操作中的重建误差，在输入和输出之间计算交叉熵损失。同时，保持局部性的约束确保相邻顶点非常接近(算法1中的步骤2-7)。编码器的潜在表示和发生器的输出将被反馈到鉴别器以获得对抗性损失(步骤10-17)。另外，通过穿过多层感知器，发生器将高斯噪声转换成与真实数据一样接近的潜在空间(步骤20-23)。在NETRA训练之后，我们通过将输入遍历编码器函数来获得网络的顶点表示f_ϕ (x)。

Algorithm 1 NetRA Model Training
Require: the walks generated from input graph, maximum training epoch n_epoch, the number of discriminator training per generator iteration n_D.
1: for epoch = 0;epoch < n_epoch do
2: Minimizing L_LE(ϕ; x) with autoencoder L_AE (ϕ, ψ; x)
3: Sample {z^((i) ) } ■(B@i=1)~P_data (x) a batch from the walks
4: Compute latent representation f_ϕ (x^((i)))
5: Compute reconstruction output h_ψ (f_ϕ (x^((i))))
6: Compute〖 L〗_AE (ϕ, ψ) and L_LE (ϕ) using Eq.(8) and Eq.(6)
7: Backpropagate loss and update ϕ and ψ using Eq.(16)-(17)
8:
9: Discriminator training
10: for n = 0, n < n_D do
11: Sample {z^((i) ) } ■(B@i=1)~P_data (x) a batch from the walks
12: Sample {z^((i) ) } ■(B@i=1)~P_g (z) a batch from the noise
13: Compute representations f_ϕ (x^((i))) and g_θ (z^((i)) )
14: Compute L_DIS (w) using Eq.(12)
15: Backpropagate loss and update w using Eq.(15)
16: clip the weight w within [−c, c]
17: end for
18:
19: Generator training
20: Sample {z^((i) ) } ■(B@i=1)~P_g (z) a batch from the noise
21: Compute the representation g_θ (z^((i)) )
22: Compute 〖 L〗_GEN (θ) using Eq.(11)
23: Backpropagate loss and update θ using Eq.(14)
24: end for

最优性分析。如图1所示，NETRA可以解释为最小化两个分布之间的偏差，即P_ϕ (x)和P_θ (z)。我们提供以下命题，表明在我们的参数设置下，如果Wasserstein距离收敛，则编码器分布f_ϕ (x)~P_ϕ (x)收敛于发生器分布g_θ (z)~P_θ (z)。

命题3.2，令P为紧致集合X上的分布，并且(P_n)∈N分布为X。考虑到W(P_n，P)→0为n→∞，以下陈述是等价的：

(1)P_n P 其中表示随机变量的分布的收敛性。

(2)E_(x~P_n ) [F(x)]→E_(x~P) [F(x)],其中F(x)=∏_(i=1)^n▒〖x_ipi,x∈R^n,∑_(i=1)n▒〖pi=k〗,k>1,k∈N〗。

证明(1)如[36]所示，P_n收敛到P等于W(P_n，P)→0。

(2)根据Portmanteau定理[36]，Ε_(X~P_n ) [F(x)]→Ε_(X~P) [F(x)]得到F：Rn→R是有效的连续函数。我们的编码器f_ϕ (·)在整个球体上的输入正常化，并且通过tanh函数，生成器(θ)也是(-1,1)n。因此，对于所有Pi > 0，F(x)=∏_(i=1)^n▒X_iPi 是有效的连续函数。

Ε_(X~P_n ) [∏_(i=1)^n▒X_i(p^i ) ]→ Ε_(X~P) [∏_(i=1)^n▒X_iPi ] (22)

表1：现实世界网络数据集的统计数据

计算分析。给定网络G(V，E)，其中|V| = n，|E| = m，根据方程(6)中的定义，拉普拉斯算子特征图嵌入的总体复杂度为O(n)。在我们的实现中，我们只考虑在它们之间有边缘的顶点对(x^((i))，x((j)))，因此采样对的大小是O(m)，这比O(n^2)小得多，因为真实网络在实际环境中很稀疏。

学习LSTM自动编码器的计算复杂度与参数数|φ|成比例和|ψ|在每次迭代中。因此，LSTM自动编码器的学习计算复杂度为O(n_epoch×(|φ| + |ψ|))。类似地，对于生成器和鉴别器，反向传播的每次调用通常在参数O(|θ|)和O(|w|)的数量上是线性的。因此，生成器和鉴别器的计算复杂度是O(n_epoch×(n_D×|w| + |θ|))。如果输入和隐藏层的大小大致相同，则它基本上是二次的。但是，如果我们将嵌入层的大小设置为远小于输入的大小，则时间复杂度会降低到O(n)。

4 评估

利用网络数据集，从网络重构、链接预测、多标签分类等多方面对模型进行了性能评价。

4.1 数据集

为了验证所提出的网络嵌入模型的性能，我们在表1中对不同领域的网络进行实验，包括社会网络、软件依赖网络、生物网络和语言网络。

UCI消息(UCI)[22]是一个直接的通信网络，包含来自加利福尼亚大学的学生的在线社区的用户(顶点)之间的句子消息(边)。

JDK依赖(JDK)2是JDK 1.6.0.7框架的软件类依赖关系网络。网络是定向的，顶点表示Java类，两个顶点之间的边界表示重新存在两个类之间的依赖关系。

Blogcatalog (BLOG)[29]是一个来自BLOG Catalog网站的非定向社交网络，用于管理博客和他们的博客。顶点代表用户，边代表用户之间的友谊。

DBLP3是来自DBLP计算机科学参考书目的非直接合作作者。这个网络中的顶点代表作者，而边代表作者之间的生态权威。

Wikipedia (WIKI)[12]是一个有方向的单词网络。顶点标签表示使用Stanford POS- tagger[33]推断出的词性(POS)标签。

蛋白-蛋白相互作用(PPI)[3]是同系猿人PP网络的子图，是描述人类蛋白质之间相互作用的网络图。顶点标签表示蛋白质的生物学状态。

4.2 比较算法

为了评价我们的网络嵌入模型的性能，本文总结以下几个竞争者。

谱聚类(SC)[30]：SC是一种基于矩阵分解的方法，用图的最小特征向量生成顶点表示。

DeepWalk[23]：基于DeepWalk的skip-gram[20]的模型，它学习了与垂直行走有关的知识。

node2vec[12]：这种方法结合了广度优先遍历深度优先遍历算法的优点。本文提出了结构等价的概念。

结构深层网络嵌入(SDNE)[37]：SDNE是一种基于深度分析的网络嵌入模型，它使用保持局部性的约束来学习捕捉高度非线性网络结构的顶点表示。

对抗网络嵌入(ANE)[6]：AN用于训练鉴别器以推动嵌入分布以匹配固定的先验值。

为了进行公平比较[18]，除非另有说明，否则我们采用一种算法，在不同的数据集上生成300维顶点表示。将DeepWalk和node2vec中每个顶点的遍历次数设置为10，遍历长度为30，称为NETRA的随机遍历生成步骤，将DeepWalk和node2vec的窗口大小优化为10。对node2vec的回归和输入输出参数(p,q)∈{0.25,0.50,1,2,4}采用网格搜索进行优化。自动编码网络的定时器.将多层感知器(MLP)用于产生器和鉴别器.对算法进行评估,并将其应用于下行任务,如滑动预测,网络重构,以及后续的多标记分类。

4.3 可视化

为了演示网络嵌入模型如何很好地捕捉网络结构的关键特性，我们用特征比较法可视化了嵌入。使用t-SNE[35]的二维空间。图3给出了三个类：org.omg的红点，org.w3c的绿点，java.beans的蓝点。其他基线可以检测到不同程度的类。NETRA性能最佳，因为它能够将多个类别与多个边界分开，但两个策略之间只有很小的重叠。

图3：JDK依赖关系网络上比较方法的可视化结果：红点属于org.omg类，绿点属于org.w3c类，蓝点属于java.beans类。

表2:链接预测的AUC评分

4.4 链路预测

链路预测任务的目的是在给定边缘去除一定比例的情况下推断出缺失的边，从网络中随机去除50%的边作为正样本，选择它们之间具有某种联系的顶点对作为负样本。通过网络嵌入算法学习顶点表示，得到顶点向量2范数的边缘特征，并直接利用其拓扑重新划分边缘，由于焦点在嵌入模型中，因此本文建立了基于假设的性能评价模型。连接顶点应该接近于欧氏空间。我们对链接预测任务进行AUC评分重估。结果如表2所示。显然，我们发现NETRA在所有数据集上的性能都大大优于基线算法。可以看出，基于四个数据集上的AUC评分，NETRA实现了3%到32%的改进。通过比较NETRA、node2vec和DeepWalk三种常用算法，可以看出生成对抗规则化在改进NETRA模型的泛化性能方面的有效性，在相同的随机游走序列下，NETRA能够克服取样序列的不足。

我们还绘制了这四个数据集的ROC曲线，如图4(a)-(d)所示。NETRA的ROC曲线主要接近于(0,1)点。结果如图4(e)-(h)所示。一般来说，在第一个纪元之后，我们可以观察到NETRA收敛速度快于AUC评分。与DeepWalk、node2vec、SDNE和ANE相比，NETRA收敛速度快于AUC评分。

图4：使用顶点表示的链接预测。用AUC ROC分数和训练时间进行评估。

4.5 网络重构

网络嵌入是对原始网络的有效表示。通过网络嵌入学习到的顶点表示保持了网络重构的边缘信息。我们随机选择顶点对，在两者之间选择并计算欧几里德距离。我们使用精确度precision@k，前k预测中正确预测的分数，预估在

precision@k=1/k×|E_pred (1:k)⋂E_obs |， (23)

其中E_pred (1:k)表示原始网络中的pk预测和E_obs表示原始网络。在评估中，UCI消息和BlogCatalog数据集用于说明NETRA的性能，结果如图5所示。

根据精度@k曲线，NETRA模型在网络重构任务中实现了较高的精度。NETRA给出的重建结果非常精确地预测了大多数阳性样本(JDK和DBLP数据集上的结果没有包括在内)。利用生成性对抗性约束过程[11]、我们的模型将保持局部性和全局重构约束集成起来以获得捕获“语义”信息的嵌入。

图5：UCI消息和博客目录的网络重构结果，通过precision@k进行评估。

4.6 多标记分类

最近对性能评估的研究中，网络嵌入算法学习到的顶点标记的预测任务很多[12，23，37]。有效的网络嵌入算法应该捕捉到下游机器学习任务最有用的特征。本文利用线[9]包对分类器进行回归，得到分类器的一个顶点特征与重逻辑回归。对于维基百科和PPI数据集，我们随机抽取10%到50%的顶点标记作为测试集，并使用它们作为测试集。我们的报告以Micro-F1[37]作为评估指标。每个结果平均五次运行，如图6所示。

从图中可以看出，NETRA优于多标记分类任务中的现有算法。在PPI数据集中，NETRA通过超过10%的未实验设置获得了比基线模型更高的micro-F1分数。在维基百科数据集中，NETRA模型在更低的百分比训练集下表现得更好。这说明在稀疏的环境下具有自我概括的性能。多标签分类器。由于LSTM自编码器具有通用性，因此其邻域信息可以被维数表示所捕获。

图6：PPI和维基百科的多标签分类

图7：参数敏感性分析

图8：LLE在不同λ_1上的性能

图9：不同NETRA架构的性能

4.7 参数敏感性

在本章中，我们研究了用于链路预测的NETRA的参数敏感性，研究了训练规模、嵌入维数和局部保持约束参数λ_1如何影响链路预测的性能。注意，对多标签分类和网络重构任务进行类似的观察扫描。

在图7(a)中，我们测量了UCI消息网络中的百分比。据我所知，性能随着训练量的增加而增加。与算法相比，NETRA可以捕获到两个边缘不均匀的边缘，这显示了涅特拉模型。在图7(b)中，我们将嵌入维数从50变化到1000，预测性能达到饱和，维数增加。考虑到嵌入维数与NETRA的参数体积有关，在模型化过程中存在性能与效率之间的矛盾。

参数λ_1由局部保持约束和自编码约束之间的相对强度定义。λ_1越高，来自局部类型保留约束的梯度越大。从图8中可以看出，较高的λ_1提高了UCI消息网络的预测性能，表明了重要的作用。

本文用NETRA的多个变异体来证明NETRA中个体成分的重要性，包括〖NETRA_〗LE、〖NETRA〗LSTM和〖NETRA〗GAN。〖NETRA〗LE和〖NETRA〗GAN移除局部保持约束LLE和对抗正则化W(P_ϕ (x),P_θ (z))。对于〖NETRA〗LSTM，我们用多层感知器代替LSTM。从图9中可以明显看出，LSTM自动编码器、局部保持约束和对抗正则化在NETRA模型中起着重要作用。在〖NETRA〗LSTM和〖NETRA〗_GAN的训练中，过度拟合变得明显。

5 相关工作

最近，在自然语言处理成功的启发下，我们目睹了基于随机游走的方法[8，12，23]的出现[23]。它建立了网络结构和自然语言之间的联系。skip-gram算法[20]使随机游动中某一窗口内顶点间的共现概率最大。DeepWalk[23]利用截断随机游动得到了有效的嵌入。Node2vec[12]扩展了模型在同亲性和结构等价性之间的灵活性[42]。

深层学习模型[4,32,37]已经应用于解决嵌入问题。利用其学习高度非线性特性的能力，提出了基于自编码器的方法[4,37]。通过仔细构造学习目标，[37]保持了网络的第一和第二邻近性，从而提供了最先进的性能指标。最近关于图卷积网络[7,17]的研究已经对网络数据进行了有效的分层卷积运算。归纳的和无监督的图[14]利用顶点特征[15]并在顶点特征域之间聚集特征。

近几十年来，深层学习研究的迅速发展为高度非线性的心电研究提供了新方法。生成对抗网络(GAN)[11]实现了对高维数据的再现和学习表示[24]。使用GANs来研究两种代表性的学习。使用GANs来学习诸如自然语言和社交网络等离散性内容在通过离散随机变量进行反向传播时仍然存在问题。最近关于GAN的工作，如GraphGAN[38]和ANE[6]。尽管采用了离散结构[5,40]和改进的双编码器[16]。

6 结论

在本研究中，我们提出了NETRA，它是一个嵌入模型的深层网络，它具有低维向量表示，并且具有通用的均一化结构。该模型不需要对隐式表示进行显式的先验密度分布，具有较好的泛化能力。特别地，利用LSTM自编码器，通过局部保持约束和生成对抗训练过程对顶点的采样序列进行正则化，从而获得对从网络中采样的稀疏顶点序列具有鲁棒性的光滑顶点表示。从本质上讲，我们评估了网络数据在不同任务中的表现，如网络重构、链接预测和多标签分类。

鸣谢

NIH U01HG008488、NIH R01GM115833、NIH U54GM114833、NSF IIS-1313606等为该工作提供支持。第四作者的研究是由陆军研究实验室赞助的，是在W911NF-09-2-0053号合作协议下完成的。这些观点和结论不应该被解释为代表陆军研究实验室或美国政府的官方政策。美国政府被授权为政府复制和分发转载件，尽管有任何版权。我们感谢匿名审稿人仔细阅读和深入评论手稿。

参考文献

Martin Arjovsky, Soumith Chintala, and Léon Bottou. 2017. Wasserstein generative adversarial networks. In ICML. 214–223.

Peter Borg and Kurt Fenech. 2017. Reducing the maximum degree of a graph by

deleting vertices. Australasian Journal Of Combinatorics 69, 1 (2017), 29–40.

Bobby-Joe Breitkreutz, Chris Stark, Teresa Reguly, et al. 2007. The BioGRID interaction database: 2008 update. Nucleic acids research 36, suppl_1 (2007), D637–D640.

Shaosheng Cao, Wei Lu, and Qiongkai Xu. 2016. Deep Neural Networks for Learning Graph Representations… In AAAI. 1145–1152.

Tong Che, Yanran Li, Ruixiang Zhang, R Devon Hjelm, Wenjie Li, Yangqiu Song, and Yoshua Bengio. 2017. Maximum-likelihood augmented discrete generative
adversarial networks. arXiv preprint arXiv:1702.07983 (2017).

Quanyu Dai, Qiang Li, Jian Tang, and Dan Wang. 2017. Adversarial Network Embedding. arXiv preprint arXiv:1711.07838 (2017).

Michaël Defferrard, Xavier Bresson, and Pierre Vandergheynst. 2016. Convolutional neural networks on graphs with fast localized spectral filtering. In NIPS. 3844–3852.

Yuxiao Dong, Nitesh V Chawla, and Ananthram Swami. 2017. metapath2vec: Scalable representation learning for heterogeneous networks. In KDD. ACM, 135–144.

Rong-En Fan, Kai-Wei Chang, Cho-Jui Hsieh, Xiang-Rui Wang, and Chih-Jen Lin.2008 LINEAR: A library for large linear classification. JMLR 9, Aug (2008), 1871–1874.

Ian Goodfellow, Yoshua Bengio, Aaron Courville, and Yoshua Bengio. 2016. Deep learning. Vol. 1. MIT press Cambridge.

Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, and Yoshua Bengio. 2014. Generative adversarial nets. In NIPS. 2672–2680.

Aditya Grover and Jure Leskovec. 2016. node2vec: Scalable feature learning for networks. In KDD. ACM, 855–864.

Ishaan Gulrajani, Faruk Ahmed, Martin Arjovsky, Vincent Dumoulin, and Aaron Courville. 2017. Improved training of wasserstein gans. arXiv preprint arXiv:1704.00028 (2017).

William L Hamilton, Rex Ying, and Jure Leskovec. 2017. Inductive Representation Learning on Large Graphs. arXiv preprint arXiv:1706.02216 (2017).
Xiao Huang, Jundong Li, and Xia Hu. 2017. Label informed attributed network embedding. In WSDM. ACM, 731–739.

Yoon Kim, Kelly Zhang, Alexander M Rush, Yann LeCun, et al. 2017. Adversarially Regularized Autoencoders for Generating Discrete Structures. arXiv preprint arXiv:1706.04223 (2017).

Thomas N Kipf and Max Welling. 2016. Semi-supervised classification with graph convolutional networks. arXiv preprint arXiv:1609.02907 (2016).

Omer Levy, Yoav Goldberg, and Ido Dagan. 2015. Improving distributional similarity with lessons learned from word embeddings. Transactions of the Association for Computational Linguistics 3 (2015), 211–225.

Alireza Makhzani, Jonathon Shlens, Navdeep Jaitly, and Ian Goodfellow. 2016. Adversarial Autoencoders. In ICLR.

Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg S Corrado, and Jeff Dean. 2013. Distributed representations of words and phrases and their compositionality. In NIPS. 3111–3119.

Paul Milgrom and Ilya Segal. 2002. Envelope theorems for arbitrary choice sets. Econometrica 70, 2 (2002), 583–601.

Tore Opsahl and Pietro Panzarasa. 2009. Clustering in weighted networks. Social networks (2009), 155–163.

Bryan Perozzi, Rami Al-Rfou, and Steven Skiena. 2014. Deepwalk: Online learning of social representations. In KDD. ACM, 701–710.

Alec Radford, Luke Metz, and Soumith Chintala. 2015. Unsupervised representation learning with deep convolutional generative adversarial networks. arXiv preprint arXiv:1511.06434 (2015).

Sai Rajeswar, Sandeep Subramanian, Francis Dutil, Christopher Pal, and Aaron Courville. 2017. Adversarial Generation of Natural Language. arXiv preprint arXiv:1705.10929 (2017).

Leonardo F.R. Ribeiro, Pedro H.P. Saverese, and Daniel R. Figueiredo. 2017.
Struc2Vec: Learning Node Representations from Structural Identity. In KDD. ACM, 385–394.

Ilya Sutskever, Oriol Vinyals, and Quoc V Le. 2014. Sequence to sequence learning with neural networks. In NIPS. 3104–3112.

Jian Tang, Meng Qu, Mingzhe Wang, Ming Zhang, Jun Yan, and Qiaozhu Mei. 2015. Line: Large-scale information network embedding. WWW, 1067–1077.

Lei Tang and Huan Liu. 2009. Relational learning via latent social dimensions. In KDD. ACM, 817–826.

Lei Tang and Huan Liu. 2011. Leveraging social media networks for classification.Data Mining and Knowledge Discovery 23, 3 (2011), 447–478.

Athanasios Theocharidis, Stjin Van Dongen, Anton J Enright, and Tom C Freeman.2008 Network visualization and analysis of gene expression data using BioLayoutExpress3D. Nature protocols 4, 10 (2009), 1535–1550.

Fei Tian, Bin Gao, Qing Cui, Enhong Chen, and Tie-Yan Liu. 2014. Learning Deep Representations for Graph Clustering… In AAAI. 1293–1299.
Kristina Toutanova, Dan Klein, Christopher D Manning, and Yoram Singer. 2003. Feature-rich part-of-speech tagging with a cyclic dependency network. Association for Computational Linguistics, 173–180.

Tomasz Tylenda, Ralitsa Angelova, and Srikanta Bedathur. 2009. Towards timeaware link prediction in evolving social networks. In Proceedings of the 3rd workshop on social network mining and analysis. ACM, 9.
Laurens van der Maaten and Geoffrey Hinton. 2008. Visualizing Data using t-SNE. JMLR 9 (2008), 2579–2605.

Cédric Villani. 2008. Optimal transport: old and new. Vol. 338. Springer Science & Business Media.

Daixin Wang, Peng Cui, and Wenwu Zhu. 2016. Structural deep network embedding. In KDD. ACM, 1225–1234.

Hongwei Wang, Jia Wang, Jialin Wang, Miao Zhao, Weinan Zhang, Fuzheng Zhang, Xing Xie, and Minyi Guo. 2018. GraphGAN: Graph Representation Learning with Generative Adversarial Nets. AAAI (2018).

J. Weston, F. Ratle, and R. Collobert. 2008. Deep learning via semi-supervised embedding. In ICML.

Lantao Yu, Weinan Zhang, Jun Wang, and Yong Yu. 2017. SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient. In AAAI. 2852–2858.

Wenchao Yu, Guangxiang Zeng, Ping Luo, Fuzhen Zhuang, Qing He, and Zhongzhi Shi. 2013. Embedding with autoencoder regularization. In ECMLPKDD. Springer, 208–223.

Daokun Zhang, Jie Yin, Xingquan Zhu, and Chengqi Zhang. 2016. Homophily, Structure, and Content Augmented Network Representation Learning. In ICDM. IEEE, 609–618.

总结与体会

网络分析在挖掘有用信息方面具有巨大的潜力，这些有用信息对诸如链接预测、社区检测和社会网络异常检测、生物网络和语言网络、语言网络等下游任务有利。在分析数据时，超顶点的低维向量表示（即网络结构被应用到向量空间），主要有两个挑战：1、复杂结构性质的保持；2、网络抽样的稀疏性。为解决以上的问题与挑战，现有的方法大多是从输入网络开始的遍历，然后建立具有最优允许维顶点嵌入顺序的模型。但是容易出现三个问题：1、稀疏样本产生一个复杂的模型而造成过拟合；2、固定的先验分布导致模型崩溃；3、未考虑先验分布而导致不能很好考虑邻近信息。

在本文的研究中，研究者提出了一个新的模型—NETRA，它用逆规则描述子(NETRA)来表示，NETRA联合地将局部保持最小化，并把自编码器的构造误差与短期记忆法(LSTM)结合起来。该模型在给定的网络G(V，E)中通过随机游走生成器获得长度为l的随机游走，将其中的每个顶点作为以编码器f_ϕ (·)(本文根据需求选用的是LSTM自动编码器)以及解码器h_ψ (·)训练出的自联想神经网络的输入，然后利用生成器g_θ (·)与鉴别器d_w (·)的极大极小值游戏生成对抗网络（GANs），之后通过网络嵌入方法通过给定的输入f_ϕ (x)ϵR^d以及输入之间的损失函数L(·)和权重φij学习关于网络结构信息的表示并逐渐优化。

NETRA模型构建工作完成后，研究者通过现有的一些数据集(UCImessage、Blogcatalog、DBLP3、Wikipedia)的测试以及与其他人的算法(谱聚类(SC)、DeepWalk、结构深层网络嵌入(SDNE)、node2vec、对抗网络嵌入(ANE))的网络重构、多标签分类、精度、性能、参数敏感性等方面的表现得对比，得出本文研究者提出的模型更好。

总的来说，本文的研究者们利用生成对抗训练过程，通过联合最小化局部保持损失和全局重构误差，提出了一种具有通用规则零树编码NETRA的深度网络嵌入模型。从网络上看，NETRA学会了从离散输入中产生有用的顶点表示，而不需要定义间接隐含空间先验知识。我们利用真实世界信息网络进行了网络重构、链接预测和多标记分类的广泛实验。并且通过同一模型不同数据集和同一测试集不同算法的实验结果表明NETRA的有效性和高效性。

你可能感兴趣的:(外文论文翻译,深度学习,网络表示,顶会论文)

为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
理解TCP连接中的进程阻塞与CPU调度机制 109702008 编程 #C语言网络 tcp/ip 网络人工智能
引言在计算机网络通信中，TCP连接的建立是一个经典的三次握手过程。当用户调用connect()函数发起连接时，内核会发送SYN报文并等待对方的SYN-ACK响应。此时，调用进程通常会进入阻塞状态，暂停执行直至连接成功或超时。这一机制看似简单，但其背后的内核实现却涉及进程调度、等待队列管理和CPU资源分配等复杂操作。本文将深入探讨阻塞状态的实现原理，并解析CPU在进程阻塞期间的行为。一、进程阻塞的实
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
玩转Docker | 使用Docker部署gopeed下载工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署gopeed下载工具前言一、gopeed介绍Gopeed简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署gopeed服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问gopeed应用五、测试与下载六、总结前言在当今信息爆炸的时代，高效地获取和管理网络资源变得尤为重要。无论是下载大型文件还是进行日常的数据传输，一个稳
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
Docker指定网桥和指定网桥IP
$dockernetworklsNETWORKIDNAMEDRIVER7fca4eb8c647bridgebridge9f904ee27bf5nonenullcf03ee007fb4hosthostBridge默认bridge网络,我们可以使用dockernetworkinspect命令查看返回的网络信息，我们使用dockerrun命令是将网络自动应用到新的容器Host如果是hosts模式，启动容
rocketmq的重试队列和死信队列还不够 MQ
原文：https://www.jianshu.com/p/1281f7fee69c消费端，一直不回传消费的结果。rocketmq认为消息没收到，consumer下一次拉取，broker依然会发送该消息。所以，任何异常都要捕获返回ConsumeConcurrentlyStatus.RECONSUME_LATERrocketmq会放到重试队列。这个重试TOPIC的名字是%RETRY%+consumer
UNIX域套接字
1、UNIX域套接字的定义UNIX域套接字是进程间通信（IPC）的一种方式，不涉及网络协议栈，因此在同一台主机上的通信中，它比基于TCP/IP协议的网络套接字更快速、更高效。2、UNIX域套接字的分类字节流套接字（SOCK_STREAM）：提供面向连接的、可靠的数据传输服务。数据报套接字（SOCK_DGRAM）：提供无连接的数据传输服务，数据以独立的数据报形式传输。3、UNIX套接字与TCP/IP
Kimi Chat 1.5 与 2.0 架构升级对比 charles666666 人工智能 transformer 深度学习产品经理 chatgpt
1.5版的MoE架构优化KimiChat1.5采用了优化后的MoE架构，其核心在于“专家网络动态路由”。这一机制类似于快递系统智能选择最优路径，能够根据输入数据的特性动态分配计算资源。这种优化显著提升了模型的计算效率，同时降低了硬件资源的浪费。在实际应用中，这意味着开发者可以在相同的硬件配置下处理更复杂的任务，或者在有限的资源下实现更高的性能。2.0的混合专家系统创新点与1.5版相比，KimiCh
RocketMQ 之死信队列 firepation RocketMQ rocketmq
在分布式消息系统中，消息的可靠传递和处理至关重要。然而，由于各种原因（如消息处理失败、消费超时等），一些消息可能无法被正常消费。这些无法被消费的消息如果不加以处理，会影响系统的稳定性和数据一致性。为了解决这一问题，RocketMQ提供了死信队列（DeadLetterQueue，DLQ）机制。本文将深入探讨RocketMQ的死信队列，包括其实现原理、应用场景以及使用示例。什么是死信队列？死信队列是一
实时预览功能问题 GISer_Jinger 项目 javascript 开发语言 ecmascript
你遇到的问题是：“B端修改配置后无法实时出现在previewiframe中，而必须点击刷新才能生效”。主要原因与以下几方面有关：❗为什么需要手动刷新：iFrame与主页面之间缺少实时通信机制：原本仅靠刷新重新加载iframe，而没有通过postMessage等方式同步状态；Valtio的proxy状态不能跨文件热刷新持久保存：当你修改包含proxy定义的文件，热重载会导致object被替换，监听丢
C++11中的std::function
文章转载自：http://www.jellythink.com/archives/771看看这段代码先来看看下面这两行代码：std::functiononKeyPressed;std::functiononKeyReleased;这两行代码是从Cocos2d-x中摘出来的，重点是这两行代码的定义啊。std::function这是什么东西？如果你对上述两行代码表示毫无压力，那就不妨再看看本文，就当温
C# 设计模式（结构型模式）：组合模式硅谷调试员玩转C#设计模式 c#设计模式组合模式
C#设计模式（结构型模式）：组合模式在软件设计中，有时我们需要处理的是一组对象，而这些对象既可以是单独的元素，也可以是由多个子元素组成的复合体。这时，组合模式（CompositePattern）便能提供帮助。它允许客户端将单个对象和对象集合统一对待，从而简化了树形结构的管理。1.组合模式的定义组合模式是一个结构型设计模式，主要用于将多个对象组合成树形结构，以表示“部分-整体”的层次关系。通过组合模
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
初始化列表与类型转换（C++） 2401_89195731 c++开发语言
初始化列表和构造函数体在C++中都是用于给类的成员变量赋初值区别：初始化列表是给每个成员变量定义初始化的地方，即使有成员变量没有给它显式在初始化列表初始化，它也会走初始化列表初始化时机初始化列表：在对象创建时，成员变量通过初始化列表被直接初始化，这发生在构造函数体执行之前。构造函数体内赋值：成员变量首先被默认初始化，然后在构造函数体内通过赋值语句进行赋值。性能差异初始化列表：通常更高效，因为它避免
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Docker容器底层原理详解：从零理解容器化技术 Debug Your Career 面试 docker 容器 docker java
一、容器本质：一个“隔离的进程”关键认知：Docker容器并不是一个完整的操作系统，而是一个被严格隔离的进程。这个进程拥有独立的文件系统、网络、进程视图等资源，但它直接运行在宿主机内核上（而虚拟机需要模拟硬件和操作系统）。类比理解：想象你在一个办公楼里租了一间独立办公室（容器）。你有自己的桌椅（文件系统）、电话分机（网络）、门牌号（主机名），但共享整栋楼的水电（宿主机内核）和电梯（硬件资源）。办公
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
.NET 一款基于BGInfo的红队内网渗透工具 dot.Net安全矩阵网络 .net 安全 .netcore web安全矩阵
01阅读须知此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他方面02基本介绍在内网渗透过程中，白名单绕过是红队常见的技术需求。Sharp4Bginfo.exe是一款基于微软签名工具
HashMap的Get(),Put()源码解析 Ttang23 哈希算法散列表算法
1、什么是HashMap？HashMap是Java中用于存储键值对（Key-Value）的集合类，它实现了Map接口。其核心特点是：无序性：不保证元素的存储顺序，也不保证顺序恒定不变。唯一性：键（Key）不能重复，若插入重复键会覆盖原有值。允许null：允许一个null键和任意数量的null值。非线程安全：相比HashTable，HashMap不支持同步，性能更高。2.核心数据结构：哈希表（Has
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul