stan1111

Radflow：时间序列网络的递归、聚合和可分解模型

本人依照对论文的理解对用pytorch在交通数据上复现了这篇论文，结果和论文给出的结果有一点出入，因为是个人理解所以难免有出入。如果大家发现错误请一定告知我，感谢！复现链接：https://github.com/stanli124/Radflow-Pytorch

摘要

我们提出了一种新的相互影响的时间序列网络模型。时间序列中的图形结构存在于不同的领域，例如受超链接影响的网络流量、受推荐影响的产品销售或受道路网络和天气影响的城市交通量。最近在图形建模和时间序列预测方面分别取得了一些进展，但目前还不存在一种用于序列网络的表达性和可伸缩性方法。我们引入Radflow，一种新的模型，它包含三个关键思想：一个用于获得依赖时间的节点嵌入的递归神经网络，用多头注意力聚集来自相邻节点的影响流，以及时间序列的多层分解。Radflow自然会考虑节点和边随时间变化的动态网络，并可用于预测和数据插补任务。在几百到几十万个节点的真实数据集上，我们观察到Radflow变体是各种设置中性能最好的模型。Radflow中的循环分量也优于最先进的时间序列模型N-BEATS。我们证明了Radflow可以学习不同的趋势和季节模式，它对缺失节点和边缘具有鲁棒性，并且网络邻居之间的相关时间模式反映了影响强度。我们策划了WikiTraffic，这是最大的时间序列动态网络，拥有366K个节点和2200万个时间相关链接，时间跨度五年。该数据集为开发该领域的模型提供了一个开放的基准，其中包括优化web资源的应用程序。更广泛地说，Radflow有潜力改进相关时间序列网络（如股票市场）的预测，并在地理上分散的自然现象网络中估算缺失的测量值。

1 介绍

预测时间序列是一个长期存在的研究问题，适用于计量经济学、市场营销、天文学、海洋科学等领域。同样，网络也是积极被研究的对象，网络与交通、互联网基础设施、生物过程中的信号和在线媒体等领域具有广泛的相关性。在本文中，我们关注相互影响的时间序列网络之间的预测。解决此问题的工具将有助于回答有关复杂系统在上述应用领域及其他领域随时间演化的问题。
从时间序列和大型网络的端到端学习的最新进展来看，有三个突出的挑战。第一个是表达能力，即构建模型以表示更丰富的功能类。最近在预测图书销量[6]和在线视频浏览量[38]方面的工作采用了对传入节点的最后观察值的简单聚合[6]或线性组合[38]。
最近的图神经网络[8,14,35]提供了网络邻居之间的灵活聚合，但不容易应用于时间序列。N-BEATS[21]是时间序列基准测试中的最新模型，使用一组神经模块分解历史值；但是，由于神经模块没有明确编码数据的时间结构，因此这种结构不能为序列网络提供可用的表示。自然语言处理（NLP）领域中考虑了几种图到序列的任务[4,39]，但时间序列网络问题，用这种术语来说，是序列图到序列图。
第二个挑战是规模。我们的目标是建立纵向（即每日）跨越几年的时间序列，以及数十万个节点的大型网络。这需要时间序列组件、图组件及其交互的可伸缩性。例如，最近提出的T-GCN模型[40]将一个图神经网络嵌套在一个递归神经网络中，该网络在空间和时间复杂度上都受到限制，因此无法扩展到web规模的网络。评估中使用的网络仅包含几百个节点。
第三是网络中连接和节点的动态特性。例如，Wu等人[38]报告说，50%的在线视频推荐链接出现在63天的观察中不到5天，我们观察到，仅2020年上半年就创建了超过10万个新维基百科页面。动态网络是图神经网络关注的一个活跃话题[18,22,33]，但这些现有算法设计用于链路预测和节点分类，而不是时间序列预测。
我们提出了一种新的时间序列神经网络模型来解决这三个挑战。我们采用一种递归结构，在时间序列分解原理的基础上提供对时间敏感的网络流聚合；因此命名为Radflow。
它比n-beats更具表大能力，因为它可以生成节点嵌入来处理图形输入。它比T-GCN更具可扩展性，因为它可以通过网络注意力和重要性加权节点采样处理数十万个节点。Radflow的结构允许它以动态变化的节点和边作为输入，允许缺失数据，适用于多变量时间序列。此外，它的多头注意策略和分层分解提供了对网络影响和时间的解释。
Radflow在四个数据集上进行评估。两个是由几百个节点组成的城市交通；另外两个是大型数据集VevoMusic，包含61K个视频[38]，和新策划的WikiTraffic数据集，包含366K页面和2200万个动态链接。在VevoMusic和WikiTraffic上，没有网络信息的Radflow始终优于可比的N-beats[21]。在具有网络信息的模型中，Radflow变体在插补和预测任务中表现最好。特别是，Radflow在VevoMusic上的SMAPE分数比最先进的ARNet[38]高出19%。我们发现，循环分量中的层捕捉到不同的季节性和趋势，而网络上的注意力捕捉到了来自相邻节点的时间变化影响。图1示出了基于该页面的历史流量和相邻页面的流量来预测黄色背心运动的28天观看次数的任务。Radflow正确预测了测试期间观察到的急剧下降。
主要贡献点：
1.Radflow，一种用于多变量时间序列动态网络的端到端神经预测模型，可扩展到数十万个节点。
2.通过分层分解对时间序列模式的可解释预测，以及通过多头注意力对网络邻居的可解释预测。
3.在各种任务的真实数据集上，始终优于最先进的时间序列预测模型和网络序列预测模型。
4.WikiTraffic，时间序列中最大的动态网络，包含来自366K个维基百科页面的多维度流量数据和五年内的22M动态链接。GitHub1上提供了数据集、代码和预处理模型。

2 相关工作

2.1 时间序列模型

时间序列建模有大量的文献，跨越许多领域。经典方法[11]包括指数平滑和自回归综合移动平均(ARIMA)模型。指数平滑使用过去观测值的指数衰减权重，而扩展可以结合趋势和季节性[3，10，36]。ARIMA [2]模型旨在使用过去观测值和预测误差的线性组合来描述时间序列中的自相关，扩展也可以包含季节性。近年来，神经网络方法变得更加流行。吴等[37]利用transformers预测流感活动。朱和拉普捷夫[42]使用贝叶斯神经网络来建模预测中的不确定性。
Oreshkin等人[21]首次证明，在基准数据集M3[16]、M4[17]和tourism[1]上，没有任一时间序列特定组件的纯神经网络模型可以优于现有的统计技术。他们提出的模型N-BEATS将时间序列预测视为一个非线性多元回归问题，输出一个固定长度的向量作为预测。N-BEATS的关键建模组件是层的叠加，每个层都将前一层计算的剩余时间序列作为输入。然而，N-BEATS仅适用于一维时间序列，并且不会在每一步生成时间序列表示向量，这使得它难以用于具有动态网络信息的设置中。我们通过采用在任何时间步产生时间序列表示（我们称之为嵌入）的循环网络结构来解决这些缺点，同时仍然利用N-beats的剩余叠加思想。
另一类时间序列是连续时间内发生的离散事件，通常由时间点过程描述。使用点过程的预测方法[19]要求数据包含单个事件的详细信息，而不是由于隐私和存储限制而在大规模web数据中更常见的聚合统计信息。点过程估计模型通常是事件数量的二次型，这对于VevoMusic和WikiTraffic等大规模数据来说过于昂贵。

2.2 网络上的预测

在线服务中的网络影响是一个活跃的研究领域，研究在线项目之间的链接如何决定可见性、影响和未来行为等属性。社交网络和信息网络经常在这种背景下被研究。在Twitter上，Su等人[29]指出，新的基于网络的推荐系统的引入导致了网络结构的实质性变化，加剧了“富人越来越富”的现象。在维基百科上，链接结构被用来跟踪新兴主题的演变[12]和由外部事件引起的流量[41]。Zhu等人[41]表明，当维基百科文章从外部事件中获得注意力时，它会导致下游超链接文章的关注大幅增加。Kämpf等人[12]表明，使用维基百科的页面浏览量和内部链接可以跟踪和预测一个新兴主题的演变。亚马逊上的产品推荐网络已被证明会影响购买决策[20]。Wu等人[38]指出，YouTube的推荐系统所诱导的网络导致了音乐视频之间的影响流。
对网络影响建模的一种最新方法是使用图神经网络生成图中节点的低维嵌入。早期的方法，如node2vec[7]和DeepWalk[24]都是直推式的，主要设计用于处理固定图。最新的模型可以应用于需要为训练期间未看到的节点生成嵌入的归纳设置。例如，这是通过在GraphSage[8]中从局部邻域中采样和聚合节点特征来实现的。已经提出了各种聚合方法，包括最大池[8]和平均池[14]。Veličković等人[35]提出了图注意力网络（GAT），该网络使用了一种改进的多头注意力[34]来聚合邻域。在我们提出的架构中，网络嵌入和聚合是关键组件。可以使用多种网络聚合机制（参见第4.2节和第6节）。我们建议的聚合机制类似于GAT，但相反，我们使用了多头注意力的原始且更常见的点积公式。

2.3 时间序列网络

作为一个新的研究领域，时间序列网络的预测方法很少，数据集数量有限。早期的方法忽略了网络结构，而是将每个节点视为一个独立的序列[25,30]。Wu等人[38]将局部网络结构整合进自回归时间序列模型，但该体系结构仅适用于静态图。Zhao等人[40]提出了一种新的递归神经网络（RNN）单元，称为T-GCN，该单元通过加入图卷积网络（GCN）组件来考虑静态图的结构。这两个组件的捆绑和缺乏邻域采样使得T-GCN在计算上过于昂贵，无法应用于超过几百个节点的图。
一个相关的问题是预测网络中的边是如何变化的，例如使用点过程[32,33]或图形和时间上的二维注意[27]。我们不处理这个问题；相反，我们假设动态图是观察到的（例如由推荐系统或crowd-sourcing生成），预测目标是每个节点上的时间序列，而不是图本身的演化。我们的工作是第一个为大型动态时间序列网络优化的预测模型。

3 问题陈述

考虑图的时间序列预测问题。输入为图 $G = (V, E)$ ，又由N个节点组成，表示为 $V=\{v^1,v^2,...,v^N\}$ ，另外还有M条边。每个节点 $v^j$ 与有T个观测值的多元时间序列相关联：
$\large v^j=[v_1^j,v_2^j,...,v_T^j] \tag 1$
其中 $v_t^j \in R^D$ 是节点vj在时间步t的d维观测值向量. 当时间序列在每个时间步只有一个值的时候D=1.我们使用 $v^j_{t:s}$ 表示vj从时间t到时间s的所有观测值的子序列，t小于s。
$\large v_{[t:s]}^j=[v_t^j,v_{t+1}^j,...,v_{s-1}^j,v_s^j] \tag 2$
如果节点vi有可能直接影响节点vj在时间步t的时间序列，我们会添加一条从vi到vj的有向边 $e^{ij}_t$ ，vi就成为vj的邻居。我们定义 $\mathcal{N_t}(v^j)$ 为vj在时间步t的邻域集合。边可能随着时间出现和消失，因此G是一个动态图。我们现在可以把G表示为一个邻接矩阵 $\in R^{N \times N \times T}$ 。对于无权有向图，A中的实体 $a_{ijt}$ ，如果边 $e^{ij}_t$ 存在其值为1，否则为0。
我们现在定义时间序列预测问题，因为它适用于动态图。预测长度F是模型将预测的未来时间步的数量，而过去长度B是可用于进行此类预测的过去观测数。假设我们当前处于时间t=0。为了预测节点vj（我们称之为ego节点）从时间步长1到F的时间序列，预测模型如下：
$\large \hat v_{[1,F]}^j=ForecastModel(v_{[-B+1:0]}^j,\mathcal V^{ \mathcal N(v^j)}) \tag 3$
预测模型会接受两个输入：vj的最近B个观测值以及来自vj邻域的信息。这导致了两个不同的设置，它们都会在章节7中评估。第一个是数据插补，这时我们在预测的同时观测邻域的真实值。这相当于在预测期内使用邻域的真实值。
$\large \mathcal V^{\mathcal N(v^j)}=\{v'_{[-B+1:F]} |v' \in \mathcal N(v^j)\} \tag 4$
这是Wu等人[38]使用的设置，当主要目标是填充时间序列中缺失的数据或解释节点之间的影响时，该设置最为有用。第二个设置是Forecast，我们首先使用我们最好的纯时间序列模型来预测每个邻居的未来观测值。然后将这些预测用于整个模型中，以预测vj本身。
在两个设置中,模型最后的输出是
$\large \hat v^j_{[1,F]} = [\hat v_1^j,\hat v_2^j,...,\hat v_F^j] \tag 5$
与接下来F个时间步对应的预测值.这里我们使用hat符号表示模型的预测值.如 $\hat v_t^j$ 是与真实值 $v_t^j$ 相对应的预测时间序列向量。

4 RADFLOW

RADFLOW主要由两个主模块组成：循环组件和流聚合组件。循环组件独立地对图中的所有时间序列建模，而流聚合组件根据相邻时间序列调整预测。通过将两个主要模块的输出相加，获得时间步长t处节点vj的预测值。
$\large \hat v_t^j=v_t^{jR}+v_t^{jA} \tag 6$
jR和jA是分别来自循环组件的预测值和流聚合组件的预测值。jA本身是jR的函数。

4.1 循环组件 Recurrent component

我们通过使用叠加循环块将时间序列分解为L个分量来预测时间序列。循环组件还被喂入流聚合组件，流聚合组件使用节点向量来聚合邻域中的信息。图2是循环部件的示意图。

首先将时间序列的历史观测值投影到潜在空间 $\mathbb R^H$ 中 ,H是隐藏状态大小:
$\large \mathcal z_t^{j1} = W^D \mathcal v_t^j \tag 7$
其中 $W^D \in \mathbb R^{H \times D}$ 是可学习权重矩阵。为了得到这个投影的直观理由，考虑D＝1和 $W^D$ 是全一向量的特殊情况。那么 $\mathcal z_t^{j1}$ 会包含观测结果 $\mathcal v_t^{j}$ 的h个副本。这类似于并行运行h个不同的时间序列模型的集合。
我们模型的循环组件由L个块组成。 $\mathcal z_t^{j \ell}$ 是节点vj在时间步t的第l个block的输入。特别地，公式7中计算得到的向量 $\mathcal z_t^{j1}$ 会被用作于第一个block的输入。每个block会输出三个向量-the backcast vector $p_t^{j \ell}$ , the forecast vector $q_t^{j \ell}$ 和 the node vector $u_t^{j \ell}$ :
$\large (p_t^{j \ell},q_t^{j \ell},u_t^{j \ell})=Block_{\ell}(z_t^{j \ell}) \tag 8$
其中 $(p_t^{j \ell},q_t^{j \ell},u_t^{j \ell}) \in \mathbb R^H$ 。特别是在每个区块内，我们有一个LSTM单元，接着是前馈层。LSTM Cell先运行，接受以下输入：由前一块 $z_t^{j \ell} \in \mathbb R^H$ 计算的时间序列残差，前一时间步的隐藏状态 $h_{t-1}^{j \ell} \in \mathbb R^H$ ，以及细胞状态 $c_{t-1}^{j \ell} \in \mathbb R^H$ 。LSTM单元计算得到隐藏状态输出 $h_{t-1}^{j \ell}$ ，该输出稍后会被传入三个不同的前馈层：
$p_t^{j \ell} = FeedForward^{P \ell}(h_t^{j \ell}) \tag 9$
$q_t^{j \ell} = FeedForward^{Q \ell}(h_t^{j \ell}) \tag {10}$
$u_t^{j \ell} = FeedForward^{U \ell}(h_t^{j \ell}) \tag {11}$
每个前馈层由两个线性投影组成，在第一个线性投影接GELU激活函数： $FeedForward(h)=W^{FF_2}GELU(W^{FF_1}h)$
GELU激活函数是Relu函数的随机变体，已经被证明在序列到序列模型中比Relu表现的更好。GELU被定义为 $x\Phi(x)$ ， $\Phi$ 是标准高斯累积分布函数。第一个输出 $p_t^{j \ell}$ 是Block_l捕获的投影时间序列的一个组成部分。后续块的输入取决于消除此序列后投影时间序列的残值：
$z_t^{j \ell + 1} = z_t^{j \ell} - p_t^{j \ell} \tag {13}$
第二个输出 $q_t^{j \ell}$ 是block_l对下一个时间步的预测的贡献。循环分量的最终预测表示将是所有块的总和
$\hat q_{t+1}^{jR}=\sum_{\ell = 1}^L q_t^{j \ell} \tag {14}$
其中 $\hat q_{t+1}^{jR} \in \mathbb R^H$ 。然后我们把该总和投影到 $\mathbb R^D$ 从而获得循环分量的预测贡献.也就是公式6中的第一项:
$\large \hat v_{t+1}^{jR} = W^R \hat q_{t+1}^{jR} \tag {15}$

4.2 流聚合组件 Flow aggregation component

流聚合组件对网络中相邻节点的时间序列之间的影响进行建模。该组件将邻域中每个节点的循环组件中与时间相关的嵌入作为输入，并生成等式（6）中的第二项作为输出。每个嵌入汇总了当前时间之前对应节点的时间序列。设 $u_t^j$ 是节点vj在时间步t处的嵌入，由节点向量 $u_t^{j \ell}$ 在L个块上求和形成:
$u_t^j = \sum_{\ell = 1}^L u_t^{j \ell} \tag {16}$
在数据插补设置(imputation setting)中，在t+1时刻预测节点所有邻域的嵌入集合为
$\mathcal u_{t+1}^{v^j} = \{u_{t+1}^i|i s.t. v^j \in \mathcal N_{t+1}(v^j)\} \tag {17}$
在预测设置中(forecast setting),我们简单地使用预测的 $\hat u_{t+1}^i$ 替换真实值 $u_{t+1}^i$ .我们现在将预测节点的嵌入投影到查询空间中
$u_t^{Qj} = W^Qu_t^j \tag {18}$
把邻域节点的嵌入投影到键空间和值空间中,
$u_{t+1}^{Ki} = W^Ku_{t+1}^i \tag {19}$
$u_{t+1}^{Vi} = W^Vu_{t+1}^i \tag {20}$
聚合嵌入 $\hat u_{t+1}^j$ 是具有GELU激活的值的加权和,
$\overset {\thicksim} u_{t+1}^j = GELU(\sum_i \lambda_i u_{t+1}^{V_i}) \tag {21}$
其中 $\lambda_i$ 称为注意力得分,由查询和键之间的点积计算得到,接着通过softmax层。注意预测节点(ego node)不包括在聚合中;相反,它是单独添加的,
$\overset {\thicksim} u_{t+1}^j = W^Eu_t^j + W^N \hat u_{t+1}^j \tag {22}$
然后将结果投影到 $\mathbb R^D$ 中.
$\hat v_{t+1}^{jA} = W^A \hat u_{t+1}^j \tag {23}$
向量 $\hat v_{t+1}^{jA}$ 就是来自流聚合组件的预测贡献,也就是公式6中的第二项.
我们将带有多头注意力的完整模型称为Radflow。请注意，流聚合组件和循环组件是解耦的。因此，我们可以很容易地用另一种节点聚合方法来代替多头注意。特别是，如果我们用邻域的简单算术平均值替换等式（21）
$\overset {\thicksim} u_{t+1}^j = \frac{1}{|\mathcal N_{t+1}(v^j)| \sum_i u_{t+1}^i } \tag {24}$
我们将获得GraphSage的原始公式[8]。我们称使用公式(24)而不是公式(21)的模型为Radflow-GraphSage。除了采用公式(24)外，进一步的简化是在添加ego节点与其邻居的嵌入时，去掉公式(22)中的线性投影。我们把这个变体Radflow-MeanPooling。

4.3 与现有模型的关系

4.3.1 GAT

我们的多头注意力(multi-head)邻域聚合类似于图注意力网络(GAT)。为了计算GAT中的注意力分数，我们首先需要将ego节点的嵌入与邻居节点的嵌入连接起来，然后通过一个前馈网络将结果输入一个LeakyReLU。相反，我们回到最初的多头注意力[34]，我们用一个简单的点积(dot product)来计算注意力分数。我们还添加了零关注，即节点可以选择不关注任何邻居。我们将在第7节中以经验证明，我们的简单方法在几乎所有情况下都优于GAT。

4.3.2 N-BEATS

将时间序列的残差输入到深度网络层的过程受到了N-BEATS的启发。然而，N-BEATS从原始标量观测值中获取残差，而我们的方法是从时间序列的向量-值投影中计算残差，如公式(7)所示。此外，N-BEATS不容易适应动态图设置，因为它不会生成依赖于时间的嵌入。N-BEATS将预测任务视为多元回归问题，其中每一步都可以看到历史中的其他每一步。这使我们能够获得整个序列的嵌入，但不能获得单个步的嵌入。在我们提出的架构中，节点向量 $u_t^{j\ell}$ 用于构建每个步的时间相关嵌入，如等式（16）所示。

4.3.3 Transformers

在过去几年中，transformers[34]已成为NLP领域中的首选序列模型。尽管他们在NLP任务中取得了成功，但在时间序列预测方面进展甚微。最近，Wu等人[37]设计了一种用于预测流感病例的transformers，但他们的模型仅比LSTM基线提供了微小的改进。我们的初步调查表明，LSTM在时间序列设置方面的性能优于transformers。我们假设LSTM严格的时间顺序可以更自然地编码时间序列；而文本通常具有潜在的树状结构，它更自然地通过注意机制和位置编码被transformers编码。

4.3.4 Non-neural aggregation

最相关的非神经聚合方法是ARNet[38]，一种标量值时间序列预测模型，其中预测计算如下：
$\large \overset {\thicksim} v_t^j=\sum_{k=1}^p \alpha_k^jv_{t-k}^j+\sum_{v_i \in \mathbb N(v^j)} \beta^{ij}v_t^i \tag {25}$
其中，第一项为p=7（天）阶自回归模型，第二项为网络效果建模。可学习参数 $\beta^{ij}$ 可以解释为控制从节点i传播到节点j的视图比例的边权重。尽管ARNet很简单，解释也很简单，但该模型假设网络是静态的。此外，Wu等人[38]仅在数组增补环境中进行评估，而不在未来观测值未知的预测环境中进行评估。我们将在第7节中展示，Radflow增加的复杂性允许它在预测环境中同时包含动态图和功能。

4.3.5 Neural aggregation

最接近我们的模型是T-GCN[40]，其修改的GRU单元在计算更新和重置门之前进行图卷积。与Radflow不同，Radflow用于从磁盘获取子图，并且只在最后一个LSTM层之后计算一次网络信息，T-GCN要求整个网络都在内存中，并在每个层的每个时间步聚合网络。因此，由于空间和时间复杂性，T-GCN不能扩展到更大的数据集。另一方面，我们提出的体系结构可以轻松处理数十万个节点的动态网络。

5 时间序列动态网络

Radflow的经验验证在两个小型静态网络Los-loop和SZ-taxi上进行[40]；以及两个大型动态网络VevoMusic[38]和WikiTraffic。其中，WikiTraffic是我们收集的新数据集，是迄今为止最大的时间序列动态网络。本节详细描述了每个数据集

5.1 Los-loop and SZ-Taxi

Los loop和SZ-taxi[40]s 包含交通速度和道路网络信息的时间序列。Los Loop是一个由207个传感器组成的网络，从2012年3月1日到3月7日，每隔5分钟测量一次交通速度。如果两个传感器彼此靠近，则它们之间有一条边。深圳出租车是深圳罗湖区156条道路组成的网络，从2015年1月1日至1月31日，每15分钟测量一次交通速度。如果两条道路相连，则在它们之间形成一条边。两者都是静态网络，Losloop包含2833条边，SZ-taxi包含532条边。我们使用这些数据集将Radflow与T-GCN进行比较[40]。

5.2 VevoMusic

VevoMusic[38]是一个YouTube视频网络，包含来自4435位不同艺术家的60740段音乐视频。网络中的每个节点对应于一个视频，并与2018年9月1日至2018年11月2日63天内收集的每日观看次数的时间序列相关联。如果在t天，视频v出现在视频u的推荐列表中，则在t天存在从视频u到视频v的有向边。
为了确保公平比较，我们使用Wu等人[38]划分的按时间顺序的训练-测试，其中我们在前49天进行训练，在接下来的7天进行验证，并在最后7天进行测试。我们还遵循最初的设置，在至少有一个传入边的13710个节点上计算评估指标。这使得网络模型和非网络模型之间的差异更加明显。

5.3 WIKITRAFFIC

我们收集了新的wikitraffic网络数据集，其中包含366K节点和2200万个不同的页面对，这些页面对在五年的时间里至少有一天具有边。在任何一天，我们都有多达1700万个链接，如表1所示。

WikiTrafficis和vevomusicin相似，它们都表现出很强的每周季节性(图3)。它们都有动态链接，尽管wikitraffic链接总体上更稳定(图4)。

数据收集从英文维基百科的原始转储开始，其中包含1700万篇文章的完整修订历史。我们从中收集2015年7月1日至2020年6月30日的每日浏览次数。在最后的140天里，我们会删除每天平均浏览量少于100的文章。这样我们就有366,802个页面了。观看量计数分为两类: 桌面用户的观看量和非桌面用户的观看量。我们将最后28天设置为测试期，再前28天设置为验证期，其余时间设置为训练期。提前28天预测可以让我们在预测未来相当长的一段时间时测试模型的稳健性。
此外，由于WikiTraffic比其他网络的时间序列数据集大一个数量级，因此我们可以留出节点，仅在测试期间使用。因此，训练-测试划分按时间和节点划分，为模型的推广能力提供了更强的测试。为了有助于评估基于网络的预测模型，测试集应该形成自己的网络，因此我们选择连接的节点。我们从四个种子类别开始：编程语言、星球大战、全球变暖和全球健康，每个类别都有许多子类别。从每个种子类别开始，我们收集该类别中的所有页面以及四个级别中的所有子类别。这为我们的测试集提供了2434页。最后，我们考虑两个版本的数据集-单变量版本，我们预测页面的总观看量计数，和二元版本，我们分别预测桌面和非桌面流量。
在我们开展工作之前，谷歌为Kaggle竞赛创建了一个数据集，其中包含了维基百科中145K个随机抽样页面两年的流量。但是，此数据集不包含网络信息，并且包含噪音较大的低流量页面。Rozemberczki等人[26]策划了一个关于专门主题（变色龙、鳄鱼和松鼠）的小型超链接Wikipedia网络，每月只提供一次浏览次数。Consonni等人[5]引入了从2001年到2018年包含所有动态链接的WikiLinkGraph，但他们没有收集流量信息。相比之下，我们的WikiTraffic是时间序列中最大的动态网络，能够对信息流和用户兴趣进行大规模的详细研究。

6 评估设置

通过预测Vevomusic上最后7天和WikiTraffic上最后28天的浏览量进行评估。对于Los loop和SZ taxi，我们预测了最后一小时的速度（Loos loop的最后12步和SZ taxi的最后4步）。如第3节所述，我们考虑了大数据集的预测和插补设置。在VevoMusic上，我们在两个不同的网络上进行评估：我们称之为VevoMusic（动态）的全动态网络和我们称之为VevoMusic（静态）的静态网络。为了构建静态版本，Wu等人[38]使用了主要的平滑方法来删除仅短暂出现的边，并使剩余边在所有时间步中保持不变。他们的最佳模型ARNet仅在插补设置的静态网络上进行评估。在WiKiTrFiFIC中，我们考虑两个网络：一个是单变量时间序列的观看计数网络，另一个是双变量时间序列的网络，其中桌面和非桌面流量被分开。
根据之前的预测工作[16,17]，我们的主要评估指标将是预测范围F的对称平均绝对百分比误差：

其中 $\small \mathcal T$ 是测试集中的样本数量，F是预测范围，D是时间序列的维度， $\hat v_{td}^j$ 是真实值 $v_{td}^j$ 对应的预测值。SMAPE的上限为200，下限为0。它与尺度无关，确保预测误差将被视为与序列的大小有关。这一点很重要，因为它可以防止具有大量观看量的节点控制评估度量。较低的SMAPE对应更好的拟合，当且仅当预测完全符合基本事实时，SMAPE为0。对于单变量时间序列的两个小网络，Los LOOP和SZ-taxi，我们还报告了均方根误差RMSE和平均绝对误差MAE。

6.1 模型变体

在一项消融研究中，我们比较了8个时间序列基线、7个网络时间序列变体和7个以上Radflow变体。以下8条时间序列基线的结果见表3和表4。
时间序列基线：

使用网络结构的预测模型

最后，我们进行一项消融研究，以测试我们架构的关键组件（表6）。从最佳模型（15）开始，用替代品替换模型中的一个部件：
(16-20)Radflow with other node embedding：我们可以选择重用单元的隐藏状态h（16）、回溯表示p（17）或预测表示q（18），而不是使用单独的输出u来表示节点。我们也可以连接不同的表示，例如[h; p]或者[h;p;q]。
(21)Radflow with no final projection：我们忽略等式（22）中的线性投影，将ego节点的嵌入直接添加到其邻居节点中。
(22)Radflow with one attention head：最后一个变体测试在完整模型中只有一个注意力头而不是默认的四个注意力头的效果。

6.2 数据预处理和训练细节

网络尺度的时间序列观测通常在尺度上有很大差异。一个不受欢迎的页面可能没有浏览量，而一个受欢迎的页面可能每天收到数百万次访问。为了确保相似的缩放，我们的模型的输入和输出都是对数转换过的时间序列。在计算SMAPE、RMSE和MAE之前，输出是指数化的。通过向前传播最后一个有效观测值，可估算缺少的浏览量。我们不对时间序列应用任何其他预处理技术，如趋势或季节性去除。

表2显示了Radflow的关键超参数。我们使用Adam优化器[13]对所有模型进行了SMAPE目标训练， $\beta_1=0.9,\beta_2=0.9999,\epsilon=10^{-8}$ 。我们将权重衰减因子设置为10−4并将其与学习率分离[15]。我们把学习速度提高到10−4在前5000步中，然后10个epochs之后线性衰减，每个epoch由10000个步组成。我们将梯度范数剪裁为0.1。我们所有的模型都在Pytorch中实现[23]。为了进行公平比较，我们将所有变体的层数固定为8层，并确保所有变体的大小都在彼此的5%以内。

6.3 计算成本

训练时间 VevoMusic实验在Titan V GPU上进行，WikiTraffic实验在Titan RTX GPU上进行。Titan RTX的内存是Titan V的两倍，用于在WikiTraffic上训练两跳Radflow。所有纯时间序列模型收敛速度非常快，训练时间不超过三个小时。具有一跳聚合的模型最多需要17小时进行训练，而具有两跳聚合的模型最多需要两天。我们从验证集中SMAPE得分最低的epoch中选取模型作为我们的最佳模型。
图的高效计算 与以前的方法（如T-GCN）不同，我们的模型不需要在训练期间将整个图形存储在内存中。相反，我们以HDF5格式存储图形，一次只直接从磁盘加载一批。
邻域采样 为了保持计算的可处理性，我们设计了一种基于重要性的邻域抽样技术。我们提出了一种两阶段的方法来选择邻居，而不是汉密尔顿使用的普通均匀采样。首先我们给每个邻域分配一个得分 $\frac {\sum_dv_{td}^j}{outdegree(v_t^j) + 1}$ 。这个得分是邻域在时间步t的总的观看次数。添加自循环以避免被零除。直观地说，具有更多观看量的邻居将具有更大的影响，但如果该邻居具有多个外链，则影响将更加分散。使用这些分数，我们移除了每个ego节点邻域中倒数第10个百分位数的邻居，这减少了聚合引起的噪声。在第二阶段，我们在训练期间对四个邻居进行采样，其概率与邻居在回播期间出现的时间步数成正比。在评估过程中，我们发现由于数据量大，使用所有节点在计算上是不可行的。因此，对于每个ego节点，我们只选择单跳设置中出现频率最高的16个邻居，以及两跳设置中的前8个邻居。

7 结果

我们首先讨论不同模型变体的预测性能(第7.1和7.2节，表3至6)。适用时，我们在括号中报告配对样本的相关t-test的P值(表示为P)。本节中讨论的所有差异都具有统计学意义。有关更详细的显著性测试，请参见附录[31]。然后，我们给出了循环组件中不同层的可视化解释(第7.3节)，接着是网络聚合组件提供的见解(第7.4节)。最后，我们对Radflow等模型的潜在应用进行了两项初步研究:网络未被完全观测时预测的稳健性(第7.5.1节)，以及节点上流量激增与其注意力得分之间的关系(第7.5.2节)。

7.1 预测和增补性能

你可能感兴趣的:(论文阅读,pytorch,深度学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【安装环境】配置MMTracking环境 xuanyu22 安装环境机器学习神经网络深度学习 python
版本v0.14.0安装torchnumpy的版本不能太高，否则后面安装时会发生冲突。先安装numpy，因为pytorch的安装会自动配置高版本numpy。condainstallnumpy=1.21.5mmtracking支持的torch版本有限，需要找到合适的condainstallpytorch==1.11.0torchvision==0.12.0cudatoolkit=10.2-cpytor
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
Pyorch中 nn.Conv1d 与 nn.Linear 的区别迪三 #NN_Layer 神经网络
即一维卷积层和全联接层的区别nn.Conv1d和nn.Linear都是PyTorch中的层，它们用于不同的目的，主要区别在于它们处理输入数据的方式和执行的操作类型。nn.Conv1d通过应用滑动过滤器来捕捉序列数据中的局部模式，适用于处理具有时间或序列结构的数据。nn.Linear通过将每个输入与每个输出相连接，捕捉全局关系，适用于将输入数据作为整体处理的任务。1.维度与输入nn.Conv1d（一
图片中的上采样，下采样和通道融合(up-sample, down-sample, channel confusion) 迪三 #图像处理_PyTorch 计算机视觉深度学习人工智能
前言以conv2d为例（即图片），Pytorch中输入的数据格式为tensor，格式为:[N,C,W,H,W]第一维N.代表图片个数，类似一个batch里面有N张图片第二维C.代表通道数，在模型中输入如果为彩色，常用RGB三色图，那么就是3维，即C=3。如果是黑白的，即灰度图，那么只有一个通道，即C=1第三维H.代表图片的高度，H的数量是图片像素的列数第四维W.代表图片的宽度，W的数量是图片像素的
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
深度学习：怎么看pth文件的参数奥利给少年深度学习人工智能
.pth文件是PyTorch模型的权重文件，它通常包含了训练好的模型的参数。要查看或使用这个文件，你可以按照以下步骤操作：1.确保你有模型的定义你需要有创建这个.pth文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。2.加载模型权重使用PyTorch的load_state_dict方法来加载权重。这里是如何操作的：importtorchimporttorch.nnasnn#定义模型结构
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt