AncilunKiang

《Generic Dynamic Graph Convolutional Network for traffic flow forecasting》阅读笔记

论文标题

《Generic Dynamic Graph Convolutional Network for traffic flow forecasting》

干什么活：交通流预测（traffic flow forecasting ）
方法：动态图卷积网络（Dynamic Graph Convolutional Network）
创新：通用（Generic）

作者

隔壁北航的大佬们太强了。这个项目有国自然和校级资金支持。

初读

摘要

现存方法的局限性：图卷积网络
- 共享模式不充分
- 时间关系不灵活
- 关系假设不固定
新方法：
- 具有参数共享和跨堆叠层独立块的通用框架
  - 用以系统地探索所以数据维度上地参数共享
  - 可以同时利用层与层之间的不同模式和跨层的稳定模式。
- 一个新的时间图卷积块
  - 从图的角度将历史时隙视为节点，并用图卷积处理时间动态。
  - 可以捕获灵活的全局时间关系，以便更好地了解当前的交通状况。
- 一种动态图构造函数
  - 不仅可以对节点之间特定于时间的空间依赖关系进行建模
  - 还可以对时隙之间不断变化的时间交互进行建模，从而从数据中彻底发现动态关系。
效果：

在四个真实世界数据集上的实验结果表明，GDGCN 不仅优于最先进的方法，而且可以获得可解释的片段动态空间关系。

结论

提出的通用框架 GDGCN
- 具有独立块和共享块。
- 可以系统地跨层捕获各种模式和共享模式。
提出的时间图卷积
- 从图的角度将多个历史时隙视为节点。
- 可以捕捉灵活的全局时间关系。
提出的动态图构造函数
- 可以同时对时变空间和时间关系进行建模。
实验证明了 GDGCN 的优越性、时间图卷积和学习的动态图的有效性。
意义：

这项工作通过探索参数共享机制和从图的角度建立时间关系，为交通预测提供了新的见解。这些思想也可以应用于更一般的多变量时间序列预测问题。

再读

Section 1 Introduction

第一段：时空数据挖掘牛
- 时空交通数据开采是交通系统领域的一个基础研究问题；
- 交通数据挖掘的研究数据形式具有代表性，因此可以很容易地将其研究转移到其他领域时空学习问题，如人类迁移建模、兴趣点推荐。
第二段：现有方法的优劣
- 最早：经验统计方法
  - 忽略了节点之间的空间依赖性。
- 后续：深度学习方法
  - 卷积神经网络（CNN）
    - 用于挖掘空间中的关系
    - 无法工作在非欧几里得空间中构建的交通图
  - 递归神经网络（RNN）
    - 用于发现时间中的模式
- 如今：图卷积网络（GCN）
  - 已被有效地用于交通预测。
  - 最早基于距离或函数相似性构建空间图
    - 缺点：
      - 需要专家知识
      - 可能是不完整的
  - 后来从数据中构造自适应空间邻接矩阵
    - 使用跨层共享参数构造矩阵
    - 通过梯度下降对其进行更新
    - 仍存在问题（三点）
第三段：GCN 现存问题一
- 能够自动利用潜在的空间关系，但时间维度和特征维度中的分层空间关系和稳定模式尚未得到很好的探索。
- 对于空间维度，当前的图卷积方法通常只使用一个关系矩阵来堆叠图卷积层，
  - 会平滑节点的输入信号，并且很难获得层之间的隐藏差异。例如，由于突发业务条件的扩散，相邻节点在浅层中可能具有更紧密的关系，而具有类似功能的节点在深层中可能由于固有特性而更加相关。
- 对于时间维度和特征维度，现有方法为不同的层分配独立的参数
  - 忽略了在这些维度中存在的层之间共享的一些模式。例如，未来的交通流可能更多地取决于近过去而不是远过去，这在多层中是有用的。
第四段：GCN 现存问题二
- 现有的时空模型利用 CNN 或 RNN 作为顺序学习模块，可能不足以理解历史流量数据中的时间动态。
- 建立一个时间图来描述时隙之间的时间关系仅仅是在局部的假设之上。
- 建模的不同时隙之间的时间关系在图视图中只是整个时间空间的有限集合，可能无法在整个输入时间内捕捉到灵活的全局时间关系。
第五段：GCN 现存问题三
- 很少讨论动态性：
  - 两个片段的空间关系应该是动态的。
    
    例如，不同时间路段之间的空间关系图变化很大；两条道路可能在早高峰表现不同但在晚高峰表现相似。
  - 时隙之间的时间关系也在动态变化。
    
    例如，在高峰时段，随着交通状况的迅速变化，近时段之间的关系可能更大；而在非高峰时段，为了避免噪声的影响，所有时隙之间的关系可能是均匀的。
第六段：GDGCN 对上述问题的解决
- 通过在所有维度（空间、时间、特征）上跨层组合参数共享和独立块来提取各种稳定的模式。
  - 代表了对交通预测中参数共享机制的初步探索
- 我们将时间步长视为图视图中的节点，将空间关系学习模块推广到时域。
- 设计了一个时间动态图卷积块。
  - 学习时隙之间灵活的全局时间关系，更好地理解历史数据中的时间动态
  - 不仅有效地捕捉了时隙之间不断变化的时间关系，而且还捕捉了段之间的动态空间相关性。
- 开发了一种受张量分解影响的图构造函数，以捕捉片段之间不断变化的空间连接和时隙之间的时间连接。
- 在四个基准数据集上进行了全面评估，表明 GDGCN 在所有情况下都始终优于其他方法。

Section 2 Related works

2.1 Traffic forecasting 交通量预测
- 在捕捉复杂的交通数据动态方面有希望的方法：
  - 利用 RNN 架构（如 LSTM）来分析序列数据
  - 同时结合 CNN 架构来考虑空间关系。
- 迎接道路网络中复杂的空间依赖性构成的重大挑战的新方法：
  - 将 GCN 与时间序列学习技术相结合，以有效地解决空间和时间上的关系挖掘问题。
  - 为了捕捉时间相关性，
    - 一些利用循环神经网络，
    - 另一些利用卷积神经网络
  - 问题：
    
    这些顺序学习方法无法对不同时隙之间的全局和动态时间关系进行建模。
- 本文贡献
  
  工作将空间图学习模块推广到时域，并提出了一个时域图卷积块，它可以学习历史时隙之间的全局和动态时间关系。
2.2. Spatio-temporal graph neural networks 时空图神经网络
- 具有代表性的基于图的模型：STGCN、DCRNN、ASTGCN
  - 结合了基于切比雪夫多项式的网络、门控循环单元和扩散过程等技术
  - 问题：
    
    使用的图形是预先安排好的，显示了直观但有限的设计。
- 为了解决上一个问题，一些工作从数据中生成了自适应图：
  - Graph Wavenet 通过利用可训练矩阵引入了一个动态元素
  - AGCRN 专门关注自适应组件
  - 问题：
    
    能够灵活地利用数据中的相关性，但忽略了空间相关性的动态性质。
- 为了解决上一个问题，有方法构造一个空间相邻矩阵，并将其用于不同的层，从而提取出跨层的共享空间关系。
  - GMAN
    - 将自注意机制扩展到空间维度，以学习动态空间关系。
    - 通过引入基于注意力的方法增强了其模型，允许获取空间和时间上的动态信息。
  - STGODE 利用常微分方程来捕捉空间和时间关系的复杂动力学
  - 问题：
    
    具有一个固定空间相邻矩阵的模型难以实现不同的层在不同的数据维度中发现不同的模式。
- 本文贡献：
  - 在堆叠层之间应用不同的相邻矩阵来学习多个模式。并将这种机制推广到所有数据维度
  - 对于3D数据，在空间、时间和特征维度上设计独立块和共享块。

Section 3 Notations and definitions

常用符号
- $G_t^S$ ：表示交通空间图，对于时隙 $t$ ， $G_t^S=\{\mathbb{V}^S,\mathbb{E}^S_t\}$
- $G_t^T$ ：表示交通时间图，对于时隙 $t$ ， $G_t^T=\{\mathbb{V}^T,\mathbb{E}^T_t\}$
- $\boldsymbol{\mathrm{X}}_t$ ：表示时隙 $t$ 的交通流量观测
- $\mathbb{V}^S=\{v_1^S\dots v_N^S\}$ ：表示一组被研究的路段
- $\mathbb{V}^T=\{v_1^T\dots v_N^T\}$ ：表示一组输入时间戳
- $\mathbb{E}^S_t$ ：表示时间 $t$ 的空间之间链接的集合
- $\mathbb{E}^T_t$ ：表示时间 $t$ 的时段之间的链接的集合
- $e^S_{t,i,j}=(v_i^S,v_j^S,\boldsymbol{A}^S_{t,i,j})\in\mathbb{E}^S_t$ ：表示出现在时间 $t$ 且源节点是 $v_i^S$ ，目标节点是 $v_j^S$ 的边的权重是 $\boldsymbol{A}^S_{t,i,j}$
- $e^T_{t,i,j}=(v_i^T,v_j^T,\boldsymbol{A}^T_{t,i,j})\in\mathbb{E}^T_t$ ：表示在时隙 $t$ 从 $v_i^T$ 到 $v_j^T$ 且权重是 $\boldsymbol{A}^T_{t,i,j}$ 的边
- $\boldsymbol{A}^S_{t,i,j}$ ：表示空间张量 $\boldsymbol{A}^S$ 的第 $(t, i, j)$ 项
- $\boldsymbol{A}^T_{t,i,j}$ ：表示时间张量 $\boldsymbol{A}^T$ 的第 $(t, i, j)$ 项
- $\boldsymbol{P}$ ：表示输入历史步骤数量，即， $|\mathbb{V}^T|=\boldsymbol{P}$
- $\boldsymbol{N}$ ：表示研究路段数量，即， $|\mathbb{V}^S|=\boldsymbol{N}$
- $d$ ：表示隐藏状态的维度
- $\boldsymbol{N}_t$ ：表示一天中的时间（24小时）被划分为 $\boldsymbol{N}_t$ 个时隙
- $\Phi(t)$ ：表示映射生成了时间 $t$ 的嵌入索引
- $\boldsymbol{\mathrm{H}}^l$ ：表示第 $l$ 层的隐藏状态和输入
- $\boldsymbol{\mathrm{A}}^S$ ：表示不同层次共享的空间动态图
- $\boldsymbol{\mathrm{A}}^T$ ：表示不同层共享的时间动态图
- $\boldsymbol{\mathrm{A}}^{l,S}$ ：表示第 $l$ 层的独立空间动态图
- $\boldsymbol{\mathrm{A}}^{l,T}$ ：表示第 $l$ 层的独立时间动态图
定义：
- 交通流（Traffic Flow）：
  
  交通流量是指在给定的时间间隔内，量化穿过特定路段的汽车/人员数量的记录数据。它是表征当前交通状况的重要属性。
  - 使用 $\mathbb{V}^S=\{v_1^S\dots v_N^S\}$ 表示一组路段的流量记录的集合
  - $\boldsymbol{N}$ 表示相关分段的计数。
  - $t$ 处第 $i$ 个路段对应的交通流量为 $x_{t,i}\in\R$
  - 使用 $\boldsymbol{\mathrm{X}}_t\in\R^N$ 来表示 $t$ 处交通流的综合观测值。
- 动态空间图（Dynamic Spatial Graph）：
  
  将一个区域内的车辆运动概念化为一个表现出时间可变性的图形，它们之间的相互联系的性质随着时间的推移而变化。
  - 在特定时刻 $t$ ，空间图由 $G_t^S=\{\mathbb{V}^S,\mathbb{E}^S_t\}$ 表示
    - $\mathbb{V}^S$ 表示路段
    - $\mathbb{E}^S_t$ 表示 $t$ 中的空间边。
  - $e^S_{t,i,j}=(v_i^S,v_j^S,\boldsymbol{A}^S_{t,i,j})\in\mathbb{E}^S_t$ 是具有起始节点 $v_i^S$ 和目的节点 $v_j^S$ 的空间边
    - $\boldsymbol{A}^S_{t,i,j}$ 是相应的权重，它是空间关系张量 $\boldsymbol{\mathrm{A}}^S$ 的元素。
  - $\boldsymbol{\mathrm{A}}^S_t$ 用于表示动态空间图 $G_t^S$ 。
- 动态时间图（Dynamic Temporal Graph）
  
  从图的角度来考虑不同时隙之间的时间关系。与空间关系类似，时间关系也是动态的。例如，交通状况在高峰时段的变化可能比非高峰时段更快，这表明预测时隙和最近的历史时隙之间的关系更强。
  - 对于时隙 $t$ ，时间图表示为 $\mathbb{V}^T=\{v_1^T\dots v_N^T\}$
    - 其中 $\boldsymbol{P}$ 个历史时隙被视为节点
    - $\mathbb{V}^T=\{v_1^T\dots v_N^T\}$ 是节点的集合
    - $\mathbb{E}^T_t$ 是在时间 $t$ 的时隙之间的边的集合
  - $e^T_{t,i,j}=(v_i^T,v_j^T,\boldsymbol{A}^T_{t,i,j})\in\mathbb{E}^T_t$ 表示在时间 $t$ 时隙 $v_i^T$ 和时隙 $v_j^T$ 之间的连接
  - 时间动态图 $G^T$ 可以由 3D 张量 $\boldsymbol{A}^T$ 表示
- 交通预测流（Traffic Flow Forecasting）
  
  目标是将 $\boldsymbol{P}$ 个过去时隙的流量记录作为输入，并输出 $\boldsymbol{Q}$ 个未来时隙的交通流量预测：
  $\hat{\boldsymbol{\mathrm{X}}}_{t+1:t+Q}=f(\boldsymbol{\mathrm{X}}_{t-P+1},\boldsymbol{\mathrm{W}}_{learnable})$

Section 4 Methodology

宏观角度 GDGCN 的结构

由多个相同的层组成。每个层包含两个部分：
- 一个用于捕获共享模式的共享部分
- 一个用于分层模式的独立部分
每个零件中的三个块分别处理空间、时间和特征维度上的隐藏状态。
在块中，空间图卷积块将分段视为节点，时间图卷积块则将时隙视为节点。它们都利用所提出的动态图构造函数来建立自适应和动态的节点关系。

4.1. A generic framework for traffic forecasting

交通预测的通用框架

该框架解决的问题：为了解决先前的研究没有很好地探索时间维度和特征维度上的分层空间关系以及稳定模式的问题
框架特点：简短、可扩展和通用的框架，可以系统地处理跨层共享和独立的交通流预测模式。
框架结构：
- 框架由 $L$ 个相同的层组成
- 每个 GDGCN 层包含一个共享部分和一个独立部分
  - 不同层的共享部分中的块共享同一组参数，旨在学习跨层稳定和通用的模式
  - 不同层的独立部分中的区块为跨层的不同模式保留不同的参数集。
- 每个层的两个部分都各有三个不同的块，分别在空间、时间和特征维度上处理隐藏状态。
- 在一层中的六个块之后，使用融合块来积分它们的输出，并保持隐藏状态的大小一致。
具体运算：
- $\boldsymbol{\mathrm{H}}^0$ 是通过一个全连接层从输入数据转换而来的：
  $\boldsymbol{\mathrm{H}}^0=\boldsymbol{\mathrm{W}}^0*\boldsymbol{\mathrm{X}}_{t-P+1:t}+\boldsymbol{\mathrm{b}}^0$
  - 参数字典：
    - $\boldsymbol{\mathrm{H}}^l\in\R^{P\times N\times d}$ 是第 $l$ 个GDGCN层的输入隐藏向量
    - $\boldsymbol{\mathrm{W}}$ 和 $\boldsymbol{\mathrm{b}}$ 是可学习的
- 一方面，输入的隐藏状态由独立部分的三个块处理：
  $\boldsymbol{\mathrm{H}}^{l,S}=f^{l,S}(\boldsymbol{\mathrm{H}}^l)\\ \boldsymbol{\mathrm{H}}^{l,T}=f^{l,T}(\boldsymbol{\mathrm{H}}^l)\\ \boldsymbol{\mathrm{H}}^{l,F}=f^{l,F}(\boldsymbol{\mathrm{H}}^l)$
  - 参数字典：
    - $f^{l,S}$ 、 $f^{l,T}$ 和 $f^{l,F}$ 分别是第 $l$ 层中的空间、时间特征块
- 另一方面，隐藏状态也由共享部分处理：
  $\boldsymbol{\mathrm{H}}^{l,S'}=f^S(\boldsymbol{\mathrm{H}}^l)\\ \boldsymbol{\mathrm{H}}^{l,T'}=f^T(\boldsymbol{\mathrm{H}}^l)\\ \boldsymbol{\mathrm{H}}^{l,F'}=f^F(\boldsymbol{\mathrm{H}}^l)$
  - 参数字典：
    - $f^S$ 、 $f^T$ 和 $f^F$ 是在不同层中接受不同输入但跨层共享相同参数集的块
- 然后，来自这六个块的隐藏状态被融合：
  $\boldsymbol{\mathrm{H}}^{l'}=\boldsymbol{\mathrm{W}}^{l,f}*[\boldsymbol{\mathrm{H}}^{l,S};\boldsymbol{\mathrm{H}}^{l,T};\boldsymbol{\mathrm{H}}^{l,F};\boldsymbol{\mathrm{H}}^{l,S'};\boldsymbol{\mathrm{H}}^{l,T'};\boldsymbol{\mathrm{H}}^{l,F'}]+\boldsymbol{\mathrm{b}}^{l,f}$
  - 参数字典：
    - 其中， $[\cdot ； \cdot]$ 是串联运算
- 在每一层之后，采用残差连接来获得下一层的输入：
  $\boldsymbol{\mathrm{H}}^{l+1}=Batch\_Norm(\boldsymbol{\mathrm{H}}^l+ReLU(\boldsymbol{\mathrm{H}}^{l'}))$
- 此外，每个层中的隐藏状态都被跳过连接到输出层，用于最终预测：
  $\hat{\boldsymbol{\mathrm{X}}}_{t+1:t+Q}=MLP(\sum^L_{l=1}\boldsymbol{\mathrm{H}}_l)$
创新点与强大之处：
- 重新考虑了交通预测模块，并将其分解为三个基本块以使其清晰明了。
- 尽管这个框架很简短，但它仍然很强大。
- 通用性更强，先前工作中的大多数模块都可以被视为它们组合的特定实例。例如，
  - DCRNN 中的扩散卷积层是空间块和特征块的组合
  - Graph Wavenet 中的 TCN 是时间块和特性块的组合
  - 时空融合图卷积是空间块与时间块的组合。

4.2. Dynamic graph constructor

动态图构造函数

问题：

在交通领域，路段之间的空间关系是潜在的，并且不断变化。
现有解决方案及其问题：
- 在大多数先前的工作中，研究人员使用专家知识，如距离，来确定空间关系。
  
  这些关系是明确的和可解释的，但它们可能是不完整的，可能不适合交通流量预测。
- 一些研究提出构建自适应图
  
  但它们生成的图是静态的，忽略了时空关系在时间上的演变。
本文解决方案：

为了学习潜在关系和变化关系，设计了动态图构造函数。该构造函数可以生成动态图，并在训练过程中对其进行优化。

本文对生成动态图的过程进行了两次简化，使其易于处理。
- 首先，受周期性的启发，假设来自不同日期的同一时隙的输入可以共享一个动态图。
  
  相应地，需要构造 $N_t$ 个动态图，使用张量 $\boldsymbol{\mathrm{A}}\in\R^{N_t\times N\times N}$ 来表示这些动态图。给定特定的时间 $t$ ， $\Phi(t)$ 用于计算相应的索引， $\boldsymbol{\mathrm{A}}_{\Phi(t)}$ 是为 $t$ 选择的动态图。
- 其次，动态关系图中的一些子结构可以重用。
  
  例如，从黎明到黄昏，两个相邻路段的交通流量可以相互关联，生活在不同地区的人们在上班时从住宅到工作场所的出行模式相似。因此，受 Tucker 分解的启发，对邻接张量进行了重组。给定一个特定的张量，Tucker 分解旨在用一个核心张量和每个模式的因子矩阵的乘积来近似它。
具体运算：

邻接张量 $\boldsymbol{\mathrm{A}}\in\R^{N_t\times N\times N}$ 是用四个矩阵 $\boldsymbol{\mathrm{E}}^t\in\R^{N_t\times d'}$ 、 $\boldsymbol{\mathrm{E}}^s\in\R^{N\times d'}$ 、 $\boldsymbol{\mathrm{E}}^e\in\R^{N\times d'}$ 、 $\boldsymbol{\mathrm{E}}^k\in\R^{d'\times d'\times d'}$ 计算的，这四个矩阵可以自动更新：
$\boldsymbol{\mathrm{A}}=Softmax(ReLU(\boldsymbol{\mathrm{E}}^k\times_1\boldsymbol{\mathrm{E}}^t\times_2\boldsymbol{\mathrm{E}}^s\times_3\boldsymbol{\mathrm{E}}^e))$
- 参数字典：
  - $\times_i$ 是第 $i$ 维度上的张量矩阵乘积
  - $\boldsymbol{\mathrm{E}}^t\in\R^{N_t\times d'}$ 表示 $N_t$ 时隙
  - $\boldsymbol{\mathrm{E}}^s\in\R^{N\times d'}$ 表示开始节点的信息
  - $\boldsymbol{\mathrm{E}}^e\in\R^{N\times d'}$ 是结束节点的参数
除了建立空间关系 $\boldsymbol{\mathrm{A}}^S$ 之外，还可以将输入时隙之间的时间关系建立为动态图 $\boldsymbol{\mathrm{A}}^T\in\R^{N_t\times P\times P}$

4.3. Spatial graph convolutional block

空间图卷积块

现状与问题：

空间交通节点之间的空间关系有利于预测。例如，考虑上游路段的交通流量有助于下游路段的流量预测。尽管图上的卷积运算提取局部信息来处理空间中片段之间的关系，但大多数都在不考虑随时间变化的特征的情况下使用它。
本文解决方案：
- 对空间中的时变关系进行建模。
- 该框架中的这个模块不同于传统的图卷积
  - 首先，空间图卷积只在动态图上应用一步。其原理是图形是可学习的。在传统的图卷积中，可学习图可以自适应地考虑多跳关系
  - 同时，特征变换是不存在的，并且特征维度上的变换被放置在另一个模块中。然而，这并没有降低它的表现力，因为传统的 GCN 可以被视为这两个模块的组合，并通过堆叠多层来实现。
具体运算：

给定输入 $\boldsymbol{\mathrm{X}}_{t-P+1:t}$ ， $\boldsymbol{\mathrm{A}}_{\Phi(t)}\in\R^{N\times N}$ 是空间中的关系矩阵。空间图卷积块的目的是根据 $A_{\Phi(t)}$ 将信息聚合到焦点节点； $\boldsymbol{\mathrm{A}}_{\Phi(t)}$ 的 $(i, j)$ 项反映了节点 $j$ 对节点 $i$ 的影响强度。
- 在层 $l$ 的独立部分中，动态图上的空间卷积可以定义为：
$f^{l,S}(\boldsymbol{\mathrm{H}}^l)_{:,i}=\sum^N_{j=1}\boldsymbol{\mathrm{A}}^{l,S}_{\Phi(t),i,j}\boldsymbol{\mathrm{H}}^l_{:,j}$
- 其中 $\boldsymbol{\mathrm{A}}^{l,S}$ 在不同的层中是不同的。卷积过程可以用张量矩阵乘法表示：
  $f^{l,S}(\boldsymbol{\mathrm{H}}^l)=\boldsymbol{\mathrm{H}}^l\times_2\boldsymbol{\mathrm{A}}^{l,S}_{\Phi(t)}$
- 在 $l$ 层的共享部分，空间块定义为：
  $f^S(\boldsymbol{\mathrm{H}}^l)=\boldsymbol{\mathrm{H}}^l\times_2\boldsymbol{\mathrm{A}}^S_{\Phi(t)}$
  其中 $\boldsymbol{\mathrm{A}}^S$ 被不同的层共享

4.4. Temporal graph convolutional block

时间图卷积块

现状与问题：

了解输入的历史数据对于交通流量预测至关重要。关键是处理历史交通流的时间动态，即利用历史时隙之间的时间关系。最普遍的方法是 CNN 和 RNN。然而，它们有以下缺点：
- 首先，这些方法倾向于对不同时隙之间的局部时间关系进行建模，
- 其次，这些方法建模的时间关系基本上是静态的，因为它在不同的时间保持相同的参数集。
本文解决方案：

这项工作采用了一种完全不同的程序，其中空间关系学习模块被推广到时域，并提出了一个时域图卷积块。
具体运算：

如总结构图所示，输入的 $P$ 个时隙可以看作图中的 $P$ 个节点，时间关系动态图 $\boldsymbol{\mathrm{A}}^T\in\R^{N_t\times P\times P}$ 由动态图构造函数构建。
- 与空间图卷积模块类似， $l$ 层独立部分的时间图卷积可以定义为：
  $f^{l,T}(\boldsymbol{\mathrm{H}}^l)_i=\sum^P_{j=1}\boldsymbol{\mathrm{A}}^{l,T}_{\Phi(t),i,j}\boldsymbol{\mathrm{H}}^l_j$
- 其中 $\boldsymbol{\mathrm{A}}^{l,T}$ 在不同的层中是不同的。卷积过程可以用张量矩阵乘法表示：
  $f^{l,T}(\boldsymbol{\mathrm{H}}^l)=\boldsymbol{\mathrm{H}}^l\times_2\boldsymbol{\mathrm{A}}^{l,T}_{\Phi(t)}$
- 在 $l$ 层的共享部分，空间块定义为：
  $f^T(\boldsymbol{\mathrm{H}}^l)=\boldsymbol{\mathrm{H}}^l\times_2\boldsymbol{\mathrm{A}}^T_{\Phi(t)}$
  其中 $\boldsymbol{\mathrm{A}}^T$ 被不同的层共享

4.5. Other components and training process

其他组成部分和培训流程

每个层中的特征块被实现为特征维度上的全连接层。
损失函数：

Huber 损失是一种常用的损失函数，它平衡 MSE 和绝对误差之间的权衡，提供鲁棒性和可微性。因此，它在数据挖掘中得到了广泛的应用，在交通预测领域也有一些优秀的工作使用了huber损失。根据它们，huber损失被选择为此处优化期间的损失：
$L=\frac{1}{N\times Q}\sum^Q_{i=1}\sum^N_{j=1}h(\hat{x}_{ij},x_{i,j})\\ \begin{equation} h(\hat{x},x)=\left\{ \begin{aligned} & \frac{1}{2}(\hat{x}-x)^2 && |\hat{x}-x|\le\delta\\ & \delta|\hat{x}-x|-\frac{1}{2}\delta^2 && |\hat{x}-x|\le\delta \end{aligned} \right. \end{equation}$
其中 $\delta$ 是用于平衡平方误差的超参数。
训练过程：
- 先前的代表性研究，如 DCRNN、STGCN 和 GraphWaveNet，使用具有不同结构的块来分别探索空间和时间关系。
- 不同的是，GDGCN 提出以通用和统一的方式对空间依赖性和时间关系进行建模。
  - 在 GDGCN 中，所有的空间相邻矩阵和时间关系矩阵都是通过同一个动态图生成器生成的。
  - 所使用的空间图和时间图都是动态的
    
    因为所提出的模式将通过映射 $\boldsymbol{\mathrm{x}}_{t-P+1:t}$ 根据具有不同时间 $t$ 的输入 $\Phi(t)$ 来选择不同的空间图 $\boldsymbol{\mathrm{A}}^S_{\Phi(t)}$ 和时间图 $\boldsymbol{\mathrm{A}}^T_{\Phi(t)}$ 。

Section 5 Experiments

5.1. Datasets

数据集

此处使用的是 PeMSD3、PeMSD4、PeMSD7 和 PeMSD8，数据集细节：

来自加州交通管理局绩效测量系统（PeMS）
数据粒度为 5 分钟
数据已进行 z 分数归一化
PeMSD 数据集具体包含以下类型的数据：交通流量、速度、占有率等。
同时，该数据集还提供了道路元数据信息，如路段长度、车道数等。
PeMSD3、PeMSD4、PeMSD7 和 PeMSD8 都是PeMSD数据集的不同子集。这些子集包含了不同路段和不同时间段的交通数据，用于不同的交通预测任务。具体来说，
- PeMSD4是旧金山湾区的交通数据，包含29条道路上的3848个检测器；
- PeMSD7是加州高速公路系统的交通数据，包含了不同时间段的交通流量数据；
- PeMSD8是圣贝纳迪诺的交通数据，包含8条道路的1979个检测器。

5.2. Baselines

基准线

GDGCN 和其他 23 个基线模型进行了比较。模型可以分为几个组：

第一组是经典的时间序列预测方法，包括 HA（历史平均法）、ARIMA（自回归综合移动平均）、VAR（向量自回归），FC-LSTM、TCN、GRU-ED。
第二组是时空方法，包括DSANet、STGCN、DCRNN、GraphWaveNet、ASTGCN（r）、MSTGCN、STG2Seq、LSGCN、STSGCN 和AGCRN。
第三组是最新的时空模型，包括STFGNN、STGODE、Z-GCNETs、DSTAGNN、ST-WA、D2STGNN、STG-NCDE。

5.3. Experimental settings and hyperparameters

实验设置和超参数

历史步骤 $P = 12$
预测步骤 $Q = 12$
4 个数据集上的比例： $训练集 : 验证集 : 测试集 = 6 : 2 : 2$ 。
$N_t = 288$
批次大小 $batch\_size= 32$
所有模型都使用 Adam 优化器
- 耐心 $p a t i e n ce = 15$
- 训练轮数 $e p oc h s = 200$
隐藏状态 $d$ 的维度选自 ${16,32,64,128,256\}$
$L$ 选自 ${4,5,6,7,8\}$
学习率选自 $\{1\times10^{-4},5\times10^{-4},1\times10^{-3}\}$
权重衰减系数选自 $\{1\times10^{-4},1\times10^{-3},1\times10^{-2}\}$
硬件使用 4 个 Tesla T4 GPU

5.4. Evaluation metrics

评估指标

平均绝对误差（MAE）、平均绝对百分比误差（MAPE）和均方根误差（RMSE）用于测量不同模型的性能：
$KaTeX parse error: Expected 'EOF', got '&' at position 6: MAE &̲=&\frac{1}{N\ti…$
其中 $x_{i,j}\in\R$ 表示在时隙 $t$ 的第 $i$ 段的交通流量， $\hat{x}_{i,j}$ 表示对 $x_{i,j}$ 的预测结果。

5.5. Comparison results

比较结果

GDGCN的优异表现可能归因于以下方面：

提供了一个全新的基于图的视图来处理时间关系。
构造了动态图，并设计了一种动态图卷积方法来捕捉动态时空相关性。
通用框架旨在系统地跨层学习独立模式和共享模式。

5.6. Ablation study of key designs in proposed model

拟议模型中关键设计的消融研究

GDGCN 的三个关键模块是动态图构造函数、具有两种跨层共享机制（包括共享块和独立块）的通用框架和时间动态图卷积块。为了验证所提出的组件的有效性，提出了四种变体：

GDGCN w/o共享块：删除了框架中所有层的共享块。
GDGCN w/o独立块：删除了框架中所有层的独立块。
GDGC N w/o dygraph：我们使用一个自适应图，没有随时间演变的机制。
GDGCN w/o 时态图 conv：直接移除了时间动态图卷积模块。

结果：全部很强

与没有共享块的 GDGCN 相比，GDGCN 获得了更好的性能，这表明跨堆叠层的共享参数可以提取稳定的模式
与没有独立块的 GDGCN 相比，GDGCN 表现得更好，证明了分层参数学习机制在不同层上的重要性。
此外，在四个数据集上的结果也表明，该方法中的逐层参数机制超过了共享机制。
GDGCN 优于没有动态图的 GDGCN，这表明了建模分段和时隙之间的动态关系的重要性。
GDGCN 的性能优于不带时态图卷积的 GDGCN，这证实了所提出的时态动态图卷积块的有效性。

5.7. Study of dynamic graph

动态图的研究

实验目的：

为了展示动态图构造器如何发现节点之间的关系并有利于预测，在PeMSD3上进行了案例研究。
实验结果：
结果分析：
- a 段，日均流量。
  - 在时段1中，道路1和2的交通流量都在上升，并且相应的权重较高。
  - 在时段2中，道路1的交通流量保持上升，而路段2的交通流量稳定。
  - 在第 3 阶段，两条道路的交通流量都开始急剧下降，表现出很大的相关性和同步性。
- b 段，GDGCN 学习的跨时间链路权重（已经过平滑和归一化）
  - 两条道路的趋势在周期 2 中不再相似，并且在学习的动态图中它们的相应边缘权重较低。
  - 在第 3 阶段，相应地，两个路段的边缘权重较高。
从这个案例研究中可以看出，动态图构造器可以从数据中挖掘出合理动态的交通模式，这对于理解当前交通状况和预测未来交通趋势非常有益。

5.8. Study of temporal graph convolutional block

时态图卷积块的研究

实验目的：

为了验证时间动态图卷积块的有效性，进行了详细的比较实验。
实验具体操作：

时间动态图卷积块被几个流行的时间关系学习模块取代：
- 使用 LSTM：用LSTM取代时间图卷积块
- 使用 TCN：用门控TCN取代时间图卷积层块
- 使用注意力：用时间注意力模块取代时间图卷积块
实验结果：
结果分析：
- GDGCN 实现了最佳性能，这表明时间图卷积块可以从数据中提取最多的信息。
- 尽管使用 LSTM 作为时间关系学习模块的变体获得的精度低于 GDGCN，但它优于表6中的其他变体。
- 使用注意力作为时间模块会导致最差的表现，这可能是由于注意力的学习过程不稳定造成的。

5.9. Study of computational efficiency

计算效率研究

实验具体操作：
- 在 PeMSD4 上进行比较实验。
- 比较了 GDGCN 的最佳两个基线和两个变体的计算效率。
  - 最佳的两个基线是 D2STGNN 和 ST-WA。
  - GDGCN 的两个变体是 GDGCN w-Attention 和 GDGCN-w-LSTM
    - GDGCN w-Attention 表示用注意力机制替换 GDGCN 中的时间图卷积模块
    - GDGCN-w-LSTM 表示用 LSTM 替换 GDGCN 中的时间图形卷积模块
实验结果
- （a）是每个轮次（epoch）的训练时间
- （b）是每个轮次（epoch）的推理时间。
- 具体时间如下表所示。所有型号的批量大小保持为16。
结果分析：
- D2STGNN 慢于 GDGCN 的训练速度表明 GDGCN 通用系统的预测框架具有时效性。
- ST-WA 提出的具有线性复杂性的窗口注意力确保了其与 D2STGNN 相比在时间上的竞争力。然而，与 GDGCN 相比，ST-WA 中的注意力设计也导致其训练时间成本更高。
- GDGCN 使用一种具有时间效率的相对有效的结构，即时间动态图卷积块来学习时间关系。表6中证实了所提出的时间动态图卷积层块的有效性。
- 以注意力为时间块的 GDGCN 的训练时间几乎是 GDGCN 训练时间的两倍。它解释了为什么 ST-WA 比 GDGCN 花费更多的时间。此外，它还进一步展示了时间动态图卷积块的时间效率。

5.10. Study of spatial complexity

空间复杂性研究

实验目的：

为了探索所提出的模型的空间效率
实验具体操作

将GDGCN与一些具有代表性的基线在模型大小方面进行了比较。
实验结果：
- 表8显示了每个模型的总参数。
- 图8显示了模型大小与精度之间的散点图。
结果分析
- ST-WA asos 以相对较小的尺寸模型实现了令人满意的性能。
- D2STGNN 在所示的具有高空间复杂度的方法中执行得第二好。
- GDGCN 实现了空间复杂性和性能之间的平衡。

5.11. Study of aggregation methods

聚合方法研究

实验目的

以表明使用级联操作组合六个块的输出的原因。
实验具体操作：

GDGCN中的级联分别替换为求和运算和均值运算。
实验结果：

实验结果如表9和表10所示。
结果分析：

具有级联的 GDGCN 实现了最佳性能。这可能是由于级联运算可以比平均和运算保留更多的信息。

个人感想

就论文而言，格式很规整，但是感觉写的有些繁琐，几句话颠来倒去地说。实验设计非常详尽，控制变量做得很好，360度全方位验证了模型的优越性。

就模型而言，有效的发现了当前问题并相应的引入方法去解决，相当于有效的缝合了各方法。

你可能感兴趣的:(论文阅读笔记,笔记,论文阅读,论文笔记)

高端密码学院笔记228 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（541）期《幸福》之启动深层心理轻松意识基础篇——“扛得住”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:高尚、伟大的代价就是责任。自由的第一个意义就是担负自己的责任2020.8.20星期三一笔记:1.从接的住到扛得住，心里境界的提升2.看到优秀的家人向别人学习如何去做，什么心里阶段性呈现什么状态。3.学习力越强，承载力越强4.精准，准确，的点评就是对笔
OpenHarmony解读之设备认证：解密流程全揭秘陈乔布斯 HarmonyOS 鸿蒙开发 OpenHarmony harmonyos openHarmony 嵌入式硬件鸿蒙开发 respons
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）①鸿蒙应用开发与鸿蒙系统开发哪个更有前景？②嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~③对于大前端开发来说，转鸿蒙开发究竟是福还是祸？④鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？⑤记录一场鸿蒙开发岗位面试经历~⑥持续更新中……一、概述本文重点介绍客户端收到end响应消息之后的处理过程。二、源码分析这一模块的源码位于：/bas
前端学习笔记：React.js中state和props的区别和联系
文章目录1.`props`（属性）定义用途示例2.`state`（状态）定义用途示例3.核心区别4.常见使用场景props的场景state的场景5.交互模式父组件修改子组件状态子组件通知父组件6.最佳实践总结在React.js中，state和props是两个核心概念，用于管理组件的数据和数据流。它们的设计目的不同，但共同构成了React组件的状态管理系统。1.props（属性）定义外部传入的数据：
ThreadLocal 在 Spring 与数据库交互中的应用笔记笑衬人心。 JAVA学习笔记数据库 spring 笔记
一、基本概念1.1什么是ThreadLocal？ThreadLocal是Java提供的一个线程本地存储工具类。每个线程访问ThreadLocal时，都只能看到自己线程范围内的变量副本，线程之间互不影响。常用于保存线程上下文信息，如用户登录信息、事务状态、数据库连接等。ThreadLocalthreadLocal=newThreadLocal>resources=newNamedThreadLoca
近期书法学习心得德凝
1、看完钱老师视频+做笔记2、微博上看到的书法博主好的内容做笔记3、看黄简老师的视频+做笔记4、不着急写、交作业、完成任务5、掌握方法，重在质量，前面写的慢一点的话技术上来了，后面自然应该会快一点吧
久远的操作系统笔记3 锦绣拾年
信号变量，条件变量，互斥锁解析来自：http://blog.chinaunix.net/space.php?uid=23061624&do=blog&cuid=2127853http://blog.163.com/huangguoqiang_123@126/blog/static/141043114201349112849554/信号量用在多线程多任务同步的，一个线程完成了某一个动作就通过信号量告
平板可以用来办公吗？从文档处理到创意创作的全面测评华一精品Adreamer 平板
在快节奏的现代职场，一个核心疑问始终萦绕在追求效率的职场人心中：平板电脑，这个轻薄便携的设备，真的能替代笔记本电脑，成为值得信赖的办公伙伴吗？答案并非简单的“是”或“否”，而是一个充满潜力与现实的探索过程。今天，小编就一一剖析平板电脑在办公领域的真实表现，并盘点其广受欢迎的日常应用场景，为您提供清晰的认知。一、平板电脑能办公吗平板电脑自诞生以来，一直被贴上“内容消费”的标签。然而，随着硬件性能的飞
Gcn符号笔记 happydog007 笔记 python
KeyPoints邻接矩阵A通常表示无向图中结点之间的连接，尺寸为[N,N]，其中N是结点的数量。度矩阵D是对角矩阵，尺寸为[N,N]，对角元素表示每个结点的度。结点特征向量矩阵XXX的尺寸为[N,C]，其中C是每个结点的特征数量，包含结点的额外属性，如年龄或文本特征。邻接矩阵A邻接矩阵A是一个方阵，用于表示图中结点之间的连接关系。对于无向图，A[i,j]=1A[i,j]=1A[i,j]=1表示结
『大模型笔记』Geoffrey Hinton对Al研究人才选拔的直觉，未来影响及技术展望的深入见解！ AI大模型前沿研究大模型笔记大模型人工智能 Hinton llya 大语言模型多模态大脑工作方式
GeoffreyHinton对Al研究人才选拔的直觉，未来影响及技术展望的深入见解！文章目录一.整个访谈内容1.1.起点：理解大脑的工作方式以及隐藏层命名的由来1.2.谈Ilya：他有很好的直觉1.3.预测下一个词也需要推理1.4.模型能从语言中学到很多，但从多模态中学习会更容易1.5.关于认知的三种观点1.6.黄仁勋送了我一块GPU1.7.数字系统有人类无法比拟的优势1.8.需要得到重视的快速权
《零基础做出有颜又有料的手帐》笔记（一）野生的二货酱
20/100想写手帐很久了，就是一直停留在想的阶段。怎么对得起我从国内辛苦背来的手帐本哦。为了避免从开始到放弃，特地选了个课来听。感觉babe老师的简约风格对我这种小白比较友好，赶紧听起来，练起来！做个笔记增加沉没成本，将来想放弃的时候阻力更大一点哈哈。第一课主要讲了手帐工具，并演示了一个简单的月计划。工具如下：钢笔，子弹笔，勾线笔，铅笔，荧光笔月计划演示图如下：卖家秀圆规插上勾线笔画圆，过圆心画
黑咖啡的功效与禁忌是什么？经常喝黑咖啡有什么好处？高省张导师
黑咖啡的功效与作用有以下几点买咖啡上高省领取商品隐藏优惠券，优惠完还会返利，让你更省钱！大家好，我是高省APP最大团队，【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，也期待你的加入。高省邀请码520888，注册送2皇冠会员，送万元推广大礼包。给大家推荐一个公主号《张十五笔记》分享引流，思维，认知，项目，干货，讲的非常有用，如果你也想提高自己的思维认知，打开自己的眼界，可以去关
《流量池》读书笔记2-品牌是最稳定的流量池A 萌梦萌萌
在互联网已规模化的时代，传统主流媒体的品牌营销应结合精准导向的效果营销。让用户在接收到广告时，增加了一个闭环型动作—不仅能看到，还能立即在手机端点击购买，实现流量的即刻转化。品牌广告要增加购买变现的动作，要追求效果，而不能只以纯品牌为借口，不注重转化。从流量池的角度看，品牌不仅是心智占有和信任背书，而且品牌本身恰恰是巨大的流量池，通过关注和“粉丝”，获取源源不断的流量，也就是品牌即流量。让定位更有
如何将 iPhone 备份到笔记本电脑？
将iPhone备份到电脑是一种明智的方式，可以在手机丢失、损坏或无法使用时保护数据安全。此外，它还可以方便您将数据转移到新的iPhone或安卓设备。无论您使用的是Windows还是Mac系统，都可以通过iTunes、Finder（Mac）、iCloud或可靠的第三方应用程序等工具将iPhone备份到笔记本电脑。在本指南中，我们将逐一介绍这些方法，并为您提供详细的iPhone备份到笔记本电脑的说明。
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
入门html这篇文章就够了 ξ流ぁ星ぷ132 html 前端
HTML笔记文章目录HTML笔记html介绍什么是htmlhtml的作用HTML标签介绍常用标签标签and标签and标签u标签del删除线br标签用于换行pre标签，预处理标签span标签div标签sub标签andsup标签hr标签h1,h2...h6标签：HTML5中的语义标签：特殊字符img标签a标签第一种用法：超链接第二种用法：锚点video标签表格标签：form标签input标签selec
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
vue3面试题(个人笔记) 武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
vue3比vue2有什么优势？性能更好，打包体积更小，更好的ts支持，更好的代码组织，更好的逻辑抽离，更多的新功能。描述Vue3生命周期CompositionAPI的生命周期：onMounted()onUpdated()onUnmounted()onBeforeMount()onBeforeUpdate()onBeforeUnmount()onErrorCaptured()onRenderTrac
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
swagger【个人笔记】撰卢笔记 java
文章目录swagger导入mave坐标在配置类(WebMvcConfiguration)中加入knife4j相关配置设置静态资源映射，主要是让拦截器放行swagger常用注解@Api(tags="\[描述这个类的作用]")@ApiModel(description="\[描述这个类的作用]")@ApiModelProPerty("描述这个类的作用")@ApiOperation("\[描述方法的作用
【个人笔记】负载均衡撰卢笔记负载均衡运维
文章目录nginx反向代理的好处负载均衡负载均很的配置方式均衡负载的方式nginx反向代理的好处提高访问速度进行负载均衡保证后端服务安全负载均衡负载均衡，就是把大量的请求按照我们指定的方式均衡的分配给集群中的每台服务器负载均很的配置方式upstreamwebservers{server192.168.100.128:8080server192.168.100.129:8080}server{lis
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
5G标准学习笔记14 - CSI--RS概述刘孬孬沉迷学习 5G 学习笔记信息与通信
5G标准学习笔记14-CSI–RS概述大家好~，这里是刘孬孬，今天带着大家一起学习一下5GNR中一个非常非常重要的参考信号------------------CSI-RS信号，CSI-RS不是持续发送，UE只能在网络明确配置了CSI-RS的情况下才能使用其进行信道测量。前言对于CSI-RS，肯定还离不开前面所说的CSI（channelstateinformation），前面也讲过CSI对于MIMO
5G标准学习笔记06-基于AI/ML波束管理刘孬孬沉迷学习 5G 学习笔记
5G标准学习笔记06-基于AI/ML波束管理前言前面对于孬孬学习了波束管理的概述，下面要进一步来看一下传统波束管理和现在3GPP中推动的AL/ML波束管理之前的区别联系。一、传统波束管理方法流程传统BM流程主要包括以下步骤：波束扫描（BeamSweeping）：gNB通过顺序发送多个窄波束（SSB或CSI-RS），覆盖整个服务区域，UE测量每个波束的信号质量（如L1-RSRP或L1-SINR）。波
5G标准学习笔记03- CSI 反馈增强概述刘孬孬沉迷学习 5G 笔记学习
5G标准学习笔记03-CSI反馈增强概述大家好，最近在研究AI/ML3gpp标准NR空口的有关内容，后面可能会给大家介绍一下对应的有关内容AI/ML在3GPP标准中的研究进展在AI/ML在NR空口的应用中，对应标准主要聚焦了3个case进行讨论研究分别是：CSI反馈增强；波束管理；定位精度增强；这三个内容可能比较涉及RAN1/2的具体内容，后面会基于这个进行一定的介绍。今天主要是主要介绍CSI反馈
运维笔记＜4＞ xxl-job打通 GeminiJM 运维 java xxl-job
新的一天，来点新的运维业务，今天是xxl-job的打通其实在非集群中，xxl-job的使用相对是比较简单的，相信很多人都有使用的经验这次我们的业务场景是在k8s集群中，用xxl-job来做定时调度加上第一次倒腾，也是遇到了不少问题，在这里做一些记录1.xxl-job的集群安装首先是xxl-job的集群安装先贴上xxl-jobsql初始化文件的地址：xxl-job/doc/db/tables_xxl
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include