当交通遇上机器学习

基于注意力时空图神经网络的交通预测

文章信息

本周阅读的论文是题目为《Learning Dynamics and Heterogeneity of Spatial-Temporal Graph Data for Traffic Forecasting》的一篇2021年发表在《IEEE Transactions on Knowledge and Data Engineering》上的使用注意力时空图网络（ASTGNN）预测交通流的文章。

摘要

准确的交通预测对于提高智能交通系统（ITS）的安全性、稳定性和效率至关重要。尽管经过多年的研究，交通预测仍然面临以下挑战，包括在时间和空间维度上建模交通数据的动态，以及捕获交通数据的周期性和空间异质性，这一问题对于长期预测来说更加困难。本文提出了基于注意力的时空图神经网络（ASTGNN）用于交通流预测。具体来说，在时间维度上，文章设计了一种新的能够利用局部上下文的自注意力机制，用于数字序列的转换表示，使预测模型能够捕获交通数据的时间动态，同时采用全局感受野便于长期预测。在空间维度上，文章开发了动态图卷积模块，利用自注意力机制动态捕捉空间相关性。此外，通过嵌入（Embedding）模块捕捉周期性和空间异质性。在五个真实交通流数据集上的实验表明，ASTGNN性能优于其他先进的模型。

介绍

近年来，许多国家致力于研究智能交通系统（ITS），交通预测作为智能交通系统不可或缺的一部分，为优化交通资源调度提供有效数据支持，还帮助人们更好安排日常出行。因此，过去几年人们一直在努力实现准确和长期的交通预测。目前广泛采用的交通预测框架是时空图神经网络（STGNNs），图中每个节点代表一个交通监控站，边代表道路网络。STGNNs将在空间维度上操作的图卷积块和在时间维度上动态建模的前向神经网络相结合，以充分捕捉交通流的时空特征来提高预测精度。尽管在预测准确性上取得了有效提升，但准确、长期的交通预测仍然存在挑战。

首先，如何有效地对交通数据在时空维度上的动态性进行建模仍然是一项挑战。通常来讲，动态性通常与随时间变化的物理量相联系，动态性描述了物理量如何随时间演变，在文章中，该物理量指的是每个监测站所观测到的交通状态。目前为止，研究仅考虑从时间维度对单个交通观测点的动态性进行建模。然而，交通拥堵通常由一条道路传播到另一条道路，这意味着站点的交通流状态演变不仅与自身历史交通状态有关，还受其他相邻站点影响。为了对空间相关性进行建模，大多研究都是利用图卷积网络处理静态的路网拓扑图。换句话说，目前存在的模型都假设空间相关性是不变的，但这在实际中是不成立的。

其次，现有的模型很难实现精确的长期预测。常见的RNNs或者CNNs模型都通过前向计算对动态性进行建模。众所周知，RNNs容易出现梯度消失问题，尤其是在长序列建模任务中；另一方面，CNNs由于卷积核的感受域有限，因此它们很难捕获远距离依赖关系。因此，现有方法的预测性能通常会随着预测区间增加而急剧下降。

此外，对长时交通序列数据进行有效的周期性建模以及在没有详细空间信息的情况下考虑空间异质性仍值得关注。交通数据是由人类的日常活动产生的，具有明显的周期性。图1-(1)显示了一个检测器检测到的流量，具有明显的周期性。因此，在搭建准确的交通预测模型时，如何有效地从长而冗余的历史序列中捕捉交通流周期性是一个需要思考的问题。在交通预测中另一个重要的点是交通的空间异质性。图1-(2) 为两个不同检测器在同一天内的交通流量变化情况，检测器A位于街道而B位于高速公路。即使位于相同时间段，二者具有不同的交通流特征，这意味着交通流在空间维度上有所不同，不同位置的交通模型不同。考虑到数据的可获取性，如何仅根据道路网络结构捕捉空间异质性仍然是一个有待研究的问题。

图1 交通流的周期性和空间异质性

为了解决这些问题，文章提出了一个新的交通预测模型，称为基于注意力机制的时空图神经网络（ASTGNN）。与RNNs或基于CNNs的方法相比，在ASTGNN中，动态性的参数更加灵活地取决于输入。为了精确预测，自注意机制使每个符号的表示可以直由其他符号所表示，这将产生一个有效的全局感受域，从而使模型能够做出准确的长期预测。此外，文章精确地模拟了周期性和空间异质性，进一步提高了性能。这篇文章的贡献总结如下：

该文章首次提出一种自注意的交通预测模型ASTGNN，该模型以灵活的方式捕捉动态，提供更准确的长期预测。
文章设计了一种趋势感知自注意力模块，使自注意力机制可以感知局部信息，并提出了动态图卷积模块对空间相关性进行建模。
与现有模型不同，文章考虑了交通数据的周期性和空间异质性以进一步提高模型的性能。
文章在五个真实世界的交通流数据集上对模型预测效果进行验证。结果表明，文章提出的ASTGNN明显优于目前最先进的交通预测方法。

与作者在另一篇文章所提出的基于注意力机制的时空图卷积网络（ASTGCN）相比，该模型存在以下的重大提升：

ASTGNN不采用一维CNN，而是采用了一种新的时间趋势感知多头自注意力模块，能够更有效地捕捉交通数据的动态。
ASTGNN设计了一种新的动态图卷积块以动态捕捉空间相关性。此外，文章对空间异质性进行了精确建模，进一步提高模型性能。
文章通过实验评估了ASTGNN的有效性。通过消融实验评估ASTGNN各组成部分对预测性能的影响。

Preliminarie

1. Problem formulation

Definition1 (Traffic Network)：文章定义了一个交通网络G=(V,E)，其中V表示节点的集合，共有N个节点，每个节点代表一个交通检测器或观测站点，E是节点边的集合。文章提出的解决方案均可以应对有向或者无向网络。

Definition 2 (Traffic Signal Matrix)：交通网络G在时间段t的观测值被定义为交通信号矩阵，其中定义为节点v在时刻t的特征向量，C表示特征的数量。

Problem Statement (Traffic Forecasting)：给定过去个时间段的历史时空交通信号矩阵、全局周期序列以及局部周期序列，文章旨在预测未来个时间步的交通信号矩阵。

大部分交通预测的相关研究仅仅将近期历史交通状态作为输入。为了公平比较，文章首先保留了相同的输入，与其他基准模型进行比较。另外，上述提到了交通数据与人们日常活动有关且具有周期性。因此，文章进一步对交通数据的周期性进行建模，加入了全局周期序列和局部周期序列。

2. Multi-Head Attention

注意力机制可以视为一个将query和key与value的集合映射到输出的函数，其中query、key和value均是向量。对这些数值加权求和计算得到输出，权重的设定是通过兼容性函数计算所得，其变量是query和相应的key。文章采用“Scaled Dot-Product Attention”，对所有的quries执行矩阵乘法操作。具体来说，给定queries和keys的维度，注意力计算公式如下：

式中，分别表示queries、keys以及values。

为了使模型能够捕捉不同子空间的注意力，学者提出了多头注意力机制。本文使用表示模型的特征尺寸。给定初始的queries、keys以及values，多头注意力可以通过以下公式计算得出：

式中，表示多头的数量，其余的W表示需要学习的权重。

3. Attention Based Spatial-Temporal Graph Neural Networks

(1) Overall Pipeline

ASTGNN的主要目的是在时间和空间维度上直接对交通流数据复杂的动态相关性进行建模。该模型基于encoder-decoder框架，其总体构成如下图所示，encoder和decoder块具有多个相同的层堆叠而成。为了保证模型可以深入学习，ASTGNN还使用了残差连接和层归一化。

图2 ASTGNN模型框架

(2) Spatial-Temporal Encoder

时空编码块（spatial-temporal encoder）由时空编码层堆叠形成，每层由时间趋势感知多头自注意力机制和空间动态图卷积组成。时间趋势感知多头注意力块旨在从时间维度对交通数据的动态性进行建模，而空间动态GCN模块则为了捕获交通数据的空间相关动态。

1) Temporal Trend-Aware Multi-Head Self-Attention

由于多头自注意力机制起初是为了处理离散标记（如单词等），并没有考虑连续数据中固有的局部特征。因此，简单将其应用于交通信号序列处理中可能会导致权重不匹配，即原始的多头注意力机制仅根据两个节点的取值相近判定二者的相关强度较大，而忽略了节点的局部趋势是否相同，这会使模型得到错误的序列表示，进而影响最终的预测性能。

为了解决传统多头注意力机制存在的局部趋势不可知问题，文章设计了一种考虑局部上下文信息的时间趋势感知多头自注意力机制。节点之间共享时间趋势感知的多头注意力，这是卷积自注意力机制（Convolutional Self-Attention）的变体，使用1D卷积替代Q、K的线性投影。由于卷积运算通过将局部上下文作为输入来计算表示，因此模型可以了解隐藏在交通流数据中的局部变化趋势。形式上，时间趋势感知多头自注意力机制定义如下。

其中表示卷积操作，表示卷积核。

在第l层encoder层中，给定输入，在所有节点上执行时间趋势感知多头自注意力机制后，得到一个中间序列表示。趋势感知自注意力机制使模型中的时间动态性是基于输入计算的。相比之下，在先前基于RNN和CNN的STGNNs模型中，时间动态性被假定为随时间移动而不变。

2) Spatial Dynamic Graph Convolution

为了捕捉空间动态性，文章基于GCN进一步设计了动态图卷积网络。GCN将传统的卷积计算从结构化数据推广到图结构，能够捕获隐藏在图中的非结构化模式。GCNs的总体思想是通过在节点之间交换信息来学习节点表示。具体地说，给定一个节点，GCN首先聚合其相邻节点的表示以生成该节点的中间表示，然后使用线性投影和非线性激活函数对聚合表示进行转换。具体公式如下：

其中以及分别为节点表示，权重矩阵以及非线性激活函数。表示节点之间的交互关系，定义如下：

其中表示邻接矩阵，表示邻接矩阵的度矩阵。

这种传统的图卷积运算不会随时间变化，即给定一个图G，相应的权重矩阵A是一个常数。然而，对于交通网络而言，节点之间的相关性很可能随着时间推移而改变，如果将传统的GCN应用于交通网络则无法捕获此类动态。基于此，文章提出了动态卷积网络DGCN，可以自适应地调整节点间的关系强弱，其思想是利用自注意机制动态计算节点间的空间相关性强度。例如，给定节点表示，时间趋势感知多头注意力的输出作为输入，空间相关性矩阵S的计算如下：

直观来说，的元素表示节点i和j之间的关联强度，取值大表示强关联，取值小表示弱关联。一旦获得了空间相关权重矩阵，就可以利用它通过element-wise dot-product来调整静态的权重矩阵A。

文章提出的动态图卷积模块基于由输入决定的可变的相关性矩阵以整合邻接信息，最终得到空间信息输出。

(3) Spatial-Temporal Decoder

时空解码模块由L个相同的解码层堆叠组成，以自回归的方式生成输出序列。为了防止使用未来子序列信息，解码器中使用了掩码（Mask）机制。每个解码层由两个时间趋势感知多头注意模块和一个空间动态GCN模块组成。具体来说，第一个时间趋势感知多头注意模块捕捉了decoder输入序列的相关性。为了掩盖未来信息，对query和key的1D卷积替换为了因果卷积，这是因为因果卷积仅关注当前位置的左侧，保证卷积运算不会窥视序列的未来信息。图3阐述了因果卷积和传统1D卷积的差别。第二个时间趋势感知多头注意块用于捕捉decoder输入序列（queries）与encoder（keys）输出序列间的相关性，其中因果卷积被应用于queries的计算而1D卷积被应用于keys的计算。

图3 传统1D卷积与因果卷积的差别

(4) Handling Preiodicity and Position Embedding

1）Handling Periodicity

该文章进一步考虑了隐藏在流量数据中的两种周期模式，即全局周期性和局部周期性。全局周期性是由于人们活动的规律性，例如通勤者在每周一早上8点离开家，因此每周同一天的同一时段的交通状况往往形似。局部周期性则是由气候或者天气变化引起的，例如大雪三天的交通速度与其他几天的交通速度显著不同。为了在预测未来个时间步的交通流时考虑这两种周期模式，除了过去个时间步的历史交通流数据，文章还引入了另外两种数据格式。

Global periodic tensor：为了捕捉全局周期性，文章考虑了过去w周与当前星期日期属性相同天的个交通记录，即。例如，假设时间步长为1小时，预测星期一早上7点到11点未来4个小时的交通状况，则需要提取过去三周（w=3）中星期一早上7点到11点的交通记录，得到全局周期性张量。

Local periodic tensor：类似全局周期张量，文章考虑过去d个连续日每日的个交通记录，即。例如，假设时间步为1小时，若希望预测当天早上7点到11点未来四个小时的交通状况，则需要提取过去两天（d=2）早上7点到11点的交通状况数据，得到局部周期张量。

2）Temporal Position Embedding

在时间趋势感知多头注意力模块中，动态性完全由自注意力机制建模。由于注意力机制通过加权和函数建立输入和目标之间的依赖关系，因此注意力机制对序列中符号的顺序时完全不可知的。然而，顺序信息在时间序列建模任务中起着非常重要的作用，因为相邻节点的信息往往更具有关联性。因此，明确地将顺序偏差引入模型可以提高预测的精确度。基于此，文章通过position embedding赋予每个元素位置信息，使相邻的元素具有紧密的位置关系。文章采用了固定位置嵌入，将每个输入元素嵌入到位置t中，具体实现如下：

其中，t是输入中每个元素的相对索引。另一个好处是，当输入包括全局周期张量和局部周期张量时，引入时间位置嵌入有利于模型更好的识别三种张量间的相对位置关系。

3）Spatial Position Embedding

虽然文章前面提出了如何捕捉不同节点（观测站）之间的动态变化相关性，但除了动态变化的交通状况外，每个空间节点还与一些静态特征相关联，这些静态特征主要由包括局部拓扑特征和相关道路类别属性在内的空间特征所决定。这些静态空间特征不随时间推进而演变，但随空间变化而变化，即具有空间异质性。因此，为了在反映图结构信息的同时对空间异质性进行建模，模型首先为每个节点分配一个额外的嵌入向量，从而得到初始空间位置嵌入矩阵。接着使用GCN层进行拉普拉斯平滑以得到最终的空间位置嵌入矩阵。

在得到时间和空间位置嵌入后，将二者加入到最初的输入中以改进模型性能。

总结

以上是对该文章所提出模型的框架及算法的具体介绍，实验部分在此不展开详细讲述，感兴趣的读者可以自行查看文章。这篇文章提出了一种新的交通流时空预测模型，称为ASTGNN。ASTGNN框架在时间和空间维度上均采用了注意力机制以实现交通数据动态性建模，同时考虑了交通流数据的周期性和空间异质性。具体来说，文章设计了一种时间趋势感知的多头注意机制，用于时间序列预测任务，它可以捕获时间序列中的局部上下文。为了捕捉空间维度上的动态，文章开发了一种新的动态GCN，可以自适应地调整空间相关强度。此外，文章明确建模了交通数据的周期性和空间异质性。在五个真实交通数据集上的实验表明，ASTGNN优于最先进的基线。

Attention

欢迎关注微信公众号《当交通遇上机器学习》！如果你和我一样是轨道交通、道路交通、城市规划相关领域的，也可以加微信：Dr_JinleiZhang，备注“进群”，加入交通大数据交流群！希望我们共同进步！

抖音算法：信息茧房的真相与AI代码生成器的助力前端
近年来，抖音的推荐算法备受争议，引发了公众对“信息茧房”的广泛关注。抖音集团副总裁李亮近日接受采访，就抖音算法的运作机制和“信息茧房”问题发表了独到见解。他认为，抖音算法并非神秘莫测，其核心原理与业界普遍使用的算法并无本质区别，关键在于平台的目标和用户体验的侧重点。这也引出了一个关键问题：如何利用技术手段，例如AI代码生成器，来优化算法，提升用户体验，并最终打破“信息茧房”的困局？抖音算法：长期留
如何用Python实现流式下载，节省内存还带进度条！ python
引言本篇文章来分享一下如何使用Requests下载文件并且显示进度条。下载文件说到下载文件，大家可能一下子就能写出以下的代码：importrequeststotal=10485url=f'https://speed.cloudflare.com/__down?during=download&bytes={total}'#上面的URL是cloudflare的测试链接，可以传入想要下载的长度res=r
WebRover ：一个功能强大的 Python 库，用于从 Web 内容生成高质量的数据集。数据集
2024-11-30，由Area-25团队开发的一个专门用于生成高质量网络内容数据集的Python库。该数据集旨在为大型语言模型（LLM）和人工智能应用的训练提供丰富的数据资源。数据集地址：WebRoverDataset|自然语言处理数据集|AI模型训练数据集一、让我们一起来看一下WebRoverWebRover通过智能网络爬虫技术，自动从网络中提取与特定主题相关的内容，并支持多种输入格式，如JS
《CPython Internals》阅读笔记：p329-p335 python
《CPythonInternals》学习第16天，p329-p335总结，总计7页。一、技术总结1.debuggingp331,Therearetwotypesofdebugger,consoleandvisual——作者将debugger分为两类：(1)console：lldb(MAC系统使用),GDB(Linux系统使用))。(2)visual：VisualStudioDebugger,CLi
抖音算法：信息茧房的真相与AI代码生成器的助力前端
近年来，抖音的推荐算法备受争议，引发了公众对“信息茧房”的广泛关注。抖音集团副总裁李亮近日接受采访，就抖音算法的运作机制和“信息茧房”问题发表了独到见解。他认为，抖音算法并非神秘莫测，其核心原理与业界普遍使用的算法并无本质区别，关键在于平台的目标和用户体验的侧重点。这也引出了一个关键问题：如何利用技术手段，例如AI代码生成器，来优化算法，提升用户体验，并最终打破“信息茧房”的困局？抖音算法：长期留
Flink系列-2、Flink架构体系技术武器库大数据专栏 flink 架构 jvm
版权声明：本文为博主原创文章，遵循CC4.0BY-SA版权协议，转载请附上原文出处链接和本声明。大数据系列文章目录官方网址：https://flink.apache.org/学习资料：https://flink-learning.org.cn/目录Flink中的重要角⾊Flink数据流编程模型Libraries支持Flink集群搭建Local本地模式（开发测试）Standalone-伪分布环境（开
OpenCV相机标定与3D重建(64)用于迭代地优化图像点的位置函数undistortImagePoints()的使用 jndingxin OpenCV opencv 人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述计算无畸变图像点的位置。cv::undistortImagePoints这个函数用于迭代地优化图像点的位置，以补偿镜头畸变，并且允许指定终止条件来控制迭代过程。函数原型voidcv::undistortImagePoints(InputArraysrc,Outpu
OpenCV相机标定与3D重建(65)对图像点进行去畸变处理函数undistortPoints()的使用 jndingxin OpenCV opencv
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述从观测到的点坐标计算理想点坐标。该函数类似于undistort和initUndistortRectifyMap，但它操作的是稀疏点集而不是光栅图像。此外，该函数执行与projectPoints相反的变换。对于3D对象，它不会重建其3D坐标；但对于平面对象，如果指定
OpenCV相机标定与3D重建(66)对立体匹配生成的视差图（disparity map）进行验证的函数validateDisparity()的使用 jndingxin OpenCV opencv 3d
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述使用左右检查来验证视差。矩阵“cost”应该由立体对应算法计算。cv::validateDisparity函数是OpenCV库中用于对立体匹配生成的视差图（disparitymap）进行后处理的一个工具。其主要功能是对计算出的视差值进行验证，确保相邻像素间的视差值
【原创】大数据治理入门（5）《数据生命周期管理：从采集到归档》入门必看高赞实用精通代码大仙数据库 hadoop python 大数据数据挖掘数据治理数据库 python
数据生命周期管理：从采集到归档引言：数据生命周期的概念数据生命周期管理（DataLifecycleManagement，DLM）是指从数据的创建、使用、存储到最终归档或销毁的全过程管理。在大数据时代，企业需要通过对数据生命周期的全面管理，确保数据的可用性、安全性和合规性。本文将详细介绍数据生命周期的各个阶段，以及相应的管理策略和技术工具。各阶段介绍：采集、存储、处理、分析、归档数据采集（DataC
【机器学习实战入门】使用OpenCV进行性别和年龄检测精通代码大仙数据挖掘深度学习 python 机器学习 python opencv 数据挖掘人工智能
GenderandAgeDetectionPython项目首先，向您介绍用于此高级Python项目的性别和年龄检测中的术语：什么是计算机视觉？计算机视觉是一门让计算机能够像人类一样观察和识别数字图像和视频的学科。它面临的挑战大多源于对生物视觉有限的了解。计算机视觉涉及获取、处理、分析和理解数字图像，旨在从现实世界中提取高维数据，从而生成可用来做决策的符号或数值信息。该过程通常包括物体识别、视频跟踪
OpenCV相机标定与3D重建(2)鱼眼相机模型 jndingxin OpenCV 数码相机 opencv 3d
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述鱼眼相机是一种具有非常宽视野的相机，通常会产生强烈的径向畸变。鱼眼相机模型旨在捕捉这种畸变，以便能够准确地处理和校正图像。鱼眼相机模型通常使用多项式函数来描述径向畸变。定义：设P是世界参考系中的一个3D点，其坐标为X(存储在矩阵X中）。点P在相机参考系中的坐标向量
python 随机数随机种子 AI算法网奇 python宝典 python 开发语言后端
目录神经网络推理随机种子gpu新版：神经网络推理随机种子gpu：神经网络推理随机种子含npu：numpy.full创建相同矩阵python生成n个随机整数python随机数种子，每次获取相同的随机数随机在区间M内取不重复的N个随机数取一个范围内均匀不重复的随机数神经网络推理随机种子gpu新版：defset_random_seed(seed):"""Setrandomseeds."""random.
使用ModelScope实现高效句嵌入生成 dagGAIYD python
技术背景介绍在自然语言处理（NLP）任务中，向量化文本（嵌入）是许多下游任务（如语义搜索、文本分类、问答系统等）的核心步骤之一。通过将文本转换为密集向量表示，我们可以在高维向量空间中构建更加高效的表示和检索算法。ModelScope是阿里云开源的一个模型和数据集管理平台，提供了大量预训练模型，涵盖了各种领域和任务。ModelScopeEmbeddings是一个与LangChain社区集成的工具类，
软件测试学习笔记丨Pytest的使用霍格沃兹测试开发学社测试人社区学习笔记 pytest 软件测试测试开发
本文转自测试人社区，原文链接：https://ceshiren.com/t/topic/221581.简介pytest是一个成熟的全功能python测试框架测试用例的skip和xfail，自动失败重试等处理能够支持简单的单元测试和复杂的功能测试，还可以用来做selenium/appnium等自动化测试，接口自动化测试pytest有很多第三方插件，并且可以自定义扩展，如pytest-allure（完
机器学习笔记 - 机器学习/深度学习实战案例合集坐望云起深度学习从入门到精通机器学习深度学习人工智能案例应用神经网络
一、简述如何学习机器学习/深度学习，理论和实践都很重要，理论上的内容需要看课程、读教材。但是实践需要自己动手，实践之后自然会对理论有更深入的理解。怎么实践？借用欧阳修《卖油翁》的话”无他，但手熟尔“。就是多看多写多跑。下面创建这个github的目的是为了存放一些图像处理/计算机视觉/机器学习/深度学习的示例代码集合，不定期会添加新的示例，可供参考。GitHub-bashendixie/ml_too
Java 大视界 -- Java 与大数据分布式机器学习平台搭建（58）青云交大数据新视界 Java 大视界大数据分布式机器学习 Apache Spark Hadoop Apache Flink 平台搭建架构设计
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。一、欢迎加入【福利社群
基于MRS-Hudi构建数据湖的典型应用场景介绍华为云技术精粹云计算华为云
一、传统数据湖存在的问题与挑战传统数据湖解决方案中，常用Hive来构建T+1级别的数据仓库，通过HDFS存储实现海量数据的存储与水平扩容，通过Hive实现元数据的管理以及数据操作的SQL化。虽然能够在海量批处理场景中取得不错的效果，但依然存在如下现状问题：问题一：不支持事务由于传统大数据方案不支持事务，有可能会读到未写完成的数据，造成数据统计错误。为了规避该问题，通常控制读写任务顺序调用，在保证写
Python基础入门之随机数种子(seed)方法的使用我的小星星 python 前端 linux Python
随机数在编程中经常被用到，而在Python中，我们可以使用random模块来生成随机数。然而，有时候我们需要控制随机数的生成过程，使得每次运行程序时得到的随机数序列是可重复的。这时，就可以使用随机数种子(seed)方法来实现这个目的。随机数种子是一个整数值，它作为随机数生成算法的起始输入值。当使用相同的种子值时，每次生成的随机数序列都是相同的。这对于调试程序和复现实验结果非常有用。在Python中
OpenCV相机标定与3D重建(63)校正图像的畸变函数undistort()的使用 jndingxin OpenCV opencv 3d
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述转换图像以补偿镜头畸变。该函数通过变换图像来补偿径向和切向镜头畸变。此函数仅仅是initUndistortRectifyMap（使用单位矩阵R）和remap（使用双线性插值）的组合。有关执行的具体变换详情，请参阅前者函数。对于在源图像中没有对应像素的目的图像中的像
[OpenAI Codex] Evaluating Large Language Models Trained on Code ShadyPi 自然语言处理 AIGC 语言模型人工智能自然语言处理
Linkofpaper:https://arxiv.org/abs/2107.03374.EvaluatingLargeLanguageModelsTrainedonCodeIntroductionCodexisaGPT-basedmodelfine-tunedonpubliccodefromGitHub,towritePythoncode.(Butcopilot,adistinctversion
2025届-2026届计算机专业毕业设计选题指南推荐—解答选题困惑以及三大选题方向 IT跃迁谷毕设展 Python实战项目专栏 Java实战项目专栏大数据实战项目专栏计算机毕业设计课程设计毕设毕业设计 java python 大数据
作者：IT跃迁谷毕设展个人简介：曾长期从事计算机专业培训教学，本人也热爱上课教学，语言擅长Java、微信小程序、Python、Golang、安卓Android等。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。平常喜欢分享一些自己开发中遇到的问题的解决办法，也喜欢交流技术，大家有技术代码这一块的问题可以问我！想说的话：感谢大家的关注与支持！Java实战项目集微信小
初学python爬虫，爬取“豆瓣电影 Top 250”相关信息，并下载电影封面 ~柠月如风~ Python 爬虫 python 爬虫正则表达式
文章目录注：一、爬取“豆瓣电影Top250”相关信息：1、准备工作2、获取数据补充：urllib3、标签解析补充：BeautifulSoup4和re4、保存数据补充：xlwt附：爬取“豆瓣电影Top250”相关信息的完整代码：二、爬取/下载top250电影对应的封面效果展示附：下载电影封面的完整代码：注：所学的视频教程：B站Python爬虫基础5天速成（2021全新合集）Python入门+数据可视
数据结构与算法（六）——循环队列的顺序存储结构（超详解，附动图+代码） fs站在远方看童年数据结构与算法队列指针算法数据结构
上一篇最后我们分析了队列的利弊，故我们这里对队列进行优化。就有了这一篇，循环队列。队列的问题主要便是入队的时间复杂度O(1).出队的时间复杂度0(n)。还有就是当进行插入和删除操作后，线性表的开始空间可能会被空出来，会浪费且占用空间。所以我们这里让队列首位相连变成了一个环，但是如何相连，相连之后入队和出队又是如何操作呢，相连以后会不会出现问题呢，出现问题又该如何解决呢，大家跟我一起往下看吧。优化（
python-with...as--管理上下文环境的语法结构赵钱孙李的赵 python
在Python中，with…as语句是一种用于管理上下文环境的语法结构，常用于处理资源的获取和释放，如文件操作、网络连接、锁定互斥等。它通过上下文管理协议（contextmanagementprotocol）来确保资源的正确使用和释放，即使在处理过程中出现了异常。在Python中，任何实现了上下文管理协议的对象都可以用作with…as语句中的上下文管理器。上下文管理协议要求对象实现两个特殊方法：e
python--对象存储服务器赵钱孙李的赵 python学习记录者 python 服务器开发语言
目录对象存储服务器定义概念普及对象（Object）桶（Bucket）终端节点（Endpoint）访问域名知名的对象存储服务器提供商微软云Azure：MicrosoftAzureBlobStorage华为云OBS:阿里云OSS:腾讯云COSMinIO:AmazonS3(SimpleStorageService)GoogleCloudStorageIBMCloudObjectStorage具体代码使用
python--数据结构赵钱孙李的赵 python学习记录者 python
1.list列表1.1特点有序：列表按照插入顺序排列。可变：可以添加，删除或者修改列表中的元素。异构：包含不同类型的数据。可重复：可迭代对象：可以使用迭代器协议来遍历列表中的元素，列表支持两种基本的迭代方法：for循环和迭代器协议。ps:迭代器协议要求对象实现两个特殊方法：iter()：返回一个迭代器对象next()：返回迭代器中的下一个值，如果没有更多值时，它会抛出StopIteration异常
Python 初始化方法钢铁男儿 Python
1、初始化方法1.1之前代码存在的问题----在类的外部给对象增加属性将案例代码进行调整，先调用方法再设置属性，观察一下执行效果。提示：在日常开发中，不推荐在类的外部给对象增加属性；如果在运行时，没有找到属性，程序会报错；对象应该包含有哪些属性，应该封装在类的内部；1.2初始化方法当使用**类名（）**创建对象时，会自动执行以下操作：1）、为对象在内存中分配空间—创建对象；2）、为对象的属性设置初
小波变换Python代码优游的鱼
小波变换是一种数字信号处理技术，用于对信号进行频域分析和处理。它通常用于信号压缩、滤波和其他信号处理应用中。在Python中，可以使用PyWavelets库来实现小波变换。下面是一个简单的例子，展示了如何使用PyWavelets库对信号进行小波变换：importpywtimportnumpyasnp#定义信号signal=np.random.rand(32)#进行小波变换wavelet='db1'
Python进阶篇 AI天才研究院 Python实战深度学习实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介什么是Python？Python是一种高级编程语言，它的设计理念强调代码可读性、简洁性和可扩展性。其语法简洁而清晰，它支持多种编程范式，包括面向对象的、命令式、函数式编程等。Python被认为是“胶水语言”——能够把许多编程语言连接起来并提供一个统一的接口，用以实现各种功能。为什么要学习Python？首先，Python是一种简单易学、功能丰富的语言。在很多情况下
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

基于注意力时空图神经网络的交通预测

Preliminarie

3. Attention Based Spatial-Temporal Graph Neural Networks

你可能感兴趣的:(大数据,算法,python,神经网络,机器学习)