csdnzhiwang

Deep Learning for Spatio-Temporal Data Mining: A Survey

摘要：

随着时空数据集的数量，数量和分辨率的迅速提高，传统的数据挖掘方法，尤其是基于统计的处理此类数据的方法正变得不知所措。近年来，随着深度学习技术的进步，诸如卷积神经网络（CNN）和递归神经网络（RNN）之类的深度学习模型由于在空间和时间上都具有强大的层次特征学习能力而在各种机器学习任务中都取得了相当大的成功。领域，并已广泛应用于各种时空数据挖掘（STDM）任务，例如预测学习，表示学习，异常检测和分类。在本文中，我们提供了有关将深度学习技术应用于STDM的最新进展的全面调查。我们首先对时空数据的类型进行分类，然后简要介绍STDM中使用的流行深度学习模型。然后介绍了一个框架，以显示针对STDM的深度学习模型利用的一般流程。接下来，我们根据ST数据的类型，数据挖掘任务和深度学习模型对现有文献进行分类，然后将STDM深度学习在不同领域的应用包括交通，气候科学，人员流动，基于位置的社交网络，犯罪分析和神经科学。最后，我们总结了当前研究的局限性，并指出了未来的研究方向。

introduction

时空数据挖掘（STDM）在大数据时代变得越来越重要，因为大型时空数据集（如地图，虚拟地球仪，遥感图像，十年一次的人口普查和GPS轨迹）的可用性和重要性日益增加。 STDM在各个领域具有广泛的应用，包括环境和气候（例如风预测和降水预测），公共安全（例如犯罪预测），智能交通（例如交通流量预测），人员流动。（例如，人类轨迹模式挖掘）等。由于多种原因，用于处理交易数据或图形数据的经典数据挖掘技术在应用于时空数据集时通常效果不佳。首先，ST数据通常嵌入在连续的空间中，而传统的数据集（例如交易和图表）通常是离散的。其次，ST数据的模式通常同时具有空间和时间特性，这更复杂，并且传统方法难以捕获数据相关性。最后，传统的基于统计的数据挖掘方法中的常见假设之一是数据样本是独立生成的。但是，当进行时空数据分析时，关于样本独立性的假设通常不成立，因为ST数据倾向于高度自相关。
近年来，随着深度学习的盛行，尽管在过去的几十年中对STDM进行了广泛的研究，但一个共同的问题是传统方法在很大程度上依赖于特征工程。换句话说，用于STDM的常规机器学习和数据挖掘技术在处理原始格式的自然ST数据的能力方面受到限制。例如，要从fMRI数据分析人的大脑活动，通常需要仔细的特征工程和相当多的领域专业知识来设计特征提取器，以将原始数据（例如，扫描的fMRI图像的像素值）转换为合适的内部表示形式或特征向量。近年来，随着深度学习的盛行，卷积神经网络（CNN）和递归神经网络（RNN）等各种深度学习模型因其强大的层次特征学习能力而在各种机器学习任务中取得了相当大的成功，并且已经广泛使用应用于许多领域，包括计算机视觉，自然语言处理，推荐，时间序列数据预测和STDM。与传统方法相比，STDM深度学习模型的优势如下。

自动特征表示学习 深度学习模型可以从原始ST数据中自动学习分层特征表示，这与需要手工制作特征的传统机器学习方法有显着不同。在STDM中，数据的空间邻近性和长期时间相关性通常很复杂且难以捕获。通过CNN中的多层卷积操作和RNN的递归结构，可以直接从原始数据中自动有效地学习ST数据中的此类空间邻近性和时间相关性。
强大的函数逼近能力 从理论上讲，深度学习可以逼近任何复杂的非线性函数，并且只要其具有足够的层和神经，就可以拟合任何曲线。深度学习模型通常由多层组成，每一层都可以被认为是具有池化，辍学和激活功能的简单但非线性的模块，因此它可以将特征表示从一个级别转换为更高级别和更抽象的表示水平。通过足够多的此类转换，可以学习非常复杂的功能，以使用更复杂的ST数据执行更困难的STDM任务。
图1显示了每年探索各种STDM任务的深度学习技术的论文数量。可以看到，过去三年中，论文数量呈显着增长趋势。从2012年到2015年，每年仅发表不到10篇相关论文。从2016年开始，这一数量迅速增加，许多研究人员针对不同应用领域中不同类型的ST数据尝试了不同的深度学习模型。 2018年，大约发表了90篇相关论文。目前尚无法获得2019年的完整数字，但我们认为增长趋势将在今年以及未来几年保持下去。鉴于问题的丰富性和实际应用的多样性，由于以下原因，迫切需要概述在STDM迅速发展的领域中探索深度学习技术的现有作品。它可以突出显示使用不同的深度学习模型来解决不同应用程序领域的STDM问题的异同。通过使得有可能看到深度学习模型（例如CNN和RNN）如何针对特定领域（例如，交通流量预测）中特定问题的深度开发，可以实现跨不同研究领域和应用领域的思想的异花授粉。运输）对于解决另一个领域的其他问题（例如，犯罪分析中的犯罪预测）可能很有用

有关STDM的相关调查 最近有一些调查从不同的角度回顾了某些情况下有关STDM的文献。 [9]和[143]讨论了在“大数据”时代用于遥感，气候科学和社交媒体分析等应用领域的STDM算法的计算问题。 [87]专注于时空数据的频繁模式挖掘。它指出了从ST数据中发现模式的挑战，并将模式分为三类：单个周期性模式；多轨迹上的成对运动模式和聚集模式。 [18]回顾了STDM研究和应用中的最新技术，重点放在时空数据的预测，聚类和可视化的数据挖掘任务上。 [130]从计算的角度回顾了STDM，并强调了STDM的统计基础。 [112]回顾了轨迹数据挖掘的方法和应用，轨迹数据挖掘是ST数据的一种重要类型。 [75]提供了对ST数据聚类的全面调查。 [4]讨论了不同类型的ST数据以及在分析每种类型的数据的背景下出现的相关数据挖掘问题。他们将有关STDM的文献分类为六个主要类别：聚类，预测学习，变更检测，频繁模式挖掘，异常检测和关系挖掘。但是，所有这些工作都是从传统方法而非深度学习方法的角度对STDM进行审查的。 [114]和[157]提供了一项调查，该调查特别侧重于利用深度学习模型来分析交通数据以提高交通系统的智能水平。总体上，对于探索STDM的深度学习技术仍然缺乏广泛而系统的调查。
首次调查据我们所知，这是第一份对近期探索STDM深度学习技术的著作进行回顾的调查。鉴于近年来对时空数据分析进行深度学习的研究越来越多，我们首先对时空数据类型进行分类，然后介绍在STDM中广泛使用的流行的深度学习模型。我们还总结了不同数据类型的数据表示形式，并总结了哪种深度学习模型适合处理ST数据的哪些类型的数据表示形式。
我们的贡献与现有作品相比，本文做出了重要贡献，总结如下：
首次调查据我们所知，这是第一份对近期探索STDM深度学习技术的著作进行回顾的调查。鉴于近年来对时空数据分析进行深度学习的研究越来越多，我们首先对时空数据类型进行分类，然后介绍在STDM中广泛使用的流行的深度学习模型。我们还总结了不同数据类型的数据表示形式，并总结了哪种深度学习模型适合处理ST数据的哪些类型的数据表示形式
通用框架 我们为基于深度学习的STDM提供了一个通用框架，该框架包括以下主要步骤：数据实例构建，数据表示，深度学习模型选择和解决STDM问题。在框架的指导下，给定特定的STDM任务，人们可以更好地使用适当的数据表示形式，并为正在研究的任务选择或设计合适的深度学习模型。
全面调查 该调查提供了针对不同STDM问题使用深度学习技术的最新进展的全面概述，这些问题包括预测学习，表示学习，分类，估计和推论，异常检测等。对于每项任务，我们将针对不同类型的ST数据提供具有代表性的作品和模型的详细说明，并进行必要的比较和讨论。我们还将根据应用领域对当前的工作进行分类和总结，包括运输，气候科学，人类流动性，基于位置的社交网络，犯罪分析和神经科学
未来的研究方向 该调查还突出了一些尚待深入研究的未解决问题，并指出了未来可能的研究方向。

时空数据的分类

A.数据类型

ST数据有多种类型，它们在不同的实际应用程序中的数据收集和表示方式不同。不同的应用场景和ST数据类型导致不同类型的数据挖掘任务和问题表述。不同的深度学习模型通常对ST数据的类型有不同的偏好，并且对输入数据格式有不同的要求。例如，CNN模型设计为处理类似图像的数据，而RNN通常用于处理顺序数据。因此，重要的是首先总结ST数据的一般类型并正确表示它们。我们遵循并扩展了[4]中的分类，并将ST数据分为以下类型：事件数据，轨迹数据，点参考数据，栅格数据和视频

事件数据。事件数据包括在地点和时间发生的离散事件（例如城市中的犯罪事件和交通网络中的交通事故事件）。通常，事件的特征可以是点的位置和时间，分别表示事件发生的位置和时间。例如，犯罪事件的特征可以是这样的元组（ei，li，ti），其中ei是犯罪类型，li是犯罪发生的地点，ti是犯罪发生的时间。图1（a）展示了事件数据。它显示了三种类型的事件，这些事件由不同形状的符号表示。 ST事件数据在犯罪学（犯罪和相关事件的发生率），流行病学（疾病暴发事件），交通（车祸）和社交网络（社交事件和趋势主题）等现实应用中很常见。
轨迹数据。轨迹表示随时间推移在空间中移动的物体所跟踪的路径。（例如，自行车旅行或出租车旅行的行驶路线）。轨迹数据通常由部署在移动物体上的传感器收集，这些传感器可以随着时间的推移周期性地传输物体的位置，例如出租车上的GPS。图1（b）显示了两个轨迹的图示。每个轨迹通常可以表征为这样的序列{（l1，t1），（l2，t2）…（ln，tn）}，其中li是位置（例如纬度和经度），ti是时间移动物体通过此位置。随着移动应用程序和物联网技术的发展，诸如人类轨迹，城市交通轨迹和基于位置的社交网络等轨迹数据变得无处不在。
点参考数据。点参考数据包括连续ST场的测量值，例如在空间和时间上一组移动参考点上的温度，植被或种群。例如，通常使用漂浮在太空中的气象气球来测量诸如温度和湿度之类的气象数据，这些气象气球会连续记录天气观测结果。点参考数据通常可以表示为一组元组，如下{{r1，l1，t1），（r2，l2，t2）…（rn，ln，tn）}。每个元组（ri，li，ti）表示在时间ti处ST的位置li处传感器ri的测量。图3示出了在两个时间戳处的连续ST场中的点参考数据（例如海面温度）的示例。它们是由传感器在两个时间戳记的参考位置（显示为圆圈）测量的。请注意，温度传感器的位置会随时间变化
栅格数据。栅格数据是连续或离散ST场的测量值，记录在空间中的固定位置和固定的时间点。点参考数据和栅格数据之间的主要区别在于，点参考数据的位置不断变化，而栅格数据的位置固定。测量ST场的位置和时间可以规则或不规则地分布。给定m个固定位置S = {s1，s2，… sm}和n个时间戳T = {t1，t2，… tn}，栅格数据可以表示为矩阵Rm×n，其中每个条目rij是时间戳tj处si处的测量值。栅格数据在运输，气候科学和神经科学等实际应用中也很常见。例如，空气质量数据（例如PM2.5）可以由部署在城市固定位置的传感器收集，并且在连续时间段内收集的数据形成空气质量栅格数据。在神经科学中，功能磁共振成像或功能MRI（fMRI）通过检测与血流相关的变化来测量大脑活动。扫描的fMRI信号还形成用于分析大脑活动和识别某些疾病的栅格数据。图4示出了运输网络的交通流栅格数据的示例。每条道路都部署了交通传感器，以收集实时交通流量数据。一整天（24小时）内所有道路传感器的交通流量数据形成一个栅格数据。
视频。包含一系列图像的视频也可以视为一种ST数据。在空间域中，相邻像素通常具有相似的RGB值，因此呈现出较高的空间相关性。在时间域中，连续帧的图像通常会平滑变化并呈现出较高的时间依赖性。视频通常可以表示为三维张量，一维表示时间t，另两个维表示图像。实际上，如果我们假设在每个像素处都部署了一个“传感器”，并且在每个帧处，“传感器”将收集RGB值，则视频数据也可以视为特殊的栅格数据。基于深度学习的视频数据分析非常热门，近年来发表了大量论文。尽管我们将视频归类为ST数据类型，但我们还是从数据挖掘的角度着重于审查相关作品，而视频数据分析则属于计算机视觉和模式识别的研究领域。因此，在本次调查中，我们不涵盖视频的ST数据类型。

B数据实例

数据挖掘算法所操作的基本数据单元称为数据实例。对于经典的数据挖掘设置，通常可以将数据实例表示为一组功能，这些功能带有用于监督学习的标签，而没有用于监督学习的标签。在ST数据挖掘方案中，不同的ST数据类型有不同类型的数据实例。对于不同的数据实例，存在几种类型的数据表示形式，用于表示数据以供深度学习模型进一步挖掘
数据实例 通常，ST数据可以概括为以下数据实例：点，轨迹，时间序列，空间图和ST栅格，如图5的左侧所示。ST点可以表示为包含以下内容的元组时态信息以及观察的一些其他功能，例如犯罪或交通事故的类型。除ST事件外，轨迹和ST点参考也可以形成为点。例如，可以将一条轨迹分解为几个离散的点，以计算在特定时隙中有多少条轨迹经过了特定区域。在某些应用中，除了形成为点和轨迹外，还可以将轨迹形成为时间序列。如果我们确定位置并计算穿过该位置的轨迹数，则它将形成一个时间序列数据。空间图的数据实例包含在每个时间戳处归档的整个ST中所有传感器的数据观测。例如，在时间t处部署在高速公路上的所有环形传感器的交通速度读数形成空间地图数据。 ST栅格数据的数据实例包含跨整个位置和时间戳集的测量。也就是说，ST栅格包含一组空间地图。
根据不同的应用程序和分析要求，可以从ST栅格中提取不同的数据实例作为时间序列，空间图或ST栅格本身。首先，对于某些时间序列挖掘任务，我们可以将在ST字段的特定ST网格处的测量视为时间序列。其次，对于每个时间戳，可以将ST栅格的测量结果视为空间地图。第三，人们还可以考虑跨越所有位置和时间戳的所有测量作为一个整体。在这种情况下，ST栅格本身可以是数据实例
数据表示。对于上述五种类型的ST数据实例，通常使用四种类型的数据表示形式将其表示为各种深度学习模型，序列，图，二维矩阵和3维张量的输入，如右侧部分所示图5。不同的深度学习模型需要不同类型的数据表示作为输入。因此，如何表示ST数据实例取决于正在研究的数据挖掘任务和所选的深度学习模型。通常使用这种数据表示来促进CNN模型的利用[67]，[118]，[142]。尽管图也可以表示为矩阵，但在这里我们将图和图像矩阵归为两种不同类型的数据表示。这是因为图节点不像图像矩阵那样遵循欧几里得距离，因此处理图和图像矩阵的方式完全不同。稍后，我们将讨论有关处理两种类型的数据表示方法的更多详细信息。根据不同的应用，空间图可以表示为图形和矩阵。例如，在城市交通流量预测中，城市交通网络的交通数据可以表示为交通流量图[85]，[155]或小区区域级交通流量矩阵[121]，[137]。栅格数据通常表示为2D矩阵或3D张量。对于矩阵而言，这两个维度是位置和时间步长，对于张量而言，这三个维度是行区域单元格id，列区域id和时间戳。与张量相比，矩阵是一种更简单的数据表示格式，但它会丢失位置之间的空间相关信息。两者都广泛用于表示栅格数据。例如，在风能预测中，通常将部署在不同位置的多个风速计的风速时间序列数据合并为一个矩阵，然后输入到CNN或RNN模型中，以进行未来风速预测[96]，[200]。在神经科学中，人的功能磁共振成像数据是一系列扫描的功能磁共振成像大脑图像，因此可以像视频一样表示为张量。许多作品使用fMRI图像张量作为CNN模型的输入，用于特征学习以检测大脑活动
[66]，[76]和诊断疾病[116]，[158]。

C.深度学习模型的初步

在本小节中，我们简要介绍了几种广泛用于STDM的深度学习模型，包括RBM，CNN，GraphCNN，RNN，LSTM，AE / SAE和Seq2Seq。
受限玻尔兹曼机（RBM）。受限玻尔兹曼机是一种两层随机神经网络[53]，可用于降维，分类，特征学习和协作过滤。如图6所示，RBM的第一层称为带有神经元节点{v1，v2，… vn}的可见层或输入层，第二层称为带有神经元节点{h1， h2，… hm}。作为完全连接的二部无向图，RBM中的所有节点通过无向权重边{w11，… wnm}跨层相互连接，但是同一层中没有两个节点被链接。 RBM的标准类型具有二进制值的节点，并且还具有权重。 RBM尝试学习二进制代码或输入的表示形式，并且根据特定任务，可以有监督或无监督的方式训练RBM。 RBM通常用于学习功能

CNN。卷积神经网络（CNN）是一类深层的前馈人工神经网络，用于分析视觉图像。典型的CNN模型通常包含以下几层，如图7所示：输入层，卷积层，池化层，完全连接层和输出层。卷积数将通过计算神经元的权重与连接到输入体积的区域之间的标量积来确定其神经元连接到输入局部区域的输出。然后，池化层将简单地沿着给定输入的空间维度执行下采样，以减少参数的数量。全连接层将一层中的每个神经元连接到下一层中的每个神经元，以学习用于分类的最终特征向量。它在原则上与传统的多层感知器神经网络（MLP）相同。与传统的MLP相比，CNN具有以下与众不同的特征，这些特征使它们在视觉问题上实现了很多通用化：3D神经元体积，局部连接性和共享权重。 CNN用于处理图像数据。由于其在空间域中捕获相关性的强大功能，现在已广泛用于挖掘ST数据，尤其是空间地图和ST栅格。

GraphCNN。 CNN设计为处理可在欧几里得空间中表示为规则网格的图像。但是，在很多应用程序中，都是从非欧几里德域生成数据的，例如图形。最近，对GraphCNN进行了广泛研究，以将CNN泛化为结构化数据[160]。图8示出了GraphCNN模型的结构示意图。图卷积操作将卷积变换应用于每个节点的邻居，然后进行池化操作。通过堆叠多个图卷积层，每个节点的潜在嵌入可以包含来自距离多跳的邻居的更多信息。在生成图中节点的潜在嵌入之后，可以轻松地将潜在嵌入馈送到前馈网络以实现回归目标的节点分类，也可以汇总所有节点嵌入以表示整个图，然后执行图分类和回归。由于它具有捕获节点相关性和节点特征的强大功能，因此现在广泛用于挖掘图结构化的ST数据，例如网络规模的流量数据和大脑网络数据

RNN和LSTM。递归神经网络（RNN）是一类人工神经网络，其中节点之间的连接沿序列形成有向图。 RNN旨在识别顺序特征并使用模式来预测下一个可能的情况。它们被广泛用于语音识别和自然语言处理的应用中。图9（a）显示了RNN模型的一般结构，其中Xt是输入数据，A是网络的参数，ht是学习的隐藏状态。可以看到前一个时间步tt1的输出（隐藏状态）被输入到下一个时间步t的神经。因此，历史信息可以存储并传递给将来。标准RNN的一个主要问题是，由于梯度消失的问题，它仅具有短期记忆。长短期记忆（LSTM）网络是递归神经网络的扩展，它能够学习输入数据的长期依赖性。由于使用了特殊的存储单元，如图9（b）的中间部分所示，LSTM使RNN能够长时间记住其输入。 LSTM单元由三个门组成：输入，忘记和输出门。这些门决定是否让新输入进入（输入门），删除信息（因为它不重要）（忘记门）或使其在当前时间步影响输出（输出门）。RNN和LSTM都广泛用于处理序列和时间严重数据，以学习ST数据的时间依赖性。

Seq2Seq。序列到序列（Seq2Seq）模型的目的是将固定长度的输入与固定长度的输出映射，其中输入和输出的长度可能不同[138]。它广泛用于各种NLP任务，例如机器翻译，语音识别和在线聊天机器人。尽管最初提出解决NLP任务的建议，但Seq2Seq是通用框架，可用于任何基于序列的问题。如图10所示，Seq2Seq模型通常由3个部分组成：编码器，中间（编码器）矢量和解码器。由于捕获序列数据之间的依存关系的强大能力，Seq2Seq模型被广泛用于ST预测任务中，其中ST数据具有较高的时间相关性，例如城市人群流量数据和交通数据

自动编码器（AE）和堆叠式AE。自动编码器是一种人工神经网络，旨在以无监督的方式学习有效的数据编码[53]。如图11所示，它具有编码器功能，可创建一个包含描述输入的代码的隐藏层（或多层）。然后有一个解码器，它创建来自隐藏层的输入的重构。自动编码器通过学习数据中的相关性，在隐藏层或瓶颈层中创建数据的压缩表示形式，这可以视为减少维度的一种方式。作为一种有效的无监督特征表示学习技术，AE有助于进行各种下游数据挖掘和机器学习任务，例如分类和聚类。堆叠式自动编码器（SAE）是由多层稀疏自动编码器组成的神经网络，其中每层的输出都连接到连续层的输入[7]。

//往下就不翻译其他类型的数据了，主要翻译轨迹数据的处理

III. FRAMEWORK

在本节中，我们将介绍如何使用深度学习模型总体上解决STDM问题。首先，我们将提供一个框架，描述包含ST数据实例构造，ST数据表示，深度学习模型部分和设计的管道，最后解决该问题。接下来，我们将详细介绍这些主要步骤。
图13显示了使用深度学习模型进行ST数据挖掘的通用管道。给定从各种位置传感器收集的原始ST数据，包括事件数据，轨迹数据，点参考数据和栅格数据，首先构建数据实例用于数据存储。如前所述，ST数据实例可以是点，时间序列，空间图，轨迹和ST栅格。为了将深度学习模型应用于各种挖掘任务，ST数据实例需要进一步表示为一种特定的数据格式，以适合深度学习模型。 ST数据实例可以表示为序列数据，2D矩阵，3D张量和图形。然后对于不同的数据表示形式，不同的深度学习模型适用于处理它们。 RNN和LSTM模型擅长处理具有短期或长期时间相关性的序列数据，而CNN模型可以有效地捕获图像中的空间相关性（如矩阵）。结合RNN和CNN的混合模型可以捕获ST栅格数据的张量表示的空间和时间相关性。最后，选定的深度学习模型用于解决各种STDM任务，例如预测，分类，表示学习等。

A. ST数据预处理
ST数据预处理旨在将ST数据实例表示为深度学习模型可以处理的适当数据表示格式。通常，取决于不同的模型，深度学习模型的输入数据格式可以是矢量，矩阵或张量。图12显示了ST数据实例及其对应的数据表示。可以看到，通常一种类型的ST数据实例对应于一种典型的数据表示形式。轨迹和时间序列数据可以自然地表示为序列数据。空间地图数据可以表示为2D矩阵。 ST栅格可以表示为2D矩阵或3D张量。但是，并非总是如此。例如，有时将轨迹数据表示为矩阵，然后应用CNN模型以更好地捕获空间特征[24]，[67]，[103]，[117]，[150]。首先，将测量轨迹的ST字段（例如城市）划分为网格单元区域。然后，可以将ST字段建模为矩阵，每个单元格区域代表一个条目。如果轨迹在单元格区域上移动，则将相应的条目值设置为1；否则，将其设置为1。否则将其设置为0。这样，轨迹数据可以表示为矩阵，因此可以应用CNN。有时，空间图被表示为图形。例如，通常将以快速方式部署的传感器建模为图形，其中节点是传感器，边缘表示两个相邻传感器之间的路段。在这种情况下，通常使用GraphCNN模型来处理
传感器图形数据并预测所有节点[22]，[85]的未来流量（量，速度等）。根据数据类型和应用，ST栅格数据可以表示为2D矩阵或3D张量。例如，一系列的fMRI脑图像数据可以表示为张量，并输入到用于疾病分类的3D-CNN模型中[78]，[116]，也可以通过提取之间的时间序列相关性将其表示为矩阵。用于大脑活动分析的成对的大脑区域[48]，[113]。

B 深度学习模型的选择与设计
使用ST数据实例的数据表示，下一步是将它们输入到针对不同STDM任务选择或设计的深度学习模型中。如图12的右侧所示，每种类型的数据表示都有不同的深度学习模型选项。序列数据可用作模型的输入，包括RNN，LSTM，GRU，Seq2Seq，AE，混合模型等。 RNN，LSTM和GRU都是适用于预测序列数据的递归神经网络。序列数据也可以通过Seq2Seq模型进行处理。例如，在多步流量预测中，通常使用Seq2Seq模型，该模型由编码器层中的一组LSTM单元和解码器层中的一组LSTM单元组成，以预测接下来几个时隙中的业务量速度或流量同时[89]，[90]。作为特征学习模型，AE或SAE可以用于各种数据表示，以学习低维特征编码。序列数据也可以使用AE或SAE编码为低维特征。 GraphCNN特别设计用于处理图形数据，以捕获相邻节点之间的空间相关性。如果输入是单个矩阵，则通常使用CNN模型；如果输入是矩阵序列，则可以根据所研究的问题来应用RNN模型，ConvLSTM和混合模型。如果目标仅是功能学习，则可以应用AE和SAE模型。对于张量数据，通常由3D-CNN或3D-CNN与RNN模型的组合来处理。表一总结了使用深度学习模型处理不同类型的ST数据的工作。如表中所示，CNN，RNN及其变体（例如GraphCNN和ConvLSTM）是STDM两种使用最广泛的深度学习模型。 CNN模型主要用于处理空间地图和ST栅格。一些作品还使用CNN处理轨迹数据，但目前尚无使用CNN进行时间序列数据学习的作品。 GraphCNN模型是专门为处理图形数据而设计的，可以将其分类为空间图。包括LSTM和GRU的RNN模型可广泛应用于处理轨迹，时间序列和空间图序列。 ConvLSTM可以被视为结合RNN和CNN的混合模型，通常用于处理空间地图。 AE和SDAE主要用于从时间序列，轨迹和空间地图中学习特征。 Seq2Seq模型通常设计用于顺序数据，因此仅用于处理时间序列和轨迹。混合模型对于STDM也很常见。例如，可以将CNN和RNN堆叠起来以学习空间特征
首先，然后捕获历史ST数据之间的时间相关性。可以将混合模型设计为适合所有四种类型的数据表示形式。其他模型，例如网络嵌入[164]，多层感知器（MLP）[57]，[186]，生成对抗网络（GAN）[49]，[93]，残差网络[78]，[89]，深层在最近的著作中也使用了强化学习[50]等

S. Dabiri and K. Heaslip. Inferring transportation modes from gps trajectories using a convolutional neural network. Transportation research part C: emerging technologies, 86:360–371, 2018.
A. Karatzoglou, N. Schnell, and M. Beigl. A convolutional neural network approach for modeling semantic trajectories and predicting future locations. In International Conference on Artificial Neural Networks, pages 61–72. Springer, 2018.
J. Lv, Q. Li, Q. Sun, and X. Wang. T-conv: A convolutional neural network for multi-scale taxi trajectory prediction. In Big Data and Smart Computing (BigComp), 2018 IEEE International Conference on, pages 82–89. IEEE, 2018.
Q. Gao, F. Zhou, K. Zhang, G. Trajcevski, X. Luo, and F. Zhang. Identifying human mobility via trajectory embeddings. In Proceedings of the 26th International Joint Conference on Artificial Intelligence, pages 1689–1695. AAAI Press, 2017.
G. Yang, Y. Cai, and C. K. Reddy. Recurrent spatio-temporal point process for check-in time prediction. In Proceedings of the 27th ACM International Conference on Information and Knowledge Management, pages 2203–2211. ACM, 2018.
Q. Liu, S. Wu, L. Wang, and T. Tan. Predicting the next location: A recurrent model with spatial and temporal contexts. In AAAI, pages 194–200, 2016.
K. Xu, Z. Qin, G. Wang, K. Huang, S. Ye, and H. Zhang. Collision free lstm for human trajectory prediction. In International Conference on Multimedia Modeling, pages 106–116. Springer, 2018.
J. Feng, Y. Li, C. Zhang, F. Sun, F. Meng, A. Guo, and D. Jin. Deep move: Predicting human mobility with attentional recurrent networks. In Proceedings of the 2018 World Wide Web Conference on World Wide Web, pages 1459–1468. International World Wide Web Conferences Steering Committee, 2018.
Real-Time Taxi-Passenger Prediction with LCNN
C.解决STDM问题
最后，选择或设计的深度学习模型用于解决各种STDM任务，例如分类，预测性学习，表示性学习和异常检测。请注意，通常如何选择或设计深度学习模型取决于特定的数据挖掘任务和输入数据。但是，为了展示框架的流程，我们首先展示了深度学习模型，然后展示了数据挖掘任务。在下一节中，我们将对不同的STDM问题进行分类，并根据问题和ST数据类型详细审查工作。

IV。解决不同STDM问题的深度学习模型

在本节中，我们将对STDM问题进行分类，并介绍为解决这些问题而建议的相应深度学习模型。图14显示了由深度学习模型解决的各种STDM问题的分布，包括预测，表示学习，检测，分类，推理/估计，推荐等。可以看到研究的STDM问题中最大的类别是预测。超过70％的相关论文致力于研究ST数据预测问题。这主要是因为
准确的预测在很大程度上取决于高质量的特征，而深度学习模型在特征学习中尤其强大。第二大问题类别是表示学习，它旨在以无监督或半监督的方式学习各种ST数据的特征表示。深度学习模型还用于其他STDM任务，包括分类，检测，推断/估计，推荐等。接下来，我们将详细介绍主要的STDM问题，并总结相应的基于深度学习的解决方案

A.预测学习
预测学习的基本目标是根据ST数据的历史数据预测ST数据的未来观察。对于不同的应用程序，输入和输出变量都可以属于不同类型的ST数据实例，从而产生了各种预测性学习问题公式。接下来，我们将基于ST数据实例的类型作为模型输入来介绍预测问题。
时间序列。在道路交通预测中，道路或高速公路上的交通流量数据可以建模为时间序列。最近，许多作品尝试了各种深度学习模型来进行道路交通预测[104]，[136]，[191]。 [104]首次利用堆叠式自动编码器从交通流时间序列数据中学习特征，以进行路段级交通流预测。 [136]将高速公路上的交通流量数据视为时间序列，并建议使用“深度信仰”网络（DBN）根据先前的流量观察结果预测未来的流量。 [126]研究了出租车需求预测问题，并以时间序列对特定区域的出租车需求建模。提出了一个具有全连接层的深度学习模型，以从出租车需求的历史时间序列中学习特征，然后将该特征与其他上下文特征（例如天气和社交媒体文本）集成在一起，以预测未来需求。 RNN和LSTM被广泛用于时间序列ST数据预测。 [90]集成了LSTM和序列到序列模型来预测路段的交通速度。除了交通速度信息外，他们的模型还考虑了其他外部特征，包括道路的地理结构，国家庆典等公共社交活动以及在线人群查询旅行信息。天气变量（例如风速）通常也被建模为时间序列，然后将RNN / LSTM模型应用于未来的天气预报[14]，[17]，[55]，[97]，[124]，[179]。例如，[17]提出了一个概率风速预报的集成模型。该模型将传统的风速预测模型与小波阈值降噪（WTD）和自适应神经模糊推理系统（ANFIS）与递归神经网络（RNN）集成在一起。在功能磁共振成像数据分析领域，功能磁共振成像时间序列数据通常用于研究功能性大脑网络并诊断疾病。 [34]建议使用LSTM模型直接从静息状态fMRI时间序列对自闭症谱系障碍（ASD）和典型对照进行分类。 [59]开发了一种名为DCAE的深度卷积自动编码器模型，用于以无监督的方式从复杂的大规模tfMRI时间序列中学习中级和高级功能。时间序列数据通常不包含空间信息，因此在基于深度学习的预测模型中未明确考虑数据之间的空间相关性。
轨迹。当前，根据轨迹的数据表示，将两种类型的深度学习模型RNN和CNN用于轨迹预测。首先，轨迹可以表示为位置序列，如图12所示。在这种情况下，可以应用RNN和LSTM模型[38]，[64]，[77]，[88]，[135]，[ 163]，[165]。 [163]提出了无碰撞LSTM，它通过添加排斥池来扩展经典LSTM，以共享相邻行人的隐藏状态以进行人体轨迹预测。无碰撞LSTM可以根据行人过去的位置生成未来序列。 [64]研究了城市人口流动预测问题，该问题给出了一个人观察到的流动性的几个步骤，试图预测他/她将在下一城市去哪里。他们提出了带有RNN的深度序列学习模型，以有效预测城市人口流动性。 [135]提出了一个名为DeepTransport的模型，用于从一组个人的GPS轨迹中预测步行，乘火车，乘公共汽车等运输方式。四个LSTM层用于构建DeepTransport，以预测用户将来的运输方式。
轨迹也可以表示为矩阵。在这种情况下，可以将CNN模型应用于更好地捕获空间相关性[67]，[103]，[142]。 [67]提出了一种基于CNN的方法来表示语义轨迹和预测未来位置。在语义轨迹中，每个访问的位置都与语义含义相关联，例如房屋，工作，商店等。他们将语义轨迹建模为矩阵，其二维是语义含义和轨迹ID。矩阵被输入到具有多个卷积层的CNN中，以学习潜在特征以用于下次访问的语义位置预测。 [103]将轨迹建模为二维图像，其中图像的每个像素代表是否在轨迹中访问了相应的位置。然后，采用多层卷积神经网络结合多尺度轨迹模式，进行滑行轨迹的目的地预测。将轨迹建模为类似图像的矩阵还用于其他任务，例如异常检测和推断[111]，[150]，这将在后面详细介绍
…
七。结论
在本文中，我们对探索STDM深度学习技术的最新进展进行了全面概述。我们首先将ST数据的不同数据类型和表示形式进行分类，并简要介绍用于STDM的流行深度学习模型。对于不同类型的ST数据及其表示，我们展示了适合处理它们的相应深度学习模型。然后，我们给出了一个通用框架，该框架显示了利用深度学习模型解决STDM任务的管道。在该框架下，我们根据ST数据类型和STDM任务的分类概述当前的工作，包括预测学习，表示学习，分类，估计和推断，异常检测等。接下来，我们总结了深度学习技术在STDM的不同领域中的应用，这些领域包括交通运输，按需服务，气候和天气，人类流动性，基于位置的社交网络（LBSN），犯罪分析和神经科学。最后，我们列出了一些尚待解决的问题，并指出了这项快速发展的研究的未来研究方向。

你可能感兴趣的:(深度学习,论文)

Python训练 + Go优化 + C#部署：端到端AI模型的跨语言实践威哥说编程人工智能学习资料库 python golang c#
在现代AI应用中，如何高效地训练、优化、并最终部署AI模型是一项复杂且具有挑战性的任务。在这一过程中，选择合适的编程语言和工具可以显著提高效率和系统的性能。Python作为AI领域的主流语言，具有丰富的深度学习框架（如PyTorch和TensorFlow），在模型训练方面处于领先地位。然而，针对计算密集型任务（如数据预处理、加密等），Go语言因其高效的并发处理和出色的性能，成为优化计算的理想选择。
【无标题】
PyQt5相关论文方向扩充及技术特性解析PyQt5的核心优势PyQt5作为基于Qt框架的Python绑定库，在科研与工程应用中具备显著优势。其跨平台兼容性极强，可在Windows、macOS、Linux等主流操作系统上稳定运行，且能保持界面风格的一致性，这对开发多场景应用系统至关重要。在界面设计方面，PyQt5提供了丰富的UI组件库，从基础的按钮、文本框到高级的图表、3D控件应有尽有，同时支持Qt
DL00478-涡轮叶片缺陷检测数据集yolo格式1300张左右
涡轮叶片缺陷检测数据集yolo格式1300张左右涡轮叶片缺陷检测数据集YOLO格式解析：提升研究与论文写作的关键要点在研究涡轮叶片缺陷检测的过程中，数据集的选择和格式处理是一个至关重要的环节。特别是当你打算通过卷积神经网络（CNN）等深度学习模型进行缺陷检测时，数据集的标注和格式化直接影响到模型的训练效果和论文的质量。本文将重点探讨涡轮叶片缺陷检测数据集的YOLO格式，并分析如何利用这一格式为研究
具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
深度学习图像分类数据集—百种病虫害分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：百种病虫害识别分类，训练集45095张，验证集7508张，测试集22619张具体类别为以下：insect_classes=["rice_leaf_roller","rice_leaf_caterpillar
基于小样本学习的图像分类综述 cdyyyyyyy 学习分类机器学习
目录引言基本概念小样本学习方法分类1、数据增强2、迁移学习3、元学习小样本学习主流方法1、基于度量的小样本学习2、基于Pretraining+FineTuning的方法3、基于元学习的小样本学习总结引言因为课程设计要求，所以进行了关于小样本学习的调研。目前小样本学习还是一个比较热门的研究，很多关于小样本学习的论文也陆续发表。本文只是一个概述，具体方法研究还有待深入。基本概念小样本学习（FSL：Fe
车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
外交部：即日起吊销《华尔街日报》三名驻京记者证件超甜吖
2月19日，外交部发言人耿爽主持网上例行记者会。有记者提问，上周，外交部发言人就《华尔街日报》发表辱华文章要求《华尔街日报》公开正式道歉并查处相关责任人，请问《华尔街日报》是否已就中方要求做出回应？耿爽表示，2月3日，《华尔街日报》刊发美国巴德学院教授米德（WalterRussellMead）撰写的评论文章。该文诋毁中国政府和中国人民抗击疫情的努力，报社编辑还为文章加上了《中国是真正的“亚洲病夫”
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
聚焦基础研究突破，北电数智联合复旦大学等团队提出“AI安全”DDPA方法入选ICML CSDN资讯人工智能安全数据要素大数据
近日，由北电数智首席科学家窦德景教授牵头，联合复旦大学和美国奥本大学等科研团队共同研发，提出一种DDPA（DynamicDelayedPoisoningAttack）新型对抗性攻击方法，为机器学习领域的安全研究提供新视角与工具，相关论文已被国际机器学习大会（ICML2025）收录。ICML由国际机器学习学会（IMLS）主办，聚焦深度学习、强化学习、自然语言处理等机器学习前沿方向，是机器学习与人工智
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
GPT-3 面试题
简介1、GPT-3是什么？它是基于什么模型的？GPT-3是一种基于深度学习原理的语言预测模型。它是由OpenAI开发的，可以从互联网数据中生成任何类型的文本。它只需要一小段文本作为输入，就可以生成大量的准确和复杂的机器生成文本²⁴。GPT-3是基于Transformer模型的，使用了仅有解码器的自回归架构。它使用下一个单词预测目标进行训练¹²。GPT-3有8个不同的模型，参数从1.25亿到1750
【Flink图计算源码解析】开篇：Flink图计算总览 hxcaifly Flink Flink原理和应用
文章目录1.图计算的作用2.本专题的写作目的3.FlinkGelly引擎总览3.1.Gelly的源码结构1.Graph的存储数据结构2.图的类别3.图的验证以及指标4.图的生成器5.Library6.图的迭代计算7.examples案例4.后记1.图计算的作用哲学上说事物之间普遍存在联系的，通常来说可以将事物看作图的顶点，事物间的联系看作图的边，典型的场景：对应于学术界的文献来说，每篇论文可以看作
大模型参与推理崩溃论战！从「思维错觉」到「错觉的错觉」再到「错觉的错觉的错觉」
苹果团队一篇论文，现已升级成AI圈“论文连续剧”。《思维的错觉》：大模型推理会崩溃。《思维的错觉的错觉》：大模型崩溃是错觉。《思维的错觉的错觉的错觉》：大模型还是会崩溃。起初，苹果团队发了一篇论文炮轰所有大模型推理都是假象，遇到高复杂度长推理问题时都会崩溃，即使给他们足够的时间和计算资源。这篇文章引起了广泛关注，有人支持也有人质疑。在质疑的人中，有一位网友与ClaudeOpus“合作”写了一篇长达
精通 triton 使用 MLIR 的源码逻辑 - 第001节：triton 的应用简介
项目使用到MLIR，通过了解triton对MLIR的使用，体会到MLIR在较大项目中的使用方式，汇总一下。1.Triton概述OpenAITriton是一个开源的编程语言和编译器，旨在简化GPU高性能计算（HPC）的开发，特别是针对深度学习、科学计算等需要高效并行计算的领域。既允许开发者编写高度优化的代码，又不必过度关注底层硬件细节。这样，通过简化高性能计算，可以加速新算法的实现和实验。传统GPU
陈若许凯张琳《重生后，我打脸恶毒狗男女》全文免费_陈若许凯张琳全文阅读_笔趣阁好书慢看
陈若许凯张琳《重生后，我打脸恶毒狗男女》全文免费_陈若许凯张琳全文阅读_笔趣阁主角配角：陈若许凯张琳小说别名：重生后，我打脸恶毒狗男女简介：中秋那天，我递了辞职信，远离医院那个是非之地。回乡下度假的那天，手机却被打爆了。男友的青梅疯狂发信息过来，质问我SCI医学论文怎么不写了。我感受着乡村的风和日丽，毅然关机图个清净。可是没等我找她，我的医院工作群已经炸开了，全是讨论着同一件事。张琳一早又发了新动
【CVPR 2025】低光增强RT-X Net（红外辅助结构引导）--part2代码讲解 BOB_BOB_BOB_ 低光增强LLIE transformer 深度学习人工智能神经网络计算机视觉
【CVPR2025】本文参考论文RT-XNET:RGB-THERMALCROSSATTENTIONNETWORKFORLOW-LIGHTIMAGEENHANCEMENTTransformerDesign下面对方法论部分进行详细分析论文提出网络类似Retinexformer/SG-LLIE，感兴趣的可以在我的主页进一步学习论文地址：arxiv代码地址：github文章目录**代码段1:导入与辅助函数
ai绘画生成软件哪个好？几款好用的AI绘画软件分享! 呼酱小宝箱
随着人工智能技术的不断发展，越来越多的AI绘画生成软件被开发出来。这些软件利用深度学习技术，可以将普通照片或图像转化成具备艺术效果的画作。那么，ai绘画生成软件哪个好？首先，让我们来看一下几个常见的AI绘画生成软件，它们分别是：1、DeepDreamDeepDream是由Google开发的一款AI绘画生成软件。它通过卷积神经网络对输入的图片进行处理，从而生成出具有艺术风格的画作。DeepDream
2023-11-15 自然科学学术论文=记叙文+说明文+议论文写作不停的追梦人
一篇自然科学的实验性的原创论文，包含了前言、材料方法、结果、讨论结论，这四块主要内容。而前言部分，就是记叙文，介绍所有研究问题的由来；而材料方法和结果部分，就是说明文部分，介绍材料方法具体过程和结果部分，主要描述结果的情况详细具体情况；而讨论结论，就是议论文部分，以实验结果为论据，来证明你的分论点，而结论就是你的一篇文章总论点。
DeepSeek部署指南：从入门到精通 wujj_whut 热门应用 c++DeepSeek 嵌入式实时数据库
DeepSeek部署指南：从入门到精通引言在人工智能和深度学习领域，模型的部署是一个至关重要的环节。DeepSeek作为一款强大的深度学习框架，其部署过程不仅关系到模型的性能表现，还直接影响到实际应用的效果。本文将详细介绍DeepSeek的部署流程，涵盖从环境配置到实际应用的各个方面，旨在帮助读者全面掌握DeepSeek的部署技巧。一、DeepSeek简介DeepSeek是一款开源的深度学习框架，
【人工智能之深度学习】1. 深度学习基石：神经元模型与感知机的数学本质（附代码实现与收敛性证明） AI_DL_CODE 人工智能之深度学习人工智能深度学习神经元模型感知机赫布法则深度学习基础线性可分
摘要：作为深度学习的基础单元，神经元模型与感知机承载着从生物智能到人工神经网络的桥梁作用。本文从生物神经元的工作机制出发，系统剖析数学建模过程：详解赫布法则的权重更新原理（Δwi=η·xi·y），推导McCulloch-Pitts神经元模型的数学表达（y=Θ(∑wixi−b)），重点证明感知机在linear可分情况下的收敛性——通过Novikoff定理严格推导迭代次数上界，揭示间隔γ对收敛速度的影
深度学习在环境感知中的应用：案例与代码实现
让机器学会“看”世界：深度学习如何赋能环境感知？关键词深度学习|环境感知|计算机视觉|传感器融合|语义分割|目标检测|自动驾驶摘要环境感知是机器与外界互动的“眼睛和耳朵”——从自动驾驶汽车识别行人，到智能机器人避开障碍物，再到城市监控系统检测异常，所有智能系统都需要先“理解”环境，才能做出决策。传统环境感知方法依赖手工特征提取，难以应对复杂场景；而深度学习通过数据驱动的方式，让机器从大量数据中自动
自编码器表征学习：重构误差与隐空间拓扑结构的深度解析码字的字节机器学习自编码器重构误差隐空间
自编码器基础与工作原理自编码器（Autoencoder）作为深度学习领域的重要无监督学习模型，其核心思想是通过模拟人类认知过程中的"压缩-解压"机制实现数据的表征学习。这种由GeoffreyHinton团队在2006年复兴的神经网络结构，本质上是一个试图通过编码-解码过程来复制其输入的系统，却在实现这一看似简单目标的过程中，意外地获得了强大的特征提取能力。基本架构与工作流程典型自编码器由对称的两部
深入解析Hadoop：大数据处理的基石学习的锅 hadoop 大数据分布式
随着信息技术的快速发展和互联网的普及，数据的产生速度极具增加。面对如此海量的数据，传统的数据处理工具显得力不从心。在这种背景下，诞生了一系列用于处理大数据的框架与工具，而ApacheHadoop便是其中最为知名和应用最广泛的一个。本文将深入解析Hadoop的基本原理、架构及其在大数据处理中的重要性。1.Hadoop的起源与发展Hadoop起源于Google公司的三篇奠基性论文：GoogleFile
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {