深度科研

ECCV 2020 | STAR:基于Transformer的行人轨迹预测模型（一）

这是一篇ECCV 2020 行人轨迹预测的文章，在这里对论文进行浅浅的翻译。当然，由于水平的局限，有些地方只能意译。

论文链接：Spatio-Temporal Graph Transformer Networks for Pedestrian Trajectory Prediction

Abstract

理解人群动态运动对真实世界的一些应用，例如监控系统、自动驾驶来说是非常重要的。这是具有挑战性的，因为它（理解人群动态运动）需要对具有社会意识的人群的空间交互和复杂的时间依赖性进行建模。我们认为，注意力机制对于轨迹预测来说是最重要的因素。在这篇论文中，我们提出了STAR网络，一种基于时空图注意力机制的模型架构，它能仅依靠注意力机制解决轨迹预测（的问题）。STAR通过TGConv对图内人群进行建模，TGConv是一种基于Transformer的新型图卷积机制。图间的时间依赖性由单独的temporal Transformer进行建模。STAR通过spatial Transformer与temporal Transformer的交互，捕捉复杂的时空关系。为了校准由于消失行人的长期影响的时间预测，我们引入了一个可读写的外部存储模块，由temporal Transforemer持续更新。我们表明，仅通过注意力机制，STAR在5个常用的现实世界行人预测数据集上实现了SOTA的性能。

1. Introduction

行人轨迹预测对于计算机视觉和机器人产业来说都至关重要。行人轨迹预测是具有挑战性的，因为：1）人与人之间的交互是多模态的，并且很难捕捉，举例来说陌生人会尽量避免与他人的亲密接触，而同伴则倾向于成群结队地行走；2）复杂的时间预测和人与人之间的空间交互，举例来说人们会根据neighbors过去和未来的运动，来调节他们（自身）的运动。

捕捉人与人之间交互的经典模型是通过人为（设定）的energy-function来实现的，这需要大量特征工程的工作，并且在建立拥挤空间的人群交互时通常是以失败告终的。随着深度神经神经网络的崛起，RNN已经被用于轨迹预测，并且取得了良好的效果。基于RNN的模型通过行人潜在的状态来捕捉其运动，然后融合空间邻近行人的潜在状态来实现人与人之间交互的建模。Social-pooling平等地看待邻里区域的行人，并通过池化机制合并他们潜在的状态。注意力机制放宽了这种假设，并根据学习到的函数对行人进行加权，该函数编码了相邻行人对于轨迹预测的不同的重要性（意思就是说不同的行人对轨迹预测有着不同的影响）。然而，现今的（轨迹）预测器有两个共同的局限性：1）注意力机制的使用过于单一，无法完全对行人间的交互进行建模；2）RNNs通常难以对复杂的时间依赖性进行建模。

最近，Transformer网络在NLP领域取得了开创性的成果。Transformer摒弃了语言序列的序列性质，仅通过强而有力的self-attention机制就能对时间依赖性进行建模。相较于RNNs，Transformer架构的主要优势是，仅通过sel-attention就能够极大地改善对时间依赖性的建模，尤其是对水平序列来说。然而，基于Transformer的模型受限于正常的数据序列，很难将其推广到结构化数据（序列），例如图序列。

在该论文中，我们引入了STAR模型——一种新颖的基于纯自注意力机制（self-attention）的时空轨迹预测模型。我们坚信，时间attention、空间attention、时空attention的学习是精确预测行人轨迹的关键，而Transformer恰恰为这项任务提供了一个简洁的、有效的解决方案。STAR通过spatial graph Transformer捕捉行人间的交互。特别地，我们引入了TGConv架构——一种基于Transformer的图卷积机制。TGConv通过Transformer的自注意力机制改善了基于注意力机制的图卷积，可以捕捉更为复杂的社交互动。准确来说，TGConv倾向于在行人密度较高的数据集如ZARA1、ZARA2、UNIV上做较大的改善。我们用一个单独的temporal Transformer对行人的运动进行建模，相较于RNNs来说可以更好的捕捉（行人间的）时间依赖性。STAR通过spatial Trans former和temporal Transformer之间的交互来提出行人之间的时空interaction，这是一种简单而有效的策略。此外，由于Transformer将序列视为一组词袋模型，因此Transformer难以对时间序列数据进行建模，这是因为时间序列具有很强的（数据）一致性。我们引入了一个额外的可读写图形的内存模块，该模块在预测期间连续对嵌入（序列）执行平滑（操作）。对STAR的概述见于图2。

我们在5个常用的现实世界行人预测数据集进行了实验。仅靠注意力机制，STAR在这5个数据集上都取得了SOTA的实验效果。为了更好的理解所提出的每个component（的作用），我们还进行了额外的消融实验。

2. Background

2.1 Self-Attention and Transformer Networks

Transformer网络在NLP领域取得了巨大的成功，例如机器翻译、情感分析以及文章总结。Transformer沿用了被广泛用在RNN Seq2Seq模型里的encoder-decoder架构。

Transformer的核心思想是完全通过多头注意力机制来取代recurrence。对于嵌入的向量 $\left\{h_{t}\right\}_{t=1}^{T}$ ，Transformer的自注意力层首先学习到的所有嵌入的query矩阵 $Q=f_{Q}\left(\left\{h_{t}\right\}_{t=1}^{T}\right)$ 、key矩阵 $K=f_{K}\left(\left\{h_{t}\right\}_{t=1}^{T}\right)$ 和相应的value矩阵 $V=f_{V}\left(\left\{h_{t}\right\}_{t=1}^{T}\right)$ 。然后通过下式计算注意力：

$\operatorname{Att}(Q, K, V)=\frac{\operatorname{Softmax}\left(Q K^{\mathrm{T}}\right)}{\sqrt{d_{k}}} V$

其中 $d_{k}$ 代表每个query的维度。 $1/\sqrt{d_{k}}$ 是缩放点乘积项，用于注意力数值稳定。通过计算跨不同时间步长的嵌入向量间的自注意力，就能够学习到长范围的时间依赖性，这与使用有限内存的单个向量来记忆历史的RNN不同。另外，将attention结构为query, key, value元组，能够使自注意力捕捉更为复杂的时间依赖性。

多头注意机制在计算attention时会将多个假设结合起来。多头自注意力允许模型在不同的位置共同关注来自不同表征的信息。对于个头，我们有：

$\operatorname{MultiHead}(Q, K, V)=f_{O}\left(\left[\operatorname{head}_{i}\right]_{i=1}^{k}\right)$

$\operatorname{where} head_{i} = Att_{i}(Q,K,V)$

其中 $f_{O}$ 表示全连接层，融合来自个头的输出； $Att_{i}(Q,K,V)$ 表示第个头的自注意力。附加位置编码用于在Transformer嵌入中添加位置信息。最后，Transformer 通过两个残差连接的全连接层输出更新后的embedding。

然而，目前基于Transformer的模型的一个主要局限是只适用于非结构化的数据序列，如词序列。STAR将Transformers扩展到更结构化的数据序列——作为第一步——图序列，并将其应用于轨迹预测。

2.2 Related Works

Graph Neutral Networks 图神经网络（GNNs)是一种强大的图结构数据深度学习结构。图卷积在图机器学习任务上表现出了显著的改进，如物理系统建模、药物预测和社会推荐系统。特别地，图注意力网络( Graph Attention Networks，GAT ) 实现了节点间高效的加权消息传递，并取得了跨多个领域的最新成果。从序列预测的角度看，时序图 RNNs 允许在图序列中学习时空关系。我们的 STAR利用 Transformer TGConv改进了GAT，它提高了注意力机制，解决了Transformer 结构的图形时空建模问题。

Squence Prediction RNNs及其变体，如LSTM和GRU ，在序列预测任务中取得了巨大成功，如语音识别、机器人定位、机器人决策等。RNNs 也被成功应用于行人的时间运动模式建模。基于 RNNs的预测器使用Seq2Seq结构进行预测。附加的结构，例如social polling、注意力机制和图神经网络，用于改进轨迹预测与社会交互建模。

近年来，Transformer网络在自然语言处理领域占据主导地位。Transformer模型完全抛弃了递归并将注意力集中在跨时间步骤上。这种架构允许长期依赖性建模和大批量并行训练。Transformer架构也被成功应用于其他领域，例如股票预测、机器人决策等。STAR将Transformer的思想应用于图形序列。我们在一个具有挑战性的人群轨迹预测任务上演示它，其中我们将人群交互视为一个图形。STAR是一个通用框架，可以应用于其他图序列预测任务，例如社交网络中的事件预测和物理系统建模。我们把这个留给以后学习。

Crowd Interaction Modeling 作为开创性的工作，社会力量模型已被证明在各种应用中有效，例如人群分析和机器人。他们假设行人在虚拟力的驱动下进行目标导航和避碰。社会力模型在交互建模方面工作良好，但在轨迹预测方面表现不佳。基于几何的方法，如ORCA 和PORCA ，考虑Agent的几何结构，将交互建模转化为优化问题。经典方法的一个主要局限在于它们依赖于手工制作的特征，这些特征非常容易调整，难以概括。
基于深度学习的模型通过直接从数据中学习模型来实现自动特征工程。行为CNNs 通过CNNs捕捉人群互动。Social-Pooling通过近似人群交互的聚合机制进一步编码近端行人状态。最近的研究将人群视为一个图，将空间邻近行人的信息与注意机制进行合并。与池化方法相比，注意机制对行人进行重要建模。图神经网络也被应用于解决人群建模。显式消息传递使得网络能够对更复杂的社会行为进行建模。

3. Method

3.1 Overview

本节，我们将介绍基于轨迹预测架构的spatial-temporal Transformer——STAR。我们坚信，attention对于有效且高效预测轨迹是最重要的因素。

STAR将时空注意力模型分解为时间模型（temporal modeling）和空间模型（spatial modeling）。对于时间建模，STAR 独立地考虑每个行人，并应用标准的temporal Transformer network来提取时间依赖项。与RNNs相比，temporal Transformer提供了一个更好的时间依赖建模协议，我们在消融实验中验证了这一点。对于空间建模，我们引入了基于 Transformer的消息传递的图卷积机制TGConv。TGConv以更好的注意机制改进了目前的图卷积方法，为复杂的空间相互作用给出了更好的模型。特别是，TGConv更倾向于在行人密度较高(ZARA1、ZARA2、UNIV)和复杂交互的数据集上改进。我们构造了两个编码器模块，每个模块包含一对spatial and temporal Transformer，并将其叠加，以提取时空交互。

3.2 Problem Setup

给定在时间步长到 $T_{obs}$ 的行人运动历史，我们感兴趣的问题是，预测在某一场景中个行人在时间步长 $T_{obs}+1$ 到的未来轨迹。在每一时间步长中，（假定）我们有N个行人 $\left\{p_{t}^{i}\right\}_{i=1}^{N}$ ，其中 $p_{t}^{i}=\left(x_{t}^{i}, y_{t}^{i}\right)$ 在某个场景中自上而下行人的位置。我们假设距离小于的行人对 $\left(p_{t}^{i}, p_{t}^{j}\right)$ 有一条无向边。这就导致在每个时间步长处有一个交互图 $\operatorname{interaction\operatorname{graph}}$ ： $G_{t} = (V_{t},E_{t})$ ，其中 $V_{t}=\left\{p_{t}^{i}\right\}_{i=1}^{N}$ ， $E_{t} = {(i,j)}$ 。（实际上 $V_{t}$ 就是节点的集合，而 $E_{t}$ 就是边的集合）。对于在时间时的每个节点，我们定义其邻接集为，其中对于每个节点, $j\in Nb(i,t),e_{t}(i,j)\in E_{t}$

3.3 Temporal Transformer

Temporal Transformer block以一组行人轨迹 $\left\{h_{1}^{i}\right\}_{i=1}^{N},\left\{h_{2}^{i}\right\}_{i=1}^{N}, \ldots,\left\{h_{t}^{i}\right\}_{i=1}^{N}$ 作为输入（注意上表表示的是第几个行人，下表表示的是在哪个时刻），输出一组具有时间依赖关系的更新嵌入 $\left\{h_{1}^{\prime i}\right\}_{i=1}^{N},\left\{h_{2}^{\prime}{ }_{2}^{i}\right\}_{i=1}^{N}, \ldots,\left\{h_{t}^{\prime i}\right\}_{i=1}^{N}$ 作为输出，独立考虑每个行人。

Temporal Transformer block的结构见图3(a)。自注意力模块首先学到query matrixs $\left\{Q^{i}\right\}_{i=1}^{N}$ ，key matrixs $\left\{K^{i}\right\}_{i=1}^{N}$ ，value matrixs $\left\{V^{i}\right\}_{i=1}^{N}$ 。对于第个person，有：

$Q^{i}=f_{Q}\left(\left\{h_{j}^{i}\right\}_{j=1}^{t}\right), \quad K^{i}=f_{K}\left(\left\{h_{j}^{i}\right\}_{j=1}^{t}\right), \quad V^{i}=f_{V}\left(\left\{h_{j}^{i}\right\}_{j=1}^{t}\right)$

其中 $f_{Q},f_{k},f_{v}$ 是行人共享的query,key,value函数。我们可以利用GPU的加速实现所有行人的并行计算。

我们按照公式1分别计算每个行人的注意力。相似地，对于多头自注意力来说（)，对于每个行人，我们有：

$\begin{aligned} \operatorname{Att}\left(Q^{i}, K^{i}, V^{i}\right) &=\frac{\operatorname{Softmax}\left(Q^{i} K^{i \mathrm{~T}}\right)}{\sqrt{d_{k}}} V^{i} \\ \operatorname{MultiHead}\left(Q^{i}, K^{i}, V^{i}\right) &=f_{O}\left(\left[h e a d_{j}\right]_{j=1}^{k}\right) \\ \text { where head } \text { he }_{j} &=A_{j}\left(Q^{i}, K^{i}, V^{i}\right) \end{aligned}$

其中 $f_{O}$ 是一个融合个head的全连接层， $Att_{j}$ 是第个head的索引。最终的输出由两个残差连接和一个全连接层产生，见图3(a)所示。

temporal Transformer是Transformer network对数据序列集的简单推广。我们在实验中论证了基于Transformer的体系结构提供了更好的时间建模。

3.4 Spatial Transformer

spatial Transformer block提取行人之间空间交互（的信息）。我们提出了一种新的基于Transformer的图卷积——TGConv——用于图上的消息传递。

通过观察发现，自注意力机制可以被视为在一个无向全连接图上（进行）消息传递。对于特征集 $\left\{h_{i}\right\}_{i=1}^{n}$ 的一个特征向量 $h_{i}$ ，我们可以将相应的query vector，key vector，value vector表示为 $q_{i}=f_{Q}\left(h_{i}\right)$ ， $k_{i}=f_{K}\left(h_{i}\right)$ ， $v_{i}=f_{V}\left(h_{i}\right)$ 。我们定义在全连接图中从节点到节点的信息传递为：

$m^{j \rightarrow i}=q_{i}^{\mathrm{T}} k_{j}$

所以注意力函数可以改写为：

$\operatorname{Att}(Q, K, V)=\frac{\operatorname{Softmax}\left(\left[m^{j \rightarrow i}\right]_{i, j=1: n}\right)}{\sqrt{d_{k}}}\left[v_{i}\right]_{i=1}^{n}$

基于以上的见解，我们引入了TGConv模型。TGConv本质上仍是基于注意力的图卷积机制，有点儿像GATConv（图注意力网络），但是比GATConv具有更好的由Transformer所驱动的注意力机制。对于任意的graph ，实际就是节点的集合，而就是边的集合。对于节点的图卷积操作可以表示为：

其中 $f_{out}$ 是输出函数，在我们的架构中，它是一个全连接层， ${h_{i}}'$ 是TGConv对节点的更新嵌入。我们通过 $TGCzonv(h_{i})$ 总结节点的TGConv函数。我们通常在上述方程中的每一个残差连接后都会由一个归一化(normalization)。我们在方程中忽略了它们，以得到一个整洁的符号。

spatial Transformer如图 3(b) 所示，可以方便地由TGConv 实现。对每个图 $G_{t}$ 分别施加一个具有共享权重的TGConv。我们认为TGConv是通用的，可以应用于其他任务，我们将它留给未来的研究。

3.5 Spatio-Temporal Graph Transformer

在本小节，我们将介绍用于行人轨迹预测的spatial-temporal Transformer——STAR架构。

temporal Transformer可以单独对每个行人的动态运动进行建模，但不包含空间相互作用；spatial Transformer用TGConv解决人群交互（的问题），但很难推广到时间序列。行人预测的一个主要挑战是建立耦合的时空交互模型。行人的时空动态是紧紧相依的。例如，当一个人决定他的下一个动作时，首先要预测她的neighbors的未来动作，并选择一个在一个时间间隔 $\Delta t$ 内避免与他人碰撞的动作。

STAR通过将temporal Transformer与spatial Transformer交织在一个单一的框架下，来解决耦合的时空建模问题。图4展示了STAR的网络架构。STAR有两个encoder模组和一个简单的decoder模组。网络的输入是行人在时间到 $t=T_{obs}$ 的位置序列，其中时刻的位置序列用 $\left\{p_{t}^{i}\right\}_{i=1}^{N}$ 表示， $p_{i}^{t} = (x_{t}^{i},y_{t}^{i})$ 。在第一个encoder中，通过两个独立的全连接层对位置进行嵌入，并将嵌入（后的输出）传递给spatial Transformer 1和temporal Transformer 1，从行人历史中提取独立的时空信息（注意：虽然这里全连接层一样，但是全连接层的输入输出都是不一样的）。然后通过一个全连接层将spatial Transformer 1 和temporal Transformer 1的输出进行融合（实际上就是Concatenate拼接），（全连接层的输出）提供了一组具有时空编码的新特征。为了进一步在特征空间中对时空交互进行建模，我们在第二个encoder对得到的特征进行后处理。在第二个编码器中，spatial Transformer 2利用（第一个encoder的输出的）时间信息对空间交互进行建模，temporal Transformer 2增强了输出的空间嵌入性，具有时态注意力。STAR通过一个简单的全连接层来预测行人在 $t = T_{obs}+1$ 时刻的位置，该全连接的输入是temporal Transformer 2的输出，并与随机高斯噪声相连接（concatenate拼接），以此产生各种未来预测。我们根据预测的位置连接距离小于的节点构造图 $G_{T_{obs}+1}$ 。将预测加入到历史中进行下一步预测

与简单讲spatial / temporal Transformer结合相比，STAR架构极大的改善了时空建模的性能。

3.6 External GraphMemory

...没有了，后面没有难度了...

要做核酸去了，记得针对甄姬！

[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
Transformer底层原理解析及基于pytorch的代码实现 LiRuiJie 人工智能 transformer pytorch 深度学习
1.Transformer底层原理解析1.1核心架构突破Transformer是自然语言处理领域的革命性架构，其核心设计思想完全摒弃了循环结构，通过自注意力机制实现全局依赖建模。整体架构图如下：以下是其核心组件：1）自注意力机制（Self-Attention）-输入序列的每个位置都能直接关注所有位置-数学公式（缩放点积注意力）：-Q：查询矩阵（当前关注点）-K：键矩阵（被比较项）-V：值矩阵（实际
基于灰色马尔科夫模型预测人口数量，是一种结合灰色系统理论（处理少数据、不确定性）与马尔科夫链（描述随机波动）的融合预测方法
利用灰色模型捕捉人口变化的总体趋势，再通过马尔科夫链修正因随机因素导致的预测偏差，从而提高预测精度。一、模型理论基础灰色系统理论原理（核心：处理少数据、部分信息未知的系统）差异信息原理：系统内外的差异是信息源，人口数据的时间序列差异蕴含变化规律。解的非唯一性原理：信息不完全时，预测结果存在多个可能区间（与马尔科夫状态划分契合）。最小信息原理：仅需少量历史数据（通常≥4个）即可建模，适合人口统计资料
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
【Html实现“心形日出”（附效果+源代码）】| JavaScript面试题：解释一下异步编程中的回调函数、Promise和Async/Await的概念。它们有什么区别？追光者♂ html5 css3 心形日出前端特效 JS面试题 Promise Async/Await
风会带走你曾经存在过的证明。——虞姬作者主页：追光者♂个人简介：[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步，一起追光！！！
大模型笔记10：LoRA微调 errorwarn 笔记
LoRA微调的原理矩阵的秩矩阵的秩代表一个矩阵中所含信息的大小。行秩：矩阵中互相不重复、不依赖（即线性无关）的行的最大数目。列秩：矩阵中互相不重复、不依赖的列的最大数目。事实上，行秩和列秩总是相等的，因此我们通常直接称之为“矩阵的秩”。Transformer中微调哪些参数：LoRA的改进版本
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
ROS：录制相机、IMU、GNSS等设备数据吃水果不削皮视觉组合导航 ROS VIO
文章目录简介录制数据️准备工作录制相机录制串口设备录制数据项目地址简介在ROS中，录制传感器数据（如相机、IMU等）常使用rosbag工具，它可以将ROS话题消息保存为.bag文件，供后续回放或分析。本文使用jetson-tx2核心板作为录制平台，录制微光相机数据和六轴IMU数据，用于相机标定、IMU标定、相机-IMU联合标定与VIO轨迹分析。相机标定详见：相机-IMU联合标定：相机标定IMU标定
AI助力基因数据分析：用Python玩转生命密码的秘密 Echo_Wish 前沿技术人工智能人工智能数据分析 python
AI助力基因数据分析：用Python玩转生命密码的秘密说到基因数据，听起来是不是感觉有点高大上？其实，基因数据分析正变得越来越“接地气”，而AI正是这条路上的神奇钥匙。今天，咱们就用Python聊聊如何利用AI技术做基因数据分析与建模，帮你破解生命的密码，找到疾病预测、个性化医疗的新路子。一、基因数据为何如此特别？基因组测序技术让我们能够获取人体细胞内数以百万计的DNA序列变异信息。但数据量巨大、
用Python实现生信分析——功能预测详解写代码的M教授生信分析 python 开发语言
功能预测是生物信息学中的一项重要任务，通过分析基因或蛋白质序列的特征，推测它们的生物学功能。功能预测通常涉及多种方法，包括序列比对、基序识别、机器学习模型等。这些方法可以帮助科学家推断未知基因的功能，从而加速生物学研究的进展。1.功能预测的主要方法（1）同源性比对：通过将未知基因或蛋白质序列与数据库中的已知序列进行比对，识别出同源序列，并推测它们的功能。常用工具包括BLAST、HMMER等。（2）
青少年编程与数学 01-012 通用应用软件简介 15 人工智能助手明月看潮生编程与数学第01阶段青少年编程人工智能应用软件编程与数学
青少年编程与数学01-012通用应用软件简介15人工智能助手一、什么是人工智能助手二、人工智能助手的产生和发展（一）早期探索阶段（二）技术突破阶段（三）广泛应用阶段三、人工智能助手的主要功能（一）信息查询（二）日程管理（三）设备控制（四）知识问答四、人工智能助手的商业模式（一）广告收入（二）增值服务（三）数据服务（四）硬件销售五、DeepSeek（一）基本情况（二）技术水平（三）产品功能（四）市场
虚拟空间中的AI协作与任务 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
虚拟空间与AI概述在当今信息化和数字化的时代，虚拟空间（VirtualSpace）已成为人们生活和工作的重要一部分。虚拟空间是一种通过计算机技术构建的虚拟环境，它能够模拟和增强现实世界中的各种交互和体验。而人工智能（AI）作为计算机科学的一个分支，通过模拟人类的认知能力来实现自动化和智能化的决策。虚拟空间与AI的结合，不仅为人类带来了全新的交互方式，也为各行业的发展注入了强大的动力。虚拟空间的定义
AI Agent: AI的下一个风口智能体在元宇宙里的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIAgent:AI的下一个风口智能体在元宇宙里的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AIAgent,元宇宙,虚拟角色,智能交互,人工智能,虚拟世界,智能体架构,交互式应用1.背景介绍1.1问题的由来随着虚拟现实(VR)、增强现实(AR)和区块链技术的不断发展，元宇宙(Metaverse)的概念逐渐兴起。元宇宙是一个由虚拟世界
攻击者利用热门AI发动黑帽SEO攻击，通过污染搜索结果传播窃密木马 FreeBuf- 人工智能
伪装成AI主题网站的恶意页面|图片来源：ZscalerZscaler威胁实验室研究人员发现一起精心策划的恶意软件攻击活动，攻击者利用ChatGPT和LumaAI等人工智能(AI)工具的热度，通过黑帽SEO（搜索引擎优化）技术劫持搜索引擎结果，诱导用户落入恶意软件陷阱。Zscaler警告称："这些攻击背后的威胁行为者正在利用ChatGPT和LumaAI等AI工具的热度。"这些欺诈活动至少从2025年
60天python训练计划----day55
DAY55序列预测任务介绍知识点回顾序列预测介绍单步预测多步预测的2种方式序列数据的处理：滑动窗口多输入多输出任务的思路经典机器学习在序列任务上的劣势；以随机森林为例一、序列预测任务介绍1.1序列预测是什么？我们之前接触到的结构化数据，它本身不具备顺序，我们认为每个样本之间独立无关，样本之间即使调换顺序，仍然不影响模型的训练。但是日常中很多数据是存在先后关系的，而他们对应的任务是预测下一步的值，我
强化学习-双臂老虎机 transuperb 强化学习人工智能
本篇文章模拟AI玩两个老虎机，AI需要判断出哪个老虎机收益更大，然后根据反馈调整对于不同老虎机的价值判断，如果把这个看作一个简单的强化学习的话，那么AI就是agent，两个老虎机就是environment，AI首先会对两台老虎机有一个预测值Q，预测哪一个的价值高，然后AI通过策略函数判断应该选择哪个老虎机，进行Action后根据Reward更新每个老虎机的价值Value，然后再进行下一次判断，直到
基于Python Anaconda环境，使用CNN-LSTM模型预测碳交易价格的完整技术方案神经网络15044 仿真模型算法机器学习 python cnn lstm
以下是一个基于PythonAnaconda环境，使用CNN-LSTM模型预测碳交易价格的完整技术方案。内容涵盖数据预处理、模型构建、训练优化、预测可视化和结果分析等核心环节，代码与文字说明共计超过6000字。基于CNN-LSTM的碳交易价格预测系统设计与实现一、项目背景与目标1.1碳交易市场概述碳交易作为应对气候变化的重要市场机制，其价格波动直接影响企业减排决策。准确预测碳价（CarbonEmis
Python/Java/Php/C#/Go/C/C++这几个主力语言，谁到底真的不行 dotNET跨平台 java c#开发语言
1.前言阿里最近又进行了史诗级的大裁员，IT行业肉眼可见的持续性衰退与没落。当潮水退却，才能看出谁在裸泳。作为当今计算机编程界的几大主力语言，谁才真正的裸泳者呢？2.描述1.Python:Python作为一款解释性的动态语言，它很早就诞生了。它的第一个发行版1991年出世，比Java还要早四年。可惜命运不济，一直没有大的作为。到了2014年人工智能的风口悄然兴起，Python一路高歌猛进。到了20
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
fps游戏中网络同步优化方案你一身傲骨怎能输 Unity游戏性能优化游戏网络
在FPS（第一人称射击）游戏中，网络同步是确保所有玩家在游戏世界中看到一致状态的关键技术。网络延迟和丢包等问题可能导致玩家之间的游戏体验不一致，影响游戏的公平性和乐趣。以下是一些优化网络同步的方案：使用UDP协议:由于UDP协议比TCP协议有更低的延迟，它通常被用于实时游戏网络通信。客户端预测（ClientPrediction）:客户端可以预测玩家的移动和操作，而不是等待服务器的确认，这样可以减少
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key