深度科研

From Goals, Waypoints & Paths To Long Term Human Trajectory Forecasting（一）

cvpr2021行人轨迹预测论文，写一写对论文的翻译，当然水平在这只能是意译。

Abstract

人类轨迹预测一直以来都是多模态问题。未来轨迹的不确定性主要来自两个方面：(a)知道人的行为意图，但不知道怎么去建模，例如长期目标（预测）；(b)既不知道人的行为意图，也不知道怎么去建模，例如行人的目的以及决策的随意性。我们提出将这种不确定性分解为认知因素和随机因素（两方面）。对于认知不确定性，可以通过在长期目标（预测）中的多模态进行建模；对于随机不确定性，可以通过在沿路点与其路径（预测）中的多模态进行建模。为了验证这一想法，我们还提出了一种新的用于长期轨迹预测的方法，这种方法的预测时长高达一分钟，比以往（工作）方法高出一大截。最后，我们还提出了Y-Net模型，一种与场景兼容的轨迹预测网络，利用先前所述的认知（不确定性）和随机（不确定性）模型，预测不同的轨迹。...

1. Introduction

序列预测是信号处理、模式识别、控制工程等多个工程学科以及几乎所有与时间测量有关的领域中的一个基本问题。... 时间序列预测是序列预测问题的一个关键实例，在这种情况下，序列由实践采样的元素组成。一些经典的技术，例如自回归移动平均模型（ARMA）已经被纳入现代先进时间序列预测方法的深度学习体系结构当中。

然而，人类不是无生命的牛顿实体抑或是物理规律的奴隶。预测台球在摩檫力和物理约束条件下在台球桌上的平稳滚动的未来运动，与预测人（在未来时间）如何运动、位置在哪（的方法）不同。人类不像是台球（没有思想），人类是目标的产物，会发挥主观能动性实现他们既定的目标。预测人类的运动对于动态智能体，例如其他人、自动化的机器人、自动驾驶的汽车来说是及其重要的。人的运动本质是以目标为导向的，并由自身实现，以达到预期的目的。

可是，仅以一个人过去的运动和长期的目标（导向）为条件，就能够决定将来的轨迹吗？现在想象这样一个场景：你呢，站在一个繁忙的街道上等红绿灯，当然，你的目的是要走到街的另一边去，然而你的行动轨迹可能是随机的，因为你可能急转弯去避让其他行人，或者因为即将要变的红灯突然加速，再或者因为难以控制的骑自行车的人的猛冲而突然停止。因此，即便以过去的运动和语义场景为条件，人类轨迹仍然随机性的，潜在的决策变量（比如长期目标）引起的认知不确定性和随机决策变量（如环境因素）引起的任意变化是（造成这种随机性的）主要原因。 ...

这促使人类动力学建模采用因式多模态的方法，其中随机性的两个因素都是分层建模的，而不是集中在一起的。我们假定行人（内心）长期潜在的目标代表了运动预测中的认知不确定性。尽管行人有在心中计划这个目标，但是我们不知道这个目标goal会不会变啊。这在现实中就相当于某个人要去哪里的问题。同样地，你有了目标，但是怎么去实现这个目标的路径就是随机不确定性，这种随机不确定性包含了环境因素例如其他行人，和决策中无意识的随机性。在现实中这就相当于某个人心里有了目的地怎么实现的问题。

因此我们提出先将认知不确定性进行建模，然后以认知不确定性为条件，再对随机不确定性建模（简单来说就是先定好目的地，再规划好到达目的地的路径）。具体来说就是给定一张RGB的三通道场景照片和行人的运动历史，先对行人的目的地（或者说长期目标）进行概率估计，这不就是上面提到的预测系统中的认知不确定性吗？于此同时，我们还得对几个选定的航路点（waypoint）做出估计，这些航路点将与咱们的目标点（长期目标）一起用于获得所有通往目的地轨迹的显式概率图。（简单来说就是只有目的地不行，还得确定几个航路点，这几个航路点与目的地共同构成了多条轨迹路径）这不就是上面提到的预测系统中的任意不确定性吗？总结一下，长期目标goal、航路点waypoint，以及多条轨迹路径一同构成了咱们的未来轨迹。（所以说是多模态的问题嘛）

说了这么多，我们有什么贡献呢？我们有三大贡献：一是提出了长期轨迹预测的方法，预测时间高达一分钟，比之前文献中的方法高了一大截。二是提出了Y-Net网络模型，Y-Net是一种与场景兼容的长期预测网络，在有效利用场景语义的同时，明确地对目标（目的地）和路径（多条轨迹路径）进行建模。三是提出的Y-Net超越了SOTA的方法，表明因式化建模的可行性。...

2. Related Works

这一部分就不写了，因为不想写。关键词得记一下并了解：Social Forces、Social LSTM、CVAE、inverse reinforcement learning、Social GAN...

3. Proposed Method

多模态预测问题可以正式地用公式表述为：给定一张RGB三通道的图片和在该图片中行人在 $t_{p}=n_{p} / \mathrm{FPS}$ 时刻的过去位置 $\left\{\mathbf{u}_{n}\right\}_{n=1}^{n_{p}}$ ，模型将预测行人在下一时刻 $t_{f}$ 的位置，表示为 $\left\{\mathbf{u}_{n}^{i}\right\}_{n=n_{p}+1}^{n_{p}+n_{f}}$ ，其中 $t_{f}=n_{f} / \mathrm{FPS}$ 。由于未来是随机的，因此对（行人）未来的轨迹有着多种预测。在我们的工作中，我们将所有的随机性分成了两种模式。第一种是与认知不确定性相关的模式，也就是最终目的地的多模性，目的地的多模性我们用 $K_{e}$ 来表示。第二种是与随机不确定性相关的模式，也就是到达目的地路径的多模性，这源于给定目的地的不可控的随机性，路径的多模性咱们用 $K_{a}$ 来表示。在短时间预测中，由于总的路径长度很短，因此通往给定目的地的路径选项是有限的，并且这些路径彼此还都相似。自然而然，由于这种特性，我们在短期预测中常把 $K_{a}$ 设置为1。但是在长时间预测中，显然到达一个相同的目的地会有着不同的路径，所以在长期预测中 $K_{a}$ >1。另外，我们在3.2小结中详细描述了我们所提出的Y-Net模型以及其三个子网络 $U_{e}$ 、 $U_{g}$ 、 $U_{t}$ 和损失函数。

3.1 Y-Net Sub-Networks

为了有效地使用语义空间中的场景信息和轨迹信息（坐标），需要在不同模式之间创建像素级对齐。之前的工作是怎么实现这一要求的呢——对RGB图像进行编码作为一个隐藏的状态向量，该隐藏状态向量来自预训练的CNN网络。虽然这为网络提供了场景信息，但任何有意义的空间信号在展平为向量时都会高度融合，（这会使得）像素对齐被破坏。... 在我们的工作中，我们采用了一种基于场景轨迹热力图的表示方法，在图像相同空间中表示轨迹（的方法）来解决对齐问题。

3.1.1 Trajectory-on-Scene Heatmap Representation

上面提到一种基于场景的热力图的表示方法来解决像素对齐问题，那具体是怎么操作的呢？首先，（给定的）RGB图像首先使用语义分割网络（如U-Net）进行处理，该语义分割网络生成图像的分割图，（语义）分割图有个类别，类是根据行人当前的行为如行走、站立、跑步等动作而确定的。与此同时，咱们还得做一件事——将行人的过去运动 $\left\{\mathbf{u}_{n}\right\}_{n=1}^{n_{p}}$ 转换成与图像空间大小（一致）、有着 $n_{p}$ 个通道的轨迹热力图，其中每个timestep对应一个通道。数学表达式为：

$\mathbf{H}(n, i, j)=2 \frac{\left\|(i, j)-\mathbf{u}_{n}\right\|}{\max _{(x, y) \in \mathcal{I}}\left\|(x, y)-\mathbf{u}_{n}\right\|}$

随后，将轨迹热力图沿通道维度与语义分割图进行concatenate拼接，得到基于场景的轨迹热力图向量 $H_{s}$ ，其维度为 $H\times W \times (C+n_{p})$ ，将其作为输入向量送到编码器 $U_{e}$ 当中去。

3.1.2 Trajectory-on-Scene Heatmap Encoder $U_{e}$

刚才咱们提到轨迹热力图向量 $H_{s}$ ，那接下来该做什么事情呢？ $H_{s}$ 首先会被送到编码器 $U_{e}$ 当中去，编码器 $U_{e}$ 设计成U-Net encoder的形式，但并不是单纯的U-Net encoder，因为在U-Net中encoder是vgg形式，而在这里 $U_{e}$ 被设计成了ResNet-101的形式。编码器 $U_{e}$ 由个block组成，每个block后面都有一个最大池化操作（步长为2），这使得空间尺寸逐block减半（但通道数此时不变），池化后面紧跟卷积+ReLU的操作，使得通道维度逐block递增（但此时空间尺寸不变）。Encoder的最终输出 $H_{M}$ 与其中间输出 $H_{m}(1\leq m\leq M)$ 将会被送到目标解码器 $U_{g}$ 和轨迹解码器 $U_{t}$ 当中去。

3.1.3 Goal and Waypoint Heatmap Decoder $U_{g}$

刚才呢有提到 $H_{m}(1\leq m\leq M)$ ， $H_{m}$ 实际上就是编码器 $U_{e}$ 的中间输出，它有着不同的空间分辨率。在encoder $U_{e}$ 中我们干了一件什么事情呢？我们做了这样一件事：将基于场景的轨迹热力图向量 $H_{s}$ 输入到我得encoder当中，经过一些列的池化和卷积的交替操作，得到有着不同空间分辨率的基于场景的轨迹热力图向量 $H_{m}$ 和encoder的最终输出 $H_{M}$ 。将 $H_{M}$ 与 $H_{m}(1\leq m\leq M)$ （有范围，表示说我的 $H_{m}$ 有多个不同的取值）送入到目标解码器 $U_{g}$ 当中去， $U_{g}$ 也是仿照U-net decoder的架构设计。那 $U_{g}$ 的架构长什么样呢？首先，一个center block接收我的 $H_{M}$ ，该center block由两个卷积层+ReLu组成；然后，在每个block的一开始，先进行双线性上采样和卷积的操作（也就是反卷积），这会使得空间分辨率逐block倍增；在反卷积之后是两层的卷积层，来自编码器 $U_{e}$ 的中间输出 $H_{m}$ 将会与这两层卷积层的前一层的输出进行skip connection，实际上就是特征融合，然后再送到两层卷积的后一层，再开始反卷积——卷积——skip connection的循环操作。有必要一提的是，这种融合来自 $U_{e}$ 编码过程中高分辨率特征图的举措是非常有必要的，因为如果仅仅使用 $U_{e}$ 的最终输出特征 $H_{M}$ ，将会极大地限制goal heatmap的最终分辨率，这将丢失保存在中间特征图中的精细空间细节。总的来说，重复反卷积——卷积——skip connection操作次就构成了 $U_{g}$ 基本的网络结构，但是还有一点没有说明，那就是 $U_{g}$ 的输出是怎样的呢？ $U_{g}$ 的输出层由一个卷积层后跟一个像素级的sigmoid函数组成，对于每个 $N^{\omega }$ 选定的航路点 $u_{\omega _{i}}$ 和目的地 $\mathbf{u}_{n_{p}+n_{f}}$ 在归一化后产生一个明确地、没有参数地概率分布 $P\left(\mathbf{u}_{w_{i}}\right)$ 、 $P\left(\mathbf{u}_{n_{p}+n_{f}}\right)$ 。 $U_{g}$ 的输出维度为 $H \times W \times\left(N^{w}+1\right)$ ，因此，对于每个 $N^{\omega }$ 航路点和目的地goal，将产生一个 $H \times M$ 的矩阵，矩阵中的第个元素表示行人在选定的timestep时刻于位置处的估计概率值。

3.1.4 Trajectory Heatmap Decoder $U_{t}$

从上面的网络结构图不难看出，轨迹热力图解码器 $U_{t}$ 的网络结构与目的地&航路点轨迹热力图解码器 $U_{g}$ 的网络结构差不多，也是一个center block后跟着反卷积——卷积——skip connection的操作。在 $U_{g}$ 中我们可以得到目标点goal、航路点waypoint的概率分布，利用这个概率分布就能够采样我们所需的goal and waypoint。具体的采样过程在3.2小结以及增补附录中有详细说明。总的来说，我们要在 $U_{t}$ 中干一件什么事呢？首先根据 $U_{g}$ 中的概率分布得到我们想要的目的地goal和航路点waypoint，我们得到 $K_{e}$ 个目标点和 $K_{a}$ 个航路点，那通往一个相同的目标点就应该由 $K_{a}$ 条路径。其次，将获得的目标点 $\hat{\mathbf{u}}_{n_{p}+n_{f}}$ 和中间航路点 $\left\{\hat{\mathbf{u}}_{w_{i}}\right\}_{i=1}^{N^{w}}$ 的坐标（在同一幅图中）转换为相应的热力图，用 $H_{g}$ 表示（也就是图中Goal & Waypoint Heatmap)，这有点类似于3.1.1中的过去轨迹热力图表示。最后，对向量 $H_{g}$ 进行下采样以匹配每个block的空间尺寸（从图中来看是要下采样6次，匹配的意思指的是”拼接“，而不是”输入“），与 $U_{g}$ 类似，在反卷积之后是两层的卷积层，来自编码器 $U_{e}$ 的中间输出 $H_{m}$ 将会与这两层卷积层的前一层的输出进行skip connection，实际上就是特征融合，然后再送到两层卷积的后一层，再开始反卷积——卷积——skip connection的循环操作。需要注意的是每次反卷积都有特征融合。对于未来每个timestep， $U_{t}$ 预测一个单独的概率分布，从而产生形状为 $H \times W \times n_{f}$ 的输出，伴随着每个通道对应于每个timestep的位置分布。

3.2 Non-parametric Distribution Sampling

之前有说所需的目标点goal与航路点waypoints是通过 $U_{g}$ 中的概率分布采样得到的，那采样的过程是怎样的呢？实际上说了跟没说似的，得去看代码和增补附录才能知道。论文中提到，给定未来帧位置的分布作为概率的矩阵，其目的是采样一个二维点作为我们对行人位置的估计（这比不说还难受）。... 仅用简单的argmax已经不能满足要求了，得用所提议的softargmax来估计行人的位置，具体公式如下：

$\operatorname{softargmax}(X)=\left(\sum_{i} i \frac{\sum_{j} e^{X_{i j}}}{\sum_{i, j} e^{X_{i j}}}, \sum_{j} j \frac{\sum_{i} e^{X_{i j}}}{\sum_{i, j} e^{X_{i j}}}\right)$

3.3 Loss Function

由于与预测（结果）是每个timestep上的显示概率分布，因此我们直接将损失加在（概率）估计分布 $\hat{P}$ 上，而不是加在绘制的坐标样本上。Ground truth被表示为以观测点为中心的高斯热力图（Gaussian Heatmap ），具有预先设定的方差 $\sigma _{H}$ 。 $U_{e}$ 、 $U_{g}$ 、 $U_{t}$ 这三个网络都是端到端联合训练的，在预测目标点goal、航路点waypoints以及轨迹分布中使用的都是二进制交叉熵的加权组合。具体公式如下：

$\begin{aligned} \mathcal{L}_{\text {goal }} &=\operatorname{BCE}\left(P\left(\mathbf{u}_{n_{p}+n_{f}}\right), \hat{P}\left(\mathbf{u}_{n_{p}+n_{f}}\right)\right) \\ \mathcal{L}_{\text {waypoint }} &=\sum_{i=1}^{N^{w}} \operatorname{BCE}\left(P\left(\mathbf{u}_{w_{i}}\right), \hat{P}\left(\mathbf{u}_{w_{i}}\right)\right) \\ \mathcal{L}_{\text {trajectory }} &=\sum_{i=n_{p}+1}^{n_{p}+n_{f}} \operatorname{BCE}\left(P\left(\mathbf{u}_{i}\right), \hat{P}\left(\mathbf{u}_{i}\right)\right) \\ \mathcal{L} &=\mathcal{L}_{\text {goal }}+\lambda_{1} \mathcal{L}_{\text {waypoint }}+\lambda_{2} \mathcal{L}_{\text {trajectory }} \end{aligned}$

4. Result

我们使用三个数据集——SDD、InD以及ETH/UCY作为基准数据来测试Y-Net的性能。

Stanford Drone Dataset(SDD)：我们在SDD数据集上测试了Y-Net模型，在过去几年里，所提出的一些（行人轨迹预测）的方法都在SDD数据集上取得了SOTA的卓越性能。SDD数据集包含了11000位不同的行人，横跨20个自上而下的场景，这些场景由无人机通过鸟瞰的方式在斯坦福大学所拍摄。对于短期预测，我们遵循[35,28]标准设置和数据分割（的方法），以FPS=2.5进行采样，得到长度为 $n_{p}=8$ 的输入序列，和长度为 $n_{f}=12$ 的输出序列，在之前有说 $t_{p}=\frac{n_{p} }{FPS}$ ，所以这里 $t_{p}=3.2 s$ ；同理 $t_{f}=\frac{n_{f} }{FPS} = 4.8 s$

在长期预测中，我们以FPS=1进行采样，在（输入序列） $n_{p}=5$ 的条件下得到 $t_{f}=\frac{n_{f} }{FPS} = 5 s$ ，然后预测未来一分钟（行人的运动轨迹）。此外，我们用语义分割（的方法）标记场景，（某个）场景的语义分割图由类“东西”组成（其实加上背景应该有6类），即路面、地形、结构、树木和道路，具体取决于实际场景。在数据集处理上，以预测短期（轨迹）相同的方式分割数据集场景，以评估在训练期间对不可见场景的性能。论文说的好像不是人话啊。。。

Intersection Drone Dataset(InD)：...

ETH & UCY datasets：...

Implementation Details：我们使用Adam优化器对整个网络进行端到端的训练，设置学习率为 $1 \times 10^{-4}$ ，。使用预训练分割模型，并在指定的数据集上进行微调。更多的实验细节在增补材料中有提及。

Metrics：我们使用平均位移误差（ADE）与最终位移误差（FDE）来评估模型性能的好坏。ADE计算的是每个预测位置和每个真值位置之间的平均欧式距离差值。 FDE计算的是终点预测位置和终点真值位置之间的平均欧式距离差值。根据以往的工作[13]，在有多个预测（结果）的情况下，最终的误差报告为所有预测（结果）的最小误差。...

4.1 Short Term Forecasting Results

Stanford Drone Results：表一展示了SDD数据集在短期预测的结果。我们分了 $K_{e}=5$ 和 $K_{e}=20$ 两种情况。由于在短期预测中任意多模态（的情况）是有限的，我们将 $K_{a}$ 设为1能够与之前的工作（将 $K_{a}$ 设为20）进行对比。...

ETH/UCY Results：...

第二十一篇：伦理/道德Ethics flying_1314 NLP ethics 伦理/道德隐私偏见双重用途
目录什么是伦理/道德？我们为什么要关心？为什么道德很难？学习成果大纲反对NLP道德检查的论据我们应该审查科学吗？H5N1透明度不是更好吗？AIvs.Cybersecurity核心NLP伦理概念偏见词嵌入中的偏差双重用途OpenAIGPT-2隐私GDPRAOL搜索数据泄露小组讨论提示自动刑期预测自动简历处理语言社区分类打包带走~什么是伦理/道德？我们应该如何生活——苏格拉底•正确的做法是什么？•为什
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
图神经网络实战——分层自注意力网络盼小辉丶图神经网络从入门到项目实战神经网络人工智能深度学习
图神经网络实战——分层自注意力网络0.前言1.分层自注意力网络1.1模型架构1.2节点级注意力1.3语义级注意力1.4预测模块2.构建分层自注意力网络相关链接0.前言在异构图数据集上，异构图注意力网络的测试准确率为78.39%，比之同构版本有了较大提高，但我们还能进一步提高准确率。在本节中，我们将学习一种专门用于处理异构图的图神经网络架构，分层自注意力网络(hierarchicalself-att
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
使用 Baseten 部署和运行机器学习模型的指南 shuoac 机器学习人工智能 python
随着机器学习模型在各个行业中的广泛应用，如何高效地部署和运行这些模型成为一个关键问题。本文将介绍如何使用Baseten平台来部署和服务机器学习模型。Baseten是LangChain生态系统中的一个重要提供者，它提供了所需的基础设施来高效地运行模型。无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
“租赁业务ERP+deepseek”模式的应用软件研究员汽车 DeepSeek 汽车租赁系统
汽车租赁业务从上世纪90年代发展至今，从传统的人工管理到软件辅助，随着互联网的发展，业务公司对汽车租赁系统提出了更高的要求，比如自助订单，业务推广、客户资质评估，车辆风控，风险预警等，又随着近期人工智能的出现，业务公司对业务系统的期望更高，期望都节约更多人工成本，让管理变得简单快捷高效和智能。所以就引发人们新的启发：“业务系统ERP+deepseek”，但业务系统ERP+deepseek能否满足业
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
【Matlab光伏功率预测】基于RF随机森林算法的多变量光伏功率预测（附MATLAB代码）天天科研工作室光伏功率预测算法 matlab 随机森林机器学习
【Matlab光伏功率预测】基于RF随机森林算法的多变量光伏功率预测（附MATLAB代码）文章目录【Matlab光伏功率预测】基于RF随机森林算法的多变量光伏功率预测（附MATLAB代码）文章介绍基本步骤代码分享运行结果参考资料文章介绍随机森林可以应用于光伏功率预测，这是一项重要的任务，旨在估计光伏发电系统的输出功率。光伏功率预测在可再生能源管理、电网调度和能源计划等领域具有广泛的应用。随机森林回
使用Python构建去中心化预测市场：从概念到实现 Echo_Wish Python！实战！python 去中心化开发语言
使用Python构建去中心化预测市场：从概念到实现大家好，我是Echo_Wish。今天，我们将深入探讨一个前沿的区块链应用——去中心化预测市场，并学习如何使用Python来构建一个简易的预测市场平台。预测市场是基于市场参与者对未来事件的预测来产生结果的地方，通常被用来预测政治事件、金融市场走向、体育比赛结果等。传统的预测市场如Augur、Polymarket等，基于去中心化平台，利用区块链技术确保
Stability AI 发布 Stable Virtual Camera：从 2D 图像生成 3D 视频三花AI 三花AI 人工智能 3d 音视频
StabilityAI发布StableVirtualCamera：从2D图像生成3D视频StableVirtualCamera[4]是由StabilityAI最新发布的一款能够从一张或多张2D图像（最多支持32张）生成具有真实深度和透视感的3D视频的技术。用户可以自由定义相机轨迹，或者选择预设的动态相机路径，例如360°旋转、螺旋、变焦（DollyZoom）等，效果极其丝滑。不过，当输入图像包含人
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
stability ai推出的 AI模型2D图像转3D视频微丽宝 AI工具人工智能 3d 音视频
StableVirtualCamera是StabilityAl推出的A|模型，能将2D图像转换为具有真实深度和透视感的3D视频。用户可以通过指定相机轨迹和多种动态路径(如螺旋、推拉变焦、平移等)来生成视频。模型支持从1到32张输入图像生成不同宽高比(如1:1、9:16、16:9)的视频，最长可达1000帧。无需复杂的重建或优化，可生成高质量的3D视频，同时保持3D一致性和时间平滑性。StableV
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比