calvinpaean

UniAD 论文学习

一、解决了什么问题？

当前的自动驾驶方案大致由感知（检测、跟踪、建图）、预测（motion、occupancy）和规划三个模块构成。

为了实现各种功能，智驾方案大致包括两种路线。一种是针对每个任务都部署一个模型，该范式能降低各团队间的研发困难度，但由于各个优化目标是孤立的，会引发模块之间信息丢失、错误累加和特征不对齐的问题。另一种是多任务的设计路线，多个任务 heads 共享一个特征提取器，该范式能节省边缘计算平台的资源消耗，并且扩展性强，但会带来“负迁移”的问题。

端到端运动规划

自从 Pomerleau 提出使用一个网络直接预测控制信号，端到端运动规划受到越来越多的关注。后续研究通过闭环仿真、多模态输入、多任务学习、强化学习以及专家模型蒸馏的方式，取得了长足进展。但是，考虑到鲁棒性和安全性，这些方法直接从传感器数据输出控制信号、从合成场景迁移到实际应用仍有问题。因此，学者们试图显式地构造出一个网络的中间表征，预测场景是如何变化的。

二、提出了什么方法？

本文认为应该围绕着规划这一最终的目标来设计整体架构，于是提出了 UniAD。UniAD 在一个网络中包括了全栈的自动驾驶任务，它能充分利用各模块的优势，从全局的角度为各 agents 之间的交流提供互补的特征抽象，并且它以统一的 query 接口来连接所有的模块，推动各模块向规划这一目标对齐。

UniAD 遵循一切为规划服务的原则，核心构成就是 query-based 的接口设计，连接各个模块。与经典的边框表征相比，queries 得益于更大的感受野，能减轻上游任务预测所带来的复合错误的影响，而且能灵活地编码和建模 agents 之间的交流。

任务定义

检测和跟踪

检测和跟踪是自动驾驶领域两个重要的任务，在 3D 空间对它们做表征以支持下游任务。3D 检测负责定位每个时刻周围的物体（坐标、长宽高、偏航角等）；跟踪目的是找到不同时刻物体之间的对应关系，在时域内将它们串联起来。本文使用多目标跟踪来表示检测和跟踪的过程。最终输出是每帧内的一组 3D 框，它们对应的特征 $Q_A$ 会输入运动模块。此外，有一个特殊的自车 query 用于下游任务，在预测框和 ground-truth 框的匹配过程中不会包括自车 query。

在线建图

地图体现了环境的几何和语义信息。在线建图是利用车载传感器数据，分割出有价值的道路元素，以替代离线标注的高精地图。在 UniAD，在线地图建模了四种元素：车道线、可行驶区域、间隔物、人行横道。在 BEV 视角下对它们做分割。运动预测模块使用 map queries $Q_M$ 来建模 agent-map 关系。

运动预测

运动预测将感知和规划连接起来，在整个自动驾驶系统扮演重要角色，确保最终的安全。通常，运动预测是一个独立模块，利用高精地图和检测到的边框来预测 agent 未来的轨迹。现有的运动数据集，边框都是 ground-truth 标注，这在车载场景不现实。本文，运动预测模块将之前编码的稀疏 queries( $Q_A$ 和 $Q_M$ )和密集 BEV 特征 $B$ 作为输入，预测各 agent 在未来 $T$ 时刻的 $\mathcal{K}$ 个可能轨迹，这些预测的轨迹是各 agent 的相对当前位置的偏移。Agent 特征编码了过去和未来的信息，会输入占用模块来理解未来的场景。

自车 query 预测未来时刻自车的运动，它实际上是比较粗糙的规划估计，planner 会利用该特征来生成最终的目标路径点。

占用预测

占用网格图是离散化的 BEV 表征，每个网格表示它是否被占用的置信度。占用预测任务用于发现网格图在未来 $T_o$ 时刻是如何变化的。运动预测依赖于稀疏的 agents，占用预测则是全场景密集表征的。为了研究场景和稀疏 agents 是如何变化的，占用模块的输入是 BEV 特征 $B$ 和 agent 特征 $G^t$ 。完成多步骤 agent-scene 交流后，对占用特征和密集场景特征做矩阵乘，得到实例级的概率图 $\hat{O}_A^t \in \mathbb{R}^{N_a\times H\times W}$ 。然后使用逐像素的 $\argmax$ 操作，将各时刻的概率图融合，得到保留了 agent ID 的全场景占用 $\hat{O}^t \in \mathbb{R}^{H\times W}$ 。

规划

规划模块是最终的目的，输入是上述模块的输出。传统的规划方法都是 rule-based，由各种 if-else 状态机组成，用检测和预测的结果来描述各类场景。而本文提出的 learning-based 模型则以上游的自车 query、密集的 BEV 特征 $B$ 作为输入，预测全部 $T_p$ 时刻的轨迹 $\hat{\tau}$ 。然后，用上游预测的未来占用 $\hat{O}$ 来优化预测轨迹 $\hat{\tau}$ ，以防发生碰撞，确保安全。

概览

UniAD 包括四个基于 transformer decoder 的感知与预测模块，以及一个 planner。Queries $Q$ 将整个流程串联起来，建模驾驶场景中各实例间的不同关系。下图展示了 UniAD 的流程，设计上非常精妙，遵循规划导向的思想。作者探索了感知和预测各模块的作用，充分发挥节点协同优化的优势。

首先，将多相机图像输入特征提取器，通过 BEVFormer 的 BEV 编码器将透视视角的特征变换为 BEV 特征 $B$ 。
然后在 TrackFormer 中，track queries 从 $B$ 中查询各 agents 的信息，进行检测和跟踪。
在 MapFormer 中，map queries 作为道路元素（车道线、间隔物）的语义抽象，并进行 maps 的全景分割。
MotionFormer 获取各 agents 和 maps 之间的关系，预测每个 agent 未来的轨迹。在场景里面，各 agent 的行为会彼此影响，所以 MotionFormer 对所有的 agents 做联合预测。
OccFormer 以 BEV 特征 $B$ 作为 queries，将 agent 的信息作为 keys 和 values，预测未来多步的占用网格图（保留 agents 的 IDs）。
最终，Planner 利用 MotionFormer 给出的自车 query 来预测出规划结果，并让自车远离 OccFormer 预测的被占用区域，以防碰撞发生。

1. 感知：跟踪和建图

1.1 TrackFormer

它协同完成检测和多目标跟踪任务，没有不可微的后处理操作。除了目标检测任务用到的检测 queries，它还包含了跟踪用的 track queries。在每一时刻，新初始化的检测 queries 负责检测首次被感知到的 agents，而 track queries 则对之前帧检测到的 agents 持续建模。检测 queries 和 track queies 都是通过关注 BEV 特征 $B$ 来获取各 agents 的信息。随着场景的变化，当前时刻的 track queries 通过一个自注意力模块与之前时刻的 queries 进行交流，聚合时域信息，直到相应的 agents 完全消失在画面中。TrackFormer 包括 $N$ 层，最终的输出 $Q_A$ 提供 $N_a$ 个有效 agents 的信息，供下游任务使用。除了编码自车周围 agents 的 queries，作者还增加了一个自车 query，显式地建模自车本身，规划模块会用到。

1.2 MapFormer

作者基于 2D 全景分割方法 Panoptic SegFormer 设计 MapFormer。将道路元素稀疏地表征为 map queries，编码了位置和结构信息，从而帮助下游的运动预测。本文将车道线、间隔物和人行横道设为 things，将可行驶区域设为 stuff。MapFormer 也有 $N$ 层，最后一层的 queries $Q_M$ 会输入 MotionFormer 做 agent-map 交流。

2. 预测：运动预测

有了 TrackFormer 和 MapFormer 分别提供的动态 agents 的 queries $Q_A$ 和静态图 $Q_M$ ，MotionFormer 就可以预测所有 agents 未来的多模态运动了，即 top-k 个可能的轨迹。同时，作者将 TrackFormer 中的自车 query 传入 MotionFormer，让自车和其它 agents 产生交流。输出的运动状态表示为 $\{\hat{\mathbf{x}}_{i,k} \in \mathbb{R}^{T\times 2}| i=1,...,N_a; k=1,..., \mathcal{K}\}$ ，其中 $i$ 表示 agent 的索引， $k$ 表示轨迹模态的索引， $T$ 是预测的长度。

2.1 MotionFormer

包括 $N$ 层，每层都获取到三种交互关系：agent-agent, agent-map, agent-goal point。对于每个 motion query $Q_{i,k}$ ，它和其它 agents $Q_A$ 或地图元素 $Q_M$ 的关系可以表示如下：

$Q_{a/m}=\text{MHCA}(\text{MHSA}(Q), Q_A/Q_M)$

上面的 $\text{MHCA}$ 和 $\text{MHSA}$ 表示多头跨注意力和多头自注意力。同时，我们也要关注目标点（goal point），优化预测轨迹，本文基于可变形注意力设计了一个 agent-goal point 注意力：

$Q_g = \text{DeformAttn}(Q, \hat{\mathbf{x}}_T^{l-1}, B)$

其中 $\hat{\mathbf{x}}_T^{l-1}$ 是上一层预测轨迹的路径点。 $\text{DeformAttn}(q,r,x)$ 是可变形注意力，输入为 query $q$ 、参考点 $r$ 和空间特征 $x$ 。它对参考点周围的空间特征应用稀疏注意力。这样，预测轨迹能进一步感知到路径点周围的环境。

这三种交互关系的建模是同时进行的，然后将生成的 $Q_a, Q_m, Q_g$ concat 到一起，输入一个 MLP，得到 query context $Q_{ctx}$ 。然后将 $Q_{ctx}$ 输入后续的层做优化，或者在最后一层就解码为预测结果。

2.2 Motion queries

MotionFormer 每一层的输入 queries 记作 motion queries，包括两个部分：前一层输出的 query context $Q_{ctx}$ 和 query position $Q_{pos}$ 。 $Q_{pos}$ 整合了四重的位置信息：

场景级 anchor $I^s$ 的位置；
agent 级 anchor $I^a$ 的位置；
第 $i$ 个 agent 的当前位置；
预测的 goal point。

$Q_{pos}=\text{MLP}(\text{PE}(I^s)) + \text{MLP}(\text{PE}(I^a)) + \text{MLP}(\text{PE}(\hat{\mathbf{x}}_0)) + \text{MLP}(\text{PE}(\hat{\mathbf{x}}_T^{l-1}))$

这里的正弦位置编码 $PE(\cdot)$ 后跟着一个 MLP 用于编码位置点，第一层的 $I^s$ 设为 $\hat{\mathbf{x}}_T^0$ 。场景级 anchor 代表了全局视角下之前时刻的运动统计，agent 级 anchor 则在局部坐标捕捉可能的意图。它们都通过 k-means 算法对 ground-truth 轨迹的路径点做聚类，从而缩小预测结果的搜索空间。起始点提供每个 agent 的位置编码，而预测出的路径点则作为动态 anchor，逐层不断地优化。

2.3 非线性优化

直接从一个不准确的检测位置或偏航角回归 ground-truth 的路径点会产生不真实的轨迹预测，曲率和加速度可能会非常大。于是作者采用了一个非线性平滑方法，来调节目标的轨迹，使它们更加合理。该过程如下：

$\tilde{\mathbf{x}}^\ast = \argmin_{\mathbf{x}}{c(\mathbf{x}, \tilde{\mathbf{x}})}$

其中 $\tilde{\mathbf{x}}$ 和 $\tilde{\mathbf{x}}^\ast$ 表示 ground-truth 和平滑后的轨迹， $\mathbf{x}$ 通过 multiple-shooting 产生，代价函数为：

$c(\mathbf{x}, \tilde{\mathbf{x}})=\lambda_{xy}\left\| \mathbf{x}, \tilde{\mathbf{x}} \right\|_2 + \lambda_{goal} \left\| \mathbf{x}_T, \tilde{\mathbf{x}}_T \right\|_2 + \sum_{\phi\in \Phi}{\phi(\mathbf{x})}$

其中， $\lambda_{xy}$ 和 $\lambda_{goal}$ 是超参数，动力学函数集合 $\Phi$ 有五项，包括 jerk, curvature, curvature rate, acceleration, lateral acceleration。这个代价函数对目标轨迹起到正则的作用，使其遵守动力学约束条件。目标轨迹优化只在训练时进行，不影响推理。

3. 预测：占用预测

占用网格图是离散化的 BEV 表征，每个格子都有一个置信度，表示该格子是否被占用。占用预测任务用于预测网格图在未来是如何变化的。OccFormer 从两个方面融合了场景级和 agent 级的语义信息：

通过一个精心设计的注意力模块，从密集场景特征学到 agent 级的特征；
对 agent 级特征和密集场景特征做矩阵乘法，输出实例占用。

OccFormer 由 $T_o$ 个序列模块组成， $T_o$ 表示预测的长度。由于占用网格图过于密集，这里的 $T_o$ 通常要小于运动任务中的预测长度 $T$ 。每个模块的输入包括丰富的 agent 特征 $G^t$ 和前一层的状态（密集特征） $F^{t-1}$ ，然后输出 $t$ 时刻的状态 $F^t$ 。为了得到 agent 特征 $G^t$ ，我们在模态维度对 MotionFormer 的 motion queries 做最大池化，记作 $Q_X \in \mathbb{R}^{N_a\times D}$ ， $D$ 是特征维度。然后通过一个时域 MLP 将它与上游的 track query $Q_A$ 及当前位置编码 $P_A$ 融合：

$G^t = \text{MLP}([Q_A, P_A, Q_X]), t=1,..., T_o$

$[\cdot]$ 表示 concat 操作。对于场景级信息，出于计算效率考虑，BEV 特征 $B$ 会缩小到 $1/4$ 分辨率，作为第一个模块的输入 $F^0$ 。为了进一步节约训练时内存占用，每个模块都遵循下采样-上采样的方式，在中间有一个注意力模块，在 $1/8$ 大小的特征（记作 $F_{ds}^t$ ）上进行 pixel-agent 交流。

3.1 Pixel-agent 交流

在预测未来占用网格图时，Pixel-agent 交流用于统一对场景和 agents 的理解。将密集特征 $F_{ds}^t$ 作为 queries，实例级特征作为 keys 和 values 不断更新密集特征。 $F_{ds}^t$ 输入一个自注意力层，建模网格间的响应，然后用一个跨注意力层建模 agent 特征 $G^t$ 和各网格的特征之间的关系。为了对齐 pixel-agent 的对应关系，作者用一个注意力 mask 来约束跨注意力，每个像素只关注于 $t$ 时刻占据它的 agent。密集特征的更新过程如下：

$attn_mask = O m t ) D_{ds}^t = \text{MHCA}(\text{MHSA}(F_{ds}^t), G^t, \text{attn\_mask}=O_m^t)$

注意力 mask $O^t_m$ 语义上类似于占用网格图，用一个额外的 agent 级特征和密集特征 $F_{ds}^t$ 相乘得到，我们将这个 agent 级特征叫做 mask 特征 $M^t = \text{MLP}(G^t)$ 。经过上述交流过程， $D_{ds}^t$ 就上采样到了 $B$ 的 $1/4$ 大小。我们将 $D_{ds}^t$ 通过残差连接加到模块输入 $F^{t-1}$ 上，得到的结果 $F^t$ 再输入进下一模块。

3.2 实例级占用

它表示的是保留了每个 agent ID 的占用网格图。它可以通过简单的矩阵乘法提取。为了得到 BEV 特征 B （原始大小为 $H\times W$ ）的预测占用，场景级特征 $F^t$ 通过一个卷积解码器上采样为 $F_{dec}^t \in \mathbb{R}^{C\times H\times W}$ ，其中 $C$ 是通道维度。

对于 agent 级特征，我们通过另一个 MLP 进一步将粗糙的 mask 特征 $M^t$ 更新为占用特征 $U^t \in \mathbb{R}^{N_a\times C}$ 。实验表明， $U^t$ 要比 $G^t$ 带来更优的表现。最终 $t$ 时刻的实例级占用表示为：

$\hat{O}_A^t = U^t \cdot F_{dec}^t$

4. 规划

不带高精地图的规划一般需要高层级的指令来表示往哪个方向走。作者将原始的导航信号（左转、右转、保持前进）转换为三个可学习的 embeddings，叫做 command embeddings。由于 MotionFormer 的自车 query 已经表达了多模态意图，作者用 command embeddings 补充它，得到 plan query。然后将 plan query 关注到 BEV 特征 $B$ ，使它感知周围环境，然后将其解码，得到未来的路径点 $\hat{\tau}$ 。

为了避免碰撞，只在推理时基于牛顿法来优化 $\hat{\tau}$ ：

$\tau^\ast = \argmin_{\tau}{f(\tau, \hat{\tau}, \hat{O})}$

其中， $\hat{\tau}$ 是原始的规划预测， $\tau^\ast$ 表示优化后的规划，最小化代价函数 $f(\cdot)$ 得到。 $\hat{O}$ 是经典的二值占用网格图，从 OccFormer 的实例占用预测融合得到。代价函数如下：

$f(\tau, \hat{\tau}, \hat{O}) = \lambda_{coord}\left\| \tau, \hat{\tau} \right\|_2 + \lambda_{obs}\sum_t \mathcal{D}(\tau_t, \hat{O}^t)$

$\mathcal{D}(\tau_t, \hat{O}^t)=\sum_{(x,y)\in \mathcal{S}} \frac{1}{\sigma \sqrt{2\pi}}\exp(-\frac{\left\| \tau_t - (x,y) \right\|_2^2}{2\sigma^2})$

这里， $\lambda_{coord}, \lambda_{obs}$ 和 $\sigma$ 是超参数， $t$ 是未来时刻的索引。考虑到周围的位置受到 $\mathcal{S}=\left\{ (x,y) | \left\| (x,y)-\tau_t \right\|_2 < d, \hat{O}_{x,y}^t=1 \right\}$ 的限制， $l_2$ 代价函数将轨迹拉向原来预测的位置，而碰撞项 $\mathcal{D}$ 则将其推离开被占用的网格。

5. 学习

UniAD 训练包括两个阶段。首先协同训练感知部分，即跟踪和建图模块，训练 $6$ 个 epochs。然后端到端训练感知、预测和规划模块共 $20$ 个 epochs。

5.1 共享匹配

UniAD 包括实例建模，所以在感知和预测任务上，需要将预测结果和 ground-truths 配对。与 DETR 相似，在跟踪和在线建图阶段它使用了二分匹配算法。至于跟踪，检测 queries 的候选框会和新出现的 ground-truth 物体做配对，track queries 的预测则会继承之前帧的配对结果。跟踪模块的匹配结果会在运动和占用节点复用，从而持续地对历史跟踪的 agents 和未来的运动之间做建模。

6. 实现细节

6.1 检测和跟踪

继承了 BEVFormer 的大多数检测设计，通过一个 BEV 编码器将图像特征变换为 BEV 特征 $B$ ，再使用一个可变形 DETR 头对 $B$ 做检测。为了避免繁琐的匹配后处理，作者引入了一组 track queries，持续地跟踪之前检出的实例。跟踪过程细节如下：

6.1.1 训练阶段

训练开始时，所有的 queries 默认为检测 queries，预测新出现的目标，这和 BEVFormer 一样。通过匈牙利算法将检测 queries 和 ground-truths 匹配起来。将它们保存起来，在下一时刻通过 query interaction 模块（QIM）更新为 track queries。在下一时刻，track queries 会根据对应的 track ID 直接匹配到部分的 ground-truth 目标，而检测 queries 会匹配到其余的 ground-truths（新出现的目标）。为了让训练稳定，采用 3D IOU 来过滤匹配到的 queries。只保存和更新那些与 ground-truth 框的 3D IOU 大于一定阈值的预测框。

6.1.2 推理阶段

推理时，序列帧按顺序送入网络，track queries 存在的时间可能要长于训练时的。另一区别就是 query 更新，推理时使用分类得分来过滤 queries，而非 3D IOU（因为没有 ground-truths 了）。此外，为了避免由遮挡引发的短时间轨迹中断的情况，在推理阶段使用了生命周期机制。对于每个 track query，若它的分类得分低连续在 $2 s$ 内于 $0.35$ ，它就被认为完全消失，则被移除。

6.2 在线建图

Map queries 被分为 thing queries 和 stuff queries。Thing queries 建模实例级的地图元素（即车道线、边界、人行横道），通过二分匹配来关联到 ground-truths，stuff queries 只负责语义元素（即可行驶区域），通过固定类别分配来处理。Thing queries 个数为 $300$ ，stuff query 个数为 $1$ 。堆叠了 $6$ 个位置解码层和 $4$ 个 mask 解码层。选取位置解码器后的 thing queries 作为 map queries $Q_M$ 供下游任务用。

6.3 运动预测

MotionFormer 用 $I_T^a, I_T^s, \hat{x}_0, \hat{x}_T^{l-1}\in \mathbb{R}^{\mathcal{K}\times 2}$ 来编码 query 位置，用 $Q_{ctx}^{l-1}$ 作为 query context。通过 k-means 算法对训练数据中所有的 agents 做聚类，得到 anchors， $\mathcal{K}=6$ 与输出模态个数一样。为了编码场景先验，根据各 agent 的当前位置和偏航角，将 anchor $I_T^a$ 旋转和平移到世界坐标系下，记作 $I_T^s$ ：

$I^s_{i,T} = R_i I_T^a + T_i$

其中 $i$ 是 agent 的索引。作者也使用了前一层预测的 goal point $\hat{x}_T^{l-1}$ ，使得更加准确。同时，将 agent 当前的位置广播到其它模态，记作 $\hat{x}_0$ 。然后，对每个先验位置信息应用 MLP 和正弦位置编码，记作 query position $Q_{pos}\in\mathbb{R}^{\mathcal{K}\times \mathcal{D}}$ ，形状与 $Q_{ctx}$ 一样。 $Q_{ctx}$ 和 $Q_{pos}$ 一起构建了 motion query。在 MotionFormer 中， $\mathcal{D}=256$ 。

MotionFormer 有三个 transformer 模块，agent-agent, agent-map, agent-goal point 关系模块。Agent-agent 和 agent-map 模块用标准的 transformer 解码层构建，包括一个多头自注意力层、一个多头跨注意力层和一个前馈网络，内部还有多个归一化层和残差连接。作者也在 $Q_A$ 和 $Q_M$ 中加入了正弦位置编码，然后跟着 MLPs 层。Agent-goal 模块用可变形跨注意力层构建，将之前预测轨迹的 goal point （ $R_i\hat{x}_{i,T}^{l-1} + T_i$ ）作为参考点使用，如下图所示。每条轨迹的采样点点个数为 $4$ ，每个 agent 有 $6$ 条轨迹。将每个关系模块的输出特征 concat 到一起，用 MLP 层映射成维度 $\mathcal{D}=256$ 。然后，使用高斯混合模型构建每个 agent 的轨迹，其中 $\hat{x}_l\in\mathcal{R}^{\mathcal{K}\times \mathcal{T}\times 5}$ 。预测时长 $T = 12$ ，约 $6$ 秒。最终输出轨迹是最后一个维度的前两个值，即 $x, y$ 。此外，也要预测每个模态的得分， $score(\hat{x}_l)\in \mathcal{R}^\mathcal{K}$ 。将该模块堆叠 $N = 3$ 次。

6.4 占用预测

给定 BEV 特征，首先用卷积层将其下采样（ $/4$ ），然后输入 OccFormer。OccFormer 由 $T_o$ 个序列模块组成，如下图所示。 $T_o=5$ 是时间长度（包括当前和未来帧），每个模块负责生成一帧的占用。该方法融合了密集场景特征和稀疏的 agent 特征。密集场景特征来自于最后一个模块的输出，用卷积层进一步下采样（ $/8$ ），降低 pixel-agent 的计算量。将 track query $Q_A$ , agent positions $P_A$ 和 motion query $Q_X$ concat 到一起，输入一个时域 MLP。计算像素级的自注意力，对剧烈变化的场景所需的长期依赖关系做建模；然后将每个像素点关注到对应的 agent，做 scene-agent 融合。为了增强 agents 和像素之间的位置对齐，用一个注意力 mask 来约束跨注意力，该注意力 mask 通过计算 mask 特征和下采样后的场景特征的矩阵乘得到，用一个 MLP 来编码 agent 特征以得到 mask 特征。然后，将密集特征上采样到与输入 $F^{t-1}$ 相同的分辨率（ $/4$ ），用残差连接将它和 $F^{t-1}$ 相加。得到的特征 $F^t$ 输入下一模块和卷积解码器，以预测占用。复用 mask 特征，输入另一个 MLP，得到占用特征。对占用特征和解码的密集特征 $F_{dec}^t$ 做矩阵乘，得到实例级的占用。注意，在所有的 $T_o$ 模块中，共享 mask 特征的 MLP 层、占用特征的 MLP 层和卷积解码器，其它的组件则是独立的。在 OccFormer 中，所有的密集特征和 agent 特征的维度都是 $256$ 。

6.5 规划

如下图，planner 的输入是跟踪和运动模块预测的自车 query，用蓝色三角和黄色矩形表示。用 MLP 层编码这俩 queries 和 command embedding，然后是一个对模态维度做的 max-pool 操作，选取并聚合模态最显著的特征。BEV 特征模块用标准的 transformer 解码层构建，堆叠 $N = 3$ 层。它用聚合后的 plan query 对密集的 BEV特征做跨注意力。为了嵌入位置信息，作者在 plan query 中加入了学到的位置编码，在 BEV 特征中加入了正弦位置编码。然后用 MLP 层回归轨迹，记作 $\hat{\tau} \in \mathcal{R}^{T_p\times 2}$ 。这里， $T_p=6$ （ $3$ 秒）。此外，根据预测占用 $\hat{O}$ 和轨迹 $\hat{\tau}$ ，作者设计了碰撞机制。

$Q_A^{ego}$ 和 $Q_{ctx}^{ego}$ 是跟踪预测模块和运动预测模块。用 MLP 层对它们和 command 做编码，然后是一个 max-pool 层，选取并聚合最显著的模态特征。

6.6 训练细节

协同学习

UniAD 训练分两个阶段。第一阶段，预训练感知任务，包括跟踪和在线建图，来稳定感知的预测。为了快速收敛，加载了 BEVFormer 的主干、FPN、BEV 编码器和检测解码器的权重，除了 object query embeddings。取消主干网络的梯度回传，以降低内存占用，训练 UniAD 共 $6$ 个 epochs，损失如下：

$L_1 = L_{track} + L_{map}$

第二阶段，冻结图像主干和 BEV 编码器（负责图像视角变换到 BEV 视角），进一步降低内存消耗。这时，UniAD 训练包括了所有的损失，有跟踪、建图、运动预测、占用预测和规划，训练 $20$ 个 epochs。

$L_2 = L_{track} + L_{map} + L_{motion}+L_{occ} + L_{plan}$

检测和跟踪损失

对于每对结果，采用匈牙利损失，即类别标签的 Focal loss 和 3D 边框定位的 $l_1$ 损失的线性组合。匹配策略是：用二分匹配将新出现的 queries 与 ground-truth 目标配对，track queries 的预测结果则继承其上一帧的 ground-truth 索引。

$L_{track}=\lambda_{focal} L_{focal} + \lambda_{l_1}L_{l_1}$

其中， $\lambda_{focal}=2, \lambda_{l_1}=0.25$ 。

在线建图损失

包括一个 thing 损失（车道线、间隔物）和一个 stuff 损失（可行驶区域）。分类损失用的 focal loss，thing 边框损失用的 $l_1$ 损失，分割用的 Dice loss 和 GIOU loss。

$L_{map}=\lambda_{focal}L_{focal} + \lambda_{l_1}L_{l_1} + \lambda_{giou}L_{giou} + \lambda_{dice}L_{dice}$

其中， $\lambda_{focal}=\lambda_{giou}=\lambda_{dice}=2, \lambda_{l_1}=0.25$ .

运动预测损失

用高斯混合建模多模态轨迹，使用 multi-path loss，包括一个分类得分损失 $L_{cls}$ 和一个 negative log-likelihood 损失 $L_{nll}$ 。为了确保轨迹是连续平滑的，首先预测每一时刻各 agent 的速度，然后随着时间不断累积它们，得到最终的轨迹。

$L_{motion}=\lambda_{cls}L_{cls} + \lambda_{reg} L_{nll}$

其中， $\lambda_{cls}=\lambda_{reg}=0.5$ .

占用预测损失

输出的实例级的占用预测是每个 agent 的二值分割，因此采用了二值交叉熵和 Dice loss 作为占用损失。

$L_{occ} = \lambda_{bce}L_{bce} + \lambda_{dice}L_{dice}$

其中， $\lambda_{dice}=1, \lambda_{bce}=5$ .

规划损失

安全是规划的最重要因素，因此，除了朴素的 imitation $l_2$ 损失，还用了一个碰撞损失，让预测轨迹远离障碍物：

$L_{col}(\hat{\tau}, \delta) = \sum_{i,t}\text{IOU}(box(\hat{\tau}, w + \delta, l+\delta), b_{i,t})$

$L_{plan}=\lambda_{imi}|\hat{\tau}, \tilde{\tau}|_2 + \lambda_{col}\sum_{(\omega,\delta)}\omega L_{col}(\hat{\tau}, \delta)$

其中， $\lambda_{imi}=1, \lambda_{col}=2.5$ ， $(\omega,\delta)$ 是额外安全距离的权重值， $box(\cdot,\cdot,\cdot)$ 表示自车框在 $t$ 时刻变大，以保持较大的安全距离， $b_{i,t}$ 表示场景中预测的每个 agent。实际使用时， $(\omega,\delta)$ 设为 $(1, 0), (0.4, 0.5), (0.1, 1)$ 。

你可能感兴趣的:(BEV,and,occupancy,学习)

【k230基础教程之ADC，RTC，TIMER，WDT】
k230基础教程之ADC，RTC，TIMER，WDT一，ADC1.read_u16方法2.read_uv方法示例二，RTC1.init方法2.detatime方法示例三，TIMER（定时器）1.init方法2.deinit方法软件定时器控制LED灯四，WDT（看门狗）1.feed方法示例本教程皆来自立创官方教程，为博主学习使用所记录，使用开发板为立创的庐山派，如有需求可自行访问立创官网关于这些外设
学习笔记(29):训练集与测试集划分详解：train_test_split 函数深度解析宁儿数据安全 #机器学习学习笔记深度学习
学习笔记(29):训练集与测试集划分详解：train_test_split函数深度解析一、为什么需要划分训练集和测试集？在机器学习中，模型需要经历两个核心阶段：训练阶段：用训练集数据学习特征与目标值的映射关系（如线性回归的权重）。测试阶段：用测试集评估模型在未见过的数据上的表现，避免“过拟合”（模型只记住训练数据的噪声，无法泛化到新数据）。类比场景：学生通过“练习题”（训练集）学习知识，再通过“考
Spring Boot + AI，真的有搞头吗？5大步骤带你轻松入门墨瑾轩一起学学Java【一】spring boot 人工智能后端
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣亲爱的小伙伴们，你们是否听说过SpringBoot和AI结合的消息？是不是觉得这两者听起来就像是天作之合？没错，SpringBoot和AI的结合确实能为我们带来许多意想不到的好处！今天，我们就来一起探讨如何在SpringBoot项目中集成AI功能，让你的应用更
【学习】微信小程序开发指南：从零开始的完整实践小程序
前言微信小程序作为腾讯推出的轻量级应用平台，自2017年正式发布以来，已经成为移动互联网生态中不可或缺的一部分。小程序具有"用完即走"的特点，无需下载安装，通过微信即可使用，为用户提供了便捷的服务体验，也为开发者提供了新的应用分发渠道。本文将从零开始，详细介绍微信小程序的开发流程，包括环境搭建、基础语法、核心功能实现、发布上线等各个环节，帮助初学者快速掌握小程序开发技能。一、微信小程序概述（一）什
RAG实战指南 Day 2：RAG开发环境搭建与工具选择在未来等你 RAG实战指南 RAG 向量检索 LLM AI开发知识库
【RAG实战指南Day2】RAG开发环境搭建与工具选择开篇欢迎来到"RAG实战指南"系列的第2天！今天我们将聚焦RAG系统的开发环境搭建和工具选择，这是构建高效RAG应用的基础。一个合理的开发环境和工具链不仅能提升开发效率，还能确保系统的稳定性和扩展性。通过本文，你将掌握如何从零开始搭建RAG开发环境，了解主流工具的选择策略，并通过实际案例学习如何将这些工具组合起来构建完整的RAG工作流。理论基础
《dlib库中的聚类》算法详解：从原理到实践 A小庞算法算法聚类数据挖掘机器学习 c++
一、dlib库与聚类算法的关联1.1dlib库的核心功能dlib是一个基于C++的机器学习和计算机视觉工具库，其聚类算法模块提供了多种高效的无监督学习工具。聚类算法在dlib中主要用于：数据分组：将相似的数据点划分为同一簇。特征分析：通过聚类结果发现数据潜在的结构。降维辅助：结合聚类结果进行特征选择或数据压缩。dlib支持的经典聚类算法包括K-Means和ChineseWhispers，适用于图像
机器学习：集成算法的装袋法（Bagging）：随机森林（Random Forest） rubyw #概念及理论机器学习算法随机森林
随机森林（RandomForest）是一种集成学习方法，通过构建多个决策树并结合其预测结果来提升模型的性能和稳定性。它由LeoBreiman于2001年提出，广泛应用于分类和回归任务。以下是随机森林的详细介绍，包括其基本概念、构建过程、优缺点及应用场景。基本概念随机森林是一种基于决策树的集成算法，通过生成多棵决策树，并将这些树的预测结果结合起来，以提高整体模型的预测准确性和稳定性。每棵决策树都是在
计算机网络基础知识+学习路线早起的小懒虫计算机网络网络
计算机网络是一种将多个计算机设备通过通信线路连接在一起，使其能够相互传输数据和共享资源的技术和设施。1.基础知识学习计算机网络需要了解计算机硬件、操作系统、编程语言等基础知识。计算机硬件：计算机硬件包括中央处理器（CPU）、存储器、输入输出设备等。CPU是计算机的核心，负责执行程序和控制计算机的各种操作。存储器主要有随机存储器（RAM）和只读存储器（ROM），用于存储数据和程序。输入输出设备包括键
大语言模型技术系列讲解：大模型应用了哪些技术知世不是芝士语言模型人工智能自然语言处理 chatgpt 大模型
为了弄懂大语言模型原理和技术细节，笔者计划展开系列学习，并将所学内容从简单到复杂的过程给大家做分享，希望能够体系化的认识大模型技术的内涵。本篇文章作为第一讲，先列出大模型使用到了哪些技术，目的在于对大模型使用的技术有个整体认知。后续我们讲一一详细讲解这些技术概念并解剖其背后原理。正文开始大语言模型（LLMs）在人工智能领域通常指的是参数量巨大、能够处理复杂任务的深度学习模型。这些模型使用的技术主要
森林的智慧：随机森林与集成学习的民主之道田园Coder 人工智能科普人工智能科普
当约阿夫·弗罗因德和罗伯特·沙皮尔提出的AdaBoost算法在90年代末期以其强大的预测精度震惊机器学习界，展示了“团结弱者为强者”的集成魅力时，另一种集成思想也在悄然孕育。这种思想同样信奉“众人拾柴火焰高”，但走的是一条与AdaBoost截然不同的路径：它不执着于反复调整数据权重去“关注”被前序模型分错的困难样本，而是致力于创造尽可能多样化的模型，然后让这些模型平等地投票。它的核心哲学是：如果每
工具学习_CVE Binary Tool
1.工具概述CVEBinaryTool是一个免费的开源工具，可帮助您使用国家漏洞数据库（NVD）常见漏洞和暴露（CVE）列表中的数据以及Redhat、开源漏洞数据库（OSV）、Gitlab咨询数据库（GAD）和Curl中的已知漏洞数据来查找软件中的已知脆弱性。该工具有两种主要操作模式：二进制扫描程序：可帮助您确定哪些包可能已作为软件的一部分包含在内。该程序包括360检查器，扫描程序主要适用于常见的
Python —— pandas 主要方法和常用属性（一）墨码笔记知识点 python 数据分析 Pandas
Pandas基础类型Series类型创建SeriesSeries的自定义索引读取SeriesPandaspandas数据分析统计包，是一款功能强大的用于数据分析的操作工具，由于其的实用性对操作数据的方便性广受欢迎，今天就来学习一下Pandas数据包的用法吧！在此之前推荐了解一下numpy基础类型说道数据类型，大家熟知的大概都是intstrbool等数据类型，或者是Python中的listtuple
机器学习：集成学习方法之随机森林(Random Forest) 慕婉0307 机器学习集成学习机器学习随机森林
一、集成学习与随机森林概述1.1什么是集成学习集成学习(EnsembleLearning)是机器学习中一种强大的范式，它通过构建并结合多个基学习器(baselearner)来完成学习任务。集成学习的主要思想是"三个臭皮匠，顶个诸葛亮"，即通过组合多个弱学习器来获得一个强学习器。集成学习方法主要分为两大类：Bagging(BootstrapAggregating)：并行训练多个基学习器，然后通过投票
板凳-------Mysql cookbook学习（十一--------2) fengye207161 mysql 学习数据库
11.6扩展序列列的取值范围2025-07-0111.7序列顶部数值的再使用11.8确保各行按照给定顺序重编号思路1、创建表的空克隆2、使用insertinto......select从源表自制行3、删除源表，并将克隆表重命名为源表表名4、如果是巨大的MyISAM,并含有多个索引，创建新表时不定义除了auto_increment列之外的索引，会使整个过程更高效重新编号时解决主键冲突的示例通过一个完
机器学习在智能金融风险评估中的应用：信用评分与欺诈检测 Blossom.118 机器学习与人工智能机器人机器学习人工智能 python 深度学习 sklearn 计算机视觉
在金融行业，风险评估是确保金融机构稳健运营的关键环节。随着大数据和机器学习技术的快速发展，金融机构开始探索如何利用机器学习算法来提高风险评估的准确性和效率。本文将探讨机器学习在智能金融风险评估中的应用，特别是信用评分和欺诈检测方面的最新进展，并分析其带来的机遇和挑战。一、智能金融风险评估中的信用评分（一）传统信用评分方法的局限性传统的信用评分主要依赖于人工规则和简单的统计模型，如逻辑回归。这些方法
用这些中医 APP，开启免费自学之旅!问止精一书院 2501_92057656 自学中医
零基础学中医学中医如何入门免费学中医！问止精一书院链接：https://tool.nineya.com/qrcode/1iv54b4ts在众多中医学习网站中，问止中医凭借专为零基础者打造的免费课程脱颖而出，成为中医入门者的理想之选。对于想要学习中医却毫无基础的人来说，选对平台至关重要。问止中医深知零基础学习者的痛点，其免费报名课程从中医基础理论讲起，像阴阳五行、脏腑经络等核心知识，都以通俗易懂的方
45 岁学医晚吗？告诉你最晚不能超过的年龄 2501_92275177 学中医如何入门零基础学中医
零基础学中医学中医如何入门免费学中医！问止精一书院链接：https://tool.nineya.com/qrcode/1iv54b4ts常有45岁的朋友问：“现在学医晚吗？”作为一名46岁才开始接触中医的学习者，我可以肯定地说：不晚！但要选对入门方式，而问止中医的免费报名课程，就是帮你打破年龄顾虑的绝佳跳板。很多人纠结“最晚不能超过多少岁”，其实中医学习更看重方法而非年龄。问止中医的免费课程专为中
机器学习在智能制造业中的应用：质量检测与设备故障预测 Blossom.118 机器学习与人工智能机器学习人工智能深度学习神经网络机器人 sklearn tensorflow
随着工业4.0和智能制造的推进，制造业正经历着一场深刻的数字化转型。智能制造业通过整合物联网（IoT）、大数据和机器学习等先进技术，实现从生产计划到质量控制的全流程优化。机器学习技术在智能制造业中的应用尤为突出，尤其是在质量检测和设备故障预测方面。本文将探讨机器学习在智能制造业中的应用，并分析其带来的机遇和挑战。一、智能制造业中的质量检测（一）传统质量检测方法的局限性传统的质量检测主要依赖于人工检
面了字节跳动的数据挖掘岗，感觉真的很难。。。大模型爱好者社区机器学习深度学习面试宝典数据挖掘人工智能数据分析算法面试
节前，我们社群组织了一场技术&面试讨论会，邀请了一些互联网大厂同学、参加社招和校招面试的同学，针对新手如何入门机器学习算法、该如何备战、面试常考点分享等热门话题进行了深入的讨论。基于社群的讨论，今天我整理了一个同学的面试题，分享给大家，希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习，可以文末加入我们交流群。一面40min【编程题】有两种数据，分别是被转发的用户和转发的
3步打造Java六边形帝国！解耦业务逻辑全攻略：破解5大陷阱！墨瑾轩一起学学C#【三】java 开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣**六边形架构的“3步魔法召唤术”**第一步：定义核心业务逻辑——给业务装上“女王皇冠”！定义：“就像给业务女王颁发‘独立宣言’，用纯业务类和接口定义核心逻辑！”案例①：订单服务核心逻
C#图片变视频：三步召唤‘AVI魔术师’——对比FFmpeg，代码实战全解析！墨瑾轩一起学学C#【七】c#音视频 ffmpeg
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣SharpAvi图片转AVI全攻略1.环境准备：先装“魔法道具包”目标：从“零基础”到“代码运行”，三步搞定！1.1安装SharpAvi方法1：通过NuGet安装
免费学中医，这些优质资源不容错过少林659 零基础学中医免费学中医
零基础学中医，学中医如何入门免费学中医！问止精一书院链接：https://tool.nineya.com/qrcode/1iv54b4ts想入门中医却担心成本太高？其实有不少免费又优质的学习资源，问止中医的系列免费课程就是其中的佼佼者，涵盖理论与实操，满足不同学习者的需求。问止中医旗下的精一书院，是免费学中医的绝佳平台。由问止中医联合创始人林大栋博士主讲，课程聚焦中医结构分析、人工智能中医大脑技术
【深度学习-Day 33】从零到一：亲手构建你的第一个卷积神经网络（CNN）吴师兄大模型深度学习入门到精通深度学习 cnn 人工智能 python 大模型卷积神经网络（CNN）机器学习
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
C#架构可扩展性终极指南：3招让代码像变形金刚一样灵活！墨瑾轩一起学学C#【七】c#架构开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣C#架构可扩展性的“超能力”实战指南秘籍1：模块解耦——给代码装“乐高积木”核心思想：模块化是代码的“变形引擎”，用接口和依赖注入（DI）让模块像乐高一样自由拼装！1.1问题场景：硬编码依赖的“灾难现场”
【微信小程序】5步轻松搞定Node.js环境，微信小程序开发从此畅通无阻墨瑾轩微信小程序微信小程序 node.js 小程序
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣标题：5步轻松搞定Node.js环境，微信小程序开发从此畅通无阻！引言嘿，小伙伴们！今天我们要聊的是如何在你的电脑上搭建Node.js环境，为微信小程序开发做好准备。是不是觉得听起来就很高大上？别担心，跟着我们的步伐一步步来，保证让你轻松上手，让小程序开发变得
【学习】《算法图解》第十二章学习笔记：K近邻算法程序员
前言《算法图解》第十二章介绍了一种简单而强大的机器学习算法——K近邻算法（K-NearestNeighbors，简称KNN）。这是一种基于实例的学习方法，也是机器学习领域中最基础、最直观的算法之一。本章不仅讲解了KNN的基本原理和实现方式，还探讨了特征提取、归一化等重要概念，为读者打开了机器学习的大门。本笔记将梳理KNN算法的核心思想、实现步骤以及应用场景。一、K近邻算法概述（一）基本思想K近邻算
小白学习Python的系统化路径 python观点资讯
学好Python需要系统化的学习和持续的实践，尤其对于小白来说，从基础到进阶需要循序渐进。以下是一份清晰的学习路径和建议，帮助你高效掌握Python：1.打好基础核心语法变量与数据类型：整数、浮点数、字符串、布尔值等。运算符：算术、比较、逻辑运算符。流程控制：if-else条件判断、for/while循环。函数：定义函数、参数传递、返回值、作用域。数据结构：列表、元组、字典、集合的常用操作。推荐资
AttributeError: module ‘openai‘ has no attribute ‘ChatCompletion‘解决方案爱编程的喵喵 Python基础课程 python AttributeError openai ChatCompletion 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了AttributeError:mod
每天40min，我们一起用70天稳扎稳打学完《JavaEE初阶》——1/70 第一天【进程和线程】【虚拟地址空间】 _蓝天IT_ 70天学完JavaEE初阶 java-ee java
专注效率记忆预习笔记复习做题欢迎观看我的博客，如有问题交流，欢迎评论区留言，一定尽快回复！（大家可以去看我的专栏，是所有文章的目录）文章字体风格：红色文字表示：重难点★✔蓝色文字表示：思路以及想法★✔如果大家觉得有帮助的话，感谢大家帮忙点赞！收藏！转发！本系列通过70天学习完JavaEE初阶，我们不图快，只求稳扎稳打。由于我高三是在家自学的，经验告诉我，学习一定要长期积累，并且及时复习，由于现在课
基于深度学习的草莓成熟度检测系统：YOLOv5 + UI界面 + 数据集 YOLO实战营深度学习YOLO实战项目深度学习 YOLO ui 人工智能目标跟踪
引言随着农业科技的发展，智能化的农业生产方式正逐步替代传统农业。果实的成熟度检测对于农业生产的管理至关重要，尤其是在果蔬的采摘、分拣和运输过程中。草莓作为一种广泛种植且受消费者喜爱的水果，其成熟度检测一直是农业智能化的重要研究方向。传统的草莓成熟度检测方法大多依赖人工经验，劳动强度大且容易出现误差，因此，基于计算机视觉和深度学习的草莓成熟度自动检测系统成为了一种理想选择。深度学习技术，尤其是卷积神
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st