爱听歌的周童鞋

四. 基于环视Camera的BEV感知算法-BEVFormer

目标

- 前言
- 0. 简述
- 1. 算法动机&开创性思路
- 2. 主体结构
- 3. 损失函数
- 4. 性能对比
- 5. BEVFormerv2
- 总结
- 下载链接
- 参考

前言

自动驾驶之心推出的《国内首个BVE感知全栈系列学习教程》，链接。记录下个人学习笔记，仅供自己参考

本次课程我们来学习下课程第四章——基于环视Camera的BEV感知算法，一起去学习下 BEVFormer 感知算法

课程大纲可以看下面的思维导图

0. 简述

今天我们来给大家分享一下一个在 BEV 感知算法里面算是比较基础也是比较具有开创性的一个工作叫 BEVFormer

论文方面的讲解流程我们还是按照算法动机&开创性思路、主体结构、损失函数然后一些性能对比，未来展望这些方面去展开。我们这节课程还是围绕 BEVFormer 的框架来进行讲解，后续会有一节单独的课程会给大家详细讲解一下 BEVFormer 有关代码方面的一些问题，包括环境配置、模块化的一些流程以及后续的训练等方面的讲解，会在一个额外的课程上面去给大家做单独的一个说明

那下面我们就正式开始 BEVFormer 的讲解

1. 算法动机&开创性思路

论文题目其实是很能概括出作者的一个中心思想的，所以我们从题目入手，题目如下所示：

文章题目叫 BEVFormer，我们把它拆分来看前面是 BEV 后面其实是 Former，那对于 BEV 这一块我们其实已经讲过很多次了，所谓的 BEV 其实是鸟瞰图也就是俯视图。那 Former 是什么呢，我们在 CV 这个领域当中我们所讲的很多的 Former 它其实就是一个 Transformer 的结构

OK，那除了 BEV 和 Transformer 这两个内容之外题目还给了我们其他什么信息呢，那首先它提供了一个了从哪学 BEV 的一个信息，从哪学 BEV 呢，从 Multi-Camera Images 多视角图像当中去学 BEV，反过来它告诉我们什么呢，它提示我们它这个 BEVFormer 是基于 Multi-Camera 图像输入的，通过什么样的架构去提这个 BEV 呢，他提出了一个 Transformer 的一个架构，此外有一个形容词 Spatiotemporal 来修饰这个 Transformer，那 Spatiotemporal 又是什么意思呢，是一个空间上时序上的一个界定

那所以从题目上我们这个文章的内容其实描述得已经非常清晰了，作者的目的是从 Multi-Camera 的图像当中去学习 BEV 的一个表征，使用的模块是上面提到的空间时序的 Transformer 模块，所以按照题目来归纳的话，文章其实具有两个核心点，第一个核心点是我们如何去做 Spatiotemporal Transformer 模块，另外一个核心点是我们如何去生成 BEV 的表征，后续我们主要按照这两块去给大家做一个讲解

首先我们在介绍 BEVFormer 这个完整的流程之前，我们先来复习一下两个知识点，什么是 BEV 表征和什么是 Transformer？这两个点其实我们在之前的讲解过程中也提到过很多次了，我们这里给大家做一个复习

那什么是 BEV 表征呢？我们这里简单总结下：

第一，它是一个重构空间
第二，它是一个多传感器融合的空间
第三，它是固定视角（俯视视角）的空间

那对于 BEV 表征而言，它首先是一个重构空间，什么叫重构空间呢，重构空间其实意味着它这个空间并不是真实存在的，我们是不能通过传感器去获取到的，而是通过某些额外的手段去构造出来的一个空间。第二点它是一个多传感器的空间，我们常见的传感器包括激光雷达、毫米波雷达还有一个多视角相机等等，那这些传感器采集到的数据通过某些融合处理的方式后可以得到我们这里所谓的 BEV 空间。

另外一点它是一个固定视角的空间，重构也好，融合也好，它需要对重构和融合的方向做一个界定，我们往哪重构，我们上哪去做融合呢，所以说 BEV 这里就给了一个比较明确的一个界定，它把这个融合的空间已经固定到俯视视角的空间了，所以有了我们这个 BEV 的表征，那我们这里就给大家先比较简单的复习一下视觉重构的俯视视角的特征是什么样子的

我们再给大家复习一下 Transformer 是干什么的，我们在之前的课程中也强调过我们理解 Transformer 可以不用把它当成一个网络去理解，我们大家其实把它当成一个模块，和卷积、池化这些模块一样，是一个很小的功能性模块

那它这个模块可以实现什么功能呢，它其实就是一个注意力的机制，通俗的讲它这个注意力是突出强调视觉特征中的某一部分，比如上图中奔驰车的示意图，通过什么样的特征去判断这辆车是奔驰车是最靠谱的呢，通过车标就可以，很明显我们通过合理的训练之后 Transformer 最后会关注哪个位置呢，显然是车标的位置

这里再给大家扩展一下就是我们在 BEVSAN 课程中也提到过，里面涉及了一个 SE 模块，如下图所示：

这个 SE 模块本身也是一种注意力机制，它的注意力机制是作用在通道域上面的，也就是说从图中我们能看到最后输出的特征图是有不同颜色的，那不同的颜色我们认为它其实是表示了不同注意力的一个权重的。通过对通道数值的重新加权网络会自适应的关注或者忽略某一部分的特征，我们可以假定颜色比较深的区域权重比较大，通过加权之后权重比较大的地方特征会自适应的得到一个加强，同理颜色比较浅的区域权重就比较小，通过加权之后权重比较小的地方特征会得到一个削弱，后续我们在对前面的特征去做一个判断的时候，网络就自然而然地不会注意到权重很小的位置

OK，这里给大家稍微了复习一下 BEV 和 Transformer 的相关内容，BEV 其实就是一个俯视图的空间，将我们前端传感器所采集到的图像数据、点云数据统一的映射到这个空间当中；Transformer 其实就是一个注意力机制，它会引导网络去忽略或者关注某一区域的特征从而对我们后续的任务起到一个促进的作用

2. 主体结构

从这里开始我们给大家具体介绍一下 BEVFormer 是一个怎样的流程，它的网络结构如下图所示：

看一个网络我们首先从输入输出看起，输入其实很清楚了，是 Multi-view input，是一个多视角的输入，这个我们前面提到过很多次了，BEVFormer 的输入是一个多视角图像，那输出在哪呢，它这个网络的图画得输出比较隐晦一点，那它的输出其实在上面，是一个分割和检测头用来做输出的，通过输入的多视角图像我们可以得到输出的结果。那明白了网络功能之后，我们按照网络的流程走向来看一下这个网络有哪些模块

那以图像为输入的话，首先图像通过 Backbone 网络得到 Multi-Camera Features 图像特征，图像特征和历史 BEV 特征和 BEV Queries 查询向量同时输入到类似于 Transformer 的结构当中得到我们当前的 BEV 特征，我们再将这个 Current BEV Feature 送入到后续的分割还有检测网络头里面，我们就可以得到最终的一个结果

按照这个流程来讲的话框架其实是很清晰的，输入是一个 Multi-view Input 通过 Backbone 我们可以得到 Feature，图像级别的特征，图像级别的 Feature 和历史数据和查询数据合在一起可以生成我们当前状态下俯视图的特征，然后利用这个俯视图的特征我们可以做很多的任务，无论是检测也好，分割也好，轨迹预测也好，我们可以利用这个 BEV 特征去做很多的任务，后续的任务其实可以依赖于我们个人的设计

OK，我们对 BEVFormer 的流程有了一个基本了解之后，我们可以对每个模块去进行一个分开的讨论，我们首先讨论的是图像的 Backbone 部分，如下图所示：

我们还是从 Backbone 的输入输出看起，首先输入是 Multi-view Input，是一个多视角的图像，那输出是什么呢，是 Multi-Camera Features，是输入的多视角图像所对应的多视角特征。那用什么网络去做这个事情呢，我们怎么样才能将输入变成特征呢，这就是 Backbone 网络要做的事情了。这个 Backbone 网络它就是一个图像特征提取的网络，所以我们常见的比如 ResNet、ResNet+FPN 等等这些网络都行，那这些网络属于很基础的深度图像处理网络了，我们这里就不再详细展开了

那了解了 Backbone 网络，我们知道这个 Backbone 网络的输出是 Multi-Camera Features，那也就是说输出的是视觉图像特征，并且是多视角的视觉图像特征，后续我们怎么处理这个特征呢，我们怎么利用这个视觉图像特征去得到我们想要的 BEV 特征呢，那后续灰色部分的模块就是干这个事情了，后续这个框架其实是 BEVFormer 的一个核心内容，它涉及到我们如何把我们得到的 Multi-Camera Feature 去生成我们当前需要的 BEV Feature

为了看懂这个模块，我们还是从输入输出看起，它的输入其实包括三个部分，那首先第一个是 Multi-Camera Features，第二个输入是历史的俯视图特征，最后一个是 BEV Queries，那这个所谓的历史俯视图特征我们可以把它理解成一个时序的特征，因为 BEVFormer 文章的题目叫 SpatialTemporal attention 空间时序注意力，那这个 Multi-Camera Features 属于空间层面的，历史的 BEV 特征属于时序层面的，它们俩怎么做一个有机的融合呢，这个空间特征和历史特征是怎么做融合的呢，所以我们就用到了 BEV Queries，BEV Queries 其实是起到了在 Multi-Camera Feature 和历史的 BEV Feature 之间一个很好的桥接的作用，

图中灰色部分是这个模块的一个详细结构，我们从流程上可以把这个模块再仔细看一下，它这个模块其实是一个从下往上的一个模块，那首先是将历史的 BEV 和 BEV Queries 输入 Temporal Self-Attention 的一个结构，一个时序的 Self-Attention 的结构，通过这个 Temporal Self-Attention 之后送到 Spatial Cross-Attention，先做时序的然后再做空间的，当做完两个之后我们会得到 Current BEV 也就是它当前状态下的俯视图的特征

那我们之前讲过，我们做注意力机制的一个主要目的是得到需要强调的部分，那这个部分通道的也好，空间的也好，时序的也好是我们需要特别去关注的部分，所以我们才把它称之为注意力机制嘛，我们带着这样一个基本思想去进入到下一个模块。那按照这个逻辑结构来讲的话，我们还是先给大家强调一些 Tempora Self-Attention 然后再说 Spatial Cross-Attention，因为它是一个从下往上的一个结构，所以我们后续也是先讲时序注意力是怎么做的，然后再讲空间注意力是怎么做的

OK，我们先讲一下 Tempora Self-Attention 也就是图中黄色部分的的时序注意力模块是怎么做的

按照作者论文中所阐述的，时序注意力模块的设计主要考虑以下两个方面：

第一，如何引入前一时刻特征？
第二，考虑不同帧中车的偏移量不同，如何选择需要的呢？

第一个方面是我们要怎么引入前一时刻的特征，因为它既然称之为时序注意力，时序它是考虑前一帧和当前帧之间的一个关联的，所以说我们如何把前一帧时刻的特征引入到我们当前 BEV 特征的计算是一个很关键的问题，在上图中我们也能看到作者是想通过历史 BEV 信息来去对我们当前 BEV Queries 去做一个加强的；另外一个我们要谈论的点是它在不同帧中车的偏移量是不同的，所以我们如果设定一个固定的 attention 机制来去建模这样一个不确定性的话，它其实是不太合理的一个事情

考虑到以上两点，作者引入了一个叫可形变注意力（Deformable Attention）的模块，那它这种注意力与我们通常意义上讲的注意力有什么区别呢，这里以一个九宫格举例，如下图所示：

传统的注意力是怎么做的呢，比如我想计算上图中 ❌ 这个位置特征应该是什么，那计算 ❌ 这个位置特征的时候我们可能会考虑临近点的一个特征，比如与它临近的三个位置的特征，我们对这三个位置特征去进行一个加权，乘以一定的系数，比如 0.5，0.2，0.3，乘到这个原始的特征上生成我们 ❌ 这个位置的特征，这就是我们通常意义上讲的视觉注意力的一个做法

那 Deformable Attention 可形变注意力是怎么做的呢，我们还是以九宫格举例，比如我们刚刚想算 ❌ 位置的特征，我们采用的是与它邻近的三个的特征，我们后续实验可能发现这个特征并不能完全满足我们的要求，因为它是一个固定位置的，但这个固定位置并不适合于通用场景的，所以就提出了这个可形变 attention 的思路

它会计算一个 offset 偏移，那这个 offset 其实表示的是我要计算的那个点位置的特征和我当前点它之间的一个偏移量，也就是一个距离。比如我想计算 ❌ 这个位置，那我采用的特征，我通过预测得出它的一个偏移量，可能离他很远，可能在 ⭕ 这个位置，那我利用 ⭕ 这个位置去计算 ❌ 这个位置的特征它可能是更准确的

我们以前的通用的方法是用的位置来计算，那这样子可能在某些场景下不合理的，那我们通过这个 offset 这样一个偏移量的预测，我们发现可能采用三个 ⭕ 去计算 ❌ 的特征可能是更合理的，所以也就提出了我们这个可形变注意力的网络，利用一个可适应的可学习的一个 offset 偏移去对特征去做一个更好的提取预测

还是以上图为基准，网络可以自行预测偏移量，它是可以预测出来我哪个点的特征对我当前点特征是有增益的，利用这个预测出来的点去对我当前点去做一个加权，那这样可以得到一个逻辑更自洽的特征提取

OK，明白了这点之后我们再回到这个时序注意力上，对于每一个 BEV Query 我们可以理解成它是一个 ❌ 的这个点，网络会来判断哪个 BEV 对我当前 BEV Query 是有用的，用这个方式我们就恰好能利用这个历史的 BEV 特征，比如在 BEV Queries 的 $(x, y)$ 上我们会去找哪一个历史 BEV 对我当前的这个 $(x, y)$ 是有用的呢，我们可以找到褐色的点和蓝色的点对我这个 BEV 是有用的，所以我们就会把它引入进来，那这就是第一个模块

那我们把历史 BEV 计算完之后，BEVFormer 会同时的去在它原始的特征图中去做第二次的 self-attention，也就是上图中深绿色的位置和浅蓝色的位置，考虑的是 BEV Query 上对我当前点有增益的一个位置，它是一个 self-attention 的一个计算过程，利用这两个方式来自于历史 BEV 和 BEV Query 它自身的一个特征加权，通过这种方式 BEVFormer 的作者认为是可以得到一个很好的查询先验的，因为 BEV Query 本身是作为一个查询向量产生的。那有了一个历史 BEV 的引导之后 BEV Query 的查询的先验会更好，那也就是说我们对当前应该生成怎样的 BEV 是有一个初步预期的，那这个初步预期其实来源于我们历史 BEV 的数据的

后续我们再结合我们当前提取到的空间特征和已经有很强的这个 BEV 先验的 BEV Query 我们就能生成更好的 BEV Feature，那后续我们有了这个 BEV Query，有了我们已经提取好的 Multi-Camera Feature，我们怎么样去生成我们想要的这个 BEV Feature 呢，而且是当前状态下的 BEV Feature 呢，所以作者提出另外一个主体结构叫做 Spatial Attention 空间注意力的结构

那 BEVFormer 的作者还是考虑了以下两个方面：

第一，还是讨论如何选择需要的特征呢？
第二，如何建模高度信息？

首先第一个方面讨论一下如何选择需要的特征，因为 BEV 空间其实很大的，那这个空间中它并不是所有信息全都是我要去构造这个俯视图特征所需要的信息，其中也包含了很多这种无用的信息。那我们如何选择我们需要的特征呢；那另外一个点是考虑的一个比较有意思的信息就是我们如何建模高度

那我们首先讨论第一个问题，如何选择我们需要的这个特征，那这个自然离不开我们上面所生成的这个已经有很强先验信息的 BEV Query，利用这个 BEV Query 去对我们的 Multi-Camera Feature 去进行一个特征的查询，去问一问当前位置是否存在特征。我们举个例子，那比如我们想查询 $(x^{'}, y^{'})$ 这个位置的特征，它会怎么做呢，它会按照我们 Query 提供的这个索引去找我们所对应的这个视角下的特征，空间位置的特征。

那我们怎么找呢，同样还是一样的引入这个可形变注意力的机制，我们将 $(x^{'}, y ’)$ 先映射到它这个视角下所对应的这个位置上，通过去找这个位置邻近的相邻点的一个特征去进行一个融合，然后生成它当前视角下需要融合的特征，那后续的话它把这个多视角全都查询完之后会生成当前这个 $(x^{'}, y^{'})$ 位置上通过 Multi-Camera Feature 融合好的一个特征。那这个特征显然也是经过了 attention 机制的嘛，我们刚提到是在每一个视角下去做这个 Deformable Attention 去做这个可形变注意力来提取空间位置上我们需要额外关注的一些特征

第二点 BEVFormer 作者考虑了一个很有意思的一个事情，是这个高度信息，我们为什么要考虑高度信息呢，是因为 BEVFormer 作者认为我们如果是不同的目标的话，它在高度上是具有显著差异的，比如公交车或者卡车很高，路牌可能很矮，它们是有显著差异的，因为目标种类的不同会导致这个高度上的差异变化。那一般我们所讲的俯视图它是拍扁的，拍扁的话会损失掉高度维度的这个特征，所以说 BEVFormer 它在这里设置了一系列的 anchor 用于匹配不同高度的这个目标，那这点我们其实在讲解 BEV-SAN 这篇文章中已经详细分析过了，如果大家忘记了的话可以再去复习一下

3. 损失函数

那我们说到这里 BEVFormer 的一个主要模块已经给大家讲解完了，那按照我们前面的分析我们对里面的一些很重要的模块去做了一个比较详细的一个讲解，那我们接下来会结合损失函数把这个整体的流程再复习一遍

BEVFormer 的整体流程我们经过前面的拆解应该相对而言是比较清晰的，那首先是经过一个 Multi-View Input 然后经过一个 Backbone 网络去得到一个 Multi-Camera Feature 多视角图像特征，通过多视角图像特征、历史的 BEV 特征和这个 BEV Query 的特征我们通过一个所谓的叫 SpatialTemporal attention 的一个网络去生成 Current BEV，也就是我们当前 BEV 空间的特征，利用当前 BEV 空间的特征就可以做一些我们后续很关心的任务，比如说检测也好，分割也好，或者说轨迹预测，轨迹规划等等，那后续这个任务是我们可以人为自定义的

那因为我们这里提到了损失函数，损失函数这个部分其实是根据我们后面子任务去定义的，后面 Loss 这一块是与我们任务相关的，比如说 3D 检测任务那就是一个边界框分类和回归的函数，那要是 3D 分割任务呢，那就是点云或者网格分类损失函数等等

那这个流程清楚了之后实验设计的部分我们也可以推理出来 BEVFormer 作者他会做哪些实验呢，按照我们流程来讲的话，它首先是一个 Multi-view 的一个 input，是一个多视角的输入通过 Backbone 去得到特征，那首先第一个实验前序的图像处理这个 Backbone 它对我们整体性能有没有影响呢，这是第一个实验。那后续第二个实验也很明了了，前面一个 Multi-view 的 Feature，然后一个历史 BEV，一个 BEV Query，通过时序 attention 通过空间 attention 可以得到最后的 BEV Feature Map，那这个 Temporal self attention 它是可去掉的网络，我们通过刚刚讲解也知道它这个 temporal 时序 attention 它最后输出的是一个带有强烈先验信息的 BEV Query

那我们把这个网络去掉那无非就是说它这个先验信息没有了，它不会对这个网络的输入输出有其他额外的影响，输入输出的数目还是固定的，它有 BEV Query 还是有 BEV Query，那无非是 BEV Query 本身额外的已经编码好的这个先验信息没有了，那后续消融实验我们就显然可以把它去掉，把这个 Temporal Self-Attention 给去掉看他对网络的性能是否有很大的影响。那另外一个我们刚才也提到无论是空间的 attention 还是时序的 attention，它俩都离不开一个叫可形变注意力的一个模块，也就是我们刚才讲的 Deformable Attention，那这个 Deformable Attention 是否对网络很重要呢

4. 性能对比

那我们带着上面的推断可以进入到性能对比的方面

那性能对比我们强调两个方面，前面第一个方面是一个总体结果，从总体结果上来看的话，比一些比较基础的 3D 检测方法还是有一定的性能提升的，比如在使用同等 Backbone 的情况下 BEVFormer 比 Fcos 高了十个点左右，那如果我们换一个更好的 Backbone，比如说换到了 V2-99*，这个性能提升就更明显了，BEVFormer 如果是 V2-99* 的 Backbone 比 R101 要好将近 0.03 个点

那另外一个实验其实我们刚刚也提到过，整个时序注意力模块是可以拿掉的，那我们这里的 BEVFormer-S 其实就是拿掉时序注意力之后的网络，我们也可以比较下这个 BEVFormer-S 和 BEVFormer 之间的一个差异，可以发现如果没有时序注意力模块的话，我们本身的这个 BEV Query 其实是没有历史 BEV 的这个先验信息的，性能是下降了很多的大家可以从表中看到一个是 53.5 一个是 46.2，它这个性能其实下降特别多的

那 BEVFormer 中讨论第三个点是不是说我们这个网络非得使用这个可形变卷积不可呢，能不能使用别的一个这样的一个注意力机制呢，那这里作者其实也是给了一个性能比较的，显然是可以使用其他注意力机制的，那性能也是会受到一定的影响，作者在这里其实给了三种注意力机制，一个叫全局注意力也就是表中的 Global，还有一种是这个 points，一种是 local

我们还是以九宫格举例来说明一下这三种 attention 有什么样的一个区别，以上图为例，它这里提到的 Global Attention 是什么意思呢，是考虑这个九宫格内的所有特征去给它做一个加权，我们会得到这个 Global 的特征，是一个全局性质的一个特征；那什么叫 point 呢，还是以九宫格特征，point 的特征其实是我们会对这个区域内去做一些点的指定，比如说我要算区域的特征，那我会指定我这个区域特征的四个点为代表，无论什么区域我全都是用这四个点的特征作为我这个区域的一个 reference 特征一个代表性的特征，

那另外一个就是 local 的方式，那这个 local 的方式就是我们提到过很多次的，是文章中所提到的可形变注意力的一个方式，比如我们同样想提取这个区域的特征，那我们这个 local 方式选择的特征是非固定的，是基于 offset 网络预测出来的，它是根据网络按照不同的情况通过不同的输入去预测出来不同的 offset，所有会产生不一样的特征组合的方式，那显然按照这种可形变的方式，这个网络会更加的灵活也能更加的自适应不同的场景

OK，以上就是我们今天 BEVFormer 部分整体的一个讲解

我们对 BEVFormer 可以再做一个总结，BEVFormer 它的一个核心内容其实是我们如何去生成 BEV 特征，就是这个 BEV 特征要怎么构造，那至于这个 BEV 特征生成好之后去做什么任务，我们可以选择我们合适的一个分割头也好，检测头也好，去做适合的这个子任务。那核心的内容就是说我们怎么去生成 BEV 特征呢，其实 BEVFormer 包含两个模块，一个模块是 Temporal Attention，另一个模块是 Spatial Attention，通过 Temporal Attention 我们可以把历史 BEV 信息融合到当前的 BEV Query 上，通过 Spatial Attention 我们可以利用 BEV Query 提取到我们想要的空间位置的信息，空间的一个特征来生成我们最终想要的 current BEV，也就是当前 BEV 视角下的特征

我们今天主要是对这个 BEVFormer 它的一个整体流程还有一些功能概念做一些介绍，后续会有对 BEVFormer 完整代码的一个详细讲解，也欢迎大家持续关注

5. BEVFormerv2

另外我们这里给大家稍微提一下 BEVFormerv2 这个方法，我们说的 BEVFormer 的改进版，它的框图如下：

我们这里主要看一下它做了哪些改进，我们还是按照输入输出的流程来看，输入是什么呢，是一个多视角图像，一个 Multi-view images，输出是什么呢，是 predictions，那也就是我们 3D 检测结果。输入的多视角图像通过 Backbone 网络可以得到 Multi-view Features，也就是我们说的图像特征，我们在课程前面提到我们说的 BEVFormer 是利用 Multi-view Feature 通过 Spatial attention 空间注意力，通过 Temporal attention 时序注意力可以得到 BEV 特征

那在 BEVFormerv2 当中除了 BEVFormer 原本框架当中的 Spatial Encoder 和 Temporal Encoder 还有一个额外的支路，我们从图中也能看到是 Perspective 3D Head 是有额外的监督信息的。这个额外的支路其实是 BEVFormerv2 的核心内容，那为什么需要这个支路呢，我们可以这样想如果把这个支路去掉，图像 Backbone 网络当中参数的监督信息来自于哪里呢，是来自于我们最后的一个检测结果，最后检测结果的损失，用梯度回传来更新图像 Backbone 的参数，那 BEVFormerv2 的作者认为像这种监督其实不是一种明显的监督，梯度回传是一步一步最终才能到达图像 Backbone 的参数上的，那我们怎么把这种远端的监督来变成一种近端的监督呢，那我们怎么把这种很不直接很不明显的监督变成又直接又明显的呢

BEVFormerv2 作者的想法也很直接，我们直接利用 Backbone 输出的图像特征可以得到一个初步的预测结果，初步预测结果如果有监督信息的话可以直接用来更新 Backbone 网络参数，通过这样的方式，那它的这个 head 的设计也很简单，我们前面是有了一个 Multi-view Feature 也就是多视角的图像特征，我们可以利用一些单目的 3D 检测框架的 Head，可以在图像上预测 3D Box，虽然这个 Box 可能是不太准的，可能是比较粗糙的，没有关系，它的 Perspective head 的预测结果是不会作为我们最终的检测结果的，它的一个更主要的作用其实是图像网络的参数更新的作用

那 BEVFormerv2 它其实也是属于那种 Two-Stage 这种框架我们叫两阶段检测器，两阶段检测器哪里是第一阶段呢，额外的支路输出结果是第一阶段，我们说第一阶段检测结果一般是不太好的，很粗糙的结果，那后续通过我们说第二阶段去对第一阶段的结果做更新做 refine 可以得到一个更好的一个更准确的结果

我们把第一阶段得到的初步的检测结果送入到第二阶段当中，它怎么送呢，我们第一阶段它不是有一个 proposal 吗，proposal 可以和我们原本初始的 BEVFormer 当中随机初始化的一些 Object Query 做混合，一个混合的 Object Query，那这个 Query 其实是有两个方面的，有一方面是我们第一阶段的检测结果，另外一方面其实是我们初始化的一些随机的，可更新的一些 Query，以上两个 Query 混合来做我们最后的 BEV Predictions

那以上其实就是 BEVFormerv2 的一些主要内容的改进，详细的内容我们这里就不再赘述了

那 OK 我们本小节内容就到此为止

总结

这节课程我们学习了一个非常经典的框架叫做 BEVFormer，BEVFormer 的整体流程是多视角图像通过 Backbone 提取到多视角图像特征，多视角图像特征加上历史 BEV 特征和 BEV Queries 一起输入到一个叫 SpatialTemporal Attention 的结构中得到我们当前的 BEV 空间特征。那其中最重要的是 SpatialTemporal Attention 结构中的 Temporal Self-Attention 时序注意力模块和 Spatial Attention 空间注意力模块，通过时序注意力模块我们可以把历史 BEV 信息融合生成一个具有强烈先验信息的 BEV Query，通过空间注意力模块我们可以提取我们想要空间位置的信息来生成我们最终想要的 current BEV。此外我们还简单介绍了一下 BEVFormerv2，它的主要改进在于引入了一条额外的支路来监督图像网络参数的更新。

OK，以上就是 BEVFormerv2 的全部内容了，下节我们学习另外一篇非常经典的环视算法 BEVDet，敬请期待

下载链接

论文下载链接【提取码：6463】
数据集下载链接【提取码：data】

参考

[1] Li et al. Bevformer: Learning bird’s-eye-view representation from multi-camera images via spatiotemporal transformers

[2] Yang et al. BEVFormer v2: Adapting Modern Image Backbones to Bird’s-Eye-View Recognition via Perspective Supervision

你可能感兴趣的:(BEV感知,自动驾驶,BEVFormer)

老师晨说平安413
主题【驯化我们的大脑】️驯化脑神经回路练习临在当下，觉察大脑神经元变化-过去：思前想后犹犹豫豫，内心戏不断加码，担忧未来放不下过去-现在：什么都不想，没有任何担忧，活在当下感知当下。现在大脑的运作模式已经完全不对什么事产生应激反应。️重视刻意训练坚定信念、信仰——训练可以带你进入幸福和可能性。训练出对当下的全心全意，全然投入在当下事情。训练对幸福感知回路，当下全心全意来到美好当中。最终把自己训练成
网络安全-动态风险评估工作原理、详细过程和架构及案例 hao_wujing web安全架构安全
大家读完觉得有帮助记得关注和点赞！！！动态风险评估（DynamicRiskAssessment,DRA）是一种通过实时数据采集、AI分析和闭环反馈实现风险持续演算的主动防御技术。以下从工作原理、详细过程、架构设计及行业案例展开系统性解析：一、核心工作原理1.多源数据融合与实时感知异构数据采集：整合网络流量、端点行为、环境变量（如设备指纹、地理位置）、业务日志等多维数据，构建动态基线15。环境感知驱
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
灵气，是一个人心灵纯粹的程度…… 本無
原创2018-02-04高鸣璞（孝德众创）什么在决定人生？人的一生不是想什么就能来什么，而是有一个看不见的东西在作用。所有外在的有形，背后都有一个无形的支撑。图片发自App我们触摸到什么，就连接到什么。当我们触摸到生命，我们的生命就更加深邃。深邃本身就是一种丰富，就是一种神秘，就是一种美好。图片发自App是什么在影响人对世界的感受呢？其实是里面的程序（内在的感知）影响对外面的感受。里面的反应不同，
opencv、torch、torchvision、tensorflow的区别
一、框架定位与核心差异PyTorch动态计算图：实时构建计算图支持Python原生控制流（如循环/条件），调试便捷。学术主导：2025年工业部署份额24%，适合快速原型开发（如无人机自动驾驶、情绪识别）。TensorFlow静态计算图优化：预编译图结构提升部署效率支持动态图（Eager模式）兼顾灵活性。工业部署首选：市场份额38%，擅长边缘计算（YOLO部署）和大规模项目（工业自动化）-59）。O
体验身体感觉 sanmaopipi
头脑里的画面是对自己所见所闻的投射，当头脑把投射的记忆画面翻出来之后进行加工，通过声音评价评判记忆画面，产生身体感觉，有时候让大脑发紧，有时候肚子里产生一定的气体，鼓鼓的紧紧的不舒服，有时候对当下的抗拒对事实的反抗，更加让自己生出起来，身体产生紧或者张的感觉，进而让自己失去对当下的觉知，对身体感觉的感知，进而让自己失去对自己的觉知，当回归后感觉不太好。
大盘依旧低迷，二胎和自动驾驶活跃虚拟大师
本周来看，大盘依然不温不火，呈现箱形震荡。很多人都在打赌，沪指在上周调整之后有望突破新高，其实不然，目前的沪指基本上很难回复到以前的高位，甚至不会有向上突破的趋势，而且目前大盘的题材不鲜明，权重股没有扛起反攻的大旗。近期来看，二胎在本周表现强势，掀起几度涨停狂潮，金发拉比10天9板，成为目前的市场总龙头（目前已经停牌核查）。与之跟随的是贝因美，高乐股份，安奈儿等。目前我国的生育大家都心知肚明，所以
亨雪的心流浪的狗尾巴草
图片发自网络风舞尘/文盼来了盼来了你——洁白的礼花于是，我便有儿时的欣喜激动的张开臂膀接纳你，拥抱你，亲吻你我欢跃于这漫天飞雪中感知你的肌肤享受你的柔情你是圣洁的公主纯洁的上天赐下的精灵图片发自App我沉醉了消失了沉醉于这飞舞的雪花里消失在这银白的世界里可惜，你只是偶尔的光顾只在寒潮时来临更可惜，你也不能长久留存你来到这多舛的尘世把生命交给了大地滋润了万物且不留痕迹图片发自网络不知何时你也偷偷的融
智界R7智驾功能和性能评价 TheWanderers 智能驾驶智界
一、智驾行车能力标题硬件配置与系统架构感知硬件：Max/Ultra版搭载1个192线激光雷达、3个毫米波雷达（含1个4D成像雷达）、12个超声波雷达、11个高清摄像头（含前向800万像素双目+鱼眼镜头）。Pro版未配备激光雷达，但保留3个毫米波雷达和10个摄像头。核心算法：HUAWEIADS3.0系统，基于端到端架构，整合感知、决策与控制模块，支持全场景目标识别（如非标准障碍物、夜间行人）。算力支
YOLOv5改进策略|YOLOv5 ⾃主检查和跟踪相关的任务|基于视觉的⽆⼈⽔⾯舰艇⾃主导航极端海洋条件斌擎人工智能官方账号 YOLO 人工智能 YOLOv5 目标检测计算机视觉深度学习自主导航
目录介绍解决方案目标检测的视觉结论视觉感知是无人水面舰艇(USV)自主导航的重要组成部分，特别是与自主检查和跟踪相关的任务。这些任务涉及基于视觉的导航技术来识别导航目标。海洋环境中极端天气条件下的能⻅度降低使得基于视觉的方法难以正常工作。为了克服这些问题，本文提出了一种基于视觉的自主导航框架，用于在极端海洋条件下跟踪目标物体。所提出的框架由一个集成感知管道组成，该管道使用生成对抗网络(GAN)来消
AI新纪元：2025年深度学习技术突破与行业应用全景像素笔记杂谈人工智能深度学习 ai 自动驾驶工业数字化转型未来趋势技术创新
2025年，人工智能技术迎来爆发式增长，大模型、生成式AI和多模态技术持续突破，人形机器人量产元年正式开启，自动驾驶商业化进程加速，工业数字化转型全面铺开。这些进展不仅重塑了技术边界，更在多个行业创造了实际价值，推动AI从实验室走向产业化。本文将深入剖析2025年深度学习与AI领域的核心技术突破、行业应用案例及未来发展趋势，为技术从业者提供全面视角。一、深度学习核心技术突破：大模型、生成式AI与多
雨天障碍物漏检？陌讯多模态算法实测 98% 准确率 2501_92474711 算法目标跟踪人工智能计算机视觉
开篇痛点：自动驾驶视觉系统的“暗礁”在自动驾驶感知层，路面障碍物识别堪称“生命线工程”。传统视觉算法在复杂场景下常面临三重困境：雨天水雾导致特征模糊时漏检率高达25%，逆光环境下小目标（如碎石、井盖）检出率不足60%，而追求高精度又会导致帧率跌破20FPS，难以满足实时性要求[1]。某车企实测数据显示，传统YOLOv8在城郊混合路况中，因障碍物识别延迟引发的决策偏差占测试事故的37%，这些问题成为
RocketMQ源码级实现原理-NameServer路由机制每天的每一天 java-rocketmq rocketmq java
面试题从年末生产故障解锁RocketMQ集群部署的最佳实践-求其在我-博客园操作系统tcp链接established但是没超时的问题_mob6454cc769a22的技术博客_51CTO博客net.ipv4.tcp_retries2作用介绍-郭流水-博客园TCP保活机制的根本意义，就是要让本端能够，及时感知对端的服务进程是不是挂了，或者对端服务器本身宕机了，方便本端针对此情况做出后续的处理比如上面
监控漏检率 30%？陌讯多模态算法实测优化
破解智慧城市视觉算法困境：陌讯多模态融合技术实战解析在智慧城市建设中，视觉算法作为感知层核心技术，正面临着日益严峻的挑战。传统目标检测算法在暴雨、逆光、遮挡等复杂环境下，漏检率常高达25%-40%，直接导致交通违章误判、异常事件漏报等问题。某新一线城市交管部门曾反馈，现有系统对无牌车的识别准确率不足65%，严重影响执法效率[实测数据来源]。这些痛点的核心在于传统单模态算法难以应对城市环境的动态变化
“显著性”（Saliency）是计算机视觉中的一个重要概念，主要指的是图像或视频中最吸引人注意力的区域或对象步步咏凉天计算机视觉人工智能
“显著性”（Saliency）是计算机视觉中的一个重要概念，主要指的是图像或视频中最吸引人注意力的区域或对象。它模拟的是人类视觉系统对视觉场景中“显著”区域的感知能力。显著性可以用于图像理解、目标检测、图像压缩、图像分割等多个任务。下面是对显著性在计算机视觉中的几个关键方面的解释：一、显著性检测（SaliencyDetection）显著性检测的目标是预测图像中最能吸引人注意的区域，通常输出一个与输
读《认知天性》（1）云城梦天
认知是对天性是挑战认知可以用数学统计与实践客观来评价，而我感觉是一种自我感知。当未知时，感知痛苦然而这是个时习之中乐的过程。也可以通过rain和轻疗的方法安抚情绪编码，可以以好奇心与视觉画面联动来做记忆编码的过程，因人是视觉性爬行动物，且好奇心也是人的天性好奇时会主动探索算是翻转式学习的一种，编码是记忆过程。另外你可能对记忆中某一刻的感觉记得很清楚，然而忘记了内容，人或许也是感觉爬行动物。巩固，可
智慧水厂怎么建？物联网数据采集+SCADA升级，水务工业智能转型
在智慧工业与“双碳”目标的双重驱动下，智慧水厂已成为水务行业数字化转型的必选项。通过物联网（IoT）技术实现水厂数据采集的实时化、自动化，不仅能提升供水效率与水质安全，还能降低能耗与运维成本。一、智慧水厂的核心痛点：数据孤岛与效率瓶颈传统水厂依赖人工巡检和分散式监控系统，普遍存在以下问题：1.数据滞后：人工抄表与离线分析导致决策延迟；2.设备盲区：水泵、阀门等关键设备状态无法实时感知；3.能耗浪费
工业喷涂机器人的革新：艾利特协作机器人引领人机交互新纪元 lingling009 人工智能运维大数据
将复杂技术转化为实际价值，赋能全球产业生态在工业自动化浪潮中，喷涂作业作为关键制造环节，长期面临效率低下、质量波动和安全隐患等痛点。艾利特机器人，作为专注新一代人机交互协作场景的制造商和迅速成长的国际协作机器人龙头企业之一，致力于通过一站式解决方案，深度升级汽车、3C、新能源等行业生态。本文将基于“工业喷涂机器人”这一核心场景，剖析其痛点、转化技术参数为可感知价值，并植入真实案例，构建“基础功能→
致小溪流家人第十七封信 mxn马娜
溪爸，溪妈：周末好！溪流教室冬至的到来，让孩子们着实兴奋了一把。在这里也要感谢我们的昀恬妈妈，佳依妈妈，家梣妈妈到教室陪孩子们一起过冬至包饺子的活动。学霸队香蕉队水饺队草莓队我们分为了四组，每组分派一位大人参与。相信家人们从孩子的写绘里已经感知到当时现场的氛围有多热闹了。故事是如何而来？是从生活经历中来，培养孩子善于观察，善于发现，善于思考，用心感知生活中发生的一切，做一个心思细腻的人。生活经历，
CAN总线模组选购指南：2025年全球CAN产品品牌与CAN-bus方案盘点
随着工业物联网（IIoT）、智能制造和自动驾驶技术的快速发展，CAN（ControllerAreaNetwork）总线已经成为工业控制、汽车电子和智能设备领域的重要通信协议之一。CAN总线模块作为实现设备间实时通信与高可靠性数据传输的核心组件，其选购对于系统稳定性和性能至关重要。本文基于权威市场数据平台的分析，盘点了2025年全球主流CAN总线模块品牌及其解决方案，帮助工程师和系统集成商选择最佳产
1.16，77 知行思合一
七项重要的感知力和技能1、对个人能力的感知力--我能行；2、对自己在重要关系中的价值的感知力--我的贡献有价值，大家确实需要我。3、对自己在生活中的力量或影响的感知力--我能够影响发生在自己身上的事情。4、内省能力强：有能力理解个人的情绪，并能利用这种理解做到自律以及自我控制。5、人际沟通能力强：善于与他人合作，并在沟通、协作、协商、分享、共情和倾听的基础上建立友谊。6、整体把握能力强：以有责任感
C++ NUMA-Aware Allocators：针对非统一内存访问架构的分配器海派程序猿 C++封神之路高阶技术系列讲座 c++架构 java
好的，让我们来一场关于C++NUMA感知分配器的技术讲座！准备好，我们要深入到内存分配的奇妙世界，特别是那些让多核处理器“心跳加速”的NUMA系统。大家好！欢迎来到NUMA大冒险！今天，我们不讲“Hello,World!”，我们要讲“Hello,NUMA!”。如果你觉得内存分配只是new和delete的简单游戏，那你就大错特错了。尤其是在NUMA(Non-UniformMemoryAccess)系
2022-04-06 做个会思考的老师
烙饼教学设计一、情境引入从对话中，你了解到了哪些信息？对“最多放两个饼，两面都要烙，每面需要3分钟”，你理解这句话的意思吗？考考你：烙一个饼需要几分钟？你是怎么计算的？一面要3分钟，两面就是3×2＝6分钟。二、研究2个饼，初步感知优化策略哦！看来同学们都理解了烙饼的方法，按这样说的话，如果是两个饼，是不是就要12分钟呢？生：6分钟。汇报想法。咦？怎么两个饼的时间和一个饼的时间一样呢？那6分钟去哪儿
无人设备遥控器之航线规划篇 SKYDROID云卓小助手深度学习算法人工智能单片机嵌入式硬件
无人设备遥控器的航线规划是确保无人设备（如无人机、无人车、无人船）高效、安全执行任务的核心环节，涉及任务目标设定、路径规划、环境感知与风险评估等多个方面。一、规划步骤目标定义：明确无人设备需要完成的具体任务，如巡检、测绘、侦察、物资运输等。优先级划分：根据任务紧急程度、资源需求等设定优先级，确保关键任务优先执行。约束条件设定：性能限制：考虑无人设备的续航、载荷、通信范围等性能参数。环境约束：避开禁
三轴云台之控制算法协同技术篇 SKYDROID云卓小助手人工智能算法机器学习网络自动化
三轴云台的控制算法协同技术是确保云台在复杂动态环境下实现高精度、高稳定性运动控制的核心，其技术体系涵盖多传感器融合、多算法协同以及多目标优化三个关键维度。以下从技术架构与实现路径展开分析：一、多传感器融合：构建环境感知基础三轴云台通过集成IMU（惯性测量单元）、编码器、视觉传感器等多源数据，构建高鲁棒性的环境感知系统。IMU与编码器融合IMU提供高频率的姿态角速度数据，编码器提供低延迟的关节位置反
每日一更631--今天的小确幸 Phoebe小语
小确幸，微小而确实的幸福。在生活中有很多这样的小确幸时刻，由于我们太忙碌了，感觉不到。或是，有的时候要求太高，不觉得那是幸福。又或是欲望太多，忽视已经有的，而是在追求未知的。我们的幸福指数一直在提升，但幸福感知力却有些下降。能够感知幸福就会有爱的能力。经常问问自己，我幸福吗？我是如何感知幸福的？我们的生活中，有很多幸福的时刻。今天上午女儿收拾自己的抽屉，有一个被堆压在最下面的小小笔记本，一打开发现
BEV+Transformer Monkey PilotX 自动驾驶 transformer 深度学习人工智能
在自动驾驶系统中，BEV（Bird’sEyeView）+Transformer主要应用于感知与环境建图（Perception&SceneUnderstanding）环节，尤其是在多传感器融合、目标检测、语义分割、轨迹预测等任务中。在自动驾驶中的关键应用场景应用环节BEV+Transformer的作用感知（Perception）多摄像头图像融合成BEV视角，进行目标检测、语义分割预测（Predict
2018-11-09 《幸福的方法》罗剑华
图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App幸福与状态无关，幸福是一种能力。随着年龄的增长，有的能力在增长，但幸福的能力在减弱，对快乐的感知力也在变弱，所以幸福的反面并不是不幸，而是麻木。既然幸福是一种能力，我们就可以锻炼，当你锻炼出自己幸福的能力的时候，你才会变得更加幸福。
晨语问安2020年5月24日求索大伟
『晨语问安5.24』从俭入奢易，从奢入俭难。没有人愿意一直生活在一个特定的环境中，总愿意让生活充满起伏和激情，但是久居兰室不闻其香，久居鲍市不闻其臭，生活的惯性会让自己不愿意离开现有的环境，尤其是比较优越的环境更难以放弃，尤其是从富贵到贫贱更是无法接受。一切都可以改变，关键是个体的顿悟，一个节点的顿悟，让自己真正感知到生活的真谛，让精神状况得以翻天覆地的改变，就能用无比的激情投入到崭新的生活当中，
自动驾驶激光3D点云处理系统性阐述及Open3D库函数应用一碗白开水一 DPL 自动驾驶 3d 人工智能
一、自动驾驶激光3D点云处理的核心挑战与流程自动驾驶系统依赖激光雷达（LiDAR）生成的高精度3D点云数据实现环境感知，其处理流程需解决以下核心问题：数据规模与实时性：现代LiDAR每秒生成数百万点，需在毫秒级完成处理以支持决策。动态环境适应性：需区分静态障碍物（如道路、建筑）与动态目标（如车辆、行人）。多传感器融合：与摄像头、雷达数据时空对齐，构建统一环境模型。典型处理流程分为四个阶段：原始点云
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {