ForeverStrong

基于单目摄像头的物体检测 - Baidu Apollo 陈光 - 2D 图像上的 3D 目标检测

摄像机是无人车系统中最重要的传感器之一，其廉价、帧频高、信息丰富、观测距离远，但易受环境影响、缺乏深度信息。
Apollo 2.5 和 3.0 中广泛使用的单目摄像头物体检测模块。

1. 物体检测模型中的算法选择

autonomous [ɔː'tɒnəməs]：adj. 自治的，自主的，自发的
radar ['reɪdɑː]：n. 雷达，无线电探测器
ultrasonic [ʌltrə'sɒnɪk]：adj. 超声的，超音速的 n. 超声波
obstacle ['ɒbstək(ə)l]：n. 障碍，干扰，妨碍，障碍物

物体检测 (object detection) 是无人车感知的核心问题，要求我们对不同的传感器设计不同的算法，准确检测出障碍物。例如在 Apollo 中，为 3D 点云设计的 CNN-SEG 深度学习算法，为 2D 图像设计的 YOLO-3D 深度学习算法。

https://github.com/ApolloAuto/apollo/tree/r3.0.0/modules/perception/model/cnn_segmentation
https://github.com/ApolloAuto/apollo/tree/r3.0.0/modules/perception/obstacle/lidar/segmentation/cnnseg
https://github.com/ApolloAuto/apollo/tree/r3.0.0/modules/perception/model/yolo_camera_detector

物体检测要求实时准确的完成单帧的障碍物检测，并借助传感器内外参标定转换矩阵，将检测结果映射到统一的车身坐标系或世界坐标系中。准确率、召回率、算法耗时是物体检测的重要指标。Apollo 中基于单目摄像头的物体检测模块。

Object Detection with Discriminatively Trained Part-Based Models
Deformable Part Model，DPM：可形变部件模型
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
YOLO9000: Better, Faster, Stronger
You Only Look Once，YOLO
SSD: Single Shot MultiBox Detector
Focal Loss for Dense Object Detection
Feature Pyramid Network，FPN

Speed/accuracy trade-offs for modern convolutional object detectors 将物体检测神经网络拆分为主框架 meta-architecture 和特征描述模块 feature extractor。选择不同的组合方式，去验证模型的实效性和准确率。
在 MS COCO 数据集上，YOLO V2 取得了实时速度下良好的检测准确率。百度最终选择了 YOLO 作为主框架，以改进的 Darknet 作为特征描述模块 feature extractor。

2. 单目摄像头下的物体检测神经网络

sedan [sɪ'dæn]：n. 轿车，轿子

Apollo 2.5 和 3.0 中，基于 YOLO V2 设计了单目摄像头下的物体检测神经网络 Multi-Task YOLO 3D。它最终输出单目摄像头 3D 障碍物检测和 2D 图像分割所需的全部信息。

(1) 实现多任务输出

物体检测包括 2D 框 (以像素为单位)，3D 真实物体尺寸 (以米为单位)，障碍物类别和障碍物相对偏转角 (Alpha Angle 和 KITTI 数据集定义一致)。
物体分割车道线信息，并提供定位模块。

(2) 特征描述模块引入了类似 FPN 的 Encoder 和 Decoder 设计。在原始 Darknet 基础上，加入了更深的卷积层 (feature map size 更小) 同时添加反卷积层，捕捉更丰富图像上下文信息 (context information)。高分辨率多通道特征图，捕捉图像细节 (例如 edge、corner)，深层低分辨率多通道特征图，编码更多图像上下文信息。与 FPN 类似的飞线连接，更好的融合了图像的细节和整体信息。

(3) 降低每层卷积核数目，加快运算速度。我们发现卷积核数目减半，实验中准确率基本不变。

物体检测最终输出包括 2D 框 (以像素为单位)，3D 真实物体尺寸 (以米为单位)，障碍物类别和障碍物相对偏转角 (Alpha Angle 和 KITTI 数据集定义一致) 等信息。
和 YOLO V2 算法一样，我们在标注样本集中通过聚类，产生一定数目的锚模板，去描述不同类别、不同朝向、不同大小的障碍物。例如对小轿车和大货车，我们会定义不同的锚模板，去描述它们的实际物理尺寸。

intrinsic [ɪn'trɪnsɪk]：adj. 本质的，固有的

为什么要去训练、预测这些参数呢？
相机成像的原理，针孔相机 (pinhole camera) 通过投影变换，可以将三维 camera 坐标转换为二维的图像坐标。这个变换矩阵解释相机的内在属性，称为相机内参 (camera intrinsic)。

pinhole ['pɪnhəʊl]：n. 针孔，小孔

对任意一个相机坐标系下的障碍物的 3D 框，我们可以用它的中心点 $T = \{X, Y, Z\}$ ，长宽高 $D = \{L, W, H\}$ ，以及各个坐标轴方向上的旋转角 $R = \{ϕ, φ, θ\}$ 来描述。这种 9 维的参数描述和 3D 框 8 点的描述是等价的，而且不需要冗余的 8 x 3 个坐标参数来表示。

对一个相机坐标系下 3D 障碍物，通过相机内参，可以投射到 2D 图像上，得到 2D 框 $c_x, c_y, h, w]$ 。从图中可以看到，一个障碍物在相机下总共有 9 维 3D 描述和 4 维 2D 描述，他们之间通过相机内参矩阵联系起来。

只通过 2D 框 $c_x, c_y, h, w]$ 是没有办法还原成完整的 3D 障碍物信息的。

3. 训练预测参数的设计

通过神经网络直接预测 3D 障碍物的 9 维参数，比较困难，尤其是预测障碍物 3D 中心点坐标。根据几何学来设计到底要训练预测哪些参数。

(1) 利用地面平行假设，我们可以降低所需要预测的 3D 参数。

我们假设 3D 障碍物只沿着垂直地面的坐标轴有旋转，而另外两个方向并未出现旋转，即只有 yaw 偏移角，剩下的 pitch 和 roll 均为 0。
障碍物中心高度和相机高度相当，所以可以简化认为障碍物的 $Z = 0$ 。

翻滚 - roll - 翻滚角
俯仰 - pitch - 俯仰角
绕 Z 轴左右旋转 (偏摆 - yaw - 偏航角)

从右图可以看到，现在只有 6 维 3D 信息需要预测，但没有办法避免预测中心点坐标 X 和 Y 分量。

yaw [jɔː]：n. (火箭、飞机、宇宙飞船等) 偏航 vt. 使...偏航 vi. 偏航
pitch [pɪtʃ]：vi. 倾斜，投掷，搭帐篷，坠落 vt. 投，掷，定位于，用沥青涂，扎营，向前倾跌 n. 沥青，音高，程度，树脂，倾斜，投掷，球场
roll [rəʊl]：vt. 卷，滚动，转动，辗 vi. 卷，滚动，转动，起伏，摇晃 n. 卷，卷形物，名单，摇晃
leverage ['liːv(ə)rɪdʒ; 'lev(ə)rɪdʒ]：n. 手段，影响力，杠杆作用，杠杆效率 v. 利用，举债经营

principle ['prɪnsɪp(ə)l]：n. 原理，原则，主义，道义，本质，本义，根源，源泉

(2) 利用成熟的 2D 障碍物检测算法，准确预测出图像上 2D 障碍物框 (以像素为单位)。
(3) 对 3D 障碍物里的 6 维描述，可以选择训练神经网络来预测方差较小的参数，例如障碍物的真实物理大小，因为一般同一类别的障碍物的物理大小不会出现量级上的偏差 (车辆的高度一般在 2-5 米之间，很少会出现大幅变化)。而 yaw 转角也比较容易预测，跟障碍物在图像中的位置关系不大，适合通用物体检测框架来训练和预测。实验中亦证明此项。

现在唯一没有训练和预测的参数就是障碍物中心点相对相机坐标系的偏移量 X 分量和 Y 分量。需要注意的是障碍物离相机的物理距离 $distance = sqrt(X^2 + Y^2)$ 。所以得到 X 和 Y，就可以得到障碍物离相机的真实距离，这是单目测距的最终要求之一。

mature [mə'tʃʊə]：adj. 成熟的，充分考虑的，到期的，成年人的 vi. 成熟，到期 vt. 使...成熟，使...长成

实现单目摄像头的 3D 障碍物检测需要完成以下两部分。
(1) 训练网络，并预测出大部分参数。

图像上 2D 障碍物框预测，因为有对应的大量成熟算法文献。
障碍物物理尺寸，因为同类别内方差较小。
不被障碍物在图像上位置所影响，并且通过图像特征 (appearance feature) 可以很好解释的障碍物 yaw 偏转角。

(2) 通过图像几何学，来计算出障碍物中心点相对相机坐标系的偏移量 X 分量和 Y 分量。

4. 模型训练与距离测算

模型训练上，我们需要注意一些细节。
(1) 确保标注质量，尤其是 3D 障碍物框。可以借助激光雷达等来辅助标注障碍物尺寸，偏转角等。
(2) 定义合适的损失函数，可以参考 3D Bounding Box Estimation Using Deep Learning and Geometry。
(3) 做好数据增强，避免过拟合。

metrology [mɪ'trɒlədʒɪ]：n. 度量衡，度量衡学

当我们训练好相应的神经网络，输出我们需要的各个参数之后，我们需要考虑的是如何计算出障碍物离摄像头的距离。通过内参和几何学关系，可以链接起图像中 3D 障碍物大小 (单位为像素) 和真实 3D 坐标系下障碍物大小 (单位为米)。

我们采用单视图度量衡 (Single View Metrology) 来解释这个几何关系：任一物体，已知它的长宽高、朝向和距离，则它在图像上的具体形状大小唯一确定；反之亦然。

房屋的支撑柱，大小高度完全相同，但是处于图像的不同位置，所占用的像素、长宽都有差别。

基于单视图度量衡，我们可以建立一个哈希查询表 (lookup table)，去根据物体图像尺寸、物理尺寸和朝向角来查询物体的距离。

对于每种障碍物，我们根据它的平均 (或单位) 尺寸，去建立查询表，覆盖 360 度 yaw 角的变化，来映射不同的距离。(例如 2D 框的 25 像素高，yaw 角为 30 度，则它的距离为 100 米等等)。图中示例了一个小轿车在不同距离下、不同偏转角 yaw angle 情况下，在图像上的显示。

adorable [ə'dɔːrəb(ə)l]：adj. 可爱的，可敬重的，值得崇拜的
wisely ['waɪzli]：adv. 明智地，聪明地，精明地

对于这样一个简单的算法，速度上可以达到 0.07 毫秒 / 每帧图像。而在准确率上，我们分别在 KITTI 数据集和 Apollo 内部数据集上做了评测。在 KITTI 上取得了很好的效果，0-30 米内障碍物误差大概在 1 米左右。随着距离增大，误差会增大，但是最终误差不超过 8%。

在 Apollo 数据集上，这个简单算法也取得了不错的效果。最大误差不超过 6%。

monocular [mə'nɒkjʊlə]：adj. 单眼的，单眼用的
calibration [kælɪ'breɪʃ(ə)n]：n. 校准，刻度，标度

Apollo 中单目摄像头下的障碍物检测流程图：输入单幅图像，预测大部分参数；基于单视图度量衡，我们可以预测出剩余的参数距离和中心点坐标。

Apollo 中单目摄像头下的障碍物检测稳定快速，对繁忙路段和高速场景都可以适配，检测速度在 30Hz 以上。

Apollo 中单目摄像头下的障碍物算法已经成功入库到 Apollo 2.5 和 Apollo 3.0，并在 CIDI 等项目中使用。

Changsha Intelligent Driving Institute，CiDi：长沙智能驾驶研究院有限公司，希迪智驾
High-Dynamic Range，HDR：高动态范围图像
Low-Dynamic Range，LDR：低动态范围图像

在车辆颠簸的情况下，相机内参基本不会发生变化，而外参可以借助在线标定 (online calibration) 得到的实时外参，提高单目测距的准确性。

单目测距的原理：
(1) 单孔成像原理 (借助内外参矩阵的帮助)。
(2) 单视图度量衡 (Single View Metrology)。
Mobileye 的测距是比较精准的，基本原理类似。
运动物体测距准确，这是考虑了上下帧的关联性 (tracking)。tracking 本身会修正物体的朝向，真实速度等等。这些都会进一步提高单目测距准确率。
IOS 12 AR 测距原理可能是利用 depth from focus/defocus 的方法，拍摄多张不同聚焦深度的图片，然后利用多张图片进行深度估计，有一定的借鉴意义。
NVIDIA®DRIVE™PX2 是开放式人工智能车辆计算平台，它可以让汽车制造商和一级汽车制造供应商加速产品的自主化和无人驾驶车辆的研发。

数据挖掘本身是一个非常重要的问题，数据挖掘一定是机器学习和人工标注的一个很好的平衡。利用一定量的标注数据，去训练一个基础模型，通过基础模型去海量数据中挖掘置信度高的样本，并添加到原始数据中再次训练，拿到新模型。不停的迭代模型，并随机挑选一些图像，进行人工验证，把错检或误检的数据 (hard example) 标注，来进一步更新模型。这个方式要注意的就是平衡人工标注和自动挖掘的数量。在合理成本下得到最多最优质的标注数据 (来自机器或人工标注)。

无人车感知是一个多传感器融合的复杂系统，单目是一个很好的方式，但它有自己明显的问题，例如依赖训练样本。对无法识别的障碍物，我们需要依赖激光雷达和多普勒雷达来进行检测，这些传感器本身测距非常准确。这些传感器与相机的融合，会极大提高单目测距的准确性。

模型的训练依赖于数据的高质量、损失函数的设计、数据增强的实现等等。最初的算法验证可以借助 KITTI 或者 Apollo 开放的一些训练集来实现 (如 ApolloScape)。

算法复杂度和摄像头内置芯片的计算能力、功耗之间的博弈。从原始算法验证的角度，工控机来负责运算更灵活一些，因为摄像头选配等等需要实验。当相机硬件定型，算法定型之后，我们可以考虑更高效的模型加速，算法固化到硬件等等方式，降低功耗，并集成到摄像机模块里，成为 smart camera。

随着距离的增加，测距精度会降低。需要其它传感器帮助，或者借助 tracking 来提高预测精度。传感器融合是感知最重要的核心思想。不同传感器要求挖掘自身优势，并认知自身劣势，达到相互弥补。摄像头测距的精度是远不如激光雷达，多普勒雷达的，这是传感器物理属性所致。

图像预处理 gain control 和 tone mapping 有效避免阳光直射造成摄像头的眩光。
3D BBOX 会稳定显示在图像中，但我们目的主要是问题的测距、测角度、测障碍物大小和速度。

如果物体有遮挡，我们要求神经网络能预测出遮挡程度 (百分比)，并根据遮挡的情况，去给出更准确的距离判断。

可以依据传统视觉进行帧与帧之间匹配，建立合适的物体跟踪模型，找到障碍物的位移，进而推断出障碍物的速度和加速度。单帧图像无法预测速度和加速度。

算法输入为 RGB，对像素大小没有特别偏好。1080P、720P 或者类似的大小都可以。

通过相机到激光雷达的标定矩阵，可以在 2D 和 3D 点云中进行点到点的坐标转换。通过标注激光点云，我们可以便利的得到物体尺寸和偏角。

测量精度随距离增大而降低，这是 camera 本身的问题。可以借助长焦相机，或者通过和多普勒雷达融合，得到精准的距离估算。

目前算法基本依赖内参标定，一般不会出现标定很差的情况。

YOLO 3D 目前识别大概七大类，包括车、人、自行车、交通锥桶等常见的路面上障碍物。路灯，树木测距不在涵盖范围内。

查询表，可以定义单位标尺 (例如在图像某个 2d 位置上，高 1 米的障碍物在图像上有多高)。通过单位标尺对应的像素数目，可以快速查到车的真实高度等。

标定的参数和车辆已经和传感器相关联，可以使用 Apollo 标定服务，快速标定。

车灯有检测，但准确率不能做到极高，不是强前提。

毫米波雷达只给了较为粗略的类别识别，在融合时基本不占权重，不会影响最终结果。

可以使用大规模开源的 Apollo Scope 做一些研发。

锚都是通过非监督学习的聚类方式生成，不是手工设计或者直接 CNN 学出。

颠簸的影响可以通过在线标定来解决。平面假设只是为了物体的测距，这种情况下，其它传感器的融合辅助测距是必不可少的步骤。

左右的对称翻转是有意义的，而上下是不会翻转的。

预测这些参数是为了测距服务，测距的误差大概在 6% ~ 8%，在之后的融合中，借助 radar 的准确测距，可以弥补这些误差。。

室内低速，建议使用双目测距。不受障碍物类别等限制，而且不需要大量训练数据。

在地面有较大坡度不平的场景，单目 camera 的检测结果在传感器融合处理时，参考会相应的降低。但是融合时是做 graph-graph 间的匹配。不需要过分担心融合时摄像头的准确率问题。

在公开数据集上区分度最好的模型，在真实业务场景下表现不好，甚至很差，可能需要采集一些新的数据，做模型的再训练，微调。

车道线来校准，两条平行线无穷远处相交。通过车道线等信息，可以帮助我们在线调整传感器标定。

摄像头高度和障碍物不一致时，只要能在摄像头中观测到障碍物，测距都不受影响。

未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
边缘计算在现代数据中心的应用 666IDCaaa 边缘计算人工智能
当今数字化时代，数据中心扮演着至关重要的角色，而边缘计算的出现为现代数据中心带来了新的机遇和挑战。一、边缘计算的概念与特点边缘计算是一种将计算和数据存储靠近数据源或用户的分布式计算模式。与传统的集中式云计算相比，边缘计算具有以下特点：低延迟：由于数据处理在靠近数据源的地方进行，减少了数据传输的距离和时间，从而实现了更低的延迟。这对于实时性要求高的应用，如工业自动化、自动驾驶、虚拟现实等至关重要。高
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
机器学习与深度学习的区别 eqa11 机器学习
文章目录机器学习与深度学习的区别一、引言二、机器学习概述1、机器学习定义1.1、机器学习的应用2、机器学习算法三、深度学习概述1、深度学习定义1.1、深度学习的应用2、深度学习算法四、机器学习与深度学习的区别1、学习方法2、数据需求3、应用领域五、总结机器学习与深度学习的区别一、引言在人工智能的浪潮中，机器学习和深度学习无疑是最耀眼的两颗明星。它们在许多领域都取得了令人瞩目的成就，从自动驾驶汽车到
GaN HEMT：未来功率半导体 David WangYang 硬件工程
硅基金属氧化物自1960年代以来，硅基金属氧化物半导体场效应晶体管（MOSFET）一直是电力电子应用的标准。尽管如此，各种技术的发展（尤其是在汽车和消费电子领域）给寻求以越来越小的外形尺寸提供更高效率和更大功率密度的开发人员带来了新的挑战。从大型数据中心和墙壁插座交流适配器到汽车车载充电站，各种用途的电源都需要高电压，同时尽可能少地占用宝贵的电路板空间。自动驾驶汽车还需要更高效的能量分配，以运行越
Python编码系列—Python团队开发工作流：高效协作的艺术学步_技术 Python编码 python 团队开发开发语言
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
大模型实战—Ollama 本地部署大模型猫猫姐大模型大模型
Ollama本地部署大模型在当今的科技时代，AI已经成为许多领域的关键技术。AI的应用范围广泛，从自动驾驶汽车到语音助手，再到智能家居系统，都有着AI的身影，而随着Facebook开源LLama2更让越来越多的人接触到了开源大模型。今天我们推荐的是一条命令快速在本地运行大模型，在GitHub超过22KStar的开源项目：ollama随着围绕着Ollama的生态走向前台，更多用户也可以方便地在自己电
信息安全国内外现状及技术要求示例（R155/R156） mini积木信息安全安全 mcu
国际政策、法规的现状与趋势鉴于对交通安全、社会安全甚至国家安全的重要影响，汽车网络安全、数据安全得到各相关国家和地区的高度重视，纷纷出台相关法规、标准。信息安全法规R155法规适用范围覆盖了乘用车及商用车，适用于M类、N类车型，装备了至少一个ECU的O类车型，以及具备L3及以上自动驾驶功能的L6和L7类车型。此法规适合于1958协议国（包括欧洲、日本、俄罗斯、澳大利亚等）。根据欧盟要求，从2022
探秘3D UNet-PyTorch：高效三维图像分割利器鲍凯印Fox
探秘3DUNet-PyTorch：高效三维图像分割利器在医学影像处理、计算机视觉和自动驾驶等领域，三维图像的理解与分析至关重要。而是一个基于PyTorch实现的深度学习模型，专为三维图像分割任务设计。本文将深入剖析该项目的技术细节，应用场景及特性，以期吸引更多的开发者和研究人员参与其中。项目简介3DUNet是2DUNet的三维扩展，其结构保持了卷积神经网络的对称性，采用跳跃连接的方式保留了不同尺度
整车级SOA软件架构的革新踏马潜行智能驾驶-传感器SOA SOA 软件革新
在汽车行业，自动驾驶技术正成为创新的主要驱动力。为了满足日益增长的技术需求，整车级SOA（Service-OrientedArchitecture）软件架构正逐渐成为下一代自动驾驶系统的关键组成部分。SOA是一种设计方法论，它将系统划分为相互独立的服务，这些服务可以单独开发、部署和重复使用，从而实现软件的高内聚、低耦合。在传统的汽车软件架构中，软件通常被直接嵌入到硬件中，这导致了软件的可扩展性和可
论文笔记—NDT-Transformer: Large-Scale 3D Point Cloud Localization using the Normal Distribution Transfor 入门打工人笔记 slam 定位算法
论文笔记—NDT-Transformer:Large-Scale3DPointCloudLocalizationusingtheNormalDistributionTransformRepresentation文章摘要~~~~~~~在GPS挑战的环境中，自动驾驶对基于3D点云的地点识别有很高的要求，并且是基于激光雷达的SLAM系统的重要组成部分（即闭环检测）。本文提出了一种名为NDT-Transf
汽车智能驾驶算法汇总芊言芊语汽车算法
汽车智能驾驶算法是自动驾驶技术的核心，它们集成了多个学科的知识，包括计算机视觉、机器学习、控制理论、路径规划等。以下是对汽车智能驾驶算法的一个详细汇总，内容分为几个关键部分进行阐述。一、计算机视觉算法计算机视觉是智能驾驶算法中用于识别和理解环境的关键技术。它主要包括图像处理、特征提取和对象识别等步骤。图像处理：通过摄像头等设备获取车辆前方的图像，然后进行预处理，如灰度化、二值化、滤波等操作，以提高
2023-08-15《苏东坡》纪录片1 每天坚持
20230815四点三十七星期二《苏东坡》纪录片1昨天上午把儿女妻送到龙门高铁站，我就回来了，开的是孩子姨家的油电混用的新能源车，电还没有用完，感觉新能源车真的是很省油，将来要是能自动驾驶能普及的话这个社会会有很大的进步。昨天中午在老城吃一碗凉皮，去对面吃了一点卤猪肉，下午睡到天黑，中间爹来，今天爸妈准备出院，晚上吃了油皮面和豆腐皮，油泼面现在涨价到八元了，吃过饭之后去领鸡蛋。昨天晚上我开的空调应
基于深度学习的动态场景理解 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的动态场景理解是一种通过计算机视觉技术自动分析和解释动态环境中物体、事件和交互的能力。该技术在自动驾驶、智能监控、机器人导航、增强现实等领域有着广泛应用，通过深度学习模型，特别是卷积神经网络（CNNs）、递归神经网络（RNNs）、图神经网络（GNNs）等，对复杂动态场景进行实时解读。1.动态场景理解的核心技术1.1卷积神经网络（CNNs）**卷积神经网络（CNNs）**擅长处理图像数据
(游戏设计草稿) 《外卖员模拟器》 (3D 科幻角色扮演开放世界 AI VR) 穷人小水滴游戏人工智能科幻 vr 元宇宙
游戏名称:外卖员模拟器.游戏类型:3D,科幻,角色扮演(RPG),开放世界,AI,VR.游戏的主要目的:技术测试/验证.1文案(超低空科幻流派)2030年,基于AI(人工智能)的自动驾驶和人形机器人技术已经大规模普及使用,但是AI的能力遭遇了瓶颈,AI只能解决99%的问题,而对于这最后1%的问题,却无论如何也解决不了,仍然需要人工处理.你是一个25岁的年轻人,居住在城市郊区破败的贫民窟.但是生活并
7. 深度强化学习：智能体的学习与决策 Network_Engineer 机器学习学习机器学习深度学习神经网络 python 算法
引言深度强化学习结合了强化学习与深度学习的优势，通过智能体与环境的交互，使得智能体能够学习最优的决策策略。深度强化学习在自动驾驶、游戏AI、机器人控制等领域表现出色，推动了人工智能的快速发展。本篇博文将深入探讨深度强化学习的基本框架、经典算法（如DQN、策略梯度法），以及其在实际应用中的成功案例。1.强化学习的基本框架强化学习是机器学习的一个分支，专注于智能体在与环境的交互过程中，学习如何通过最大
【IT】软件行业发展的前瞻性和希望的广度天若有情673 人工智能
我说一下我对程序应用的一个看法就是我其实个人不太建议自动驾驶技术的发展因为这个东西它说到底还是什么那么一点安全隐患，虽然我们平常考虑用同时实行各种各样的高级的自动作用，但是自动驾驶可能是个特例，其实我个人觉得程序可以在以下方面发展1.医学（包括诊断治疗手术等）因为现在也有很多的疾病是医学还没有能力去解决的，2.国防有的时候因为国家安全真的非常重要的，因为我们每个人都希望有一个国泰民安的和平环境.3
【关于车载测试的基础知识的认知详解】 @逝水流年轻染尘@ 门控循环单元车载系统汽车 51单片机
目录一、目前车企的趋势1.电动化：2.自动驾驶技术：3.车联网（ConnectedCars）：4.智能化和数字化：5.安全性：6.轻量化：7.个性化和定制化：8.供应链和制造创新：9.法规和政策：10.竞争格局变化：二、汽车域控的介绍1.动力域（PowertrainDomain）：2.底盘域（ChassisDomain）：3.车身域（BodyDomain）：4.座舱域（CockpitDomain）
车载测试| 汽车的五域架构（含线控技术知识） squirrel快乐敲码汽车架构
汽车的五域架构是一种将汽车电子控制系统按照功能进行划分的架构模式，主要包括动力域、底盘域、座舱域、自动驾驶域和车身域。（汽车三域架构通常是指将汽车电子系统划分为三个主要领域：动力域、底盘域和智能座舱域（或车身舒适域））以下是对这五个域的详细介绍：1、**动力域**：**功能**：动力域控制器是智能化的动力总成管理单元，主要功能包括对多种动力系统单元（如内燃机、电动机/发电机、电池、变速箱等）进行计
第15篇运用指挥家思维模型开发自动驾驶算法墨客云开
如何带领一个团队共同开发一项自动驾驶功能，问题边界和指挥家问题边界是相似的，首先，各个算法工程师都是在有明确边界下的内部协作，共同开发一个新功能；其次，最终集成后呈现的功能是前期可调试测试的。第一，要抓住“功能应用边界”关键点和指挥家一样，算法团队的负责人无法做到精通每一个子技术领域的算法，但却需要把控好整个团队的工作方向。感知，决策，控制，每一个子领域的算法开发都有解决不完的问题，团队负责人要做
一文让你搞懂什么是AI大模型码上飞扬人工智能大模型 AI
近年来，人工智能（AI）技术飞速发展，特别是大模型的出现，给各行各业带来了巨大的变革。无论是自然语言处理、图像识别，还是自动驾驶，AI大模型都展现出了强大的能力和广泛的应用前景。那么，什么是AI大模型？它们有哪些特点和应用场景？本文将带你一探究竟。目录AI大模型的定义AI大模型的发展历程AI大模型的特点AI大模型的应用场景如何训练和使用AI大模型AI大模型的挑战与未来1.AI大模型的定义AI大模型
数据分析-13-时间序列异常值检测的类型及常见的检测方法皮皮冰燃数据分析数据分析
参考时间序列异常值的分类及检测参考异常值数据预警分析1时间序列异常的类型时间序列异常检测是数据处理和分析的重要环节，广泛应用于量化交易、网络安全检测、自动驾驶汽车和大型工业设备日常维护等领域。在时间序列数据中，异常通常指的是与正常数据模式显著不同的数据点，可能由系统故障、错误或外部干扰引起。异常数据，也称为离群点，是指在数据集中与其他数据点明显不同的样本。这些数据点往往不符合预期的模式或行为，可能
比亚迪方程豹携手华为乾崑智驾，开放合作，加速中国智驾技术向前科技真优趣汽车
在智能化领域，比亚迪很早就开始布局，在行业最早提出“上半场是电动化、下半场是智能化”。当前，比亚迪L2级智能驾驶搭载量已突破350万，智驾数据基座稳居全球第一梯队。同时，比亚迪是获得全国第一张高快速路段有条件自动驾驶（L3级）测试牌照，也是国内首批获得L3准入的车企。比亚迪拥有超四千名工程师的智驾研发队伍，构建起一套全栈自研的智驾研发体系，研发实力稳居行业第一梯队。比亚迪全栈自研的“天神之眼”高阶
Python编码系列—Python项目架构的艺术：最佳实践与实战应用学步_技术 Python编码 python 架构开发语言
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
你不开车，车可不会自己走小斌哥ge 了解AI 人工智能自动驾驶
你不开车，车可不会自己走前言《人工不智能：计算机如何误解世界》由美国人工智能专家、数据记者梅瑞狄斯·布鲁萨德著。我看这本书已有很长一段时间，当时书中对自动驾驶的分析让我印象深刻，如自动驾驶的分级、电车难题等。2024年5月份，我国某互联网公司在一座一线城市发布和上线了最新版的自动驾驶汽车，他们自称新发布的大模型支持L4级自动驾驶。这次上线确实为乘客提供了出行服务，不是“即将推出”、不是“将来会有一
支持萝卜快跑：AI能否颠覆出租车与外卖行业？ ai_xiaogui 人工智能
在人工智能技术快速发展的背景下，自动驾驶技术正在逐步渗透到各行各业，其中最为人瞩目的莫过于出行和餐饮配送领域。萝卜快跑作为一个代表性的自动驾驶项目，引发了广泛的讨论。本文将探讨AI技术在出租车和外卖送餐行业的应用前景，并邀请持不同意见的朋友提出他们的观点，以期达成共识。一、引言简述AI技术的发展及其在交通和餐饮配送领域的应用。引出文章主题——萝卜快跑项目及其对传统行业的潜在影响。二、萝卜快跑项目简
基于Frenet坐标系的无人车路径规划：ROS实现与Python程序详解快撑死的鱼算法杂谈 python算法解析硬件算法实践 python 开发语言
基于Frenet坐标系的无人车路径规划：ROS实现与Python程序详解前言在自动驾驶和无人车技术快速发展的今天，路径规划是实现车辆自主行驶的核心技术之一。本文将详细介绍基于Frenet坐标系的无人车路径规划，并结合ROS（RobotOperatingSystem）和Python程序进行实现。通过系统的讲解和实例代码，帮助读者深入理解这一技术，并能够在实际项目中应用。Frenet坐标系简介什么是F
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

基于单目摄像头的物体检测 - Baidu Apollo 陈光 - 2D 图像上的 3D 目标检测

基于单目摄像头的物体检测 - Baidu Apollo 陈光 - 2D 图像上的 3D 目标检测

1. 物体检测模型中的算法选择

2. 单目摄像头下的物体检测神经网络

3. 训练预测参数的设计

4. 模型训练与距离测算

你可能感兴趣的:(autonomous,driving,-,自动驾驶)