笑扬轩逸

【读书笔记】第一本无人驾驶技术书笔记汇总 1

作者简介：
吴双，原百度研究院硅谷人工智能实验室高级研究员，百度美国研发中心高级架构师。美国南加州大学物理博士，加州大学洛杉矶分校博士后，研究方向包括计算机和生物视觉，互联网广告算法，互联网文本和视频的推荐系统，语音识别和自然语言处理，曾在NIPS等国际会议中发表文章。
刘少山，PerceptIn联合创始人。加州大学欧文分校计算机博士，研究方向包括智能感知计算、系统软件、体系结构与异构计算。现在PerceptIn主要专注于SLAM技术及其在智能硬件上的实现与优化。曾在百度美国研发中心负责百度无人车系统架构与产品化。

2. 光学雷达在无人驾驶技术中的应用

无人驾驶汽车的成功涉及高精地图、实时定位以及障碍物检测等多项技术，而这些技术都离不开光学雷达（LiDAR）。本文将深入解析光学雷达是如何被广泛应用到无人车的各项技术中。文章首先介绍光学雷达的工作原理，包括如何通过激光扫描出点云；然后详细解释光学雷达在无人驾驶技术中的应用，包括地图绘制、定位以及障碍物检测；最后讨论光学雷达技术目前面临的挑战，包括外部环境干扰、数据量大、成本高等问题。

在实际应用中，LiDAR也面临着许多挑战，包括技术（空气中悬浮物）、计算性能以及价格挑战。要想把无人车系统产品化，我们必须解决这些问题。

3. GPS及惯性传感器在无人驾驶中的应用

本文是无人驾驶技术系列的第五篇，着重于GPS以及惯性传感器在无人驾驶中的应用。GPS是当前行车定位不可或缺的技术，但是由于GPS的误差、多路径以及更新频率低等问题，我们不能只依赖于GPS进行定位。惯性传感器（IMU）是可以检测加速度与旋转运动的传感器。基础的惯性传感器包括加速度计与角速度计。惯性传感器拥有很高的更新频率，可以跟GPS形成互补。而使用传感器融合技术，我们可以融合GPS与惯性传感器数据，各取所长，以达到较好的定位效果。

4. 基于计算机视觉的无人驾驶感知系统

本章节里，作者首先介绍了KITTI的数据集，用来作为基于计算机视觉的无人驾驶感知方案的算法验证。之后又介绍了无人驾驶感知方面的三个研究内容：光流（Optical Flow）和立体视觉、物体的检测和跟踪以及视觉里程计算法。

Optical Flow和立体视觉

在今年6月于美国拉斯维加斯召开的CVRP大会上，多伦多大学的Raquel Urtasun教授和她的学生改进了深度学习中的Siamese网络，用一个内积层代替了拼接层，把处理一对图片的时间从一分钟左右降低到一秒以内。

Siamese结构的深度神经网络

如图所示，这个Siamese结构的深度神经网络分左右两部分，各为一个多层的卷积神经网络（CNN），两个CNN共享网络权重。Optical Flow的偏移矢量估计问题转化为一个分类问题，输入是两个9x9的图片块，输出是128或者256个可能的偏移矢量y。通过从已知偏移矢量的图片对中抽取的图片块输入到左右两个CNN，然后最小化交叉熵（cross-entropy）：

我们可以用监督学习的方法训练整个神经网络。

i是像素的指标。
y_i是像素i可能的偏移矢量。
p_gt是一个平滑过的目标分布，用来给一两个像素的预估误差反馈一个非0的概率，gt表示ground truth。
p_i (y_i,w)是神经网络输出的给定w时y_i的概率。

在KITTI的Stereo2012数据集上，这样一个算法可以在0.34秒完成计算，并达到相当出色的精度，偏移估计误差在3-4像素左右，对大于3像素的偏移估计误差在8.61像素，都好于其他速度慢很多的算法。

在得到每个像素y_i上的分布后，我们还需要加入空间上的平滑约束，这篇文章试验了三种方法：

最简单直接的5x5窗口平均。
加入了相邻像素一致性的半全局块匹配（Semi Global Block Matching，SGBM）。
超像素+3维斜面。

这些平滑方法一起，能把偏移估计的误差再降低大约50%，这样一个比较准确的2维偏移矢量场就得到了。基于它，我们就能够得到如图8所示场景3维深度/距离估计。这样的信息对无人驾驶非常重要。

深度信息图

物体的识别与追踪

从像素层面的颜色、偏移和距离信息到物体层面的空间位置和运动轨迹，是无人车视觉感知系统的重要功能。无人车的感知系统需要实时识别和追踪多个运动目标（Multi-ObjectTracking，MOT），例如车辆和行人。物体识别是计算机视觉的核心问题之一，最近几年由于深度学习的革命性发展，计算机视觉领域大量使用CNN，物体识别的准确率和速度得到了很大提升，但总的来说物体识别算法的输出一般是有噪音的：物体的识别有可能不稳定，物体可能被遮挡，可能有短暂误识别等。自然地，MOT问题中流行的Tracking-by-detection方法就要解决这样一个难点：如何基于有噪音的识别结果获得鲁棒的物体运动轨迹。在ICCV 2015会议上，斯坦福大学的研究者发表了基于马尔可夫决策过程（MDP）的MOT算法来解决这个问题，下面我们就详细介绍这个工作。

运动目标的追踪用一个MDP来建模（图9）：

图9 DMM状态图

运动目标的状态：s∈S=S_active∪S_tracked∪S_lost∪S_inactive,这几个子空间各自包含无穷多个目标状态。被识别到的目标首先进入active状态，如果是误识别，目标进入inactive状态，否则进入tracked状态。处于tracked状态的目标可能进入lost状态，处于lost状态的目标可能返回tracked状态，或者保持lost状态，或者在足够长时间之后进入inactive状态。
作用a∈A，所有作用都是确定性的。
状态变化函数T:S×A→S定义了在状态s和作用a下目标状态变为s'。
奖励函数R:S×A→R定义了作用a之后到达状态s的即时奖励，这个函数是从训练数据中学习的。
规则π:S→A决定了在状态s采用的作用a。

如图10，这个MDP的状态空间变化如下：

图10 状态转换实例

在active状态下，物体识别算法提出的物体候选通过一个线下训练的支持向量机（SVM），判断下一步的作用是a_1还是a_2，这个SVM的输入是候选物体的特征向量，空间位置大小等，它决定了在S_active中的MDP规则π_active。
在tracked状态下，一个基于tracking-learning-detection追踪算法的物体线上外观模型被用来决定目标物体是否保持在tracker状态还是进入lost状态。这个外观模型（appearance model）使用当前帧中目标物体所在的矩形（bounding box）作为模板（template），所有在tracked状态下收集的物体外观模板在lost状态下被用来判断目标物体是否回到tracked状态。另外在tracked状态下，物体的追踪使用上述外观模型模板，矩形范围内的Optical Flow和物体识别算法提供的候选物体和目标物体的重合比例来决定是否保持在tracked状态，如果是，那么目标物体的外观模板自动更新。
在lost状态下，如果一个物体保持lost状态超过一个阈值帧数，就进入inactive状态；物体是否返回tracked状态由一个基于目标物体和候选物体相似性特征向量的分类器决定，对应了S_lost中的π_lost。

这个基于MDP的算法在KITTI数据集的物体追踪评估中达到了业界领先水平。

视觉里程计算法

基于视觉的定位算法有两大分类：一种是基于拓扑与地标的算法，另一种是基于几何的视觉里程计算法。基于拓扑与地标的算法把所有的地标组成一个拓扑图，然后当无人车监测到某个地标时，便可以大致推断出自己所在的位置。基于拓扑与地标的算法相对于基于几何的方法容易，但是要求预先建立精准的拓扑图，比如将每个路口的标志物做成地标。基于几何的视觉里程计算法计算比较复杂，但是不需要预先建立精准的拓扑图，这种算法可以在定位的同时扩展地图。以下着重介绍视觉里程计算法。

视觉里程计算法主要分为单目以及双目两种，纯单目的算法的问题是无法推算出观察到的物体的大小，所以使用者必须假设或者推算出一个初步的大小，或者通过与其它传感器（如陀螺仪）的结合去进行准确的定位。双目的视觉里程计算法通过左右图三角剖分（Triangulation）计算出特征点的深度，然后从深度信息中推算出物体的大小。图11展示了双目视觉里程计算法的具体计算流程：

图11 双目视觉里程计算法的计算流程

双目摄像机抓取左右两图。
双目图像经过Triangulation产生当前帧的视差图（Disparity Map）。
提取当前帧与之前帧的特征点，如果之前帧的特征点已经提取好了，那么我们可以直接使用之前帧的特征点。特征点提取可以使用Harris Corner Detector。
对比当前帧与之前帧的特征点，找出帧与帧之间的特征点对应关系。具体可以使用随机抽样一致（RANdom Sample Consensus，RANSAC）算法。
根据帧与帧之间的特征点对应关系，推算出两帧之间车辆的运动。这个推算是最小化两帧之间的重投影误差（Reprojection Error）实现的。
根据推算出的两帧之间车辆的运动，以及之前的车辆位置，计算出最新的车辆位置。

通过以上的视觉里程计算法，无人车可以实时推算出自己的位置，进行自主导航。但是纯视觉定位计算的一个很大问题是算法本身对光线相当敏感。在不同的光线条件下，同样的场景不能被识别。特别在光线较弱时，图像会有很多噪点，极大地影响了特征点的质量。在反光的路面，这种算法也很容易失效。这也是影响视觉里程计算法在无人驾驶场景普及的一个主要原因。一个可能的解决方法，是在光线条件不好的情况下，更加依赖根据车轮以及雷达返回的信息进行定位。

5. 卷积神经网络（CNN）在无人驾驶中的应用

无人驾驶双目3D感知

在无人车感知中，对周围环境的3D建模是重中之重。激光雷达能提供高精度的3D点云，但密集的3D信息就需要摄像头的帮助了。人类用两只眼睛获得立体的视觉感受，同样的道理能让双目摄像头提供3D信息。假设两个摄像头间距为B，空间中一点P到两个摄像头所成图像上的偏移（disparity）为d，摄像头的焦距为f，那么我们可以计算P点到摄像头的距离为：

所以为了感知3D环境得到z，需要通过双目摄像头的两张图像I_l和I_r得到d，通常的做法都是基于局部的图片匹配：

由于单个像素的值可能不稳定，所以需要利用周围的像素和平滑性假设d(x,y)≈d(x+α,y+β)（假设α和β都较小），所以求解d变成了一个最小化问题：

这和optical flow任务想要解决的是非常类似的问题，不过是（Il，Ir）变成了（It ，It+1），所以下面将要介绍的算法，两者都适用。

MC-CNN

现在来看看Matching-Cost CNN算法，这个算法使用了一个CNN来计算上式的右侧matchingcost，MC-CNN的网络结构见图1。

图1 MC-CNN的网络结构

这个网络的输入是两个图片的一小块，输出是这两块不匹配的概率，相当于一个cost函数，当两者匹配时为0，不匹配时最大可能为1。通过对一个给定的图片位置搜索可能的d取值，找到最小的CNN输出，就得到了这一点局部的偏移估算。MC-CNN算法接下来做了如下后期处理：

Cross-based cost aggregation：基本思想是对邻近的像素值相似的点的偏移求平均，提高估计的稳定性和精度。
Semi-global matching：基本思想是邻近的点的平移应该相似，加入平滑约束并求偏移的最优值。
插值和图片边界修正：提高精度，填补空白。

最终算法效果如下：

图2 MC-CNN的算法效果

MC-CNN虽然使用了CNN，但仅限于计算匹配程度，后期的平滑约束和优化都是必不可少的，那有没有可能使用CNN一步到位呢？FlowNet就是这样做的。

FlowNet

为了实现端到端的模型结构，需要用CNN实现特征提取，匹配打分和全局优化等功能。FlowNet采取了encoder-decoder框架，把一个CNN分成了收缩和扩张两个部分。

图3 encoder-decoder的框架

在收缩部分FlowNet提出了两种可能的模型结构：

FlowNetSimple：把两幅图片叠起来输入到一个“线性”的CNN中，输出是每个像素的偏移量。这个模型的弱点是计算量大，而且无法考虑全局的优化手段，因为每个像素的输出是独立的。
FlowNetCorr：先对两幅图片分别进行特征的提取，然后通过一个相关层把两个分支合并起来并继续下面的卷积层运算。这个相关层的计算和卷积层类似，只是没有了学习到的特征权重，而是由两个分支得到的隐层输出相乘求和。

图4 FlowNetSimple与FlowNetCorr

FlowNet网络收缩部分不仅减少了CNN的计算量，同时起到了在图像平面上聚合信息的作用，这也导致分辨率下降。于是在FlowNet网络扩张部分使用 “up convolution”来提高分辨率，注意这里不仅使用了上一层的低分辨率输出，还使用了网络收缩部分相同尺度的隐层输出，如图5所示。

图5 FlowNet网络扩张

FlowNet算法在常见的公开数据集上都获得了不错的效果，值得一提的是它的速度很快。

无人驾驶物体检测

物体检测技术是无人驾驶感知必不可少的部分。自从2012年CNN在图片分类问题上的突破，物体检测自然是CNN应用的下一个目标，CNN的物体检测算法层出不穷，我们挑选比较有代表性的几个算法做介绍。

Faster R-CNN

CNN在物体识别领域大行其道之前，通常做法类似于DPM（Deformable Parts Model）这样的解决方案：在图像上抽取局部特征的组合作为模板，比如基于图像的空间梯度的HOG特征；为了能够处理形变，遮挡等变化，我们建立一个“弹性”的结构，把这些“刚性”的部分组合起来；最后加上一个分类器判断物体是否出现。这样的算法一般复杂度较高，需要大量经验，而且改进和优化难度较大。CNN的到来改变了一切。

R-CNN系列算法是一个两段式的算法，它把物体识别这个问题分为：

物体可能所在区域的选择：输入一张图片，由于物体在其中的位置大小有太多可能性，我们需要一个高效的方法找出它们，这里的重点是在区域个数的一定上限下，尽可能找到所有的物体，关键指标是召回率。
候选区域的识别：给定了图片中的一块矩形区域，识别其中的物体并修正区域大小和长宽比，输出物体类别和更“紧”的矩形框。这里重点在识别的精度。

在了解算法的大致架构后，来看看算法的具体实现，这里主要描述R-CNN这一系列算法的最新版：Faster R-CNN，它对应上面两步分为RPN（Region Proposal Network）和Fast R-CNN，接下来分别介绍。

RPN

我们称物体可能所在区域为候选，RPN（Region Proposal Network）的功能是最高效地产生一个候选列表。如图6，RPN选择以CNN为基础，图片通过多个（比如4）卷积层进行特征提取，在最后一个卷积层输出的特征图上使用一个3x3的滚动窗口连接到一个256或者512维的全连接隐层，最后再分支到两个全连接层，一个输出物体类别，一个输出物体的位置大小。为了能够使用不同的物体大小和长宽比，在每一个位置上考虑三个尺度(128x128, 256x256, 512x512)和三个长宽比(1:1, 1:2, 2:1)一共9种组合。这样一个1000x600的图片上考虑了(1000/16) × (600/16) × 9 ≈ 20,000种位置、大小和长宽比的组合，由于使用CNN计算，这一步耗时不多。最后根据空间重叠程度去掉冗余的候选区域，一张图片大约获得2000个左右的物体可能区域。

图6 Region Proposal Network

知乎的马塔同学做了一张图，很容易理解了

Fast R-CNN

在候选区域分类阶段，我们使用的是基于全连接的神经网络，如图7的右侧部分：

而左侧的特征提取部分可以重用RPN中的CNN计算结果，大大节约了计算时间，能达到5-17帧每秒的速度。

图7 Fast R-CNN

当然书中对 Fast R-CNN只是简单提了一下，如果想详细了解，可以参阅知乎的文章：https://zhuanlan.zhihu.com/p/31426458

MS-CNN

虽然Faster R-CNN算法大名鼎鼎，但在物体尺度变化很大的场景，比如无人驾驶，它还有提升的空间，Multi-scale CNN（MS-CNN）正是针对这个问题的尝试。CNN的层级结构由于pooling层的存在自然形成了和不同尺度的一个对应关系。那为什么不把对物体的检测放到CNN的不同层里去呢？这正是MS-CNN的想法。

在选择物体候选区域阶段，MS-CNN使用了图8的网络结构，我们看到如果把CNN网络里的卷积层看成一个大树的“主干”，那么在conv3、conv4和conv5这三个卷积层之后，这个网络都长出了“分支”，每个“分支”都连接了一个检测层，负责一定的尺度范围，这样多个“分支”一起，就能覆盖比较宽的物体尺度范围，达到我们的目的。

在候选区域识别阶段，我们让上一阶段多个检测层的输出特征图分别输入到一个子网络里，这里有几个值得注意的细节：

图8 MS-CNN

第一层是“Deconvolution”，目的是为了提高特征图的分辨率，保证物体检测的准确率，特别是对尺度偏小的物体。
Deconvolution之后，在抽取物体特征时（绿色框），同时还抽取了物体周边的信息（蓝色的框），这些“上下文”信息对识别准确率的提高有明显帮助。

总的来说，MS-CNN和Faster R-CNN相比，优势是识别的准确度有很大提高，尤其在物体尺度变化的情况下，比如KITTI数据集里面的行人和自行车。但是Faster R-CNN还是有速度的优势。

图9 MS-CNN

SSD

虽然Faster R-CNN的速度比之前的R-CNN已有很大提高，但还达不到实时的要求。Single Shot Detector（SSD）就是一个能够实时运行，有更佳准确度的算法，最近人气很高。SSD沿用了滑动窗口的思想，通过离散化物体的位置，大小和长宽比，使用CNN高效计算了各种可能的物体情况，从而达到了高速检测物体的目的。

图10 Single Shot Detector

如图10所示，SSD使用了VGG-16网络来做底层的图片特征提取，通过取消生成候选区域，缩放图片缩放和特征图采样的步骤，一步到位判断物体位置和分类，得到了高速的物体检测算法。

在VGG网络的基础上，SSD加入了逐步变小的卷积层，这些不同尺度的卷积层分别使用3x3大小的卷积核进行物体位置偏移和分类的判断，使SSD能够检测到不同大小的物体。

详细的SSD介绍，请看知乎文章：https://zhuanlan.zhihu.com/p/33544892

当然，现在最火的目标检测的算法是YOLOv3，基本上已经一统江湖了，知乎我是小将的一篇文章讲的蛮仔细的，可以参考：https://zhuanlan.zhihu.com/p/32525231

未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
边缘计算在现代数据中心的应用 666IDCaaa 边缘计算人工智能
当今数字化时代，数据中心扮演着至关重要的角色，而边缘计算的出现为现代数据中心带来了新的机遇和挑战。一、边缘计算的概念与特点边缘计算是一种将计算和数据存储靠近数据源或用户的分布式计算模式。与传统的集中式云计算相比，边缘计算具有以下特点：低延迟：由于数据处理在靠近数据源的地方进行，减少了数据传输的距离和时间，从而实现了更低的延迟。这对于实时性要求高的应用，如工业自动化、自动驾驶、虚拟现实等至关重要。高
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
机器学习与深度学习的区别 eqa11 机器学习
文章目录机器学习与深度学习的区别一、引言二、机器学习概述1、机器学习定义1.1、机器学习的应用2、机器学习算法三、深度学习概述1、深度学习定义1.1、深度学习的应用2、深度学习算法四、机器学习与深度学习的区别1、学习方法2、数据需求3、应用领域五、总结机器学习与深度学习的区别一、引言在人工智能的浪潮中，机器学习和深度学习无疑是最耀眼的两颗明星。它们在许多领域都取得了令人瞩目的成就，从自动驾驶汽车到
GaN HEMT：未来功率半导体 David WangYang 硬件工程
硅基金属氧化物自1960年代以来，硅基金属氧化物半导体场效应晶体管（MOSFET）一直是电力电子应用的标准。尽管如此，各种技术的发展（尤其是在汽车和消费电子领域）给寻求以越来越小的外形尺寸提供更高效率和更大功率密度的开发人员带来了新的挑战。从大型数据中心和墙壁插座交流适配器到汽车车载充电站，各种用途的电源都需要高电压，同时尽可能少地占用宝贵的电路板空间。自动驾驶汽车还需要更高效的能量分配，以运行越
Python编码系列—Python团队开发工作流：高效协作的艺术学步_技术 Python编码 python 团队开发开发语言
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
大模型实战—Ollama 本地部署大模型猫猫姐大模型大模型
Ollama本地部署大模型在当今的科技时代，AI已经成为许多领域的关键技术。AI的应用范围广泛，从自动驾驶汽车到语音助手，再到智能家居系统，都有着AI的身影，而随着Facebook开源LLama2更让越来越多的人接触到了开源大模型。今天我们推荐的是一条命令快速在本地运行大模型，在GitHub超过22KStar的开源项目：ollama随着围绕着Ollama的生态走向前台，更多用户也可以方便地在自己电
信息安全国内外现状及技术要求示例（R155/R156） mini积木信息安全安全 mcu
国际政策、法规的现状与趋势鉴于对交通安全、社会安全甚至国家安全的重要影响，汽车网络安全、数据安全得到各相关国家和地区的高度重视，纷纷出台相关法规、标准。信息安全法规R155法规适用范围覆盖了乘用车及商用车，适用于M类、N类车型，装备了至少一个ECU的O类车型，以及具备L3及以上自动驾驶功能的L6和L7类车型。此法规适合于1958协议国（包括欧洲、日本、俄罗斯、澳大利亚等）。根据欧盟要求，从2022
探秘3D UNet-PyTorch：高效三维图像分割利器鲍凯印Fox
探秘3DUNet-PyTorch：高效三维图像分割利器在医学影像处理、计算机视觉和自动驾驶等领域，三维图像的理解与分析至关重要。而是一个基于PyTorch实现的深度学习模型，专为三维图像分割任务设计。本文将深入剖析该项目的技术细节，应用场景及特性，以期吸引更多的开发者和研究人员参与其中。项目简介3DUNet是2DUNet的三维扩展，其结构保持了卷积神经网络的对称性，采用跳跃连接的方式保留了不同尺度
整车级SOA软件架构的革新踏马潜行智能驾驶-传感器SOA SOA 软件革新
在汽车行业，自动驾驶技术正成为创新的主要驱动力。为了满足日益增长的技术需求，整车级SOA（Service-OrientedArchitecture）软件架构正逐渐成为下一代自动驾驶系统的关键组成部分。SOA是一种设计方法论，它将系统划分为相互独立的服务，这些服务可以单独开发、部署和重复使用，从而实现软件的高内聚、低耦合。在传统的汽车软件架构中，软件通常被直接嵌入到硬件中，这导致了软件的可扩展性和可
论文笔记—NDT-Transformer: Large-Scale 3D Point Cloud Localization using the Normal Distribution Transfor 入门打工人笔记 slam 定位算法
论文笔记—NDT-Transformer:Large-Scale3DPointCloudLocalizationusingtheNormalDistributionTransformRepresentation文章摘要~~~~~~~在GPS挑战的环境中，自动驾驶对基于3D点云的地点识别有很高的要求，并且是基于激光雷达的SLAM系统的重要组成部分（即闭环检测）。本文提出了一种名为NDT-Transf
汽车智能驾驶算法汇总芊言芊语汽车算法
汽车智能驾驶算法是自动驾驶技术的核心，它们集成了多个学科的知识，包括计算机视觉、机器学习、控制理论、路径规划等。以下是对汽车智能驾驶算法的一个详细汇总，内容分为几个关键部分进行阐述。一、计算机视觉算法计算机视觉是智能驾驶算法中用于识别和理解环境的关键技术。它主要包括图像处理、特征提取和对象识别等步骤。图像处理：通过摄像头等设备获取车辆前方的图像，然后进行预处理，如灰度化、二值化、滤波等操作，以提高
2023-08-15《苏东坡》纪录片1 每天坚持
20230815四点三十七星期二《苏东坡》纪录片1昨天上午把儿女妻送到龙门高铁站，我就回来了，开的是孩子姨家的油电混用的新能源车，电还没有用完，感觉新能源车真的是很省油，将来要是能自动驾驶能普及的话这个社会会有很大的进步。昨天中午在老城吃一碗凉皮，去对面吃了一点卤猪肉，下午睡到天黑，中间爹来，今天爸妈准备出院，晚上吃了油皮面和豆腐皮，油泼面现在涨价到八元了，吃过饭之后去领鸡蛋。昨天晚上我开的空调应
基于深度学习的动态场景理解 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的动态场景理解是一种通过计算机视觉技术自动分析和解释动态环境中物体、事件和交互的能力。该技术在自动驾驶、智能监控、机器人导航、增强现实等领域有着广泛应用，通过深度学习模型，特别是卷积神经网络（CNNs）、递归神经网络（RNNs）、图神经网络（GNNs）等，对复杂动态场景进行实时解读。1.动态场景理解的核心技术1.1卷积神经网络（CNNs）**卷积神经网络（CNNs）**擅长处理图像数据
(游戏设计草稿) 《外卖员模拟器》 (3D 科幻角色扮演开放世界 AI VR) 穷人小水滴游戏人工智能科幻 vr 元宇宙
游戏名称:外卖员模拟器.游戏类型:3D,科幻,角色扮演(RPG),开放世界,AI,VR.游戏的主要目的:技术测试/验证.1文案(超低空科幻流派)2030年,基于AI(人工智能)的自动驾驶和人形机器人技术已经大规模普及使用,但是AI的能力遭遇了瓶颈,AI只能解决99%的问题,而对于这最后1%的问题,却无论如何也解决不了,仍然需要人工处理.你是一个25岁的年轻人,居住在城市郊区破败的贫民窟.但是生活并
7. 深度强化学习：智能体的学习与决策 Network_Engineer 机器学习学习机器学习深度学习神经网络 python 算法
引言深度强化学习结合了强化学习与深度学习的优势，通过智能体与环境的交互，使得智能体能够学习最优的决策策略。深度强化学习在自动驾驶、游戏AI、机器人控制等领域表现出色，推动了人工智能的快速发展。本篇博文将深入探讨深度强化学习的基本框架、经典算法（如DQN、策略梯度法），以及其在实际应用中的成功案例。1.强化学习的基本框架强化学习是机器学习的一个分支，专注于智能体在与环境的交互过程中，学习如何通过最大
【IT】软件行业发展的前瞻性和希望的广度天若有情673 人工智能
我说一下我对程序应用的一个看法就是我其实个人不太建议自动驾驶技术的发展因为这个东西它说到底还是什么那么一点安全隐患，虽然我们平常考虑用同时实行各种各样的高级的自动作用，但是自动驾驶可能是个特例，其实我个人觉得程序可以在以下方面发展1.医学（包括诊断治疗手术等）因为现在也有很多的疾病是医学还没有能力去解决的，2.国防有的时候因为国家安全真的非常重要的，因为我们每个人都希望有一个国泰民安的和平环境.3
【关于车载测试的基础知识的认知详解】 @逝水流年轻染尘@ 门控循环单元车载系统汽车 51单片机
目录一、目前车企的趋势1.电动化：2.自动驾驶技术：3.车联网（ConnectedCars）：4.智能化和数字化：5.安全性：6.轻量化：7.个性化和定制化：8.供应链和制造创新：9.法规和政策：10.竞争格局变化：二、汽车域控的介绍1.动力域（PowertrainDomain）：2.底盘域（ChassisDomain）：3.车身域（BodyDomain）：4.座舱域（CockpitDomain）
车载测试| 汽车的五域架构（含线控技术知识） squirrel快乐敲码汽车架构
汽车的五域架构是一种将汽车电子控制系统按照功能进行划分的架构模式，主要包括动力域、底盘域、座舱域、自动驾驶域和车身域。（汽车三域架构通常是指将汽车电子系统划分为三个主要领域：动力域、底盘域和智能座舱域（或车身舒适域））以下是对这五个域的详细介绍：1、**动力域**：**功能**：动力域控制器是智能化的动力总成管理单元，主要功能包括对多种动力系统单元（如内燃机、电动机/发电机、电池、变速箱等）进行计
第15篇运用指挥家思维模型开发自动驾驶算法墨客云开
如何带领一个团队共同开发一项自动驾驶功能，问题边界和指挥家问题边界是相似的，首先，各个算法工程师都是在有明确边界下的内部协作，共同开发一个新功能；其次，最终集成后呈现的功能是前期可调试测试的。第一，要抓住“功能应用边界”关键点和指挥家一样，算法团队的负责人无法做到精通每一个子技术领域的算法，但却需要把控好整个团队的工作方向。感知，决策，控制，每一个子领域的算法开发都有解决不完的问题，团队负责人要做
一文让你搞懂什么是AI大模型码上飞扬人工智能大模型 AI
近年来，人工智能（AI）技术飞速发展，特别是大模型的出现，给各行各业带来了巨大的变革。无论是自然语言处理、图像识别，还是自动驾驶，AI大模型都展现出了强大的能力和广泛的应用前景。那么，什么是AI大模型？它们有哪些特点和应用场景？本文将带你一探究竟。目录AI大模型的定义AI大模型的发展历程AI大模型的特点AI大模型的应用场景如何训练和使用AI大模型AI大模型的挑战与未来1.AI大模型的定义AI大模型
数据分析-13-时间序列异常值检测的类型及常见的检测方法皮皮冰燃数据分析数据分析
参考时间序列异常值的分类及检测参考异常值数据预警分析1时间序列异常的类型时间序列异常检测是数据处理和分析的重要环节，广泛应用于量化交易、网络安全检测、自动驾驶汽车和大型工业设备日常维护等领域。在时间序列数据中，异常通常指的是与正常数据模式显著不同的数据点，可能由系统故障、错误或外部干扰引起。异常数据，也称为离群点，是指在数据集中与其他数据点明显不同的样本。这些数据点往往不符合预期的模式或行为，可能
比亚迪方程豹携手华为乾崑智驾，开放合作，加速中国智驾技术向前科技真优趣汽车
在智能化领域，比亚迪很早就开始布局，在行业最早提出“上半场是电动化、下半场是智能化”。当前，比亚迪L2级智能驾驶搭载量已突破350万，智驾数据基座稳居全球第一梯队。同时，比亚迪是获得全国第一张高快速路段有条件自动驾驶（L3级）测试牌照，也是国内首批获得L3准入的车企。比亚迪拥有超四千名工程师的智驾研发队伍，构建起一套全栈自研的智驾研发体系，研发实力稳居行业第一梯队。比亚迪全栈自研的“天神之眼”高阶
Python编码系列—Python项目架构的艺术：最佳实践与实战应用学步_技术 Python编码 python 架构开发语言
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
你不开车，车可不会自己走小斌哥ge 了解AI 人工智能自动驾驶
你不开车，车可不会自己走前言《人工不智能：计算机如何误解世界》由美国人工智能专家、数据记者梅瑞狄斯·布鲁萨德著。我看这本书已有很长一段时间，当时书中对自动驾驶的分析让我印象深刻，如自动驾驶的分级、电车难题等。2024年5月份，我国某互联网公司在一座一线城市发布和上线了最新版的自动驾驶汽车，他们自称新发布的大模型支持L4级自动驾驶。这次上线确实为乘客提供了出行服务，不是“即将推出”、不是“将来会有一
支持萝卜快跑：AI能否颠覆出租车与外卖行业？ ai_xiaogui 人工智能
在人工智能技术快速发展的背景下，自动驾驶技术正在逐步渗透到各行各业，其中最为人瞩目的莫过于出行和餐饮配送领域。萝卜快跑作为一个代表性的自动驾驶项目，引发了广泛的讨论。本文将探讨AI技术在出租车和外卖送餐行业的应用前景，并邀请持不同意见的朋友提出他们的观点，以期达成共识。一、引言简述AI技术的发展及其在交通和餐饮配送领域的应用。引出文章主题——萝卜快跑项目及其对传统行业的潜在影响。二、萝卜快跑项目简
基于Frenet坐标系的无人车路径规划：ROS实现与Python程序详解快撑死的鱼算法杂谈 python算法解析硬件算法实践 python 开发语言
基于Frenet坐标系的无人车路径规划：ROS实现与Python程序详解前言在自动驾驶和无人车技术快速发展的今天，路径规划是实现车辆自主行驶的核心技术之一。本文将详细介绍基于Frenet坐标系的无人车路径规划，并结合ROS（RobotOperatingSystem）和Python程序进行实现。通过系统的讲解和实例代码，帮助读者深入理解这一技术，并能够在实际项目中应用。Frenet坐标系简介什么是F
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S

【读书笔记】第一本无人驾驶技术书 笔记汇总 1