山水之间2018

一文详解Apollo7.0 预测模块及相关技术

引言

自动驾驶主车（Autonomous Driving Car ，ADC）行驶时，周围的车辆及行人在接下来的几秒内将要做什么？是否有碰撞的可能？这对于实现安全的自动驾驶而言至关重要，这也是自动驾驶领域中的轨迹预测模块的问题：对周边车辆、行人在接下来数秒时间的多种行为状态进行预测，进一步影响主车的路径规划。

近几年中自动驾驶行为预测领域很火的一种方式是——采用类似VectorNet（《VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized Representation》）这个分层的图神经网络的思想，将道路等静态环境信息以及动态交通参与者的运动轨迹均进行编码，编码后经过类似TNT （《TNT:Target-driveN Trajectory Predictio》）思想的方式进行轨迹预测。

2021年12月29日，Apollo7.0版本正式发布。本次7.0版本预测模块更新部分的核心思路与上述两篇论文非常接近，但主要区别在于使用MLP（多层感知机）替代了GCN（图神经网络），以及增加了更加丰富的工程化的优化方式。

本文就Apollo7.0的预测模块及其所涉及技术进行分享。

注：文章图片来自Apollo7.0技术分享课内容及相关论文，参考文献附于文末。

预测模块概述

整体框架

绿色表示预测模块所依赖的上游模块，包括了规划、定位、感知、Storytelling和高精度地图，下游是规划模块。

红色虚线框内是预测模块的整体逻辑，包含容器（Container），场景（Scenario）、评估器（Evaluator）和预测器（Predictor）。

容器 Container

输入上游的一系列信息，输出障碍物、主车和相关联车道信息。

场景 Scenario

输入障碍物车状态、主车状态及相关车道信息，输出场景相关联信息。其中interaction（交互标志位）是7.0中新增加的一部分。

6.0和7.0的区别

6.0 的思想是将车辆及人过去的状态和位置作为输入，放在神经网络中，得到一个未来的预测，实际上还是拟合函数的核心思想。

7.0中会先根据障碍车的位置判断是不是交互式的车辆（危险等级为ineraction及caution），然后针对交互式的车辆用交互式模型。

如果是其他类型的车辆（normal），使用巡航MLP评估器及路口MLP评估器，对于不在道路上的，使用卡尔曼滤波器。所以因此7.0更加细分了感知障碍物的类别判断，新增的一类使感知预测更加细致，提升点在于有针对性，预测效果也更好。

评估器 Evaluator

输入障碍物的信息及场景信息，评估器为机器学习的模型，输出障碍物的轨迹或意图，其中障碍物意图是指障碍物在每个车道序列的概率。

障碍物主要分为四类：自行车、行人、车辆、未知障碍物（感知模块中未检测出的）。

在预测模块中，不同的障碍物类型对应不同的评估器和预测器。

关于不同评估器的介绍，可参考：王方浩：apollo预测模块分享（二十一）

知识点：障碍物
感知侧输入的障碍物分为静态障碍物和动态障碍物，只有动态障碍物会进入预测模块，静态障碍物不做处理，打包后输出至规划侧。

这部分中Apollo6.0和7.0的结构区别

车辆（vehicle）部分中，Apollo6.0版本先将其分为onlane和injunction，再按caution和normal然后去做划分。而Apollo7.0版本直接做等级的预分，只在normal的情况下做 onlane和injunction 的划分。

此外7.0版本中多了interaction的等级，其和caution均指向JOINTLY_PREDICTION_PLANNING_EVALUATOR。6.0版本中的onlane情况下的caution 和 normal 均指CRUISE_MLP_ EVALUATOR。

预测器 Predictor

预测器是在Evaluator获取预测轨迹或意图后，进行轨迹的延伸或者生成，处理完后最终生成8秒的轨迹。

预测器分类如下所示：

环境信息编码

为什么要编码？

最初对障碍车辆的预测，只是依赖于障碍车自身的运动状态，但障碍车的运动状态与当下所处环境是密不可分的。例如，当下障碍车在一个路口的右转车道上，可以判定其基本上要右转，如果在直行车道上，则很可能直行。

编码的作用是把道路之类的信息以形成特征的方式保存，以此决定障碍车的预测轨迹。

此外，当主车ADC的planning轨迹有可能和障碍车辆产生交互时，例如主车需要变道、加塞时，也会对周边车辆产生影响，因此编码流中也会包含主车轨迹。

如何编码？

在Apollo7.0的设计中，如下图所示，蓝色的表示人行道，四个向量的四条边均是有效的，连接后用以表示人行道；道路边缘是指polyline（下图中的多线段），也是以向量的方式形成；障碍物（obstacle）轨迹和自车 ADC 轨迹同理。

用这种方式，可以将左边的仿真图变成了右边编码后的图。

具体的结构化数据存储信息编码过程如下：

其中，Xs,Ys为起始点的横纵坐标，Xe,Ye 为结束点的横纵坐标， attr是需要额外放置的属性，lane_type 是判断线端是什么类型，虚线or实线，双黄线or单黄线，id是指每条路的标识。

障碍物中的l,w，对应路网的 0,0，是指障碍物的长和宽。

信息编码完成之后，我们可以将其抽象的理解成这幅彩虹图，每个图都是由多个矢量组成的，不同颜色的方块都表示不同的九维矢量（红色为主车轨迹，黄色为障碍物轨迹，绿色为道路，蓝色为人行道）。每一列可以描述为多线段，也就是多矢量的一个线段，它表示是一个完整的物体。

编码后总体结构

编码后形成的不同颜色的色块。每一个色块其又由多种子元素构成。例如绿色（表示道路）由三段构成，轨迹则被分为两段。

之后需要做的事情有：

1.形成子图

2.全局图的交互

3.输出最终的语义地图

1.子图

子图：每一个向量特征进行处理

在子图阶段会每一个元素进行一次全连接，让每个元素之间产生联系。例如，其将红色人行道（crosswalk）的每一条边全连接在一起，lane和轨迹也是如此。

子图的网络架构具体如下：

原文公式：

翻译为人话的公式：

Node Encoder 这里用的是MLP，就是全连接的一个网络结构，将数据相关联并提升到高维空间。

Permutatation Invariant Aggregator 使用的是Max Pooling，最大值池化。

对Max Pooling的更深入了解可参考：对Max Pooling的理解_117瓶果粒橙的博客-CSDN博客_maxpooling

这里在VectorNet中，在MLP上包裹了一层GCN，从而使有连接关系的节点（每一条轨迹都由带有前后指向关系的节点组成）能够进行特征层面的传播。

Apollo这里单纯采用了MLP，我们猜测可能会在特征层损失一部分向量信息（节点与节点的连接关系）。

但当下核心的问题是，当我们考虑部署的情况时，我们需要将我们的模型使用TorchScript的jit方法导出成一个中间状态，才可以以ONNX的形式或在C++平台上部署。GCN当前对TorchScript的导出还不友好，比如GCN通常采用torch_gemotric.data 来进行数据输入，而如果想通过TorchScript进行导出，则只支持tensor的形式；以及在某些算子层，TorchScript也不直接支持GCN的导出。因此单独使用MLP反而是一个更加朴适的方法，这是我们对这一个部分的理解。

在下一篇文章中，我们则会全面展开着在GCN部署时遇到的问题，我们的优化历程，以及如何end-end考虑预测模块模型的设计与部署。

2.全局图

全局图：对所有的向量进行处理

这部分是对每个完整的物体做处理，这一部分会对所有的物体都会做一个交互。这里交互既包含了车辆，也包含了路网在内。

原文公式：

翻译为人话的公式：

MultiHeadattention的具体操作就是把Attention加在一起。Attention是指之前的特征（P）经过Q 矩阵，T K矩阵，V 矩阵，之后再做softmax合在一起。

说到这里大家有点晕，我们重新梳理一下：

基本意思是指第一层进来的东西，经过Max Pooling,再经过Self Attention 运算，就会输出整体的这个结果。

知识点：Attention 机制
对于一个图像而言，当对其进行预测，或是做类似YOLO的目标检测或图像分类，其特征是对于整张图而言的。但Attention机制下会采用某些权重比，让其对某一部分的区域产生兴趣，这部分会多学。例如照片中的某个位置有只狗，这个位置的权重相对会高一点。
Apollo这里用的是 self Attention，核心思想是使全局图的元素产生更多的交互，产生更多的兴趣点。
此处我们不再展开讲解Self-Attention, 想要补充相关知识的同学可以观看李宏毅老师的关于这一部分的教学片，非常详细也非常清楚。

3.输出最终的语义地图

最后输出为每一个物体所对应的特征向量，然后取出需要的特征向量进入下一步处理流程。

轨迹生成器

《VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized Representation》这篇论文原文在经过编码后，直接使用了比较通用的方法作为解码器，生成目标预测的轨迹点。

而Apollo7.0中经过编码后，使用类似于TNT (Target-driveN Trajectory Prediction)思想的方式进行轨迹预测。

总体结构如图：

在实际道路上采一些样点，我们称其为候选点（图中的菱形样点），根据候选点，预测可能会到达的选中点（图中所示的星点），最后由可到达的选中点，决定可能会生成何种轨迹。

总结而言，就是从一堆点中学习出一些真正可能去到的选中点，再学习出从当前位置到选中点的轨迹。

预测任务分为三步：

1.给定环境的context，估计每个候选点的可能性，从而选择概率高的候选点，下图分别用钻石和星星表示候选点和选中点

2.根据目标，估计每个选定目标的轨迹（分布）

3.对所有的轨迹进行排名的评分和选择

Target -> 轨迹 -> 轨迹概率分布 -> 轨迹交互

Target

假设过去的状态：

预测未来的状态：

Cp 代表着此时的背景（环境）

用真实的Target拼接特征向量来生成预测的轨迹，用生成的轨迹和真实轨迹做一个Huber loss。

使用X=（Sp，Cp）表示所有的过去状态，就是要尝试估计 p(sF |x)：给定过去状态未来状态的边缘概率。

这里的核心思想是，通过设计目标空间τ(Cp) (候选点位置), 候选点分布p(τ|x)可以很好地捕捉意图不确定性。一旦确定了目标，进一步证明了控制不确定性（轨迹）可以通过简单的单峰分布可靠地建模。通过一组离散位置来近似目标空间τ(Cp)，将p(τ |x)的估计转化为一个分类任务。

在以上的公式中，N 表示广义的正态分布，Huber作为距离函数，平均值表示为v。可训练功能 f和v由两层多层感知器（MLP）实现，目标坐标和场景上下文特征作为输入。他们预测目标位置上的离散分布及其最可能的偏移量。

Softmax！最终核心：分类问题，每个候选点到底哪个属于哪一个选中点（星点）。

Loss：Lcls是交叉熵，Loffset是HuberLoss，u是预测选中点离最近的真值选中点的距离。

Apollo7.0目前使用的是道路中心采样方式，使用其来预测车辆的轨迹。

Apollo7.0对于Target点的计算方式相同，不多赘述。

Trajectories

上一步得到选中点之后，接下来就是根据选中点生成相应的轨迹。

（TNT）原论文中的公式如下

这里存在两个假设：时间步长是条件独立的，也就是时间上步与步的预测是独立的，可以使模型避免了顺序预测，提高了计算效率；对一个选中点只有一条最大概率的Trajectory，这样的轨迹分布为正态单峰分布的，这在短期内肯定是正确的；对于较长的时间范围，可以在（中间）目标预测和运动估计之间进行迭代，这样假设仍然成立。

总而言之，通过两层的MLP来预测每一个Target的轨迹SF，它将上下文特征X和目标位置τ作为输入，并为每个目标输出一条最可能的未来轨迹。由于它是以第一阶段的预测目标为条件的，为了使学习过程顺利进行，训练时通过输入位置真值作为目标

损失函数则是预测轨迹与真实轨迹的差值，这么做期望达到生成轨迹最后一个点，跟Target的点尽可能的重合。

Distribution

这一部分在原论文中没有提及，属于Apollo7.0版本的新增部分。

根据轨迹去计算轨迹的一个概率分布，真实分布（计算公式见下图）是指被选轨迹距离真实轨迹越近时，它的概率越高。前向计算前向计算就是计算备选轨迹的概率分布。

Interaction

这一部分也是Apollo7.0中新增的重要部分。

前文所述考虑了障碍车预测轨迹和环境的影响，但还需要与主车规划轨迹进行交互打分，去选择最优轨迹。例如交互前该障碍车预测轨迹为0.8 分，和主车的轨迹交互后可能不再是 0.8 分，可能会重新打分。

交互情况

以下四张图为不同情况下（路口、车道行驶、换道、左转）可判断为交互车辆的情况。

交互分数计算

假如说50条备选轨迹，就会有50条交互分数（用cost表示）。是指交互的严重程度，如果cost较大，说明危险程度较大，会削弱对该条预测轨迹的发生概率。

预测轨迹与规划轨迹之间的时间对齐。预测未来3s，时间间隔0.1s, 共有30个选中点。

30个选中点之间的相对距离（D）累加，30个点的相对速度（V）累加起来，两项经过两个条件权重（W1和 W2）进行加权，之后相加得到交互分数cost。如果距离越近，那么cost越大；如果速度差距越大，那么cost也越大。

Tips：W1和 W2这两项条件权重是通过编码器的特征向量，经过MLP实现的。

预测效果演示

第一张图为最原始的环境编码后的矢量图。

第二张图为选中点预测结果（即上文所述的星点）。

第三张图是备选轨迹生成，根据每个选中点的位置生成了相应的轨迹。

第四张图是最优轨迹的选择，通过本身的轨迹预测分数和主车轨迹的交互分数，得到一个最优轨迹。

测评指标

为衡量预测效果的好坏，（TNT）论文使用的是MR、MinFDE、MinFDE和DAC几个指标来进行衡量。

MR (Miss Rate，缺失率) ，描述检测结果中的漏检率的指标。

minFDE( Minimum Final Displacement Error , 最小最终距离误差)，对于 N 个预测轨迹，选择最终轨迹预测点与真值预测误差最小的作为评估结果

minADE( Minimum Average Displacement Error，最小平均距离误差 )，对于 N 个预测轨迹，选择平均轨迹预测点与真值预测误差最小的作为评估结果。

MinFDE只能评估最好的估计有多好，但不能评估所有轨迹的优劣。

因此提出新的标准DAC(Drivable Area Compliance ，最小最终距离误差）。如果模型产生n个可能的未来轨迹，并且其中m个轨迹在某个点离开可移动区域，则该模型的DAC为（n m）/ n。因此，较高的DAC意味着更好的预测轨迹质量。

如果存在n个样本，并且其中m个具有其最佳轨迹的最后一个坐标距离地面真值超过2.0 m，则未命中率为m / n。

表2及表3分别为在地图采样时样点取点距离的效果对比，表2为车辆检测中取样的效果，可以看出每1m取一个样点可性价比最优。表3为行人检测中的取样效果，可以看出每0.5m取一个样点可性价比最优。

从下图的检测结果的测评指标来看，TNT的效果较好。

当前Apollo 7.0的轨迹预测由于有许多工程化方法，尚未提供量化分析其性能的方法或指标。我们可以通过剥离其代码，使用到传统轨迹预测的评测指标上来。但不可否认的是，由于TNT本身方法在之前轨迹预测中表现较好，且其改进版本DenseTNT也拿到了相关比赛的第一名，我们认为该方法对于准确性是有依托的。

结语

对Apollo7.0的预测模块及所涉及技术进行探讨分享全文结束

码字不易，更新虽慢，但每篇都是用心之作。希望可以帮到屏幕前正在阅读的你，也欢迎多多转发，分享，讨论~

再次声明：文章图片来自Apollo7.0技术分享课内容及相关论文。参考文献附于文末。

参考文献

Gao J , Sun C , Zhao H , et al. VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized Representation[J]. 2020.

Zhao H , Gao J , Lan T , et al. TNT: Target-driveN Trajectory Prediction[J]. 2020.

-----本文首发于公众号i车Gear联，转载需标明出处

推荐阅读：文章收录于《自动驾驶Apollo实践》专栏下，如想要系统完整的进行学习，欢迎关注专栏，持续更新ing

参考链接

1.一文详解Apollo7.0 预测模块及相关技术 - 知乎

基于C++和ONNX Runtime的YOLOv5目标检测实战浪浪山小白兔 c++YOLO 目标检测
1.前言在计算机视觉领域，目标检测是一项关键任务，其应用广泛，涵盖了安防监控、自动驾驶、工业检测等众多领域。YOLOv5作为一种先进的目标检测算法，以其速度快、精度高的特点备受关注。本文将详细介绍如何使用C++结合ONNXRuntime推理引擎来部署YOLOv5模型，实现高效的目标检测。2.ONNX与YOLOv52.1ONNX简介ONNX（OpenNeuralNetworkExchange）是一种
1. 基于大模型能力，如何提炼出优质prompt（入门版）姚瑞南 prompt系列课程人工智能 AIGC chatgpt
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）本文简介：入门版：基于大模型能力，如何提炼出优质prompt提示词的重要性和价值大模型基础能力简介prompt的基本定义如何定义优质的promptprompt的万能公式与套路prom
AI系统架构原理与代码实战案例讲解 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI系统架构原理与代码实战案例讲解1.背景介绍1.1人工智能的发展历程1.1.1人工智能的起源与早期发展人工智能的概念可以追溯到上世纪50年代，图灵测试的提出标志着人工智能作为一门学科的诞生。早期的研究主要集中在符号推理、专家系统等领域，取得了一些突破，例如机器定理证明、西洋跳棋程序等。1.1.2人工智能的黄金时期上世纪80年代，随着专家系统的兴起，人工智能进入了一个黄金时期。专家系统通过模拟人类
【多模态 AI】从跨模态学习到生成革命：文本、图像与音频的深度交融网罗开发人工智能 AI 大模型机器学习人工智能 AIGC
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
美国采取行动扩大人工智能出口限制数据分析能量站机器学习人工智能
大幅拓展限制：美国政府（拜登执政末期提出）出台新规，显著扩大人工智能技术出口限制，构建针对先进芯片与模型获取的国际分级体系。出口限制范围：对多数国家限制出口人工智能芯片与模型，仅少数亲密盟友除外。新规创建三级体系，对不同国家区别对待，并首次限制大型AI模型封闭权重出口。规则运作方式意见征询与生效：新规在媒体曝光后发布，设120天公众意见征询期，供新政府参考调整，预计一年后生效。国家分级及限制一级国
通用人工智能的多层次提示词架构 AI天才研究院计算机软件编程原理与应用实践大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
通用人工智能的多层次提示词架构关键词通用人工智能（AGI），多层提示词架构，人工智能设计原则，算法原理，系统架构设计，应用案例摘要本文将深入探讨通用人工智能（AGI）的多层次提示词架构，阐述其背景、核心概念、设计原则和实现方法。我们将逐步分析这一架构在不同领域的应用，并展望其未来的发展方向。通过本文，读者将了解如何构建能够模拟人类智能的多层次提示词系统，并思考其在实际应用中的潜力与挑战。目录第一部
半导体、芯片、人工智能、智能驾驶汽车的趋势不爱原创的Yoga 人工智能汽车
1.市场增长与需求汽车半导体市场：预计到2025年，中国汽车半导体市场仍将保持稳健增长态势，AI和能源将成为未来最重要的两大变革因素。2023年中国汽车电子芯片行业市场规模约为820.8亿元，预计2024年有望增至905.4亿元左右。随着新能源汽车和智能化的快速发展，一些新的半导体技术在中国汽车领域迅速应用，如集中式架构和高性能处理器需求正日益增加。AI芯片市场：随着AI技术的不断普及和应用场景的
Minimax 开源的 4 百万超长上下文模型百态老人人工智能大数据笔记
MiniMax开源4百万超长上下文模型MiniMax开源模型概述2025年1月15日，MiniMax发布并开源了MiniMax-01全新系列模型，这一举措在人工智能领域引发了广泛关注。该系列包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax作为大模型六小强（或六小虎）企业之一，其推出的这一系列模型有着诸多独特之处。这一系列模型的开源是Min
无人驾驶公交车落地情况百态老人笔记
无人驾驶公交车的最新进展无人驾驶公交车作为智能交通系统的重要组成部分，近年来在中国多个城市逐步推进示范运营。最近的进展包括：绵阳市无人驾驶公交车示范运营：2024年6月28日，绵阳市启动了首批自动驾驶车辆示范运营测试，包括19辆无人驾驶公交车。这些公交车配备了安全员，并规划了4条试运营线路，覆盖科技城新区直管区全域。试运营期间，市民可以免费乘坐体验无人驾驶公交车。深圳无人驾驶公交车：深圳市在201
程序员创业公司的技术栈选择与性能优化 AI天才研究院 ChatGPT AI大模型企业级应用开发实战大数据AI人工智能大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《程序员创业公司的技术栈选择与性能优化》概述本文旨在探讨程序员创业公司在选择技术栈和进行性能优化方面的策略与实践。随着技术的不断进步和市场的快速变化，技术栈的选择和优化成为创业公司成功的关键因素。正确的技术栈选择不仅能够提升系统的性能和可扩展性，还能降低开发成本和维护难度。关键词技术栈选择性能优化创业公司云计算数据库微服务人工智能区块链边缘计算摘要本文首先分析了技术栈选择的重要性以及创业公司在技术
AI人工智能深度学习算法：高并发场景下深度学习代理的性能调优 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度学习代理的兴起近年来，随着人工智能技术的飞速发展，深度学习在各个领域都取得了显著的成果。特别是在自然语言处理、图像识别、语音识别等领域，深度学习模型的性能已经超越了传统方法。为了更好地将深度学习技术应用于实际场景，深度学习代理应运而生。深度学习代理是一种将深度学习模型封装起来，并提供对外接口的服务。它可以接收来自客户端的请求，将请求数据输入到深度学习模型中进行推理，并将推理结
AI生成PPT：智能技术重塑演示文稿创作的新篇章 mhjidfoi 人工智能
在快节奏的商业与学术环境中，演示文稿（PPT）作为信息传递与观点展示的重要工具，其质量与效率直接关系到演讲者的说服力和观众的接收度。近年来，随着人工智能（AI）技术的飞速发展，AI生成PPT的应用正逐渐从科幻概念转变为现实工具，为演示文稿的创作带来了革命性的变革。本文将深入探讨AI生成PPT的工作原理、优势、挑战以及未来展望，为您揭示这一智能技术的无限潜力。一、AI生成PPT的工作原理AI生成PP
零门槛一键生成PPT，利用人工智能快速提高办公效率（无需第三方插件） beautycountry88 powerpoint 人工智能
人工智能技术的发展正以惊人的速度改变着我们的世界，今天给大家介绍下利用ChatGPT快速生成PPT的方法，它能够帮助你一键生成PPT内容和漂亮的PPT文档，无需繁琐的设计和排版，只需要与ChatGPT交流，你就能轻松拥有一份令人赞叹的演示文稿。什么是ChatGPT？它是基于人工智能技术的语言模型，能够理解和生成自然语言。与传统的PPT制作方式不同，ChatGPT通过与你进行对话，理解你的需求和要点
探索AloT（人工智能物联网）：未来智能设备的核心驱动力为也科技人工智能物联网边缘计算目标检测 iot
探索AloT（人工智能物联网）：未来智能设备的核心驱动力随着物联网（IoT）技术的飞速发展，人工智能（AI）也在各行各业中找到了应用的空间。两者的结合，诞生了一个崭新的技术领域——AloT（ArtificialIntelligenceofThings，人工智能物联网）。AloT不仅仅是AI与物联网技术的简单融合，它更是推动智能设备进化和物联网产业向更高层次发展的关键力量。今天，我们就来深入探讨Al
汽车和工业用激光雷达行业分析 LPiling 汽车自动驾驶人工智能
行业现状激光雷达（LiDAR）作为自动驾驶和智能驾驶领域的关键技术，近年来经历了显著的技术进步和成本下降。激光雷达通过脉冲激光照射目标并用传感器测量反射脉冲返回时间来测量目标距离，能够生成高分辨率的地图和三维模型。这种技术在汽车领域的应用已经从高端车型快速渗透到中低端市场，成为自动驾驶系统不可或缺的传感器之一。在工业领域，激光雷达支持机器人、工厂自动化和物流等多种应用。随着电子商务的蓬勃发展，消费
人工智能与量子计算：未来编程的碰撞与共鸣大梦百万秋知识学爆量子计算
引言：编程的“摩尔定律”快到尽头了？曾几何时，摩尔定律曾预言着计算能力的飞速发展——每两年，晶体管的数量翻倍，处理器的速度也在跟着疯狂增长。这个定律引领了数十年的技术革命，推动了今天的智能手机、超级计算机和现代互联网的诞生。然而，摩尔定律的黄金时代正逐渐走向尾声。传统的硅基芯片工艺遇到了物理极限，无法再轻易实现持续的性能翻倍。此时，新的计算范式开始崭露头角——量子计算与人工智能（AI）的结合，正在
【人工智能】Python常用库-Keras：高阶深度学习 API IT古董深度学习人工智能 Python 人工智能 python 深度学习
Keras：高阶深度学习APIKeras是一个高效、用户友好的深度学习框架，作为TensorFlow的高级API，支持快速构建和训练深度学习模型。它以模块化、简单和灵活著称，适合研究和生产环境。Keras的发音为[ˈkerəs]，类似于“凯拉斯”或“克拉斯”。这个名字来源于希腊语κέρας(kéras)，意思是“角”或“角质物”。这个词与深度学习的灵感来源——大脑的神经网络结构有一定联系。Kera
南京大学苏州校区学生代表团到访合合信息，开启“沉浸式”人工智能企业行人工智能图像识别程序员
为进一步深化校企合作，探索产业科技拔尖创新人才培养新模式，近期，南京大学苏州校区师生代表到访上海合合信息科技股份有限公司（以下简称“合合信息”，股票代码：SH688615）。此次活动设置了展厅讲解、技术交流、模拟面试等多个体验环节，旨在增强学生对人工智能及商业大数据技术在实际应用中的理解和认识，引导学生系统性开展职业规划，提升职业胜任力。图说：南京大学苏州校区学生代表团到访合合信息合影留念合合信息
反转字符串中的单词 II：Swift 实现与详解网罗开发 Swift vue.js
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
【Python】已解决ModuleNotFoundError: No module named ‘tensorflow‘ 屿小夏 python tensorflow neo4j
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
实时离线AI字幕生成与翻译功能在智能眼镜上的应用展望花生糖@ AIGC学习资料库 VLC播放器 AI AIGC 方案技术 AI眼镜
随着人工智能（AI）技术的不断进步，实时字幕生成和翻译功能正逐渐从传统的云服务走向本地设备，为用户提供了更为便捷、私密且广泛适用的服务。特别地，当这些先进的AI能力被集成到诸如智能眼镜这样的穿戴式设备中时，它们可以极大地改善用户体验，并开拓一系列全新的应用场景。技术框架概述VLC播放器近期推出的基于AI的实时字幕生成和翻译功能，标志着一个重要的里程碑。这项创新不仅限于视频播放器内部，而是为整个智能
【Python】已解决：ModuleNotFoundError: No module named ‘tensorflow‘ 屿小夏 python tensorflow neo4j
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
一文洞悉AI技术架构：大模型、智能体与应用场景大模型玩家人工智能架构数据库深度学习 pytorch transformer ai
人工智能（AI）的发展，正以前所未有的速度重塑我们的世界。从能与人对话的大语言模型到自动驾驶、精准医疗，AI的背后究竟隐藏着怎样的技术奥秘？本篇文章将为您深度剖析一套先进的AI技术架构，从基础设施到应用层，每一层都充满了惊喜和启发。读完本文，您不仅能看懂AI的底层逻辑，还能掌握其对各行业变革的潜力与方向。一、基础设施层：AI技术的坚实地基基础设施层是AI技术架构的“地基”，为整个系统提供计算能力和
Transformer模型全面解析：工作原理、应用与未来展望* 泰山AI AI大模型应用开发 transformer
概述：深入探讨Transformer模型的工作原理，分析其在NLP领域的应用场景，并展望其未来发展趋势。本文为您提供关于Transformer模型的全面指南。正文Transformer模型全面解析：工作原理、应用与未来展望在人工智能的浪潮中，Transformer模型以其强大的性能和广泛的应用场景，成为了自然语言处理（NLP）领域的一颗璀璨明星。本文将对Transformer模型进行深入剖析，从工
使用LangChain构建基于RAG技术的智能问答系统：深入解析与实战指南 m0_57781768 langchain
使用LangChain构建基于RAG技术的智能问答系统：深入解析与实战指南近年来，随着大语言模型（LLMs）的迅猛发展，基于LLM的复杂问答系统（Q&AChatbot）逐渐成为人工智能领域的热门应用之一。这类应用程序可以基于特定的文本信息源回答用户提出的问题，在实际应用中非常有价值。而实现这些强大功能的核心技术之一，便是检索增强生成（RetrievalAugmentedGeneration，RAG
车规芯片SOC简介车载诊断技术车载电子电气架构车载通信架构汽车网络人工智能电子电器架构架构
一、背景信息汽车电动化、智能化引领产业变革，关注“自动驾驶”及“智能座舱”，汽车行业正在经历电动化、智能化革命，电动化主要改变汽车的动力和传动系统，智能化则改变了人与车之间的关系。从PC时代的微软、智能手机时代的苹果，以及到破万亿市值的特斯拉，属于智能电动车的新时代已经拉开帷幕，当下时点为汽车行业新周期起点，电动及智能化革命将颠覆整个汽车产业链，也将孕育新的产业生机。目前汽车行业有如下三大趋势：1
《探秘鸿蒙Next：非结构化数据处理与模型轻量化的完美适配》人工智能深度学习
在鸿蒙Next的人工智能应用场景中，处理非结构化数据并使其适配模型轻量化需求是一项关键且具有挑战性的任务。以下是一些有效的方法和策略。数据预处理数据清洗：非结构化数据中往往存在噪声、重复和错误数据。对于文本数据，要去除乱码、特殊字符等；对于图像数据，需处理模糊、损坏的图像。比如在处理鸿蒙Next设备采集的监控图像时，通过OpenCV的HarmonyOS适配库进行图像滤波等操作去除噪声。数据归一化与
如何利用模板为您的聊天机器人自动生成反馈 FADxafs 机器人 windows python
在人工智能快速发展的今天，聊天机器人是应用大型语言模型（LLM）的最常见接口之一。尽管如此，许多聊天机器人的质量参差不齐，这使得不断完善和发展显得尤为重要。传统的用户反馈机制往往无法有效捕捉用户体验，而这种反馈的稀缺也阻碍了对聊天机器人的进一步优化。本文旨在介绍一种无需明确用户反馈即可评估聊天机器人的方法。技术背景介绍在构建和改进聊天机器人的过程中，用户反馈如“赞”或“踩”往往是稀缺的资源。即使在
宇宙规律对可转移量子强化学习架构的启示 AI天才研究院计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
第1章引言：宇宙规律与量子强化学习架构1.1问题背景宇宙规律是指宇宙中普遍存在的自然规律，如物理学中的万有引力定律、量子力学中的不确定性原理等。这些规律对宇宙的运行和演化起着决定性的作用。随着科技的发展，人们开始意识到这些宇宙规律可能对人工智能领域，尤其是量子强化学习架构的设计和优化有着深远的启示。量子强化学习是一种结合了量子计算和强化学习的新型机器学习方法。它利用量子计算机的优势，在训练和优化模
【机器学习】多模态AI——融合多种数据源的智能系统 2的n次方_ 人工智能
随着人工智能的快速发展，单一模态（如文本、图像或语音）已经不能满足复杂任务的需求。多模态AI（MultimodalAI）通过结合多种数据源（如文本、图像、音频等）来提升模型的智能和表现，适用于多样化的应用场景，如自动驾驶、医疗诊断、跨语言翻译等。一、多模态AI简介多模态AI是一种将不同形式的数据（如文本、图像、音频等）融合在一起的技术，旨在让模型从多个维度感知和理解信息。这种融合使得AI系统能够从
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C