自动驾驶之心

站在2023的起点，目前自动驾驶技术发展到了什么水平？

作者 | 洪泽鑫编辑 | 汽车人

点击下方卡片，关注“自动驾驶之心”公众号

ADAS巨卷干货，即可获取

点击进入→自动驾驶之心【全栈算法】技术交流群

按：汽车行业这年经历了众多跌宕起伏，既遭遇了新冠疫情、芯片短缺、L4自动驾驶寒潮等冲击，也收获了城市领航辅助驾驶落地、国产大算力芯片/激光雷达上车等亮眼战绩。

站在年终岁末的节点，HiEV编辑们将和业内人士一同总结当下、探索未来，为大家梳理行业发展的关键脉络。在2022年终盘点这个系列中，我们将共同记录下这年关于公司、技术和人的那些闪闪发光的时刻。

2022年，科技日/Tech Day/AI Day成为汽车行业一种新的潮流，其中既有特斯拉、小鹏这样的车企，也有毫末智行、百度、华为、轻舟智航、福瑞泰克等从L4/L2技术出发推动前装量产的科技公司。

硬核科技日，意味着面对自动驾驶这样的尖端话题，头部公司希望通过开放一部分的思考，来加速整个行业的进步；另一方面，公众对整车产品背后的技术，也逐渐显露出浓厚的兴趣。

车企和科技公司们，从不同的背景和业务定位出发，技术路线也各有差异，我们可以从中管窥自动驾驶领域不少前沿的突破和技术趋势。

Robotaxi公司篇

Waymo

作为全球自动驾驶的鼻祖和领导者，Waymo在公布技术进展、研究成果时，有很强的推动行业的意味。比如，它的成果发布常常带着数据集的公开或者更新，以期影响更多开发者。
Waymo官网的技术博客理解门槛较低，很好地体现了Waymo ONE直面用户To C的定位，主要目的是让乘客更信任自动驾驶。但同时，Waymo又附上了具体论文信息，对技术人员了解新的技术趋势很友好。

感知

下面几篇小论文可以看到Waymo在感知领域的一些新进展：

SWFormer：点云3D目标检测的稀疏窗口Transformer
LidarAugment：搜索可扩展的3D LiDAR数据增强
PseudoAugment：学习使用未标记的数据在点云中进行数据增强

Surprise-based framework

关键概念

基于“惊讶度”对真实道路环境下的司机反应时间进行测量和建模。

亮点/指标

在决策规划上，Waymo一直在找判断智驾好坏的基准线。
在反应时间上，智驾系统延迟多少算是达标？目前并没有很好的答案，这篇论文就是为了解答这个问题。
Waymo发现，在交通事故发生时，人类司机的反应时间可以作为一个很好的参考，所以把“惊讶度”作为衡量标准，对真实道路环境下的司机反应时间进行测量和建模。
借助这个框架和模型，Waymo给自己的智驾系统的碰撞避免行为创建了一个内部基准，用于验证智驾系统的智能化程度。

劣势/不足

这是Waymo对于如何利用人类行为数据作为智驾表现好坏评价基准的尝试之一，并没有引起太多关注。

NIEON

关键概念

这个模型是基于人类司机事故数据训练出来的，意思是一个“理想型”人类司机，并把这个“司机”作为评价Waymo智驾系统的基准线。

亮点/指标

今年论文公开的NIEON模型，相比人类司机，能防止62.5%的碰撞，并降低84%的严重伤害风险。
当Waymo智驾被置于撞人角色时，完全避免或减轻了100%的碰撞。
当Waymo智驾被置于被撞角色时，完全避免了82%的事故。
在另外10%的场景中，当Waymo智驾是被撞角色时——当另一辆车转向其路径时，都在十字路口——它采取了减轻碰撞严重性的行动。
只有8%的被撞状态模拟没有变化，几乎都是被追尾的情况。
Waymo的智驾系统比NIEON模型更安全，能避免75%的碰撞，并降低93%的严重伤害风险。这说明，自动驾驶比人类驾驶更安全的客观依据，同时再次科普了自动驾驶并非0事故，只是更安全，为政策制定提供依据。

Block-NeRF

关键概念

基于相机图像的大规模场景重建的新方法。

亮点/指标

将场景分解为单独训练的NeRF，使渲染能够扩展到任意大的环境，并允许对环境进行每个块更新。
使用这项技术从280万张图像中重建了旧金山的整个社区——这是迄今为止最大的基于NeRF的3D重建。
细节展示了基于旧金山阿拉莫光场和使命湾合成的3D场景，阿拉莫广场面积960米 x 570米，数据分别捕捉于6月、7月和8月，共由35个Block-NeRF组成，经过了38到48次数据收集训练，训练每个Block-NeRF分别使用了6.5万到10.8万张图像数据，累计采集时间为13.4小时（1330次数据采集）。
发布了Waymo Block-NeRF数据集，由12个摄像头记录的100秒驾驶组成，包含1.08公里车程，总共约12,000张图像。

劣势/不足

没有公布给旧金山“建模”用了多长时间，但从描述来看，花费的总时长应该不短。

Waymo Open Dataset

关键概念

是2019年推出，最大、最多样化的自动驾驶数据集之一。

亮点/指标

Perception dataset，有2030个场景，目前最新版为2022年6月升级的v1.4，分训练和评估两部分，主要在凤凰城、山景城和旧金山采集，大部分为白天和晴天。
Motion dataset，有目标轨迹追踪和3D同步地图，有103354个场景，目前最新版为2021年8月升级的v1.1版。
发布以来，支撑了500多篇业界论文成果。
2022年3月增加了关键点和姿势估计、3D分割标签、2D到3D边界框对应标签。
2022年Waymo开放数据集挑战赛，连办多届，多家公司响应。

百度

文心大模型自动驾驶感知

关键概念

前代的感知更多是后融合，把激光雷达、摄像头、毫米波雷达三种传感器的感知结果融合在一起。
新一代感知2.0基于前融合方案，多模态前融合端到端；利用了文心大模型图像弱监督预训练的模型来挖掘长尾数据。

亮点/指标

这是一套覆盖近距离、中等距离和远距离的感知方案。

通过半监督的方法，利用2D的标注和没有3D标注的数据，在既有2D又有3D的训练数据上面，去训练一个感知大模型，然后给3D数据打上3D伪标注。

在编码器、2D检测Head、3D检测Head三个地方使用了蒸馏。

把大模型的Detection head，包括2D、3D里面的参数，直接作为小模型的初始化，提升训练的效率和效果。
用了几个例子表示新模型的准确度，左边绿色的框是对应真值，红色的是预测的结果。

Apollo自动驾驶地图

关键概念

主要应用于L4自动驾驶。

亮点/指标

自动化数据融合：按照数据空间分布划分，构建多层级的图结构，确保全图的精度一致，在统一的坐标系下进行融合。

地图自动化标注：多层级的点云识别，结果优于一次识别的结果，基于车道级的拓扑模板进行了矢量要素的匹配，提高了拓扑的生成以及车道线串接的准确性。
在线地图：使用车辆的摄像头和激光雷达，基于Transformer生成BEV的Feature Map，生成车端的实时地图，最终将车端的实时地图和高精地图以及众源地图进行有效的融合，生成在线地图。

驾驶知识图谱：基于百度地图超过1200万公里的路网覆盖、日均20亿公里的轨迹里程，包含了多维度，且丰富的驾驶知识，例如经验速度、变道的时机、变道的轨迹等等，这跟轻舟提到的人类驾驶行为数据使用类似。
Apollo自动驾驶地图总共分三层：静态层、动态层、知识层、驾驶层，跟Momenta2019年的说法有点像。

数据提纯+数据消化

关键概念

百度理解整个数据闭环是由数据提纯以及数据消化这两个部分构成。

亮点/指标

数据挖掘与标注都是提高数据纯度的手段。
基于图文弱监督预训练的模型帮助做长尾数据的挖掘，大模型可以用来通过推理引擎获取对应数据的特征和标签，可以用作定向挖掘。

车上的小模型可以进行数据的初步筛选，通过推理的方式获取小模型的标签，实现重要的数据回传，多个小模型还可以获得模型对数据的不确定性，从而实现不确定性挖掘。

数据消化：自动化、联合优化以及数据分布。

自动化：
使用异步的推理引擎对模型进行评测，最终的训练的输出是一个候选模型的集合，而不是单一的模型，以下图小狗为例，当出现误检之后，可以利用特征检索的一些方式，挖掘出小狗的数据，然后将新数据与旧数据同时传入到训练引擎进行自动化训练，最终实现指标的提升。

联合优化：
假如预测指标与仿真指标的目标不一致，预测模型的指标提升不一定对仿真指标提升有帮助，但在训练的同时，将产生的预测模型实时地与下游规划模块进行打包，同步地进行仿真评测。最终的训练引擎同时优化的是离线的预测指标以及仿真的端到端指标。

数据分布：
首先对数据分布的先验进行统一的管理，这里的先验可以是人为设定的，也可以是通过学习来获得。当这个先验进入到训练引擎之后，训练引擎其实可以把这个先验或者这个数据分布当作超参数，做一定程度的探索或搜索。当发现更好的分布之后，可以通过一个反馈的机制修正数据分布的先验。

昆仑芯

关键概念

亮点/指标：

第一代14纳米的人工智能芯片，HBM内存，2.5D封装，已经在百度数据中心里面部署了超过2万片。
第二代AI芯片，7纳米的工艺，XPU第二代架构，第一颗采用GDDR6内存技术的AI芯片。

Cruise

Cruise背靠车企，其L4无人车Origin集合了改装车成本低、前装车可定制的优点。
其分享会的最后用一个具体的女性用户案例，来描述无人出租能带来的便利和安全，并且展示远程监控工具，还能确认有没有遗落物品。

感知

用了很多demo示例来呈现不同模块的表现效果，但具体技术实现讲得少。
在面对遮挡区域时，也有类似特斯拉ghost object的应用。

预测神经网络架构

关键概念

基于众多数据，用自监督的方法构建了一个端到端的预测神经网络架构，由Encoder和Decoder两部分组成。
Encoder以每个物体的历史状态和所处场景为输入，通过一个Graph Attention Network学习整个场景的潜在含义，包括不同物体间的交互。
Decoder则是由Two-Stage和辅助任务两个子集构成，见下图，特别强调运用了自监督学习实现自动标注。

亮点/指标

能同时预测超过20人的行走状态。
在旧金山需要处理的交互场景的复杂度比凤凰城高32倍。

Cruise Decision Engine

关键概念

公开了决策模型的架构图，并简要介绍了含义。

亮点/指标

针对达到的效果（outcomes），尤其是不确定性（运动状态、存在与否、3D空间的不确定性），放了许多demo视频作为例子，但没有太详细解释具体技术方法。
其中existence uncertainty有被遮挡区域的ghost object例子，以及鬼探头的例子。
3D uncertainty是找了一个十字路口，其中一个路口是坡道的例子。
360 interaction是一个用逆向车道绕过路障的例子。
在计算速度上，通过其深度学习网络加速，大部分的时候决策只需要14ms，最坏的情况延迟是80ms。

用一个曲线图表示如何在控制层面达到的平顺效果，但没有细讲做法。

Cruise仿真

关键概念

包括morpheus、Road to Sim、NPC AI三个基础模块。
morpheus：通过简单代码便能模拟行驶轨迹，结合地图数据生成众多轨迹。

Road to Sim：从收集到的真实场景图像数据中学习，生成仿真场景。

NPC AI：smart agent，用到了预测模型来让NPC做出反应

亮点/指标

展示了阿拉莫广场的自动仿真重建结果（没说耗时多久），强调没有人工的参与。
可仿真光照和天气，还可以模拟多普勒效应。
仿真可以帮助收集特殊数据，比如被遮挡的警车、救护车等，效率比实际道路收集高180倍。

Webviz

关键概念

最初只是可视化工具，现在已经是一个开源的、供大规模开发团队一同协作的开发平台。

亮点/指标

在旧金山的日常道路测试里，有用的数据占比不到1%，所以数据的管理筛选很重要。
展示了内部的Event管理页面，可以很简单地查找case，或者智能化地提取跟某个event相关的其他类似event。

超过95%的Cruise员工在使用。
展示了工程师如何修改代码、自动构建和执行系列测试、分析结果并比较的过程，下面是某个场景在仿真测试中的比较结果。

简单提到了车道线生成，应用在了地图的自动更新中。

仿真的运行效率数据：每天收集PB量级真实数据，合成PB量级的仿真数据，每天仿真的数据相当于17年的驾驶经验积累，计算资源的每个月的使用价值达到770年（这个我也没有太理解），每个月执行2千万次场景测试，累积收集已有4 EB的数据。

Origin

关键概念

基于通用对“造车”的洞察，可以保障硬件冗余，同时控制成本。

亮点/指标

目前正在正向研发的激光雷达可以更好地保障FOV的冗余。
考虑到了空气动力学，减少风阻和风噪。
考虑到了传感器的清洁，但没有细讲怎么做的。
计算平台，在四代芯片的迭代过程中，成本下降了十倍。

主要是两类平台，一类用于传感器的边缘计算平台，一个作为主计算平台。
芯片INT8算力1500 TOPS，带宽400GB/Sec，运行内存RAM 1G，DDR达800GB/Sec。

计划推出的新一代传感器，已经看不到机械式激光雷达的身影，可见Cruise在2021年11月就已经在准备应用半固态/固态激光雷达了，领先于国内。

预计2023年Origin投入使用，车队规模达数百辆，2024年车队规模超过一千辆。

车企篇

特斯拉

特斯拉的AI DAY更多分享的是方法论上的创新，以及在最终结果上跟自身过往方法相比的优势。
对比国内公司，特斯拉敢于把较多的技术细节分享出来，从而会引发更多工程师的关注和分析，相反国内的技术分享总是让人云里雾里的。
大部分工程师会细细研究Demo视频，了解细节及原理。没有官方中文解读，所以国内工程师都是连蒙带猜，在语言理解上有点各持一言。
过去一年训练了75000个神经网络，每8分钟就要出一个新的模型，共有281个模型用到了特斯拉的车上。

Occupancy Network

关键概念

Occupancy表示空间中每个3D体素是否被占据，可以更好地处理长尾问题——类别不明的障碍物。

亮点/指标

以多个场景demo展示了对物体形状以及运动状态的感知。

不同颜色含义：

蓝色表示运动物体，红色表示车辆，绿色表示路沿...

3D分割输出时长只需要10ms。
从Demo中估算的感知范围：前向40m，后向20m，左右15m，单个体素约为40cm的立方体。

公开了模型结构：

直接输出道路信息（Surface Outputs），包括海拔和语义信息。
基于queryable MLP decoder，避免了分辨率对模型的限制。

劣势/不足

Occupacy network的真值监督用到了特斯拉4D标注中的线下三维重建场景，但重建场景也存在不准确性。
Tesla bot也用了相同的技术栈，但从demo来看，Occupancy Network在室内的体素体积更小，准确度一般。
首次亮相是2021年FSD Beta的Release Note中，后来在CVPR 2022 WAD WORKSHOP介绍了更多细节。

NeRF

关键概念

Neural Radiance Fields，用深度学习完成3D渲染，完成三维场景的重建。

亮点/指标

以demo呈现利用车队数据离线构建的三维场景效果。
每次重建可能会遇到图像模糊、雨、雾等，但多辆车的数据可以相互补充，在全世界范围内不同天气和光照条件下都能用上。
NeRF和Occupancy的相互结合：Occupancy network产生 3D volume后，将其于3D-reconstruction volume（Nerf离线训练得到）进行比较，起到监督作用。

劣势/不足

相比追求渲染颜色效果，更应该追求准确的位置信息，但官方表示这部分还在努力。
NeRF在Occupancy中的应用类似于“高精地图”，未来如果特斯拉的车队能做到对街景的细节重建，中国测绘政策就形同虚设了。

Interaction Search

关键概念

基于神经网络的轨迹规划，基于特斯拉车队的人类驾驶行为轨迹以及离线优化算法得出轨迹。

亮点/指标

讲解时，先基于无保护左转讲了传统方法的轨迹生成和优化的劣势，再抛出Interaction Search。
基于神经网络可形成数据驱动，减少对工程师的依赖。
基于神经网络的轨迹生成比传统方法时延下降了许多，从1-5ms per action到100us per action
在计算上，从CPU迁移到了GPU。
分享了一个Occlusion的案例：在摄像头被遮挡的区域里，会假设有一个ghost object从远处开过来，这样做类似于人类的习惯。

劣势/不足

特斯拉的Joint Planning指的是自车和他车的联合规划，主要分享的是轨迹的优化方法，没有谈到速度和方向的联合优化方法（国内吉大郭洪艳教授提出过横纵向一体化决策，轻舟提出过时空联合优化）。

Lanes Network

关键概念

Lanes Network

在线矢量地图构建模型，参考了自然语言模型中的Transformer decoder，以序列的方式自回归地输出结果。
分割得到的像素级别的车道不足够用于轨迹规划，而通过Lanes Network可以得到车道线的拓扑结构。

亮点/指标

展示了传统车道线识别的方法只能应用于高速，在城市这种有更多路口的环境下，难以应用。
由于Map信息的稀疏性，向量化表示比栅格化表示更佳。
详细介绍了如何加速Lane Network这类模型。

Autolabeling

关键概念

去年AI DAY详解了Autolabeling，今年主要讲解Lanes Network的自动标注。
通过车队收集上来的多轨迹，重建道路环境，在新的轨迹上便可以重建的道路环境作为真值，自动标注出车道线，自动标注一段新轨迹的时间约为30分钟，支持并发。

亮点/指标

在车道线标注上的各类指标提升情况，原本一万个trips需要5百万个小时的人工标注，现在只需要机器运转12个小时便能完成。

展示了在黑暗、雾气、遮挡、雨天情况下的自动标注效果。

劣势/不足

测绘法再次敲起警钟。

Simulation world creator

关键概念

依赖自动标注的真实世界道路信息和丰富的图形素材库，生成大量场景。

亮点/指标

要想创建一个路口的仿真场景，需要艺术家花2周时间，但特斯拉只需要5分钟。
创建旧金山的仿真城市只需要2周时间。

劣势/不足

特斯拉直到2021年才全面对外展示了自研的渲染引擎、场景库、目标库和对抗学习场景，对旧金山的虚拟城市重建工作Waymo和Cruise早就做过了。

Data Engine

关键概念

以一个路口右前方的停止车辆案例讲解数据闭环，并且展示了手动标注系统的友好度。

FSD芯片+DOJO

基础设施/计算平台

亮点/指标

车载计算平台上，多模型在两个SoC上跑时，通过优化，可以最大限度地利用100TOPS算力

超算中心拥有14,000个GPU，共30PB的数据缓存，每天都有500,000个新的视频流入这些超级计算机

专门开发了加速的视频解码库，以及加速读写中间特征的文件格式.smol file format。
使用24个GPU集群的服务器在计算一个Batch Normalization时候延迟是150us，在25个D1组成的DOJO训练服务器上，同样的Batch Normalization只需要5us就可以完成，效率提高了30倍。
在加速器使用效率（也就是公式中Accelerator Occupancy部分）上的优化，Tesla给出训练中占用负载最高的AutoLabeler和Occupancy Network部分优化前后的性能分析对比，优化前DOJO加速器占用率只有4%，大量时间消耗在数据读取装载上，而优化后，极速器利用率达到了97%，保证了DOJO高效的使用。
4个DOJO集群箱子就可以带来等效目前72个GPU集群的性能。
预计2023年Q1将会开始交付用以进行AutoLabeler训练的DOJO服务器。

小鹏

内容更偏C端车主端，主要被包装为功能、场景的宣传语言。
缺少技术细节，不像Waymo附有具体论文，鲜有工程师讨论。
自9月17日在广州试点开放以来，截止10月17日，城市NGP周用户渗透率达到84%，里程渗透率达到63%，同时通行效率可接近人类司机的90%，平均每百公里被动接管仅0.6次。
发布XNGP智能辅助驾驶系统，包括无图区域能力大幅升级、XNet 深度视觉神经网络、拟人化的决策系统、人机共驾体系。
相比高速NGP，城市NGP的代码量提升至6倍，感知模型数量提升至4倍，预测/规划/控制相关代码量提升至88倍（潜台词是研发干了很多活）。

XNet

关键概念

将多个摄像头采集的数据，进行多帧时序前融合，输出BEV视角下的动态目标物的4D信息（如车辆，二轮车等的大小、距离、位置及速度、行为预测等），以及静态目标物的3D信息（如车道线和马路边缘的位置）

亮点/指标

Transformer 部署，原本需122%的Orin-X 算力，优化后仅需 9%。

小鹏数据闭环

关键概念

由采集、标注、训练、部署四大核心能力组成。

亮点/指标

引入了黄金骨干网络架构（Golden backbone），首次应用自监督技术。
解藕了骨干模型和发布模型的训练，让多任务的网络训练效率更高。
通过定向采集和仿真结合，一年内累计解决1000个以上Corner case（极限场景），高速NGP事故率降低95%。
5 千万公里的仿真里程，5000+ 个核心模拟场景，挑战 17000+ 个专项模拟场景。

全自动标注系统

关键概念

亮点/指标

标注效率是人工标注的近45000倍，以50万段训练数据Clip，10亿个物体为例，现在仅需16.7天可以完成，而全人工标注需2000人年。
峰值日产 30000 clips，相当于 15个NuScene数据集。

扶摇

关键概念

自动驾驶智算中心

亮点/指标

在乌兰察布建成中国最大的自动驾驶智算中心“扶摇”，算力可达600PFLOPS（每秒浮点运算60亿亿次），模型训练效率提升602倍。
与2400TFLOPS算力的服务器进行单机训练相比，80机并行训练可将训练时长由276天缩短至11小时。

劣势/不足

只抛出数据结果，没有具体怎么做的分享。

全场景语音2.0

关键概念

亮点/指标

唤醒到界面反馈245ms、到语音反馈小于700ms。
并行指令：支持2-4个指令连在一起说，一般竞品只能支持任意2个命令组合。
端云一体：端4路+云4路结果仲裁。
回声消除：支持30dB。
错误率大幅下降：识别准确率达到97%，标准安静场景降低7.7%、中英文混合场景降低7.16%、噪声环境场景降低36.79%、带地域口音场景降低33.84%。
综合唤醒率98%、高噪唤醒率97%。到UI响应低至245ms（提升3倍），到语音回应小于700ms（提升60%）；误唤醒率：低于2次/24h。
语音的CPU使用率降低65.9%，内存使用降低42.3%。
通过实车模拟生成车型适配数据，单车型数据采集成本大幅降低，仅为录制音频数据方式成本的5%。

科技公司篇

华为

八爪鱼

关键概念

工具链分为数据、训练、仿真、监管四部分。
可解耦、可定制化。

亮点/指标

华为的预标注算法精度已经达到领先水平，在nuScenes、COCO、KITTI等多个自动驾驶国际公开数据集测试挑战中获得第一。
可提供50多类、120多万张、超过2000多万对象的标注数据集，而且这个数据集是持续迭代、持续扩充的。
对场景进行智能化打标签：开发人员可以上传需要车辆获取的图片，通过云端下发指令，车端会采取类似‘以图搜图’的方式，遇到类似的场景就会自动截取下来，形成特定场景的难例数据集，减少90%的上云数据，并节省70%的数据集构建时间。
一键将真实路测场景转化为仿真场景，可实现95%以上的场景还原能力，能有效帮助开发者快速模拟周边车辆，实现分钟级的场景构建。
从安全性、舒适性、可靠性、人机交互体验、可用性、合规性、能耗性和通行效率等维度，共开放了200项评价指标。
虚拟仿真测试：将规控算法评测周期从原来的天级缩短到了小时级，整个算法的迭代周期也从周级缩短到了天级。
提供超过20万个仿真场景实例；系统每日虚拟测试里程可超过1000万公里，支持3000个实例并发测试。
提供给客户一套参考算法，客户可以在此基础上调试优化。
和VTD战略合作，并嵌入了CarMaker的车辆动力学模型。
车企间的数据共享：有一个叫 Club 的模式，车厂可以选择加入或不加入，如果加入的话所有是共享的。如果不加入，那你自己就是一个 Pool，别人也不会和你共享。

高精地图

智驾方案可根据对高精度地图的依赖程度，分成ICA、ICA+、NCA三类模式。
ICA 模式：车在第一次开的地方实现自动驾驶
ICA+ 模式：没有高精度地图，但是车会根据自车或者是他车开过的环境自动学习地图
NCA 模式：车内有预置的高精地图
整个地图系统叫 Roadcode，Roadcode 里面有两部分组成，一个叫 Roadcode HD，一个叫 Roadcode RT。
Roadcode HD可以理解为传统的高精度地图，有专门的地图制作团队做的，是离线的；
Roadcode RT 是车子的自学习地图，用于NCA和ICA+ 。
这两个东西是两位一体的，Roadcode RT 本身会不断地自学习后去更新 HD，把数据沉淀下来。AVP 也是同样的实现原理。（类似于特斯拉3D场景重建的做法）

轻舟智航

OmniNet

关键概念

时序多模态特征融合，应用于前中融合阶段、实现数据/特征融合的全任务大模型。

亮点/指标

将视觉、毫米波雷达、激光雷达等数据通过前融合和BEV空间特征融合，让本来独立的各个计算任务通过共享主干网络（backbone）和记忆网络（memory network）进行高效多任务统一计算，最终同时在图像空间和BEV空间中输出不同感知任务的结果。

情调通用障碍物识别：在前向lidar视野内，OmniNet可输出每一个占据栅格的语义、实例、运动状态等信息，不仅能有效识别车辆、人群、植被、护栏、锥桶、小动物、施工区域等常见的道路交通参与元素，各类陌生或长尾罕见的异形障碍物，即使不属于交通参与者也可以识别并快速做出反应。
让本来独立的各个计算任务通过共享主干网络（backbone）和记忆网络（memory network）进行高效多任务统一计算，在完成相同数量任务的基础上，OmniNet可以节省2/3的算力。

前向120度的激光雷达看不到后方，但通过时序和空间融合算法，在车行驶过程中，前向激光雷达扫过的区域会在系统时刻进行记忆，并在车往前行进后将记忆区域的点云数据，与侧向后向的纯视觉信息进行补充和融合，从而保证对前后向区域的充分认知。

时空联合规划

关键概念

业界更多采用的是「时空分离规划」——把「对轨迹的规划」拆分成两个子问题，即路径规划（path planning）和速度规划（speed planning），路径规划对应于横向控制，即方向盘；速度规划对应于纵向控制，即刹车或油门，这种决策机制也就是通常所谓的「横纵分离」。
「时空分离规划」相当于先为车辆「铺好」一段铁轨，再在铁轨上计算速度。这种方式非常依赖手写规则调整车辆行为，也非常依赖大量路测来验证算法。
轻舟智航自研「时空联合规划算法」，同时考虑空间和时间来规划轨迹，能直接在x-y-t（即平面和时间）三个维度的空间中直接求解最优轨迹。

亮点/指标

用了一个案例来说明两种规划算法的区别。

规划控制技术架构设计灵活，可以适用高低性能的计算平台，当算力足够的时候，会计算出较多轨迹，选取最优轨迹，充分利用多核做并行计算；算力有限的情况下，生成的轨迹会相应减少，但也可以保证行车的安全性与稳定性。
将传统机器人技术和机器学习技术结合，通过深度学习来优化决策和规划，在大规模智能仿真系统中，模型算法每天可以抽取数百万帧有效数据，完成训练、测试验证和迭代优化，说明两个场景——“判断跟车距离”和“选择变道时机”都是可以基于人类驾驶行为数据训练得出的。
特斯拉讲的联合优化是指自车和障碍物之间的优化，跟轻舟的时空联合优化不是一回事，自车和障碍物的博弈并非轻舟强调的点。

Prophnet

关键概念

轻舟的预测模块分为车端和训练平台端两大重要部分：
① 车端的预测模块
主要目的是预测障碍物未来可能的行进轨迹，该模块又分成预测Context、预测Scheduler、后处理这三个主要的子模块。
· 预测Context（预测的上下文），主要用于记录各种各样的信息，比如自动驾驶车的历史的驾驶信息，障碍物的历史信息、包括历史的位置姿态，它的转向灯的历史序列，还有当前障碍物的信息。还有地图和红绿灯，因为障碍物的很多运动是跟地图以及红绿灯的状态强相关的，所以预测也需要考虑地图和红绿灯。
· 预测Scheduler，使用预测Context提供的信息来预测障碍物未来的行为和轨迹。
首先对障碍物进行优先级分析：把障碍物分成高优的——即距离自车较近的、有潜在交互风险的障碍物，和低优先级的----跟自车交互可能比较低的障碍物，比如远处的。这么做的主要目的是把有限的车载的算力去集中到比较重要的障碍物上。
其次是场景分析，主要分析障碍物当前所处的场景：比如正处于路口，还是正常道路；是在高速，还是在匝道上等等。
经过分析之后，会有相应的预测分发逻辑。根据不同的优先级、不同的场景，分发到不同的预测器去做大量的预测（预测器可以理解为预测算法的「容器」，不同的预测器包含不同的预测算法）。
· 后处理，解决预测轨迹之间的冲突：比如两个预测如果互相矛盾，那么会由冲突解决模块去仲裁。
裁剪低概率预测轨迹：如果有预测的轨迹概率较低，则可以裁剪掉不给下游。
交互后处理：主要处理障碍物，预测未来的轨迹，预测和自车的潜在的交互。
② 训练平台端
拥有预测样本生成模块——从海量的路测数据里提取感兴趣的预测样本，再将这些样本存到样本库中，在样本库中，预测模型的训练模块会从中选取所需的样本，进行深度学习模型的训练和优化。

亮点/指标

提供10秒的意图加轨迹预测，主模型预测有至少三条带概率的轨迹，同时最大概率轨迹和真值的平均误差是 3.73 米，即10 秒整体轨迹的平均误差3.73 米（没有提及在什么场景下）。
主模型可同时支持预测 256 个目标，推理整体耗时小于 20 毫秒，可以满足实时运算的需求。
除主模型外还包括副模型，包括Cutin模型，其平均可以提前一秒预测到和自车平行的障碍物的切入行为。准确率达95%，误报率小于10%，路口出口的选择模型的准确率也能高达90%以上。
Prophnet模型在Argoverse 2021年和2022年的比赛里分别拿到是冠军和季军，号称可在车端以10Hz的频率运行。

轻舟矩阵

关键概念

轻舟自动驾驶研发的工具链。

亮点/指标

建立了驾驶数据仓库，可自动化地对实际驾驶数据和影子模式下的人工驾驶数据打上标签。这些标签的内容非常丰富，数量多达成百上千个，包括道路信息（道路级别、种类、车道类别等）、坐标环境信息（周围障碍物、车流密度、行人、其他车辆是否cut in等）、自车信息（自车的速度、位置）、从影子模式中获得的人类司机的开车数据，由此就可以得知人类司机在哪个时间点刹车变道、什么时候打了转向灯。
可以更便捷地针对发现的问题建立场景库：比如，如果自车无法很好地处理有大车cut in的情况，就可以将大车在自车前突然起步的类似情况全挖掘出来，做成场景库进行仿真测试。
线上事件挖掘机制：当发现有行人检测不稳定的情况时，便会将相关时段的信息保存上传；在案例分析阶段，找到大量相似场景，确认相关场景的共性和算法处理的不足，在此基础上进一步挖掘出充分的数据用于标注训练，最终解决好这一类场景的问题。
生成红绿灯数据：通过对抗式生成网络，在有大量红绿灯数据积累的情况下，进一步增强其多样性；生成的数据可以在许多维度上更加多样化，在模型训练中加以使用，可以大幅提升模型算法的泛化能力。

毫末智行

解决了大部分高速场景后，今年自动驾驶很大一部分研发重心开始转向城市场景。
城市场景的复杂性较高速倍增：比如，城市道路经常不定时的养护；有的路段大型车辆密集，遮挡和截断严重；周围车辆的行为导致自车变道空间狭窄，变道困难；还经常遇到打开的车门等等。

毫末数据训练

关键概念

将所有感知任务backbone进行统一，然后利用无标注数据对统一backbone进行预训练，模型剩余的部分再用标注样本进行训练。
做Backbone的预训练这种方式比只用标注样本做训练，效率可以提升3倍以上，同时精度也有显著的提升。
在数据规模增加后，需要继续保持巨量数据规模下对自然界数据分布遵循长尾分布形态。
简单来说，就是在处理好头部场景数据的基础上，兼顾腰尾部场景数据。
业界常用的方式是用全量数据再次精细的训练模型，但是这种做法的成本高而且效率低。
毫末的做法是，构造一个增量式的学习训练平台。训练过程中不再无差别地去优化所有参数，而是选择“有偏见”的参数进行定点优化，并动态观察模型的拟合能力，适时扩充模型参数规模。

亮点/指标

据称，相比常规做法，这一方式达到同样的精度可以节省 80% 以上的算力，收敛时间也可以提升 6 倍以上。

重感知+轻地图

关键概念

采用了重感知的技术路线。

亮点/指标

使用 Transformer 建立强感知的时空理解能力，用时序的transformer 模型在 BEV 空间上进行虚拟实时建图，通过这种方式让感知车道线的输出更加准确和稳定，在这个时空下对障碍物的判断也会变得更加准确。
目前，在实时感知能力下，毫末已经可以不需要地图辅助就能解决过去比较麻烦的复杂路口、环岛等问题。

拟人的驾驶策略

关键概念

过去业界常用的分场景、微模型方法，会存在由于太机械导致的舒适感不足问题。
毫末正在借鉴多模态大模型的方法来解决认知问题，让系统的动作更加拟人。
大致做法是，对覆盖全国的海量人驾数据进行深度理解，构建毫末自动驾驶场景库，并基于典型场景挖掘海量司机的实际驾驶行为，构建 taskpromt，训练一个基于时空 Attention 的驾驶决策预训练大模型，使得自动驾驶决策更像人类实际驾驶行为。

福瑞泰克

福瑞泰克的技术中台——ODIN数智底座，其大致可以分为：传感器、域控制器、算法、数据闭环。

传感器

以前视感知为主的1V或者1V1R是当前量产的主力。第一代前视摄像头产品FVC1.0 2018年量产；第二代产品FVC2.0/FVC2.1已经量产，第三代产品FVC3即将量产。
FVC1.0、FVC2.0/FVC2.1 单V或者融合前雷达，支持L2辅助驾驶全功能的量产。向下，FVC2可以支持10万元级车型的量产，向上FVC3可以支持到25万元级的车型。
自研的摄像头模组，配合自研的标定算法，对图像进行高度拟合还原，可以提升识别精度；模组在设计时，充分考虑了温度对材料的影响，确保定焦时有较高的清晰度；在滤光片上，利用旋涂工艺，消除鬼影、优化光斑。
FCV3集成800万像素摄像头，FOV开角更大，可以在高时速下更好的识别到近距离的Cut-in，可以在较长距离车道线缺失的情况下优化LCC的体验，通过大弯道时也会更稳；800万像素前视对AEB功能也会有大幅提升。
涉足4D毫米波雷达的研发，除了成本更低，获取更丰富的原始数据外，传感器依据智驾的场景和软件需求进行针对性定义和优化。
相比激光雷达，福瑞泰克在传感器的路线选择上，更倾向深挖视觉和毫米波雷达的能力。

域控制器

ADC20，AI算力 13 TOPS，接入5V6R，支持高速NOA功能；
ADC25，AI算力37 TOPS，可接入10V5R，可以实现部分城区辅助驾驶功能；
ADC28，264 TOPS，支持城区NOA的L2.9方案；
ADC30，448 TOPS，可接入11V5R3L，支持L3级自动驾驶方案。

福瑞泰克 ADC30

数据闭环

基于FVC以及ADC20的量产，福瑞泰克在数十个ADAS项目上积累实车测试数据，尤其从ADC20开始，系统支持影子模式，内部保守估计未来一年内将获得千万公里级别的高价值数据回传。
在NOA开启时系统发现驾驶员接管，原因可能是超车时机不对、或者下匝道时机不对，接管的动作会触发相关数据上传到云端，云端训练后算法的策略会迅速优化迭代。

搭建分层的数据湖，支撑海量数据的生命周期管理：
对有缺陷的数据，快速发现并且尽快反馈给前方调整采集策略；
对高价值的数据，通过轻度挖掘，基于分层标签策略存储，方便研发人员访问洞察。
已建立了超过4000+高价值场景的场景库，用于算法测试、验证和质量管理；通过影子模式，与OEM厂商共建数据合作模式，发掘数据的商业价值方向。

【自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区，聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多传感器融合、SLAM、光流估计、深度估计、轨迹预测、高精地图、NeRF、规划控制、模型部署落地、自动驾驶仿真测试、硬件配置、AI求职交流等方向；

添加汽车人助理微信邀请入群

备注：学校/公司+方向+昵称

你可能感兴趣的:(站在2023的起点，目前自动驾驶技术发展到了什么水平？)

全面解析条形码、二维码与RFID技术的区别及应用场景爱码字的小印条形码经验分享
在生活中，我们常见的条形码、二维码，甚至RFID技术，早已成了日常识别的小帮手。从超市结账到包裹追踪，再到门禁通行，它们无处不在。然而，看似都能识别信息，这三者的背后其实有着各自独特的工作原理和适用场景。到底条形码、二维码和RFID有什么不同？它们各自适用于哪些行业？今天，我们就来揭开这三种技术的奥秘，帮您找到最适合自己业务的识别方案！一、条形码技术：传统而稳定的识别方式条形码（Barcode）是
python、JavaScript 、JAVA等实例代码演示教你如何免费获取股票数据（实时数据、历史数据、CDMA、KDJ等指标数据）配有股票数据API接口说明文档详解参数说明蝶澈乐乐 python javascript java 股票数据接口 api 开发语言
近一两年来，股票量化分析逐渐受到广泛关注。而作为这一领域的初学者，首先需要面对的挑战就是如何获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的核心任务是从这些数据中挖掘出有价值的信息，为我们的投资策略提供有力的支持。在寻找数据的过程中，我尝试了多种途径，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花
Java通过QRCode生成二维码(1) 2401_84006757 程序员 java 开发语言
QRCode码，是由Denso公司于1994年9月研制的一种矩阵二维码符号，它具有一维条码及其它二维条码所具有的信息容量大、可靠性高、可表示汉字及图象多种文字信息、保密防伪性强等优点。先下载QRCode.jar包：https://pan.baidu.com/s/1Pb9XzWKhumgwaYrE90vyWg二、代码实例1、生成二维码//加密：文字信息->二维码publicstaticvoidenc
【ES6】05-Promise + Fetch + Axios + 模块化 + 同步异步 beibeibeiooo ES6【已完结】es6 javascript 前端
本文介绍Promise+Fetch+Axios+模块化+同步异步目录1.Promise1.1Promise简介1.2resovle1.3reject&finally2.Fetch2.1get请求2.2post请求3.Axios4.模块化开发5.同步异步同步异步asyncawait1.Promise1.1Promise简介Promise是一个对象，表示承诺在未来的某个时刻可能会完成并返回结果对于某些
【初学者】请介绍一下线性与非线性的区别？ lisw05 计算科学线性代数图论数学建模
李升伟整理线性与非线性是数学和科学中常用的概念，主要区别如下：1.定义线性：系统或函数满足叠加性和齐次性。叠加性指输入的和导致输出的和，齐次性指输入按比例缩放时，输出也按相同比例缩放。非线性：不满足叠加性或齐次性的系统或函数。2.数学表达线性：形式为y=ax+b，其中a和b为常数。非线性：形式多样，如y=x2、y=sin(x)、y=ex等。3.图形表现线性：图形为直线。非线性：图形为曲线，如抛物线
21.7 ChatGLM3-6B私有化部署实战：2小时快速搭建200 QPS高可用模型服务少林码僧 AI大模型应用实战专栏人工智能 gpt 语言模型
ChatGLM3-6B私有化部署实战：2小时快速搭建200QPS高可用模型服务ChatGLM3-6B私有化部署实战指南关键词：ChatGLM3-6B部署，私有化模型服务，性能优化，容器化部署，API服务封装1.部署环境准备与硬件规划ChatGLM3-6B私有化部署需要充分考虑算力资源与软件生态的适配性，以下是推荐配置方案：
31天Python入门——第7天:集合·字典你真的懂了吗? 安然无虞 Python手把手教程 python 开发语言后端
你好，我是安然无虞。文章目录1.集合1.1集合的定义1.2集合的常用操作1.3集合练习2.字典2.1字典的定义2.2嵌套字典和字典的取值2.3字典的常用操作补充知识:字典的优势是查找值效率高2.4字典推导式2.5字典练习很重要的补充练习:希望你能掌握练习一练习二1.集合在之前的章节中,我们学习了列表,元组,字符串.已经可以覆盖七成的使用场景了.那么为什么还要学习集合类型呢.列表:有序可变,元素可重
Opencv计算机视觉编程攻略-第一节图像读取与基本处理 weixin_44242403 深度学习 opencv 计算机视觉
1.图像读取导入依赖项的h文件#include#include#include#include项目Valuecore.hpp基础数据结构和操作（图像存储、矩阵运算、文件I/O）highgui.hpp图像显示、窗口管理、用户交互（图像/视频显示、用户输入处理、结果保存）imgproc.hpp图像处理算法（图像滤波、几何变换、边缘检测、形态学操作）二读取图片Matimage;//图像矩阵std::co
Flutter中常用命令肥肥呀呀呀 flutter经验 flutter
1.检测flutter运行环境flutterdoctor2.升级flutterflutterupgrade3.查看flutter版本flutter--version4.查看连接的设备flutterdevices5.运行flutter项目flutterrun或者在vscode中按Fn+F56.打包flutterbuildapk//默认打release包7.开启web端构建(开启以后每次新建flutt
什么是hessian矩阵红廉骑士兽矩阵线性代数算法机器学习 numpy
Hessian矩阵是一个数学概念，是用来表示函数关于其自变量的二阶偏导数的矩阵。它是一个实对称矩阵，对于多元函数来说，每一个元素是对应自变量关于该函数的二阶偏导数。Hessian矩阵在优化算法和最优化等领域有着重要的应用。
电子工程师转战汽车OEM主机厂之路上层精灵的赞美诗行业杂谈汽车单片机嵌入式硬件 eclipse mcu
文章目录1电子工程师2汽车系统工程师第一篇分享一个笔者2018年的一个心得文章，回头想想从事汽车行业也小8年了，从懵懂稚嫩到所谓的老油条，也是难忘的经历，希望我的经历对从事电子行业和汽车行业的小伙伴有所帮助。1电子工程师2013年电气工程及其自动化专业毕业，由于家里条件的原因，我不能选择继续读研深造，所以本科毕业必须出来工作，由于本科生的就业压力也是非常大的，所以当时想，在大学的时候要学习一些真正
java替换特殊字符,如何替换字符串中的特殊字符？大禹昆仑
那取决于你的意思。如果您只是想摆脱它们，请执行以下操作：(更新：显然您也想保留数字，在这种情况下，请使用第二行)StringalphaOnly=input.replaceAll("[^a-zA-Z]+","");StringalphaAndDigits=input.replaceAll("[^a-zA-Z0-9]+","");或等效的：StringalphaOnly=input.replaceAl
【Kivy App】ToggleButton切换按钮实例 Botiway 移动APP Kivy python
在Kivy中，ToggleButton是一种特殊的按钮，它可以在“选中”和“未选中”两种状态之间切换。ToggleButton通常用于表示二进制状态（如开/关）。以下是ToggleButton的使用方法、常用属性以及实例。1.基本使用方法首先，确保你已经安装了Kivy库。如果没有安装，可以使用以下命令进行安装：pipinstallkivy然后，你可以在Kivy应用中创建一个ToggleButton
一款适用于 Windows 、Mac 和 Linux 的屏幕录制与截图软件。 Mbblovey 开发语言开源软件电脑 java
Screenrec是一款适用于Windows、Mac和Linux的屏幕录制与截图软件。软件本身可以免费使用，只需要登录即可使用全部功能。当咱们打开软件后，电脑右边就会出现一个小漂浮窗。点击上方的图标就能一键开启视频录制、截屏等功能。Screenrec很有意思的是可以在开始录制屏幕的同时录制咱们的网络摄像头视频和麦克风音频。在录制完成后大家可能会发现右下角软件会给大家发出一个提醒。这就是它的另一个特
通过LoRA（Low-Rank Adaptation）低秩矩阵分解来高效微调权重变化背太阳的牧羊人模型微调矩阵线性代数深度学习人工智能自然语言处理 LoRA
LoRA的原理LoRA的核心思想是用低秩矩阵分解来建模参数的变化，而不是直接调整整个权重矩阵。这种方法通过减少微调的参数数量来提高训练效率。基本公式假设预训练模型的某一层权重为(W\in\mathbb{R}^{d\timesk})，LoRA的调整方式是：[W’=W+\DeltaW]其中(\DeltaW)是调整后的权重变化。LoRA假设权重变化(\DeltaW)的秩较低，可以表示为两个低秩矩阵的乘积
技术债务的隐患：何时重构，何时妥协？测试者家园测试开发和测试质量效能软技能软件测试质量效能 AI赋能人工智能项目管理研发管理技术债务
在快节奏的软件开发环境中，企业为了抢占市场或满足紧迫需求，往往不得不在短期内采取“捷径”来加速产品交付，这便引入了“技术债务”。短期内看似能迅速交付，但随着时间推移，这些未优化的代码和架构缺陷会逐渐累积，成为制约团队敏捷性、影响系统稳定性和增加后期维护成本的隐患。如何在“重构”和“妥协”之间找到平衡，是每个技术团队必须面对的难题。一、技术债务概述1.定义与来源技术债务（TechnicalDebt）
【Flutter】从安卓与iOS包体优化到一键自动打包脚本的一条龙服务 sugood Flutter android flutter ios
系统信息Systemversion:MacOS12Flutterversion:1.22.5Dartversion:2.10.4AndroidStudioversion:4.1.1介绍APK优化包体大小APK多渠道打包APK一键打包脚本IPA优化包体大小IPA无签名打包IPA一键打包脚本脚本地址github脚本地址安卓APK优化包体大小优化图片等资源大小，删除无用资源只选择保留必要的so库。第三方
基于 Docker 和 Flask 构建高并发微服务架构 TechStack 创行者 #服务器容器 Linux 架构 docker flask 容器微服务
基于Docker和Flask构建高并发微服务架构一、微服务架构概述（一）微服务架构的优点微服务架构是一种将应用程序拆分为多个小型、自治服务的架构风格，在当今的软件开发领域具有显著的优势。高度可扩展性：每个微服务可以独立进行扩展。例如，在电商系统中，订单服务在促销活动期间可能会面临高并发的订单处理需求，此时可以仅对订单服务进行横向扩展，增加服务实例数量，而无需对整个系统进行大规模的扩容，从而提高资源
UI自动化测试与性能测试 scratchpads ui 鸿蒙 harmonyos
在HarmonyOSNEXT应用的开发过程中，除了单元测试和集成测试外，UI自动化测试和性能测试也是不可或缺的环节。UI自动化测试用于确保应用的用户界面能够正确响应用户操作并提供预期的交互体验，而性能测试则评估应用在不同负载条件下的表现，确保其具备良好的响应速度和稳定性。本文将重点讨论如何在鸿蒙操作系统中进行UI自动化测试和性能测试，帮助开发人员提升应用质量。一、UI自动化测试UI自动化测试（UI
HPC综合-心得与笔记【19】 sakura_sea HPC and 3D Graphics Engine 线性规划
Dijkstra算法【2】基础距离数组dist，设置起点距离为0，其他节点距离为无穷大（∞）用最小堆创建优先队列，将起点放入队列。从队列中取出当前距离最小的节点u。遍历u的每个邻接节点v，计算从起点到v的路径长度：alt=dist[u]+weight(u,v)。如果altdist[u]:continue#遍历邻接节点forv,weightingraph[u].items():alt=dist[u]
数据结构-ArrayList 小豪GO! java的养成方法 java
文章目录1.线性表2.顺序表3.ArrayList4.ArrayList的问题以及思考4.2增容的性能消耗问题4.3空间浪费问题1.线性表线性表（LinearList）是n个具有相同特性的数据元素的有限序列。线性表是一种在实际中广泛使用的数据结构，常见线性表：顺序表、链表、栈、队列…线性表在逻辑上是线性结构，也就是连续的一条直线。但是在物理上不一定是连续的，线性表在物理上存储时，通常以数组和链式结
Hessian 矩阵（海森矩阵） Chen_Chance 矩阵算法机器学习
Hessian矩阵（海森矩阵）是一个包含二阶偏导数信息的方阵，在数学和优化中起着重要作用。对于一个多元函数，其Hessian矩阵是由其各个变量的二阶偏导数组成的矩阵。假设有一个函数f(x1,x2,…,xn)f(x_1,x_2,\dots,x_n)f(x1,x2,…,xn)，其Hessian矩阵(H)的元素是：Hij=∂2f∂xi∂xjH_{ij}=\frac{\partial^2f}{\parti
C++标准模板（STL）- 类型支持（杂项变换，将 std::remove_cv 与 std::remove_reference 结合，std::remove_cvref）繁星璀璨G #杂项变换 c++标准库模板运行时类型识别杂项变换 remove_cvref
类型特性类型特性定义一个编译时基于模板的结构，以查询或修改类型的属性。试图特化定义于头文件的模板导致未定义行为，除了std::common_type可依照其所描述特化。定义于头文件的模板可以用不完整类型实例化，除非另外有指定，尽管通常禁止以不完整类型实例化标准库模板。杂项变换将std::remove_cv与std::remove_reference结合std::remove_cvreftempla
打造城市二手房分析与可视化系统+聚类分析+58爬虫+线性回归 OverlordDuke 聚类算法数据可视化爬虫线性回归算法
打造城市二手房分析与可视化系统+聚类分析+58爬虫+线性回归利用数据实现全面分析数据分析与可视化功能创新的聚类分析功能结语在如今房地产市场日益复杂的背景下，对于投资者、购房者和市场分析师来说，了解市场动态并做出明智的决策至关重要。基于此，我们开发了一款基于Python的城市二手房分析与可视化系统，为用户提供了强大的工具，帮助他们深入了解当地房地产市场。利用数据实现全面分析我们的系统利用爬取的58同
神经网络之参数初始化硬水果糖人工智能神经网络人工智能深度学习
引言：参数初始化是训练深度神经网络的一个关键步骤，目的是给网络中权重（weights）和偏置（biases）赋予初始值。合适的参数初始化方法有助于提高训练速度、避免梯度消失/爆炸问题，并且加速网络的收敛。一、参数初始化目的避免梯度消失和梯度爆炸：在深度神经网络中，参数初始化对梯度流动非常重要。如果初始权重值太大或太小，可能导致梯度爆炸或梯度消失，从而增加网络的训练难度。加速收敛：良好的初始化可以帮
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
python-56-基于Vue和Flask进行前后端分离的项目开发示例实战皮皮冰燃 python3 python vue.js flask
文章目录1创建Vue前端项目1.1运行demo1.2实现需求2flask部署上述dist(前后端未分离)2.1代码app.py2.2运行访问3nginx部署(前后端分离)3.1nginx前端服务3.3.1windows安装nginx3.3.2修改nginx.conf配置文件3.3.3启动nginx3.3.3停止nginx3.2启动后端服务3.2.1app.py(去除前端渲染)3.2.2启动flas
glm-4v-9b 踩坑（4-bit量化，bitsandbytes 异常） phynikesi pytorch glm-4v-9b踩坑 bitsandbytes异常
前言本文只分享了自己在体验glm-4v-9b过程中遇到的问题，没有涉及对模型本身以及更多问题的分析，大家可先看问题描述，再决定是否看下去。实验平台：linux系统，RTXA4000。嫌麻烦的可以直接到文未看结论。问题描述16g显卡难以加载模型bitsandbytes异常，模型无法运行加载问题本人设备有限，引用一下别人完整加载模型的数据，大约18.9g。用16g显卡直接报OOM，用8-bit加载还是
爬虫基础--request库详解 amo的代码园_毕设 Java基础爬虫 java spring boot vue.js python 开发语言
爬虫基础–request库详解1.requests模块介绍request库中文文档：https://docs.python-requests.org/zh_CN/latest/user/quickstart.htmlrequests是一个非常流行的PythonHTTP第三方库，它允许你发送各种HTTP请求，处理cookies、会话、连接池、重定向、多种认证方式等，使得处理HTTP请求变得非常便捷，
C++20 新特性全面解析：从概念到协程的编程革命小乌龟登顶记 java 算法数据结构
一、引言：C++20的里程碑意义2020年发布的C++20标准被公认为继C++11之后最重要的版本更新，带来了4大核心特性和20+项重大改进。这些变革不仅提升了代码表达力，更从根本上改变了C++的编程范式。本文将深入解析C++20的关键特性，并通过实战代码示例演示其应用场景。二、四大核心特性详解2.1概念（Concepts）：模板编程的革命基本概念类型约束：通过requires子句限制模板参数类型
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi