九章智驾

自动驾驶下半场的“入场券”

交流群 | 进“传感器群/滑板底盘群/汽车基础软件群/域控制器群”请扫描文末二维码，添加九章小助手，务必备注交流群名称 + 真实姓名 + 公司 + 职位（不备注无法通过好友验证）

作者 | 张萌宇

自动驾驶战争的上半场拼的是硬件和算法，下半场拼的则是数据和将数据点石成金的能力，即数据闭环能力。

然而，笔者在跟业内人士的交流中了解到，目前，通过量产车大规模采集数据来支持自动驾驶系统迭代升级的设想尚未实现。有的公司尚未搭建好这样一套数据闭环的流程；有的公司虽然搭建好了流程，也已经采集了一些数据，但是由于数据闭环系统还不够先进，因而尚未将数据很好地用起来。

传统的自动驾驶数据闭环，存在着大量不够高效的部分。例如，几乎每家公司在数据标注环节都需要依靠“人海战术”，需要依靠人工一个个地对采集回来的数据做场景分类等。

幸运的是，我们处在一个技术快速更新的时代，随着深度学习技术的发展，尤其是，随着大模型的潜能逐步得到释放，人们很欣喜地发现，数据闭环中的很多环节都可以实现自动化或者半自动化，效率也会显著提升。

由于参数量大带来的容量优势，大模型的性能和泛化能力相比小模型显著提高。在数据预处理、数据标注等传统数据闭环中需要消耗大量人力且效率低下的环节，大模型的表现都可圈可点。很多公司都在积极探索，希望将大模型运用于数据闭环从而加速算法迭代。

大模型，或将助力数据闭环步入2.0时代（自动化程度低的时代可以称之为数据闭环“1.0”时代），从而影响到自动驾驶下半场的竞争态势。

然而，训练大模型需要大量的数据以及极高的算力，对底层的硬件设施以及AI研发平台都有很高的要求。

特斯拉为了打造一套效率高的数据闭环系统，还自研了DOJO超算中心，目前，特斯拉的Autopilot系统已收集了超过20.9亿公里的路采数据。在某种程度上，在数据闭环系统上的投入，是特斯拉得以在自动驾驶研发上大幅领先的原因之一。

然而，特斯拉这种做法的投入也是巨大的。据悉，2024年，特斯拉在DOJO超算上的投入将超过10亿美金。在国内，有这个财力的公司屈指可数。

那么，对国内的主机厂和自动驾驶公司来说，一个更可行的选择就是，上云，借助于云厂商开放出来的大模型能力、算力、工具链等基础设施及开发平台，快速步入数据闭环2.0时代。

尤其是，假如云厂商具备全栈自研能力，能提供一整套基础设施，那么主机厂和自动驾驶公司在使用时，就无需考虑不同公司提供的工具接口不一致等问题，可以减少很多适配的工作，从而进一步提高开发效率。

1. 大模型如何加速数据闭环2.0

数据闭环1.0时代，人们还没有准备好应对自动驾驶系统研发对大量数据的需求，各个模块的自动化程度不够高，效率也不够高。

数据闭环2.0时代需要一套能快速处理大量数据的系统，让数据在系统内更快地流转，提高算法迭代的效率，让车越开越聪明。

在7.21华为云智能驾驶创新峰会上，华为云自动驾驶开发平台重磅发布，在盘古大模型的加持下，该平台在corner case的解决能力、数据预处理能力、数据挖掘能力、数据标注能力方面，相比于传统的数据闭环体系，都表现出了明显提升。

1.1 盘古大模型助力corner case的解决

传统解决corner case的方式主要是通过实车路采尽力采集到足够多的相关数据，然后训练模型，从而让模型具备应对能力。这种方式成本较高而且效率较低，更何况，很多特殊场景出现的频率特别低，实车很难采集到。

近年来，人们发现可以采用NeRF技术做场景重建，然后，通过调整一下参数如改变视角、改变光照、改变车辆行驶路径的方法来模拟一些在真实世界里出现频率较低的场景（合成数据），作为实车路采数据的补充。

早在2022年初，Waymo便开始将基于NeRF技术生成的合成数据用于自动驾驶的算法训练中。

今年CVPR的highlight paper之一UniSim: A Neural Closed-Loop Sensor Simulator也是探索用NeRF技术做场景重建。在这篇文章中，来自无人驾驶卡车公司Waabi的作者将场景分为三部分：静态背景（如建筑、道路和交通标志）、动态物体（如行人和汽车）和区域外物体（如天空和非常远的道路），然后采用NeRF技术来分别建模静态背景和动态物体。

作者发现，采用NeRF技术重建的场景不仅高度逼真，而且方便扩展，研发人员只需采集一次数据就可以做重建。

在国内，华为云基于盘古大模型开发的场景重建大模型也结合NeRF技术。该模型可基于采集的路采视频数据做场景重建（合成数据），普通用户很难用肉眼分清这些重建的场景跟真实场景有何区别。这些重建的场景数据作为真实路采数据的补充，可以用于提高感知模型的精度。

具体来说，场景重建大模型输入的是一段一段的路采视频，在模型对这些视频做场景重建后，用户可以编辑天气、路况以及主车的姿态、位置、行驶轨迹等，然后生成新的视频数据。

例如，用户可以将原始视频中的天气从晴天改为雨天，也可以将白天换成黑夜（如下图所示），还可以将宽阔平整的路面变成泥泞小道。

也就是说，用户可以通过编辑场景元素来生成更多数据，而无需全部依靠路采。尤其是，对于一些不太方便采集的数据，例如极端天气下的场景数据，用户可以采用场景重建的方式来生成。

华为云的一位工程师告诉九章智驾：

我们拿场景重建的数据来训练感知算法时发现，这些数据确实对算法训练有帮助。同时，我们的大模型正在不断提高这些虚拟场景的覆盖度，争取让这些数据能够被更广泛地使用，从而让自动驾驶算法可以应对更多的corner case。

对corner case的解决能力提高，意味着自动驾驶系统在车辆行驶中的参与度提高，用户体验更好，最终可以带动自动驾驶的渗透率上升。

1.2 盘古大模型助力数据预处理

车端采集的数据一般需要经过预处理，然后再进入挖掘和标注流程。预处理的主要作用是给数据分类，去掉不需要的数据，保留重要场景的数据。

传统的采用人工回放来给数据分类的方式非常耗时，假如用大模型来理解视频的内容，自动给这些视频数据分类，就可以大幅提高工作效率。

用模型来给视频分类的难点在于，如何通过语义的方式解锁视频的场景，华为云基于盘古大模型开发的场景理解大模型可以对视频数据做语义理解然后分类。用户上传视频数据后，模型可以识别出关键信息，按照视频类别、出现的时间进行标记，如下图所示，同时支持组合检索。

经测试，场景理解大模型对天气、时间、物体等的识别精度都可达90%以上。

据悉，此种方案已在某主机厂项目中落地。工程师仅需调用华为云提供的API就可以用场景理解大模型来完成给视频数据分类的工作。

1.3 盘古大模型助力数据挖掘

在车辆将路采数据回传到云端后，工程师通常需要挖掘出价值较高的数据。传统的基于标签来挖掘长尾场景的方式一般只能分辨已知的图像类别。

大模型有较强的泛化性，适合用于对长尾数据的挖掘。

2021年，OpenAI发布了CLIP模型（一种文字——图像多模态模型），该模型可以摆脱对图片标签的依赖，在无监督预训练之后将文本和图像对应，从而基于文本对图片进行分类。

这意味着，工程师可以采用这样的文字-图像多模态模型，用文字描述来检索drive log中的图像数据，例如，‘拖着货物的工程车辆’、‘两个灯泡同时亮着的红绿灯’等长尾场景。

根据笔者与业内人士交流得到的信息，一些自动驾驶科技公司已经开始基于CLIP来实现以文搜图，从而提高挖掘长尾数据的效率。

华为云基于盘古大模型开发了多模态检索大模型，多模态检索大模型除了可以实现以图搜图、以文搜图外，还可以以文搜视频。例如，工程师希望找到前车异常停止的视频片段，可以直接用“前车异常停止”来搜索相关的视频片段。

1.4 盘古大模型助力数据标注

根据估算，头部自动驾驶公司每年大概要标注上百TB甚至是PB级的数据需要标注，标注成本高达上千万甚至上亿。

为了降低标注成本，同时提高标注效率，很多公司都在开发自动标注模型。

但目前，大部分公司的自动标注模型（小模型）都存在着不够通用的问题。

在实践中，工程师通常需要针对不同的场景训练不同的标注模型（比如，标注红绿灯的模型，不能用来标注车道线），重新训练的过程可能需要消耗大量的数据及算力，成本较高。

在盘古大模型的基础上，华为云开发了预标注大模型。借助预标注大模型，在面对新的场景时，工程师无需从头开始训练，仅需对基础模型做“微调”，就可以得到针对新场景的预标注大模型。

根据华为云工程师的介绍，针对不同类型的自动驾驶场景，预标注大模型仅需用少量数据（几百到几千张图片）做为期1-2周的训练就能达到较为理想的预标注效果。

并且，针对2D、3D标注任务，预标注大模型可以实现高精度标注。采用预标注大模型做预标注后，标注公司基本只需要再做一些质检，这样可以显著降低标注成本。

2.用户如何方便地调用大模型？

说一千道一万，大模型最终还是要接受用户的检验。那么，用户该如何调用大模型呢？

实际上，再通用的大模型，也不会是万能的。大模型的“大”，主要强调其在底层能力方面的通用性，而不是说它有能力解决“每一个细分场景的中每一个细节问题”。在具体落地的过程中，大模型往往要分多个层级，到最终的执行端，真正“干活”的可能是“中模型”，甚至是“小模型”。

在这里，我们以华为云发布的盘古大模型3.0为例来做个简单的阐释。

盘古大模型3.0是一个分层的解耦的开放架构，总共分为3层，如下图所示：

最底层是L0级的基础大模型，它包括语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型等5个大模型。L0级基础大模模型对应的能力，类似于人的看、听、说、读、写、算、思等基础能力，是无论在哪个行业、无论干什么工作，都需要用到的。

在L0级模型的基础上，华为云针对不同行业开发了L1级的行业大模型，包括政务大模型、金融大模型、制造大模型、矿山大模型等。每个L1级行业大模型都跟特定的行业强耦合。

在L0级基础模型和L1级行业大模型的基础上，华为云还给细分场景的用户生成了一些解决特定问题的任务模型，即上图中的L2级场景模型。本文第一章提到的预标注大模型、场景重建大模型等都属于L2级场景模型。

除此之外，在L0级和L1级大模型的基础上，华为云给用户提供了模型开发套件，用户可以用自己收集的数据对L2级的场景理解模型做微调，得到自己的场景模型。

以场景理解大模型为例，用户可以直接调用华为云的API来使用场景理解大模型，也可以加入自有数据训练自己的场景理解大模型。

由此看来，华为盘古大模型3.0的进化是“双轮驱动”：一方面，华为云通过不断地收集公开数据让基础大模型学习通用知识，并且让行业大模型学习行业知识（据悉，华为云的每个行业大模型的训练数据都超过了500亿tokens)；另一方面，用户也可以不断地收集适用于自己面对的场景的数据，提高微调后的场景大模型解决特定问题的能力。

在这种机制下，已训练好的大模型，只需少量补充训练样本，就有可能快速迁移到新的场景，大大降低应用推广成本和门槛，提升使用效率。

3.为了追求大模型“好用”，华为云都做了些什么？

在实践中，用户要真正用好大模型的能力来为数据闭环赋能，还需要一系列的基础设施。

目前，自动驾驶产业碎片化严重，即使是把范围缩小到数据闭环系统，我们也会看到，在整个生态中，不同的供应商占据着各自的一小部分。体现在研发上，就是数据格式多种多样、工具链的接口不一，主机厂和自动驾驶公司不得不做很多的适配工作，研发的协同效应较差。

如果能有一家供应商可以提供数据闭环工具链的全栈解决方案，那下游客户在使用大模型做数据闭环时就会轻松许多。

在国内，华为云就是极个别具备自动驾驶数据闭环工具链全栈自研能力的云厂商之一。除了给用户提供大模型的能力外，华为云也可以提供数智融合架构、ModelArtsAI开发生产线、昇腾AI云服务等一系列配套设施，用户可以在华为云的自动驾驶开发平台上同时实现数据加速、算法加速和算力加速。

3.1 数智融合架构实现数据加速

在实际使用中，“数据孤岛”是困扰各位研发工程师的一大问题。数据孤岛问题包括但不限于数据格式不一致、工具链接口不一、工具分散在不同的平台导致协同困难等。

针对这些问题，华为云一方面尽力找到各家主机厂以及自动驾驶公司的需求“公约数”，将工具链打造得更加通用，省去很多适配工作；另一方面把数据生产线和AI生产线融合到一起，通过一个统一的原数据管理平台实现数据的无缝流转，在该平台上，工程师可以很方便地在全域数据内使用预置AI算法，将盘古大模型以API和工作流的方式集成到整体的数智融合架构中，从而可以很方便地调用盘古大模型的能力。

3.2 ModelArts AI开发生产线实现算法加速

ModelArts AI开发生产线包含DataTurbo、TrainTurbo、InferTurbo 3部分，分别提供数据加载、模型训练、模型推理的加速工具，倍速提升模型训练效率。

3.2.1 DataTurbo实现数据加载加速

当模型变大后，用于训练模型的数据也会相应增加，相应地，数据读写效率就成为了一个对模型训练速度影响很大的因素。

DataTurbo将计算集群本地的高速SSD盘组建成统一的分布式缓存系统，算法从后端OBS初次读取训练数据时系统会自动将数据缓存，后续训练数据从近计算缓存直接获取，大幅提升数据加载性能。DataTurbo的分布式缓存数据读取带宽可以做到随计算集群节点扩容而线性扩展，最高可达1TB/s以上。

3.2.2 TrainTurbo实现模型训练加速

神经网络由很多基础的算子排列组合而来，因此，优化算子是提高模型训练效率的重要方式。

主流的AI训练框架（如PyTorch、TensorFlow等）由于需要尽可能地保证通用性，提供的算子一般都很基础。

在实践中，企业可以根据自己的需求，对算子做一些针对性的优化。华为、商汤、字节跳动、百度等公司都开发了自己的AI训练框架，并对算子做了针对性的优化，从而提高模型训练效率。

其中，华为由于从底层硬件到工具链再到AI模型的训练框架，都实现了全栈自主，那么，工程师就更容易对算子做软硬联合调优，因而，在TrainTurbo中，用户可以享受到更极致的训练性能。

3.2.3 InferTurbo实现模型推理加速

在模型推理环节，InferTurbo采用算子并行、多流并行、显存复用、低bit量化等方法，针对不同的框架、操作系统进行调优。

以多流并行为例，推理任务中通常需要执行函数计算、数据在多个GPU设备间拷贝或转移等几个操作。InferTurbo把一个大任务中的上述几部分拆分开，放到多个流中，每次只对一部分数据进行拷贝、计算和回写，将数据拷贝和函数计算同步执行，形成流水线，能获得非常大的性能提升。

经过多种方式的优化后，InfeTurbo在确保模型精度的前提下，可以将推理性能提升2-5倍。

3.3 昇腾AI云服务实现算力加速

为了应对模型训练的算力需求，各家科技公司、主机厂等纷纷开始自建/合建算力中心，打造算力集群。华为云在乌兰察布和贵安数据中心同时上线了昇腾AI云服务，为模型训练提供澎湃算力，单集群性能可达2000P Flops，给业界提供了更好的选择。

大规模的算力集群通常会面临业务连续性的问题，因为单点故障就可能导致整个大规模分布式任务失败。

当然，这一问题并非无解。至少，华为云就不会被这个问题困扰。

为保证训练任务不中断，华为云开发了断点续训的方法，假如在训练过程中出现了单点故障，系统会将这个点排除掉，用新的节点替换掉故障节点，并且原地重启。据悉，昇腾AI云服务可以实现千卡训练一个月以上不中断，断点恢复时长不超过10分钟。

结语：

今年以来，各大车企都在积极进军城市NOA。自动驾驶技术有望“跨越鸿沟”，从科技尝鲜者的圈层突破到大众圈层。

当然，并非所有公司都有能力抓住这一契机。

如果不出意料的话，我们将会看到，自动驾驶在进入下半场之后，那些无法在数据闭环能力上取得突破的公司，将一方面同时被“高成本”和“低效率”拖累，另一方面因为对corner case的解决能力无法取得突破而难以令终端消费者满意。

事实上，只有那些真正掌握了数据闭环能力的公司，或者更近一步说，那些能将大模型等技术运用好从而打造出一套高效的数据闭环系统的公司，才算是拿到了自动驾驶下半场的“入场券”。

当然，对数据闭环能力的掌握，未必要所有东西全部通过自研来实现。因为，普通公司的资源不是特别充沛的情况下，把自研做得太重，反而可能导致竞争力被削弱。在这种情况下，自己只研发数据闭环系统的应用层，而底层基础设施跟有实力的供应商来合作，是更可行的选择。

在这样一个行业拐点时刻，华为云将盘古大模型、算力、工具链等数据闭环基础设及开发平台开放出来，将帮助主机厂和自动驾驶科技公司加速自动驾驶的算法迭代。

我们期待，在产业界各方的努力下，自动驾驶技术能早日取得突破，让大家感受到科技带来的便利。

END

交流群 | 进“传感器群/滑板底盘群/汽车基础软件群/域控制器群”请扫描上方二维码，添加九章小助手，务必备注交流群名称 + 真实姓名 + 公司 + 职位（不备注无法通过好友验证）

写在最后

与作者交流

如果希望与文章作者直接交流，可以直接扫描右方二维码，添加作者本人微信。

注：加微信时务必备注您的真实姓名、公司、现岗位，谢谢！

关于投稿

如果您有兴趣给《九章智驾》投稿（“知识积累整理”类型文章），请扫描右方二维码，添加工作人员微信。

注：加微信时务必备注您的真实姓名、公司、现岗位，谢谢！

“知识积累”类稿件质量要求：

A：信息密度高于绝大多数券商的绝大多数报告，不低于《九章智驾》的平均水平；

B：信息要高度稀缺，需要80%以上的信息是在其他媒体上看不到的，如果基于公开信息，需有特别牛逼的独家观点才行。多谢理解与支持。

推荐阅读：

◆自动驾驶数据闭环系列之一：理想丰满，现实骨感

◆万字长文说清大模型在自动驾驶领域的应用

◆“去高精地图”跟“轻高精地图”有啥区别？落地的挑战又是啥？| 九章自动驾驶随笔之一

◆工程化能力，并非L4自动驾驶公司不可逾越的障碍 | 九章自动驾驶随笔之二

◆主机厂的“丈母娘思维”，迫使自动驾驶行业背离了“最优解” | 九章自动驾驶随笔之三

STM32智能小车的设计与实现 a1666137 stm32 嵌入式硬件单片机
一、引言随着科技的飞速发展，智能小车作为一种集机械、电子、计算机、传感器、人工智能等技术于一体的新型交通工具，已经广泛应用于科研、教育、娱乐等多个领域。STM32作为一款高性能、低功耗的微控制器，凭借其强大的功能和灵活的编程方式，成为智能小车设计的首选平台。本文将对基于STM32的智能小车的设计与实现进行详细介绍。二、智能小车系统概述基于STM32的智能小车系统主要由STM32微控制器、电机驱动模
从Manus爆红到OpenAI反击：AI Agent技术架构与实战解析大F的智能小课大模型理论和实战 DeepSeek技术解析和实战人工智能架构
大家好，我是大F，深耕AI算法十余年，互联网大厂技术岗。知行合一，不写水文，喜欢可关注，分享AI算法干货、技术心得。欢迎关注《大模型理论和实战》、《DeepSeek技术解析和实战》，一起探索技术的无限可能！1.引：一夜爆红的Manus与OpenAI的反击2025年3月6日凌晨，中国团队Monica推出的通用人工智能代理产品Manus横空出世。这款被称作"Agent界的DeepSeek时刻"的产品，
量子神经网络（Quantum Neural Network）：结合量子计算的 AI 新探索盼达思文体科创人工智能和深度学习量子计算人工智能神经网络
一、引言在当今科技飞速发展的时代，人工智能（AI）和量子计算成为了两个备受关注的领域。量子神经网络（QuantumNeuralNetwork，QNN）作为这两个领域的交叉点，正吸引着越来越多的研究兴趣。QNN试图将量子计算的强大能力与传统神经网络的学习能力相结合，为解决复杂的人工智能问题提供新的思路和方法。二、量子计算基础（一）量子比特（Qubit）量子比特是量子计算的基本信息单位，与传统的比特不
AI 革命再提速：从 Manus 封停到 OpenAI 开源，技术竞赛与伦理博弈下的产业变局 zhz5214 AI 人工智能开源智能体 ai AI编程 AI写作
2025年3月，人工智能领域迎来戏剧性转折。继DeepSeek以开源策略搅动市场后，新兴AI公司Manus的官方X账号因涉嫌关联加密货币诈骗被平台封禁，引发轩然大波。而在封禁事件发酵不到一周，OpenAI连夜发布AgentSDK与ResponsesAPI，以开源姿态强势回应。这场技术竞赛与伦理博弈交织的产业变局，正将AI革命推向新的临界点。一、技术突围与平台博弈：Manus事件的双重隐喻Manus
深度学习中的注意力机制：解锁智能模型的新视角冰蓝蓝深度学习深度学习人工智能
在人工智能的快速发展中，深度学习模型已经成为了处理复杂数据和任务的主力军。然而，随着数据量的激增和任务的复杂化，传统的深度学习模型面临着效率和性能的双重挑战。在这样的背景下，注意力机制（AttentionMechanism）应运而生，它不仅提升了模型的处理能力，还为深度学习领域带来了新的研究视角。什么是注意力机制？注意力机制是一种受人类视觉注意力启发的技术，它允许模型在处理大量信息时，能够动态地聚
机器学习Pandas_learn3 XW-ABAP 机器学习 pandas
frompandasimportDataFrameimportnumpypaints={"车名":["奥迪Q5L","哈弗H6","奔驰GLC"],"最低报价":[numpy.nan,9.80,numpy.nan],"最高报价":[49.80,23.10,58.78]}goods_in=DataFrame(paints,index=[1,2,3])print(goods_in)goods_in_n
【技术解密】本地部署 DeepSeek-V3：完整指南海棠AI实验室 “智元启示录“-AI发展的深度思考与未来展望人工智能深度学习 DeepSeek
目录引言运行环境需求下载与安装推理部署总结参考资源引言随着人工智能的快速发展，开源大模型正逐步改变着技术生态。DeepSeek-V3作为最新的开源大模型之一，不仅提供了强大的推理能力，同时也支持本地部署，使开发者可以灵活地进行自定义优化。本文将详细介绍如何在本地部署DeepSeek-V3，涵盖系统要求、安装步骤、模型转换及不同推理框架的应用。1.运行环境需求1.1硬件要求✅NVIDIAGPU（支持
人工智能伦理与可持续发展 CarlowZJ 人工智能
前言人工智能（AI）技术正在深刻地改变我们的生活和工作方式。从自动驾驶汽车到智能医疗系统，从个性化推荐到自动化决策，AI的应用无处不在。然而，随着技术的快速发展，其伦理和社会影响也引发了广泛的关注。人工智能伦理不仅涉及技术本身的公平性、透明性和安全性，还涉及到更广泛的社会、经济和环境影响。本文将探讨人工智能伦理的核心问题，并从可持续发展的角度提出应对策略。一、人工智能伦理的核心问题1.1数据隐私与
机器学习中输入输出Tokens的概念详解爱吃土豆的程序员机器学习基础机器学习人工智能 Tokens
随着深度学习技术的快速发展，大语言模型（LargeLanguageModels,LLMs）已经成为自然语言处理（NLP）领域的一个热点研究方向。这些模型不仅能够生成高质量的文本，还能在多种任务中展现出卓越的表现，比如机器翻译、问答系统、文本摘要等。在大语言模型的工作流程中，Tokens的概念扮演着至关重要的角色。本文将详细介绍大语言模型如何使用Tokens，以及如何计算Tokens的数量。什么是T
LLM-PowerHouse: 一站式大型语言模型定制训练与推理指南 Nifc666 语言模型人工智能自然语言处理 whisper langchain gpt 开源软件
LLM-PowerHouse:解锁大型语言模型的潜力在人工智能和自然语言处理领域,大型语言模型(LargeLanguageModels,LLMs)正在掀起一场革命。随着GPT、BERT等模型的出现,LLMs展现出了惊人的能力,可以执行各种复杂的语言任务。然而,如何有效地训练和使用这些强大的模型仍然是一个挑战。针对这一需求,GitHub上的LLM-PowerHouse项目应运而生,为开发者、研究人员
【sklearn 01】人工智能概述 @金色海岸人工智能 sklearn python
一、人工智能，机器学习，深度学习人工智能指由人类制造出的具有智能的机器。这是一个非常大的范围，长远目标是让机器实现人工智能，但目前我们仍处在非常初始的阶段，甚至不能称为智能机器学习是指通过数据训练出能完成一定功能的模型，是实现人工智能的手段之一，也是目前最主流的人工智能实现方法深度学习则是机器学习的分支，超过8层的神经网络模型就叫深度学习，深度即层数。深度学习目前在语音、图像等领域取得很好的效果
【人工智能】【Python】在Scikit-Learn中使用决策树算法（ID3和CART） SmallBambooCode 机器学习人工智能 python 算法 scikit-learn 决策树机器学习 ai
importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.treeimportDecisionTreeClassifier,plot_tree#加载数据集iris=load_iri
差异中寻找共识：浅析中美欧AIGC服务商的标识义务人工智能
2025年1月7日，西藏日喀则地震中一张被广泛传播的图片“被压在废墟下的小男孩”被证明是AI合成图片，[1]这随即引发了社会对于人工智能生成物（ArtificialIntelligenceGeneratedContent，以下简称“AIGC”）的广泛讨论。随着AI大模型生成逼真图像、音频与视频的能力日益增强，人类作品与AIGC之间的界限愈发模糊。如不加以管控，则会产生“真相侵蚀”（TruthDec
迷雾渐开：美国AIGC可版权性剖析及案例梳理人工智能
当地时间2025年1月29日，美国版权局（U.S.CopyrightOffice,USCO）发布了版权和人工智能相关法律和政策报告的第二部分——《版权和人工智能：可版权性》（以下简称“《USCO可版权性报告》”）[1]，旨在探讨人工智能生成内容（AIGC）的可版权性问题。该报告明确指出，美国版权局认为现有的版权法足以解决AIGC问题，因此无需制定新的立法。具体而言，该报告在此前美国版权局于2023
智能体平台架构深度剖析：从底层到应用的全链路解析人工智能
在当今人工智能飞速发展的时代，智能体平台作为承载和驱动智能应用的关键基础设施，其架构设计至关重要。一个优秀的智能体平台架构，能够高效整合各类资源，实现智能体的灵活构建与稳定运行，为多样化的应用场景提供强大支持。稳固根基：基础资源层与并行平台层基础资源层是整个智能体平台的基石。其中，GPU和服务器构成了强大的计算硬件支撑，确保平台能够应对复杂的计算任务。而数据与OSS（对象存储服务）则如同智能体的“
美国首例AI训练数据版权案：从汤森路透诉罗斯案看AI训练数据的“合理使用” 人工智能
随着人工智能（AI）技术的快速发展和广泛应用，复杂的版权问题也随之而来。2025年2月11日，美国特拉华州联邦地区法院对汤森路透（ThomsonReuters）诉罗斯（Ross）案作出部分简易判决，认定被告罗斯公司未经授权使用受版权保护的作品训练AI法律检索工具的行为构成版权侵权，且不属于合理使用。[1]这是美国首个就AI训练数据作出实质性判决的案件。本文将重点分析其合理使用论述中对于“转换性目的
【人工智能基础2】Tramsformer架构、自然语言处理基础、计算机视觉总结 roman_日积跬步-终至千里人工智能习题人工智能自然语言处理计算机视觉
文章目录七、Transformer架构1.替代LSTM的原因2.Transformer架构：编码器-解码器架构3.Transformer架构原理八、自然语言处理基础1.语言模型基本概念2.向量语义3.预训练语言模型的基本原理与方法4.DeepSeek基本原理九、计算机视觉七、Transformer架构1.替代LSTM的原因处理极长序列时，效率下降：虽然LSTM设计的初衷是解决长期依赖问题，即让模型
怎么做一个AI产品经理？ AI筑梦师 AI产品经理人工智能产品经理
AI产品经理全面进化：在人工智能迅猛发展的时代，产品经理的角色正经历前所未有的转型。从传统的需求捕捉者到技术与商业紧密结合的创新推动者，AI产品经理肩负着将前沿AI技术转化为解决用户痛点的产品的重要任务。随着大数据、云计算和大模型技术的不断成熟，产品经理不仅需要具备敏锐的市场洞察，还必须深刻理解AI技术本质，跨界整合技术、数据与业务优势，从而推动产品的持续创新与落地。本文将全面解析AI产品经理的角
自动驾驶中间件技术对比小牛蛋自动驾驶中间件
转载：自动驾驶中间件技术辨析：ROS、Apex.Grace、DDS、AutoSAR和AutoSARAdaptive-CSDN博客在自动驾驶技术的演进中，中间件作为连接硬件、操作系统与应用软件的核心枢纽，其安全性、实时性和可扩展性至关重要。当前市场上主流的中间件技术包括ROS/ROS2、Apex.Grace（Apex.OS）、DDS、AutoSAR（经典平台CP）和AutoSARAdaptive（自
【AI】使用Python实现机器学习小项目教程丶2136 AI 人工智能 python 机器学习
引言在本教程中，我们将带领您使用Python编程语言实现一个经典的机器学习项目——鸢尾花（Iris）分类。通过这个项目，您将掌握机器学习的基本流程，包括数据加载、预处理、模型训练、评估和优化等步骤。论文AIGC检测，降AIGC检测，AI降重，三连私信免费获取：ReduceAIGC9折券！DetectAIGC立减2元券！AI降重9折券！目录引言一、项目背景与目标二、开发环境准备2.1所需工具2.2环
LORA 微调大模型：从入门到入土大模型. 人工智能开发语言 gpt agi 架构大模型
在当今人工智能领域，预训练的大模型已经成为推动技术发展的核心力量。然而，在实际项目中，我们往往会发现这些预训练模型虽然强大，但直接就去应用于一些特定的任务时，往往无法完全满足需求。这时，微调就成为了必不可少的一步。而在众多微调方法中，LORA全名(Low-RankAdaptation)以高效性和实用性，逐渐成为了许多开发者训练模型的首选项。作为一名小有经验的咸鱼开发者，我深知在实际项目中高效的进行
AI人工智能中的概率论与统计学原理与Python实战：Python实现概率模型 AI天才研究院 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的不断发展，概率论与统计学在人工智能领域的应用越来越广泛。概率论与统计学是人工智能中的基础知识之一，它们在机器学习、深度学习、自然语言处理等领域都有着重要的作用。本文将介绍概率论与统计学的核心概念、算法原理、具体操作步骤以及Python实现方法，并通过具体代码实例进行详细解释。2.核心概念与联系2.1概率论与统计学的区别概率论是一门数学学科，它研究随机事件发生的可能性。
二值逻辑、三值逻辑到多值逻辑的变迁（含示例）搏博人工智能原理算法人工智能机器学习线性代数图像处理数据分析
二值逻辑、三值逻辑到多值逻辑的变迁是一个逻辑体系不断拓展和深化的过程，反映了人们对复杂现象和不确定性问题认识的逐步深入。前文，我们已经探讨过命题逻辑与谓词逻辑，了解了如何用符号语言从浅入深地刻画现实世界。具体可以看我的CSDN文章：人工智能的数学基础之命题逻辑与谓词逻辑（含示例）-CSDN博客人工智能中用到的逻辑可概括地划分为两大类。第一类是经典命题逻辑和一阶谓词逻辑，第二类是泛指除经典逻辑之外的
ollama下载的DeepSeek的模型(Model)文件在哪里？(C盘下) 神秘泣男子常见AI大模型部署与应用 Ollama部署LLM 人工智能 ollama llama 自然语言处理机器学习
目录一、下载大模型（DeepSeek）2.安装Ollama3.检查安装是否成功二、拉取大模型（DeepSeek）1.打开命令行2.下载模型3.测试下载4.等待下载完成三.模型存放路径这个位置！！在人工智能快速发展的今天，大语言模型已经成为许多人探索和使用的热门技术。而Ollama作为一款轻量级的本地大模型运行工具，让我们能够在个人电脑上体验各种强大的AI模型，如DeepSeek系列。不少用户在安装
技术解析麦萌短剧《月光下的你》：从「时间序列的对抗扰动」到「加密身份的收敛证明」萌萌短剧重构
《月光下的你》以十六年的时间跨度展开一场关于「数据污染」与「身份验证」的深度博弈，本文将用机器学习视角拆解这场跨越时空的模型纠偏实验。1.数据污染事件：十六年前的对抗攻击许芳菲（Agent_Xu）的遭遇可视为时间序列上的对抗样本注入：标签篡改攻击：许清清（Adversary_XuQing）通过伪造标签（Label_Tampering）将Agent_Xu与傅临州（Node_Fu）强行关联，触发道德约
AIGC从入门到实战：可能消失的职业和新出现的机会 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIGC从入门到实战：可能消失的职业和新出现的机会作者：禅与计算机程序设计艺术1.背景介绍人工智能生成内容（AIGC）正在迅速改变我们的世界。从文本、代码到图像和音乐，AIGC正在各个领域展示其强大的能力，并开始挑战传统的创意产业。本篇文章将深入探讨AIGC的概念、技术原理、应用场景以及其对未来职业的影响，并为读者提供入门AIGC的实用指南。1.1AIGC的兴起AIGC的兴起得益于近年来人工智能技
机器学习 [白板推导]（三）[线性分类] 神齐的小马机器学习分类人工智能
4.线性分类4.1.线性分类的典型模型硬分类：输出结果只有0或1这种离散结果；感知机线性判别分析Fisher软分类：会输出0-1之间的值作为各个类别的概率；概率生成模型：高斯判别分析GDA、朴素贝叶斯，主要建模的是p(x⃗,y)p(\vec{x},y)p(x,y)概率判别模型：逻辑回归，主要建模的是p(y∣x⃗)p(y|\vec{x})p(y∣x)4.2.感知机4.2.1.基本模型模型：f(x
内容创作者必备！Deepseek赋能，让创作更高效小焱创作 AI改变未来人工智能人工智能写作 ai写作深度学习神经网络 ai chatgpt
内容创作者必备！DeepSeek赋能，让创作更高效在当今信息爆炸的时代，内容创作已成为自媒体博主们展现才华、吸引粉丝的重要途径。然而，面对日益增长的竞争压力和不断变化的用户需求，如何高效、高质量地产出内容成为了摆在我们面前的一大挑战。幸运的是，随着人工智能技术的飞速发展，一款名为DeepSeek的智能工具应运而生，为内容创作者提供了强大的赋能。本文将深入探讨DeepSeek的基本概念、深层次解读、
开源模型应用落地-Qwen2-VL-7B-Instruct-vLLM-OpenAI API Client调用开源技术探险家开源大语言模型-新手试炼深度学习 AI编程 AIGC
一、前言学习Qwen2-VL，为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。这不仅拓宽了我们的知识视野，更让我们站在科技发展的潮头，紧跟时代的步伐。Qwen2-VL具有卓越的图像和视频理解能力，以及多语言支持等特性。学习它可以提升我们处理复杂视觉信息的能力，无论是在学术研究中分析图像数据、解读视频内容，还是在实际工作中进行文档处理、解决
ChatGPT、DeepSeek、Grok 三者对比：AI 语言模型的博弈与未来一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能技术的飞速发展，AI语言模型已经成为人机交互、内容创作、代码生成、智能问答等领域的重要工具。其中，ChatGPT（OpenAI）、DeepSeek（中国团队研发）和Grok（xAI，ElonMusk旗下公司）是当前三大具有代表性的AI语言模型。它们在技术架构、应用场景、用户体验、生态开放性等多个维度各具特色，并针对不同的用户需
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

自动驾驶下半场的“入场券”

你可能感兴趣的:(自动驾驶,人工智能,机器学习)