ifenxi爱分析

长安汽车：基于云器Lakehouse一体化数据平台，建立智能互联时代的领先优势丨案例研究

长安汽车智能化研究院是中国长安汽车集团有限责任公司旗下专注于汽车智能化技术研究和创新的研发机构。其愿景是通过持续创新和技术突破，实现汽车智能驾驶、智能网联和智能交通的全面发展，提供更安全、更便捷、更智能的出行体验，并成为中国汽车智能化领域的领军企业。

智能化是汽车工业发展近百年来对汽车功能的一次重新定义，它旨在利用大数据、人工智能、云计算、物联网等数字技术，对汽车设备和系统的运行状态进行全方位的感知、分析、决策和控制，从而提高汽车的安全性、舒适性、便捷性和节能性。因此，对于广大汽车企业而言，实现汽车智能化的关键之一，是需要首先建立起一个稳定、高效的数据平台，以承载和利用海量的车联网数据。

以长安汽车智能化研究院为例，其承担着整个长安汽车集团车联网数据的汇聚、处理和应用工作，并已在业务指标分析、质量管理系统、智慧能耗、智能诊断、智慧运营等重点场景实现一定的数据应用。而此前支撑这些应用的，是长安汽车智能化研究院基于Lambda架构，采用Flink、Hive、Iceberg、Doris等多个开源大数据组件组装而成的数据平台，如用Spark做离线数据的加工，Doris做实时数据的查询，并以Iceberg做数据湖支持规模数据的写入，以两个独立的通道来支持数据的离线加工和实时业务。这也是业界主流的数据架构，承载了长安汽车一直以来的数智化发展。

图1：长安汽车原有数据平台架构（来源：长安汽车智能化研究院）

然而，在近几年汽车销量快速增长，以及汽车智能化水平不断提升的背景下，长安汽车原有的数据平台逐渐难以应对规模迅速膨胀的车联网数据，其面临的挑战主要集中在以下几个方面：

图2：发展过程中数据平台遇到的挑战（来源：长安汽车智能化研究院）

难以承接高吞吐，大规模数据的实时写入和处理。为了实现智能化，汽车的车门、座椅、刹车等设备上会被设置大量的传感器，每个传感器会收集一种或多种类型的信号数据，之后再被汇聚和做进一步加工处理。具体到长安汽车，其当前需要处理信号数据达到上千种，并且随着其汽车智能化水平的不断提升，预期在未来需要处理信号数据将达到上万种；与此同时，长安汽车近年来销量持续增长，市场保有量不断提高，当前已经需要支持400万辆车的连接，预计到2025年需要连接上千万辆。

信号数以及汽车保有量的快速增加，以及车联网数据本身具有高采集密度的特点，首先给长安汽车带来的就是数据写入的挑战。一方面，长安汽车车联网数据的每秒的吞吐量已达数百万级TPS，预期很快就会达到千万级TPS；另一方面，长安汽车当前每天产生的车联网数据规模已达到几十TB，未来每天产生的数据可能会数倍于这个量级。

但长安汽车原有的数据平台通过组合多个数据通道产品，如Kafka -Flink- Iceberg/HDFS形成复杂的数据加工链路，来解决数据入湖仓的问题，实时性不足，且过程需要做非常多的预计算和处理。原先的数据平台无论在系统能力，还是资源消耗层面已经疲于应对当前这种规模的数据写入，更不必说未来数倍规模增长的数据。

2）难以支撑准确及时的数据查询分析需求。在车联网场景的数据应用中，快速给出各种分析结果是保障服务有效性的前提。例如在智能诊断中，车企需要近实时地收集相关信号数据，并快速定位故障原因。但车联网数据的处理存在很多特殊性，在很多场景下，原有数据平台在性能和成本等方面，不能支持实时查询和分析的更高需求，包括：

Doris链路通常只适合对有限列的信号数据进行实时处理，如果用Doris对车联网全量信号数据进行分析，成本会非常高昂。

车联网数据的采集会存在很多延迟的情形，如在地下车库等信号不佳的地区，数据回传存在一定时间差，导致需要重新扫描一定时间内的历史数据，并进行写入更新。而如果用原有的数据平台频繁地进行延迟数据更新，会带来额外的高成本。

随着汽车上传感器数量的增加，数据平台需要写入和处理的信号类型数据会不断变化，也即数据的schema会出现变动。但原有的数据平台不能灵活高效地支持这种信号列可变的数据处理。

车辆静置或设备状态没有发生改变期间，平台采集了大量重复的信号数据，如对大量重复数据进行计算，不仅会大幅降低计算性能，同时也造成了较高的资源浪费。

3）难以负担不断攀升的数据存储和计算成本。长安汽车数据量的快速攀升，以及逐渐要求对数据进行全量写入和计算的要求，给其带来了逐渐高昂的数据存储和计算成本。但与此同时，原有数据平台却不能很好地针对车联网数据的特点进行针对性地的成本优化，例如：

原有数据平台采用Json格式对车联网数据进行存储，无法对数据进行有效压缩，从而降低存储和计算成本。
原有数据平台在多套引擎中传输和同步数据，造成了数据存储的冗余，以及额外的ETL作业和计算成本。
原有数据平台采用存算一体的架构，无法针对存储和计算资源需求，分别进行弹性扩展。
4）难以应对多组件带来的使用和运维的复杂性。为了高效处理车联网数据，长安汽车智能化研究院曾尝试在原有的数据平台架构基础上，引入新的大数据组件，修补之前遇到的问题。然而，不断堆叠的各类大数据组件，让整个平台的使用和运维非常复杂。因为在组装式的架构中，每个引擎都是独立开发和运维的，它们之间可能存在不同的系统设计优化方向。当业务需要调整引擎之间的配置时，例如重新平衡数据新鲜度、性能和成本之间的关系，需要进行复杂的修改和重复开发工作。这增加了调整的复杂性和耗时，使得数据架构调整的周期较长，无法应对快速变化的业务需求。

构建Lakehouse一体化数据平台，获取数据处理时效性、性能、成本和易用性的最优解

为了支撑海量车联网数据的写入和处理，并在数据处理的时效性、性能、成本和易用性等方面获得显著优化，以应对长安汽车在当前以及未来的汽车智能化需求。长安汽车智能化研究院经过反复的探讨和验证，最终发现如果继续基于开源路线，采取对原有数据平台打补丁的方式，无法从根本上解决上述问题，因此迫切需要引入一套针对物联网数据处理的全新的数据平台架构和技术体系。最终，长安汽车智能化研究院基于云器科技自研的Lakehouse一体化数据平台，为其痛点需求找到了最佳解决方案。

图3：开源路线演进方式存在的瓶颈（来源：长安汽车智能化研究院）

云器科技成立于2021年，是一家多云及一体化的数据平台提供商，团队成员主要由来自阿里云、字节、微软、Oracle等国内外顶尖云计算与大数据企业的资深技术人员组成。云器科技自研的Lakehouse一体化数据平台，能够让数据平台架构更简单、数据更开放、分析更灵活。

图4：长安汽车基于云器科技产品升级后的Lakehouse一体化数据平台架构（来源：长安汽车智能化研究院）

长安汽车基于云器科技产品升级后数据平台采用了一体化的架构，以及极具创新性的全数据链路实时增量计算模式，结合多重技术优化，让长安汽车能够以较低的成本应对超大规模的数据实时写入和及时分析。具体而言，新的数据平台在以下多方面进行了显著的技术创新，来实现这一目标。

图5：长安汽车构建的全数据链路实时增量计算模式（来源：长安汽车智能化研究院）

一体化架构。新的数据平台以一套引擎，统一离线、实时、交互式分析三种计算形态，统一数据存储和管理，统一数据开发、统一数据服务。长安汽车因此可以在一个一体化的数仓架构中用一套SQL同时开发实时、离线和多维分析任务，降低了开发难度和运维成本，也减少了数据冗余和数据不一致等问题。
增量计算。新的数据平台将一天内产生的车联网数据拆分为小份多批次，如每5分钟一次将增量数据实时写入平台，并进行加工处理，避免全量数据计算给系统带来了的负载压力；同时，系统可以根据过滤规则在增量数据中只选择与分析需求相关的数据进行计算，避免数据更新时对全量数据进行扫描带来的额外计算时间和成本。因此，增量计算有效解决了长安汽车面临的几点问题：

在大规模数据计算中，性能得以显著提高；
延迟数据得以在平台中以较低的成本快速更新；
结合自研的数据存储格式Map，得以灵活应对信号可变列的问题。
3) 高并发写入。新的数据平台采用读写分离的架构，支持高吞吐upsert及数据入湖仓后的快速增量数据识别与自动化更新处理。同时，为了保障数据能够以千万级TPS实时写入，云器在科技还在以下方面进行了针对性的优化：

通过独立的实时数据接入服务Ingestion Service，在读写分离架构下，为数据写入分配独立的计算资源，让平台具备高吞吐数据写入的能力；
对不断写入的数据自动进行小文件合并等操作，并支持流式接口的数据写入；
采用新的数据存储格式Map对原始数据进行压缩，并采用多种索引与文件组织技术进行存储优化；
将实时写入的数据与已经写入的数据进行统一建模管理，但仅对增量对象进行高效计算，充分利用集群中空闲资源进行数据整合。
图6：新的数据平台采用的读写分离的架构（来源：长安汽车智能化研究院）

MV on MV与Table Stream结合的新数仓模式。新的数据平台采用在物化视图之上再构建物化视图的方式，即MV on MV，构建了一种新的数仓模式，可实现一键创建数据加工处理的Pipeline，自动对新增数据进行加工处理。大幅降低数据开发工作成本的同时，也提高了数据处理的效率。具体而言，这种新数仓模式的主要特点有：

数仓创建可以直接使用SQL表达，结合其他的计算脚本形成统一的编程语言；
MV的自动管理和维护，无需配置调度，系统自动根据数据新增行为自动触发，同时可结合SQL优化技术对于新提交数据做队列或重跑处理；
无需维护按照时间切分及触发的定时任务，自动完成数据刷新和计算触发；
所有的资源调度采用统一调度，由于任务调度和作业调度都统一在一个资源池里，避免分开调度带来的不一致问题。
同时，由于在部分分析场景，用MV on MV的方式，SQL语句会非常复杂，且用全量数据的处理逻辑不够灵活。新的数据平台提供了更灵活易用的Table Stream，即Table流式增量对象（CDF）模式。具体而言，用户可以针对每一张表创建Table Stream，实现定时处理某一类型的增量数据；并且Table Stream可以支持多分支的增量数据消费，即一份增量数据可以用于如ETL加工、质量监控等多个数据处理链路。从而极大提高数据处理的灵活性和时效性。

图7：新的数据平台构建的全新的数仓模式（来源：长安汽车智能化研究院）

数据去重。云器科技针对车联网场景存在大量重复数据的问题进行了创新性的优化，首先是进行行级去重，去除车辆设备状态未变化期间产生的重复行级数据，其次在行级去重的基础上再进行信号去重，去除行之间重复类型的信号数据。通过数据去重降低数据量，大幅提升了下游任务的计算性能，同时也节省了计算资源。
查询优化。为了进一步提升即席查询的响应效率，云器科技还针对查询性能进行了大量优化，如查询计划优化、采用Share-everthing架构提高读写性能、算子优化、向量执行等，从而获得了查询性能的大幅提升。

图8：新的数据平台查询优化的效果（来源：长安汽车智能化研究院）

在使用成本方面。新的数据平台在系统架构和技术上进行了多重创新和优化，为长安汽车大幅节省了数据存储、计算，以及平台运维的成本，减少了资源浪费，包括：

利用自研的数据存储格式Map，实现比Json更优的压缩率，结合在Parquet存储上进行编码优化，对数据进行大量压缩；
一体化的架构解决了数据冗余、以及运维复杂的问题；
增量计算模式避免了延迟数据更新对全量数据的计算；
基于去重后的数据表进行计算，性能更优；且原始表因此可以冷存，降低了存储成本；
平台采用存算分离架构，可针对存储和计算资源需求分别进行弹性扩展。
数据平台升级后的效果与价值

为了在汽车智能化时代建立领先优势，给消费者提供更优质的用车服务体验，长安汽车智能化研究院积极探索全新的数据平台方案以低成本支撑快速增长的车联网数据处理，从而满足各项业务需求。通过采用云器科技的Lakehouse一体化数据平台产品，长安汽车实现了以下主要的效果与价值：

系统具备了对超大规模数据的处理能力，并且能够应对未来数据规模的进一步增长。通过采用一体化架构、创新的增量计算等技术，新的数据平台能够有效支撑高并发、大规模数据的写入和处理问题。长安汽车因此可以应对未来数据规模的迅速攀升，并支撑2025年接入千万辆汽车数据的目标。
突破多重技术瓶颈，数据查询分析的时效性得到有效保障。在信号数繁多，以及车联网数据存在很多特殊性的前提下，为保障业务场景越来越复杂，时效性越来来越高的查询需求。新的数据平台在一体化架构、增量计算的基础上，还进行大量创新，如MV on MV、数据去重、查询优化等，从而突破了超大规模数据即时查询、延迟数据处理、信号可变列等技术瓶颈，满足各类场景的即时查询需求。最终让客户服务更完善、响应更及时。
提升开发效率、简化使用门槛。平台一体化的架构免去了长安汽车原先需对复杂的大数据组件进行维护的工作；同时在新的平台中，用户可以用一套SQL进行数据开发，以及系统基于MV on MV自动刷新数据处理链路，让整个数据开发工作变得更简单，业务协作更高效。从而扩展了长安汽车的数据分析和洞察能力。
存储和计算成本得以大幅降低。在存储成本方面，通过采用更高效的数据存储方式和压缩算法，结合系统架构上优化，如一体化减少数据冗余，存算分离等，平台的存储成本降低了50%以上；在计算成本方面，通过优化的数据架构和高效的数据处理方案，平台的计算成本降低了35%以上；在开发和运维成本方面，平台采用一体化架构，并在多个数据处理流程中引入自动能力，让平台的开发和运维成本显著降低。此外，通过多种查询优化，平台的查询性能提升了3倍以上，减少计算时间的同时也节省了计算资源。最终有效缓解了长安汽车面对成本攀升的压力。

图9：长安汽车采用新的数据平台带来的成本优化

项目经验总结

回顾大数据技术的演进历史，业内总是在跟随数据应用场景、数据类型和规模的变化，寻求在大数据技术架构、功能、性能、成本等方面更优解。如2005年左右诞生和发展的Hadoop技术体系，在互联网时代，曾为企业提供了一个以低成本高效处理大规模互联网数据的能力。

但在即将到来的物联网时代，物联网数据，尤其是其中由汽车智能化浪潮带来的海量车联网数据，有着多种显著区别于以往其他类型数据的特征。比如，一方面，车联网数据存在高并发，超大规模，以及价值密度低的特征，但业务场景又需要对这些数据进行快速写入，全量计算；另一方面，车联网数据存在数据延迟、信号列可变，原始表过大等问题，但业务场景又要求能对复杂的数据进行即时查询分析，满足业务上的时效性要求。

长安汽车与云器科技联合项目组在车联网数据处理领域进行的前沿探索经验表明，如果继续采用传统的大数据平台架构和技术来处理规模不断增长的车联网数据，上述问题不仅无法得到根本解决，还会带来极其高昂的数据处理成本，最终也很快会制约业务的发展。因此，在即将到来的车联网时代，广大车企为了更好地实现汽车智能化的目标，就必须下定决心，拥抱新架构、新技术，如采用一体化架构、增量计算等技术，提升数据平台的扩展性、弹性、性能、和成本优化，从容应对车联网时代的数据处理挑战。

机器学习驱动的智能化电池管理技术与应用满木悦电池化学机器人化学电池机器学习人工智能硕博研究生
在人工智能与电池管理技术融合的背景下，电池科技的研究和应用正迅速发展，创新解决方案层出不穷。从电池性能的精确评估到复杂电池系统的智能监控，从数据驱动的故障诊断到电池寿命的预测优化，人工智能技术正以其强大的数据处理能力和模式识别优势，推动电池管理领域的技术进步。据最新研究动态，目前在电池管理领域的人工智能应用主要集中在以下几个方面：1.状态估计：包括电池的荷电状态（SOC）和健康状态（SOH）的实时
AI算力要变天了？一文搞懂ASIC和GPU asicgpuai芯片
近期，全球股市的动荡中，ASIC和GPU这两个科技股概念突然变得火热，引起了市场的高度关注。博通作为ASIC的代表，股价一路猛涨，而英伟达作为GPU的代表，股价却一路下跌。这是否意味着AI算力市场即将变天？随着人工智能技术的飞速发展，AI算力的重要性日益凸显。从早期的简单模型训练到如今的大规模语言模型如ChatGPT等的出现，对算力的需求呈爆发式增长。01那什么是ASIC和GPU？ASIC：定制化
云智慧：拥抱AI算法驱动的智能运维服务创新引擎
随着信息化、数字化、智能化的加码，企业对人工智能、大数据等技术应用呈现出明显兴趣，海笔研究对国内中型规模企业调研表明，在2020年，54.1%的企业选择购买人工智能类应用，41.9%的企业选择购买大数据及BI类应用，各类产品软件的应用大幅提升了企业信息系统复杂度，以及运维管理难度。业务发展催生服务需求从系统管理者角度出发，信息系统从“单机Excel表格”到“集中式单系统”再到“微服务、云架构”等，
算力租赁：人工智能时代的“水电煤”革命——以NVIDIA 4090为例解读下一代算力解决方案算法工程gpu
引言：当AI算力需求遇上“算力饥渴症”2023年，ChatGPT仅用2个月突破1亿用户，StableDiffusion让普通人秒变艺术家，但背后是单次训练消耗超10万GB内存、千亿级参数的恐怖算力需求。当全球AI企业陷入“算力饥渴症”时，一种名为算力租赁的创新模式正以每年37%的增速（MarketsandMarkets数据）重塑行业格局。本文将深度解析这一革命性服务，并聚焦搭载NVIDIARTX4
AI大模型产品经理学习路线，2025最新，从AI产品经理零基础入门到精通，非常详细收藏我这一篇够了！ AGI-杠哥人工智能产品经理学习语言模型 agi 自然语言处理
随着人工智能技术的发展，尤其是大模型（LargeModel）的兴起，越来越多的企业开始重视这一领域的投入。作为大模型产品经理，你需要具备一系列跨学科的知识和技能，以便有效地推动产品的开发、优化和市场化。以下是一份详细的大模型产品经理学习路线，旨在帮助你构建所需的知识体系，从零基础到精通。一、基础知识阶段1.计算机科学基础数据结构与算法：理解基本的数据结构（如数组、链表、树、图等）和常用算法（如排序
别只会用别人的模型了，自学Ai大模型，顺序千万不要搞反了！刚入门的小白必备！鸡腿爱学习人工智能学习自然语言处理服务器数据库
大家好，我是JackBytes，一个专注于将人工智能应用于日常生活的半吊子程序猿，平时主要分享AI、NAS、Docker、搞机技巧、开源项目等。在使用诸如DeepSeek、ChatGPT、豆包、文心一言等大模型之余，你是否知道这些大模型背后的技术原理是什么？假如让你从头开始学习大模型，你知道应该遵循什么样的路线嘛？今天给大家介绍一下Ai大模型的学习路线，顺序千万不要搞反了！，大家可以按照这个路线进
国内外的网络安全成难题，IPLOOK 2022年用产品筑起“护城墙” 爱浦路 IPLOOK 网络安全安全架构
《爱尔兰时报》和爱尔兰国家广播电台（RTE）于12月31日对2021年爱尔兰科技行业的赢家和弱点进行了年终盘点。双方纷纷表示，2021年爱尔兰科技行业最大的弱点是爱尔兰的网络安全，这一年是一场前所未有的灾难。随着人工智能、大数据、5G等新兴技术的发展，企业面临的威胁日益增加，信息安全的重要性变得越来越突显。现在我们把视线从爱尔兰的网络安全问题拉回到国内的网络安全现状。我国对网络安全问题保持时刻警惕
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
密码学，算法在人工智能的实战利用 china—hbaby 人工智能密码学
在人工智能（AI）的快速发展中，数据安全和隐私保护成为了核心议题。密码学，作为保护信息安全的基石，其在AI领域的应用显得尤为重要。本文将探讨密码学在AI中的利用，并提供一些代码示例来展示其实际应用。密码学的概述即常用加密方式密码学（Cryptography）是数学和计算机科学的一个分支，它涉及保护信息的安全性和隐私性。密码学的主要目标是确保信息在传输过程中不被未授权的第三方读取或篡改，以及确保信息
【人工智能时代】-人工智能发展史：1900~2023 xiaoli8748_软件开发人工智能时代人工智能搜索引擎
第一阶段：人工智能发展历史：1900-19591909年西班牙工程师LeonardoTorresyQuevedo发明了“Occultus”，这是一个可以自动执行国际象棋对弈的机器，预示了未来的计算智能。
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
“租赁业务ERP+deepseek”模式的应用软件研究员汽车 DeepSeek 汽车租赁系统
汽车租赁业务从上世纪90年代发展至今，从传统的人工管理到软件辅助，随着互联网的发展，业务公司对汽车租赁系统提出了更高的要求，比如自助订单，业务推广、客户资质评估，车辆风控，风险预警等，又随着近期人工智能的出现，业务公司对业务系统的期望更高，期望都节约更多人工成本，让管理变得简单快捷高效和智能。所以就引发人们新的启发：“业务系统ERP+deepseek”，但业务系统ERP+deepseek能否满足业
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

长安汽车：基于云器Lakehouse一体化数据平台，建立智能互联时代的领先优势丨案例研究

你可能感兴趣的:(人工智能)