LiveVideoStack_

座舱音频系统的架构设计和音频体验

编者按

近年来，智能座舱体验日益成为汽车竞争力的核心，智能座舱的多样体验正在成为用户购车时考虑的重要因素。

LiveVideoStack2023深圳站邀请到蔚来汽车座舱音频系统软件负责人高林，从主流音频架构设计、算法集成方案及体验影响、音频体验与整车融合的挑战三个方面，为大家介绍音频软件架构设计是如何影响智能座舱体验的。同时他希望通过此次分享，呼吁业界各方共同努力，大胆革新，化机遇为挑战。

文/高林

整理/LiveVideoStack

大家好，我是高林，蔚来汽车座舱音频系统软件负责人，拥有十余年音频系统开发经验。

蔚来汽车NT1/NT2平台座舱音频系统的软件架构设计和研发工作都由我负责，涉及到Android、QNX、Hypervisor等系统的音频设计。今天与大家交流的主题是：汽车座舱音频软件架构中算法集成方面的设计，以及对音频体验产生的影响。近两年，新能源汽车座舱这一领域发展较快，大家开始慢慢关注到这一行业。

下面来介绍座舱音频现状。

此前的传统汽车，消费者对座舱的音频体验不太关注，只要能播放音乐、广播就能满足需求，关注更多的是汽车的驾驶性能或是乘坐性能。近两年，随着智能汽车行业逐渐发展之后，消费者开始提出新的要求，例如是否能支持互联网接入、全景声音乐和多声道音乐体验，是否能将游戏APP融入座舱，这些逐渐成为大家购车时的重要考虑因素。

由于座舱的独特性，在驾驶的过程无法长时间通过屏幕观看视频，大众相较于视频会更关注音频，因此，座舱音频的重要性日益提升。座舱音频也得到了车企的广泛重视，音频系统APP在座舱中的推进也越来越快。例如，在这一波智能座舱浪潮当中，蔚来汽车首先将Dolby全景声功能集成到座舱中。半年之后，各个车厂便开始跟进这个功能。目前，Dolby全景声基本已经成为了新发布的新能源车的标配。通过这个案例，可以有效感受到音频功能在座舱推进的速度。

随着消费者对体验的要求越来越高，音频的需求也在不断增加。蔚来汽车每个月都会将许多APP添加到座舱当中，落地后便可以体验。座舱里的麦克风和扬声器的数量在不断地提升，比如蔚来汽车第二代的座舱有23个喇叭，可以满足消费者对于Dolby全景声的体验要求。

音频需求的增加对算力提出了更高的要求。虽然智能座舱芯片SOC的算力，相较于手机有所提升，但是仍旧无法满足座舱的要求，所以算力资源愈发紧张。正是由于算力有瓶颈，所以在来汽车在集成音频功能，包括音频的体验算法时，就需要全方位考虑各类因素。因此后续会谈谈音频领域的新挑战，包括目前在架构设计方面遇到的问题该如何解决，希望能和业界同仁一起推动音频技术在座舱领域更快更多运用。

接下来正式进入今天的主题。今天的主题分为三部分：首先介绍目前智能座舱的主流音频架构设计，其次分析智能座舱音频算法集成方案以及体验影响，最后再谈音频体验与整车功能融合方面的挑战。

智能座舱主流音频架构设计

在座舱系统领域，目前不同车企采用的架构各有不同。

这点与手机不同，目前手机行业基本分为两大系统，即Android系统和Apple系统。这两个系统在市场上占有率很高，因此消费者很难买到较为个性化的手机，每种手机的体验都较为相似。

而目前各大车企在座舱中采用的架构各不相同，市面上正在销售的汽车的座舱系统，很难找到完全相同的座舱设计，这给消费者带来了个性化、多样化的选择，但同时也给架构设计带来了挑战。

目前，主流的两种硬件方案可以分为单SOC和双SOC。在单SOC中有一个Hypervisor的虚拟机架构。Hypervisor虚拟机上可以跑其他的操作系统，有些支持QNX/Android架构，有些支持QNX/Linux架构的。单SOC和单系统架构，有支持单Android架构的，也有支持单Linux架构的。双SOC一般支持双系统架构，它有QNX/Android架构，也支持Linux/Android架构，以及Android/Android架构。根据不同厂商的设计和需求，可以选择不同的架构。

可以看几个案例：

第一类是单SOC、Hypervisor音频架构。如上图，左边为QNX系统，右边是Android系统。

Android系统分为几个简单的层次，包括APP层、Framework层（中间层）、还有Hal（硬件适配层），以及Kernel层。图上列了一些目前座舱基本都支持使用的典型APP，包括音乐类应用、视频类应用、语音类应用、TTS导航应用、游戏应用、广播应用。

QNX是传统车厂使用的系统，包括仪表盘、一些简单的广播应用，使用的就是QNX系统。报警音、AVAS（车外低速行驶音）、UPA、DVR（行车记录仪）等与车机安全相关的、与车身本身的功能联系较为紧密的功能，一般在QNX系统中做。其中，WTI与AVAS是法规规定要有的，也是传统车机里面所必需的，所以集中在QNX这个轻量化的系统里面做，可以满足法规的延时性需求。

单SOC的两个系统之间通过Hypervisor这一虚拟的通信机制进行通信。底层有专门给Audio（音频）提供算法运行的单独的处理单元，即ADSP，这也是大多数SOC厂商提供的架构。

第二类是单SOC和单Android的音频架构。有些车厂会采用这种架构，因为可以节省一些CPU资源。其中，Android架构基本没有变化，QNX中的一些功能会提升在Android的底层，比如Native层。这类轻量化的功能放在底层运行，延迟更低，处理起来更轻便，也能满足法规要求。

第三类是双SOC音频架构。双SOC架构拥有两个SOC芯片，它的底层有两路ADSP，同时拥有两个CPU，因此算力较为富余。双SOC架构为了兼容Android的生态，能够快速地将Android的APP移植进来，一般需要有一个Android系统。另外一个系统可以根据各个厂商的要求，选择QNX、Linux或Android系统。与法规相关的轻量化的功能，会单独在一个系统里运行。

智能座舱音频算法集成方案及体验影响

从系统的角度出发，目前座舱常用的音频算法可总结为五类。第一是语音交付类，目前使用较广的是前端的算法、语音识别的算法；第二是语音通话类，包括回声消除、降噪（即ECNR）等功能；第三是音乐音效类，包括了空间音效和Dolby全景声、音场模式、AGC、DRC等算法；第四是K歌娱乐类，包括防啸叫、降噪、评分、修音等功能；最后是与车身功能相关的功能，例如氛围灯随音乐律动、AVAS、3D WTI、RNC、ANC，以及主动降噪等功能。

接着以单SOC与Hypervisor的架构为例，介绍目前座舱音频算法的集成方法。

从系统的层面来讲，常用的集成方法是集成在Android Framework中。音效类的可以集成在Framework、APP、 HAL、Kernel、ADSP中，功放里面也可以集成一个音效算法。在QNX系统中，也可以有专门的Audio-Service来处理，它也可以集成一些音效算法。

常用的算法会集成在Framework、HAL、DSP、功放、QNX中，APP和Kernel则不是系统算法常用的集成方法。如果集成在单个APP中，可能只有单个的APP才能使用，不符合厂商车机的需求。如果集成在kernel中，由于Kernel是一个比较完整的系统，可能不符合架构上的需求，对Kernel影响比较大，所以不常用。

下面介绍一些目前各个厂商的车机都会用到的、已经落地的算法，包括算法的集成以及对体验的影响。

电话ECNR算法是一种很常见的算法，从工程化的角度上来说，它的集成难点在于MIC录音和参考信号相位对齐挑战较大。

电话ENCR算法的一种方案是集成在APP中，多应用于Voip通话方面。这种方案的底层录音和参考信号的获取通道，从底层延伸到最上层，还有一些与进程调度相关的问题。因此，这种方案会带来MIC录音和参考信号相位抖动、难以对齐的问题，回声消除效果难以保证。现在很多APP集成的ENCR算法，包括WebRTC，有些可能不是从底层直接获取到参考信号，而是截流的从VIP应用上播放的声音的参考信号，所以处理效果更难以保证。

另一个方案是集成在Hal层，这种方案更为常见，一般车体里的蓝牙电话就会用到这种方法。这个方法经过的层级比较少，Kernel运行的性能较为稳定，所以这个方案相位对齐较好，回声消除效果也较好。这个方案的劣势是，在CPU算力消耗比较高的情况下，Hal层的进程也会受到影响，这时它的相位抖动和回声消除效果也难以保证。

可以在底层获取到录音信号和参考信号时，将其拼接成一体，再从底层传到上层。通过这种方式，录音信号与参考信号在底层就能够对齐，减少抖动。

第三种方案是集成在音频专用的DSP中，例如ADSP中。这是最靠近录音前端的一个方案，也是最优的方案，适用于蓝牙通话。

这种方案的相位抖动较少，信号对齐问题也不大，最关键的是，它采用一个单独的处理单元，不会影响到CPU的算力。如果集成了较多功能，CPU受到影响，蓝牙通话的回声降噪效果也不会受到影响，这是其很大的优势之一。

目前各个新能源厂商基本都支持Karaoke功能。从集成的角度来看，这一功能最大的难点在于延时，例如通过话筒录音再播放，这个过程的延时要短。如果延时太长，用户就可能听到自己唱歌的声音，体验不佳。

方案一是集成在Hal中。如图所示，Karaoke的APP中带有评分算法，用户能够播放伴奏，用话筒录音，通过防啸叫和修音算法，然后分出一路传到APP上评分，另一路传到ADSP，从AMP功放播出。这是集成在Hal的方案，当然也可以选择集成在APP中，但是因为延时太长，目前各个厂商都放弃了这种方案。

Hal的方案，延时可以达到50毫秒左右。除了延迟较小，这个方案还有一大优势是不依赖于SOC的供应商，可以自主完成，工作量有保障。这个方案的劣势是会受到CPU系统性能的影响，如果算力没有富余，话筒录音可能会有丢帧和杂音的风险，延时难以保证。

方案二是集成在Kernel中，可以进一步缩短Loopback延时，相较于集成在Hal层，可以减少7~8毫秒。

这个方案也会受到系统性能的影响，如果CPU消耗太高，可能也会有丢帧、杂音的风险。它的劣势之一是需要SOC供应商提供技术支持，因为它对靠近底层的SOC硬件、DMV配合的依赖度较高，需要供应商提供技术支持，所有很多厂商放弃了这种集成方案。

最后一种是理论上最好的一个方案，即集成在ADSP中。录音通过Kernel传到ADSP里面，最后直接播出。这个方案延时最短，并且单独使用ADSP的功能，不会受到系统算力的影响。但这种方案的劣势在于，它依赖供应商支持。录音要传到CPU，再从CPU转到ADSP，而话筒多数是用USB接口传输语音，基本现在的SOC厂商都不支持从USB接口传到ADSP的功能，所以此方案虽然在理论上能给用户最好体验，但是推动起来技术难度非常高。目前，市面上基本没有车厂采用这个方案。

再举一个氛围灯的案例。氛围灯功能与车身的ECU联系比较紧密，也是多数厂商都已经落地的一个功能。它的技术难点之一是需要和音乐的节奏同步。

目前的车身ECU通过CAN信号传输而非互联网。互联网传输速度能达到千兆，而CAN的传输速度根据各个ECU的性能，有些ECU目前仅有几十兆的传输带宽，有些ECU能达到百兆的上传带宽，所以它的传输速度比较慢。

方案一是集成在APP里。在获取到音乐的节奏、响度等信号后，通过Android系统的Framework传到QNX系统的CANService，然后把CAN信号传输到氛围灯的ECU中，也就是其他供应商提供的氛围灯的ECU中。

CAN信号的传输路径在系统内部比较长，再通过CAN总线传到ECU上，信号的延时就更长。这种方案因为集成在APP中，所以只有单个APP才能使用氛围灯的节奏同步。整个的CAN信号传输链路，目前可以达到200毫秒，虽然它目前也有很多约束性条件，例如它的同步算法需要在APP里进行，同时如果CPU系统算力消耗过多，音乐和氛围灯的节奏就会出现不同步现象。

方案二是集成在Hal里。Hal层距离CANService更近，传输时间更短。该方案的优势之一是不会受到单个APP的局限，所有的APP都可以使用氛围灯算法。同时，与集成在App里相比，该方案氛围灯CAN信号链路的传输时间短50ml以上，达到150ms。当在Hal里做音乐播放和氛围灯节奏同步的算法时，如果CPU算力消耗比较多，Hal的节奏同步方案同样也会受到影响，出现音乐和氛围灯节奏不同步的现象。

方案三是集成在ADSP里。从理论上来看，该方案是最好的方案。首先，所有的音乐APP都能使用氛围灯的功能。其次，氛围灯CAN信号链路的时延最短，可达到100ms以上。此外，在ADSP里做节奏同步算法不会受到系统性能的影响。该方案的难点之一在于，由于SOC厂商提供的是一个约束性较强的处理单元，所以ADSP的内存有限，在CPU系统算力消耗较多时，音乐播放和氛围灯节奏同步会受到影响，无法满足需求。因此，虽然理论上这是很好的一个方案，但是由于种种约束条件，目前多数厂商未采用该方案。

总的来看，座舱架构设计影响音频算法效果的因素主要有延时、抖动、性能消耗、集成难度和音频硬件这几点。从技术上看，前四点影响较大。

其中，延时包括音频数据传输本身的延时、车身信号CAN信号传输和处理的延时以及对Karaoke和氛围灯的影响；

抖动包括ECNR相位的需求，与其他相位比较，其处理要求更高、影响更大。此外，语音识别会用到声源定位的算法，其对多MIC相位性要求较高；

从性能消耗因素来看，如果CPU算力不够用，会对算法产生影响，出现丢帧、卡帧等现象；

从集成难度来看，需要考虑能否解决对外依赖的问题，能否推动SOC厂商解决成本问题、人力问题。一些理论上好的方案可能由于实际集成起来难度较大而无法采用；

从音频硬件来看，MIC和喇叭的器件选型布局、电路布线、信噪比和扬声器解析度都会影响声音的播出效果和录音效果。

音频体验与整车融合的挑战

第一个挑战是复杂的座舱内音频环境。与座舱相比，手机的音频硬件环境更为简单。主要表现为手机对MIC和喇叭的数量有一定限制，通常为两到三个。然而，车舱的MIC数和扬声器数则越来越多，对音频算法的要求也越来越高。同时，座舱内的声学环境也比较复杂，尤其是车辆在中高速公路行驶的过程中会产生大量噪音，手机的算法挪用到车舱时对噪音的处理无法达到用户的需求。许多厂商在尝试各种方式来降低噪音或提升音效体验，但目前音效算法的噪音处理效果大多无法满足需求。

第二个挑战是复杂的座舱音频需求。一方面，随着座舱内部的MIC和扬声器数越来越多，手机的音频算法挪用到车机时无法满足处理需求，所以需要对算法进行重新开发和适配。同时，许多Android APP希望能在座舱内适配和落地。因此，对音频需求的落地速度和落地质量要求也越来越高。

另一方面，多个大屏的音频需求和分区播放音频已成为未来的座舱发展趋势。比如四座或六座车，每个座位前排都有一个单独的大屏可以分区播放不同的音频，使用不同的娱乐APP。目前谷歌专门给Android系统开发了车机版以适应这些需求，未来其开发方向也沿着分区播放趋势发展。

第三个挑战是Android音频架构的大量定制化。Android系统是针对手机开发的操作系统，它的很多功能与手机融合得较好。由于车机的MIC和扬声器数量较手机都增加较多，所以手机版Android对许多座舱音频功能都不支持，蔚来对Android架构修改较多。虽然谷歌也专门给Android系统开发了car版，但也无法满足音频处理的需求，也不支持Dolby的7.1.4和5.1声道的播放。同时，目前的Android也不支持多个大屏的音频需求定制和分区播放音频定制，都需要进行大量修改。

因此，尽管有些车机上有Android系统，许多APP仍然不能随意安装，需要各个厂商适配。每个厂家的Android系统都定制较多，第三方APP安装到车机上需要考虑是否能和Android系统融合，是否会影响车机的安全性能。

从多声道算法的集成角度来看，各厂商都在将手机的算法进行重新开发和适配以适应车机的多声道等算法要求，搭建多声道算法的集成架构。

第四个挑战是车身ECU的开发滞后。比如氛围灯功能的移植，车身ECU的技术赶不上手机的技术前沿的体验。

车身ECU开发滞后比较突出的体现是CAN信号的延时较大，因为车身ECU本身采用的是一些传输速度较慢的处理单元。这一方面目前各厂商也在进行变革以解决该问题，比如尝试将以太网应用到车机ECU中。后续如果各个ECU能够传输千兆带宽，这一问题可能会得到缓解。目前有少量车机支持千兆以太网，但成本较高。

第五个挑战是座舱系统算力瓶颈。目前，座舱SOC芯片基本是从手机SOC芯片衍生而来的，需要经过一系列的车规认证。例如高通开发的8155和8295车机芯片，相较于同类型的手机芯片，在算力等性能上有所提升。这类SOC芯片基本满足在手机上应用的算力需求，但应用在座舱上时基本满负荷运行。

此外，多MIC多扬声器由于需要多通道处理、声源定位等对座舱的算力消耗也较多。例如，座舱有4MIC、6MIC和四座、六座、七座之分，分区越多、座位越多消耗的算力也越高。座舱的多Camera应用，包括UPA、DVR、360°全景守护功能对算力消耗也较大。还有多屏娱乐需求，比如每个屏幕播放不同音频、视频、游戏等。这些都是手机所不具备的功能。

虽然座舱领域这两年刚受到关注，但随着功能集成越来越多，算力的消耗已无法满足用户的需求，这是目前各个SOC厂商正在考虑的问题。

以上提及的五点既是挑战又是机遇，需要我们业界包括软件的音频架构设计、硬件的SOC厂商和汽车ECU等各方共同努力，积极革新，共同解决这些问题。

总体来说，今天介绍的内容可以总结为四点：一是音频对座舱体验正变得越来越重要；二是座舱音频系统软件架构和工程落地对音频体验有很大影响；三是座舱音频需求越来越复杂，用户对音频体验要求越来越高，这些给软件架构设计带来了一些挑战，也需要我们去思考如何解决这些需求带来的问题；最后，问题的解决不能单靠软件结构设计一方，需要我们业界共同努力，把挑战变为机遇。

谢谢大家！

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
pyhon+ffmpeg 常用音视频处理命令不再游移 ffmpeg 音视频 python
FFmpeg是多媒体领域的万能工具。只要涉及音视频领域的处理，基本上没有它做不了的事情！通俗点讲，从视频录制、视频编辑再到播放，它都能做！前段时间做了个短视频自动化脚本项目，需要自动处理音视频（包括一些合成、拼接、转场、调色等等），当时做的时候找各种命令还是很痛苦的，因此对用到的所有处理命令做了个汇总，方便以后使用。目录一、获取音频时长二、获取视频信息三、获取视频时长四、多个视频合并五、视频提取视
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【物联网技术大作业】设计一个智能家居的应用场景 Dream_Chaser～期末复习智能家居物联网技术期末大作业
前言：本人的物联网技术的期末大作业，希望对你有帮助。目录大作业设计题（1）智能家居的概述。（2）介绍智能家居应用。要求至少5个方面的应用，包括每个应用所采用的设备，性能，功能。（3）画出智能家居应用图，并设计使用。大作业设计题设计一个智能家居的应用场景。要求：（1）智能家居的概述。答：智能家居，又称为智能住宅或家庭自动化，是指运用综合布线、网络通信、安全防范、自动控制及音视频等技术，将家居设施集成
架构评审的自动化与人工智能: 如何提高效率光剑书架上的书架构自动化人工智能运维
1.背景介绍架构评审是软件开发过程中的一个关键环节，它旨在确保软件架构的质量、可维护性和可扩展性。传统的架构评审通常是由人工进行，需要大量的时间和精力。随着大数据技术和人工智能的发展，自动化和人工智能技术已经开始应用于架构评审，从而提高评审的效率和准确性。在本文中，我们将讨论如何通过自动化和人工智能技术来提高架构评审的效率。我们将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，

座舱音频系统的架构设计和音频体验

你可能感兴趣的:(音视频,人工智能)