LiveVideoStack_

Facebook 360度音频编码与渲染

从360度视频到Oculus，通过Facebook 360音频编码与渲染都可实现身临其境的感受，并且使用的声道更少，小于0.5毫秒的渲染延迟。Facebook技术团队撰文对此进行了解读，LiveVideoStack对文章进行了编译。

文 / Hans Fugal, Varun Nair

译 / 郭俊翔

审校 / 包研

• 全新的360度空间音频编码和渲染技术，使得空间化的音频在从编辑者到用户的整个处理过程中，都能保持高质量。这一技术有望首次实现大规模商用。

•我们支持一种被称为“hybrid higher-order ambisonics（混合高阶立体声高保真混响）”的技术，使得空间化的声音在整个处理过程中依旧能保持很高的质量。这是一个具有渲染与优化功能的8声道音频处理系统，可借助更少的声道实现更高的立体声质量，最终达到节省带宽的目的。

• 我们的音频系统同时支持空间化音频和头部定向音频。在空间化音频中，当听到来自某种场景的声音时，系统会根据用户在360度全景视频的体验中，头部会转向不同的方向作出不同反应。通过头部定向音频，人物对白和背景音乐等音频在方位上会保持静止。这是我们在业界第一次实现同时渲染混合高阶立体声和头部定向音频。

• 空间音频渲染系统能够为开发者带来延迟小于半毫秒的实时渲染体验。

• FB360编码器工具可以将处理后的音频传输至多个平台。用于音频渲染的SDK可集成在Facebook和Oculus Video之中，保证了从制作到发布的体验统一性。这样可以节省工作时间，并确保开发者在制作中听到的内容和最终发布的内容一致。

Facebook上的360度全景视频体验令人惊叹，给人带来身临其境的非凡体验。但如果想获得更加完美的视听体验，也可能需要360度空间音频。当用户使用360度空间音频时，每种声音听起来像是从空间中对应的方位发出，就像我们在现实生活环境中感知声音一样。在摄像机上方飞行的直升机轰鸣听起来就像是在用户的上方，在摄像机前方的演员对白听起来就像是在用户的前面。当用户环视整个视频画面时，系统需要根据用户头部方向的变化作出反应并将每种声音重新定位到画面上的相应位置。无论是通过手机，浏览器还是VR头戴显示器，当用户每次观看360度全景视频时，音频都需要被重新计算并更新方位以完美还原用户真实的空间感受。

简而言之，为了实现这种效果，我们必须开发一种即使不依赖放置了扬声器的大房间也能为用户带来超越影院沉浸感的音频处理系统。在等待我们解决的一系列问题中，首要的是必须架构能够反映真实世界环境的音频环境，并通过耳机以更高的声音解析度呈现给用户，同时不断追踪用户的视觉方位。通过头戴式耳机听到的常规立体声可能会帮助用户了解声音是在自己的左耳还是右耳播放，但它不会帮助用户感知环境中声音的深度或高度，也无法准确感知声音是源于自己的前方还是在后方。

创造这种空间化听觉体验并将其大规模商用化需要许多新技术。尽管空间音频研究正在学术领域如火如荼地进行，但到目前为止，还没有出现可靠的端到端的传输方式能将这种技术大规模地推向消费市场。最近我们推出了新的用户工具和渲染方法，这使得我们首次有机会为大规模的消费市场提供高质量的空间音频技术。这些渲染技术被应用于一个名为“空间音频工作站”的新型强大工作平台，使创作者能够在360度全景视频中添加空间化音频。该渲染系统也适用于Facebook应用程序，这样用户便可以通过Facebook听到创作者上传的同样生动的全景音频。

这两项改进都能帮助视频制作人在多种设备与平台上重塑现实。我们在这篇文章中，将探讨我们已经探索到的一些技术细节。不过先让我们了解一下空间音频的发展历史与背景。

初识空间音频

由于头相关传输函数（HRTFs）的存在，通过耳机使用户听到具有逼真空间感的声音是有可能实现的。 HRTFs帮助开发者构建可应用于音频流的音频滤波器，使得声音听起来像是位于其特定的正确位置 ——在听者之上、之后或旁边等等。 HRTFs通常适用于具有人类主体模型或人体头部和躯干模型的消声室中，但通过其他方法也可以达到这种效果。

如果想让用户在观看全景视频时也听到全景声，开发者必须将声音放在正确的位置。换句话说，他们必须设计并传输空间音频。有很多方法可以实现这一点。其中一种方法是基于对象的空间音频，场景中的每个对象（例如，直升机或演员）单独发出的声音会被保存为具有位置元数据的离散流。大多数游戏的声音环境架构使用的便是这种基于对象的空间音频渲染系统，因为每个音频流的位置可根据玩家移动的位置而随时变化。

Ambisonics技术是另一种能够展现整个声场的空间音频方法。我们可以将其视为音频的全景照片。多声道音频流可轻松用于展现整个声场，这使得与基于对象的空间音频处理技术相比具有更容易进行转码和流式传输。一个 Ambisonic的流可以通过各种方案来呈现。这些方案最大的区别在于the order of the ambisonic sound field。一阶声场会产生四个声道数据，而三阶声场则会产生16个声道数据。通常，较高的声阶意味着更好的音质和更准确的空间定位。我们可以将低阶的ambisonic sound field理解为模糊的全景照片。

工作流程与工具

Spatial Workstation空间音频工作站是我们开发的一套音频处理工具，可帮助专业音效设计师设计能够用于360度全景视频和线性VR体验的空间音频。该工作站与现有音频工作站相比具有更强大的音频处理能力，开发者借此可以根据360度全景视频在三维空间中定位声音，同时通过VR耳机上的声音输出端对空间音频进行预听。这开创了一套贯穿内容创建到发布整个过程的高质量“端到端”工作流程。

传统的立体声音频只包括两个音频通道。我们使用Spatial Workstation开发的系统可实现八个音频通道的输出。因为声场已被优化调整以适应VR和360全景视频，我们将此称为混合高阶ambisonic系统。这套系统被整合（tuned）到我们的空间音频渲染器中，这样能最大限度地提高声音的质量和位置精度，同时把对性能的要求和延迟时间降至最低。此外，Spatial Workstation还可以输出两个头部定向音频声道。此时输出的，是一个不会对头部进行追踪并以旋转来作出响应的立体声流，此时声音将保持被“锁定”到头部周围某个方位的状态。大多数360度全景体验使用的是混合的空间化音频和头部定向音频，空间化音频可用于在360度全景内进行的动作，而头部定向音频可用于旁白或背景音乐。

SPATIALIZED / HEAD-LOCKED

非凡的渲染效果

我们的空间音频渲染器凝萃了我们这几年开发的一系列技术，可以将空间音频轻松扩展到广大不同类型和配置的设备中，同时保持最佳质量。渲染器使用参数化和表示HRTFs的方式，可以衡量HRTFs的各个组成部分来决定在渲染时是侧重速度还是质量，或在两者之中找到一个最佳的均衡点。除此之外，我们的渲染器音频延迟小于半毫秒，比大多数渲染器低一个数量级，这使得它非常适合用于优化全景音视频的实时体验，例如带头部追踪的全景视频。

这种灵活性有利于全景音视频在一系列台式计算机，移动设备和浏览器等载体上的传播。我们的渲染器被调整优化，能为不同平台的用户带来协调统一的工作体验，并且在这些不同的平台上都能很好地工作。对于创建高质量的空间音频而言，这种一致性非常重要。由于对运行性能有不同的要求，音频可能在不同平台或设备上呈现出不同的效果，这样对于整个生态而言显然是不利的。我们希望在如Facebook这样的平台的大规模使用下确保全景音视频在各种常用设备和生态中都能一致保持优秀的质量。

跨平台高效工作

渲染器是Audio360音频引擎的一部分，它可以将混合高阶ambisonic和头部定向音频流空间化。音频引擎是用C ++编写的，这为每个平台提供了优化的矢量指令。它非常轻量，可通过多线程和Lock-Free system进行列队（queueing）与空间化（spatialization）工作并混合（mixing）。它还能直接与每个平台上的音频系统（Android上的openSL，iOS / macOS上的CoreAudio，Windows上的WASAPI）进行交流协作，以最大限度地减少输出延迟并尽可能地提高处理效率。这种轻量化设计不仅可以让开发者时刻保持高效工作，还能通过保持二进制大小（binary size small）来减少应用程序的臃肿。音频引擎中二进制文件会被编译为大约100千字节。

对于Web，音频引擎使用Emscripten编译为asm.js。这有助于我们在所有平台上进行维护、优化并使用相同的代码库。该代码只需很少修改就能在浏览器中正常工作。渲染器的灵活性和高速性使我们能够在各种浏览器中使用相同的技术来保证音频质量。这种情况下的音频引擎被用作WebAudio中的定制处理器节点，其中的音频流会从Facebook视频播放器排列至音频引擎中，同时来自音频引擎的空间化音频被传递到WebAudio并通过浏览器回放。与原生C ++实现相比，JS版本只能在2倍慢速或4倍慢速下运行，这对于实时处理而言还是足够的。

随着电子设备和浏览器的处理速度一年年变得更快，各种设备和浏览器的浏览速度都会大幅进化，渲染器和音频引擎的灵活性和跨平台特性使我们能够随之不断提升声音的质量。

从编码到客户端

空间音频编码和其文件格式的世界正处于迅速发展不断变革的状态。我们希望尽可能方便地将使用Spatial Workstation制作的内容编码并上传到Facebook，以便在人们能在所用的所有设备上观看和收听。Spatial Workstation编码器能准备好8声道空间音频和立体声头部定向音频，与360度全景视频一起打包至一个文件并上传到Facebook。

编码器的选取优化

在寻找可行的文件格式方面我们遇到了一些挑战。主要面临几个约束条件，其中的一些可以先放一放，但迫切需要解决的是尽早提供一种合适的编码器。主要的限制因素是将视频转码成Facebook的原生视频格式：H.264编码的MP4格式视频时尽可能地减少整个过程中声音质量的损失，这意味着存在以下实际限制：

•MP4中的AAC支持8个频道，但不支持10个频道。

•AAC编码器将8声道音频看作是7.1环绕声格式，它采用积极的低通滤波器和其他技术来压缩LFE声道。这不符合我们致力于呈现的空间音频。

•MP4元数据，是可扩展的，但会繁琐地利用工具，如ffmpeg或MP4Box工作。

我们选择使用MP4文件中包含三条音轨的频道进行配置。前两个是没有LFE的四声道音轨，共有八个非LFE声道。第三首曲目是立体声头部定向音频。我们以高比特率进行编码，以最大限度地减少从WAV转换到AAC时的质量损失，因为这些音轨将在服务器上再次进行转码以准备通过客户端传送。

在Facebook，我们拥有核心工程价值（core engineering valve）以实现快速的技术革新。我们认为，随着用来编辑音频的工具和相应功能的不断更新，我们没能及时考虑清楚可能需要传达的所有信息。出于这个原因，我们需要一个前向扩展（forward-extensible）且易于使用的元数据解决方案。定义我们自己的MP4盒子类型感觉很脆弱，所以我们决定将元数据放入一个位于元框中的xml框中。 XML可以遵循一种能按照开发者的需求快速进化的模式。 MP4Box工具可用于从MP4文件中读取和写入此元数据。我们为每个音轨（在trak框下）存储元数据，为该音轨定义声道布局。然后，我们还在文件级（在moov框下）编写全局元数据。

空间工作站编码器也会将视频作为输入的部分。该视频被整合到生成的文件中，无需转码，并将写入适当的视频空间元数据，以便在上传到Facebook时服务器将其作为360度全景视频进行处理。

YouTube目前需要四个频道来支持一阶立体声效果。我们同样支持这种格式的视频。

高效便捷的转码操作

一旦开发者上传了具有360度全景视野和360度空间声音的视频，这些视频就已经准备好推送至各种设备的客户端。音频以多种格式进行类似的处理。我们提取音频元数据（无论是YouTube ambiX还是Facebook 360格式）以确定音轨和频道一一映射，然后将其转制为各种需要的格式。与其他的所有视频一样，有时为了便于比较，我们会使用多个编码器设置进行转码，来获得最佳的完整体验；我们还准备了与所有传统客户端兼容的立体声双耳渲染技术，并在出现任何问题时将其作为备选方案。

音频与视频可以分开处理，并通过使用自适应流媒体协议合并传送给客户端。

向客户交付作品

不同的客户端具有不同的功能并支持不同的视频容器/编解码器格式。我们不能强制所有设备都同时支持一种格式，因此我们为iOS，Android和网络浏览器准备了不同的格式。这令用户可以跨平台地在这些设备上控制视频播放器，根据不同需求实现特殊行为，但我们更喜欢经过充分测试并且不需要花费额外时间去执行的现有代码。出于这个原因，在iOS上我们更喜欢把MP4格式文件作为视频载体，在Android和Web浏览器上我们更喜欢使用WebM。在iOS和Android上，与单声道或立体声音轨不同，解码10声道AAC音频不直接受本机支持或单纯依赖硬件加速。上述这些有关AAC以及8声道或10声道音频的问题，使我们发现了特别的编解码器——Opus正在被其他人用于空间音频，利用Opus编解码器可实现更好的压缩。它是一款先进的开源编解码器，它的软件解码速度比AAC更快。这使Opus自然而然成为我们的最佳选择，特别是对于WebM这种视频格式。大多数编码器或解码器目前不支持MP4下的Opus。但是，这里有一份实现MP4下的Opus的拟定草案，并且我们正在进行一项工作来支持ffmpeg。

当我们将上传的文件（“4 + 4 + 2”）中的三音轨格式转换为单个10声道Opus音轨时遇到了一些挑战。与AAC一样，允许的信道映射和LFE信道也是一个问题。然而，Opus允许未定义的频道映射族（255族），意味着这些频道并不是已知的布局。这项工作已经足够完善了，因为我们控制了编码和解码，并且我们可以确保两端的布局具有相同的理解相同。我们在流动的清单文件中传输通道布局信息。未来，随着Opus中的空间音频技术的成熟，可能会出现一些特定的能实现在大幅减小文件体积的同时显著提升音频质量的通道映射和增强编码技术。这样，我们的客户将能以最小或无需更改的方式对空间音频其进行解码。

未来的发展方向

我们处于一个不断拓展和进化的空间音频先进领域 ——正在改进优化非空间视频和音频所采用的格式。我们所做的一切，开创了全新的视听体验并将其变成现实。但还有很多的事情需要去做：上下堆叠组件、从工作站到视频文件格式等方面都需要进行改进。目前，我们正在研发可以将所有音频存储在一个音轨中进行上载的文件格式，并有可能实现无损编码。同时我们也对Opus中改善空间音频压缩的项目十分感兴趣。我们期望探索自适应比特率和自适应信道布局技术，以改善那些受带宽所限的用户、或是拥有足够多的带宽并期待获得更高质量内容的用户的使用体验。这是一个令人兴奋的领域，我们期待为整个音视频生态作出更多卓越贡献。

LiveVideoStack Meet | 上海

多媒体开发新趋势

2018年初的视音频技术生态并不平静，Codec的争夺进入群雄逐鹿的时代; WebRTC 1.0版定稿在浏览器中，移动端乃至IoT上的多媒体通信; AI，区块链技术的发展，正在与多媒体开发发生在化学反应，将成为推动生态发展的新力量。

2018年，LiveVideoStack将通过“LiveVideoStack Meet：多媒体开发新趋势”系列沙龙，展现新技术在音视频领域的探索与实践，以及新兴应用场景和传统行业的最新最佳实践。

讲师与话题：

吴威麒：触宝科技音频技术专家

《实时语音通信的音频后处理技术》

曾小伟：苏宁云商IT总部技术副总监

《如何使用机器学习算法优化分发链路》

沈轲轶：腾讯天天P图iOS开发组长

《iOS实时相机的GPU实践》

盛骁杰：优酷VR技术专家

《超高清VR直播技术的演进与挑战》

崔文秀：北京三体云联科技有限公司总监

《实时音视频技术赋能传统行业》

蔡锐涛：相芯科技图形引擎负责人

《Animoji动态表情的技术实现》

点击 [阅读原文] 了解相关活动信息，快来报名吧!

鸿蒙开发：正则中的match和matchAll
前言本文基于Api13关于正则表达式，其实之前也撰写过相关文章，但没有对match和matchAll做过详细的分析，虽然都是用于常见的字符串匹配，但是在使用方式上还是具有一定的区别；大家记住一点，正则表达式适用于所有的编程语言，可能有些语法和使用方式有些不同，但基本的原理是一样的。我们先看下源码：match：将字符串与正则表达式匹配，并返回一个包含该搜索结果的数组。/***Matchesastri
ArkTS函数与模块的定义与调用 harmonyos
ArkTS是一种面向全场景的声明式编程语言，它在函数与模块的定义和调用方面有着独特的特点和优势。一、ArkTS函数的定义在ArkTS中，函数是一段可以重复使用的代码块，用于执行特定的任务。函数可以接受输入参数，并返回一个值。例如：在这个例子中，add是函数名，a和b是输入参数，number是参数和返回值的类型。通过定义函数，可以将复杂的任务分解为较小的、可管理的部分，提高代码的可读性和可维护性。二
筛选素数的三种方法小赖同学吖算法 c++
判断一个数是不是素数，相信大家都知道，那么如果每一个数，都规规矩矩的使用判断[1,本身]是否有除了本身和1，以外的可以整除的数，这样的做法显然不可取的，如果查看1~n的素数，这样的时间复杂度为O（n^2）1.朴素筛法这个筛法的思想是，每一次把枚举到的数x的倍数筛选掉，这样就可以优化一些时间复杂度为O(N*lnN)具体代码#includeusingnamespacestd;intn,cnt;cons
深入探索HarmonyOS NEXT自定义组件与样式，提升应用个性化水平 harmonyos
深入探索HarmonyOSNEXT自定义组件与样式，提升应用个性化水平在HarmonyOSNEXT平台上开发应用程序时，创建自定义组件和有效应用样式是实现独特用户体验的关键。本文将详细介绍如何从零开始构建自定义组件，并探讨如何利用样式系统来统一整个应用的视觉风格。我们将重点介绍API12版本中支持的功能和技术，帮助开发者提升应用的个性化水平。创建自定义组件：封装特定功能和外观自定义组件允许开发者封
HarmonyOS NEXT 应用开发：用户反馈收集与处理 harmonyos
在应用的生命周期中，用户反馈是提升应用质量、优化用户体验以及增强市场竞争力的重要依据。对于开发者来说，如何有效地收集、分析和处理用户反馈，已成为一项关键的运营任务。在HarmonyOSNEXT环境中，开发者不仅需要关注功能实现和技术优化，还需要建立高效的用户反馈机制，以确保应用能够持续满足用户需求、解决用户痛点，并在市场中不断迭代和进步。本部分将介绍在HarmonyOSNEXT应用开发中，如何通过
YashanDB yasrman恢复数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...操作说明执行恢复操作的数据库版本需与生成备份集的数据库版本完全一致。恢复语法详细说明请参考工具手册yasrman。分布式部署模式下，需要保证待恢复的集群部署状态与备份前节点部署状态一致，包括节点类型、节点监听IP、节点个数、节
费控系统是做什么的费控系统
费控系统主要用于费用监控**、成本控制、风险预警。其中费用监控通过实时采集和精细数据分析，帮助企业实时掌握资金流向和支出情况，从而确保预算执行与资金使用的准确性。企业借助该系统可以提前预警异常支出、降低运营风险，并借助数据反馈不断优化管理策略，从而提升整体财务透明度和管理效率。一、费控系统的概念与基本功能费控系统是企业在财务管理中的重要工具，主要用于对企业各项费用进行实时监控和管理。它通过对各部门
蓝桥杯算法实战：技巧、策略与进阶之路竣雄蓝桥杯算法职场和发展
摘要蓝桥杯作为国内颇具影响力的程序设计竞赛，对提升大学生算法思维与编程能力意义重大。本文深入剖析蓝桥杯算法竞赛，结合历年真题总结核心考点与典型题型，分享实用解题技巧与备考策略，并探讨算法优化与进阶方向。通过系统学习与实践，助力参赛者提升算法水平，在竞赛中取得优异成绩。关键词蓝桥杯；算法竞赛；解题技巧；备考策略；算法优化一、引言蓝桥杯全国软件和信息技术专业人才大赛旨在选拔优秀的软件和信息技术人才，推
多元素Slots游戏数值设计与平衡：特色玩法的深度策略小宝哥Code 游戏策划游戏 microsoft 网络
问题：如何深入研究针对特色游戏（如多元素组合类游戏，多重路线设计游戏）进行专业的数值设计与平衡，确保游戏体验与平台效益双赢？多元素Slots游戏数值设计与平衡：特色玩法的深度策略一、特色Slots游戏的市场定位与设计理念在当今竞争激烈的Slots游戏市场中，传统单一玩法已难以满足玩家日益增长的复杂需求。作为资深Slots游戏策划，我深知特色玩法如多元素组合和多重路线设计已成为市场差异化的关键。1.
嵌入式系统开发如何选择和备考软考高级矿渣渣系统架构
针对已通过软考中级嵌入式系统设计师的开发者或者从事嵌入式系统设计的人员，以下是为您量身定制的高级科目推荐及备考方案：一、软考高级科目推荐1.系统架构设计师（首推）推荐理由：技术延续性：与嵌入式系统设计高度相关，涉及硬件/软件协同设计、实时系统架构、低功耗设计等核心领域。职业发展：适合向架构师或技术负责人转型，提升复杂系统设计能力。考试内容匹配：覆盖嵌入式场景（如物联网架构、边缘计算系统设计）。考试
单片机原理及应用风亦辰739 单片机
单片机（Microcontroller，简称MCU）是集成度高、功能强大的微型计算机，广泛应用于嵌入式系统、智能家居、工业控制、汽车电子、物联网等领域。作为一种重要的硬件平台，单片机具有小巧、低功耗、高效、成本低等特点。本文将介绍单片机的基本原理、结构特点以及其在实际应用中的使用方法。一、单片机的基本原理单片机是由中央处理单元（CPU）、存储器（RAM、ROM）、输入输出接口、定时器、串行通信接口
从阅读空间到知识孵化器，AI时代智慧图书馆何为？技能咖生成式人工智能认证 GAI认证人工智能
在人工智能（AI）浪潮席卷全球的当下，图书馆作为知识传播与文化传承的重要场所，正面临着前所未有的变革。从传统的阅读空间到如今的知识孵化器，智慧图书馆在AI时代肩负着新的使命与挑战。本文将探讨智慧图书馆在AI时代的发展方向，并引入生成式人工智能认证（GAI）认证，为图书馆从业者的技能提升提供新思路。AI时代智慧图书馆的新角色知识资源整合与挖掘者在AI时代，信息爆炸式增长，图书馆不再仅仅是纸质书籍的收
蓝桥杯备赛（7）：ST表神里流~霜灭蓝桥备赛蓝桥杯贪心算法 c++c语言数据结构动态规划
RMQ问题RMQ问题是针对于数组，每次给一个区间[l,r]，要求返回区间内的最大值或最小值（的下标），也就是说，RMQ问题就是求区间最值的问题。对于RMQ问题，容易想到一种O(n)的方法，就是用i直接遍历[l,r]区间，不断比较a[i]与max的大小关系，然后不断更新max，最后得出的就是最大值。但是，我们可以利用倍增和动态规划的思想，利用“ST表”这个数据结构来帮助解决。ST表ST表是一种可以“
Goroutine 与 Channel 九班长 Golang 算法数据库网络 golang Goroutine Channel
Goroutine和Channel是Go语言并发编程的核心概念。理解它们的原理和使用方法，对于编写高效、安全的并发程序至关重要。以下是对Goroutine和Channel的深入解析，包括它们的原理、使用场景、常见问题及最佳实践。1.Goroutine1.1什么是Goroutine？Goroutine是Go语言中的轻量级线程，由Go运行时（runtime）管理。与操作系统线程相比，Goroutine
（一）stm32F411RE点亮板上LED——基于HAL库（微控第一周MCU验收） yxt230791 stm32 嵌入式硬件单片机
近期有点懒，还是先直接上链接通过网盘分享的文件：led.rar链接:https://pan.baidu.com/s/1GUI7wd9dtNwqPhpS9GfLag提取码:XDer--来自百度网盘超级会员v2的分享
FFmpeg 命令行全解析：高效音视频处理从入门到精通码流怪侠 ffmpeg 音视频 ffplay ffprobe 实时音视频视频编解码直播转码
FFmpegFFmpeg是一款开源的多媒体处理工具集，支持音视频编解码、格式转换、流媒体处理等全链路操作。核心功能与工具:多媒体全链路支持支持1000+音视频编解码格式（如H.264、HEVC、AV1）和协议（RTMP、RTSP、HLS），覆盖录制、转码、流化等全流程。提供三大核心工具：ffmpeg：转码与流处理（如ffmpeg-iinput.mp4output.avi）。ffplay：媒体播放（
基于ssm的药房管理系统 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于ssm的药房管理系统作者：禅与计算机程序设计艺术1.背景介绍1.1药房管理系统的重要性在现代医疗体系中,药房管理系统扮演着至关重要的角色。高效、准确、安全的药品管理不仅关系到患者的健康,更是医院运营的重要一环。传统的人工管理模式已经难以满足日益增长的医疗需求,因此,开发一套功能完善、易于操作的药房管理系统势在必行。1.2SSM框架的优势SSM(Spring、SpringMVC、MyBatis)
一篇文章，彻底理解数据库操作语言：DDL、DML、DCL、TCL Java布道者 oracle 数据库 sql
最近与开发和运维讨论数据库账号及赋权问题时，发现大家对DDL和DML两个概念并不了解。于是写一篇文章，系统的整理一下在数据库领域中的DDL、DML、DQL、DCL的使用及区别。通常，数据库SQL语言共分为四大类：数据定义语言DDL，数据操作语言DML，数据查询语言DQL，数据控制语言DCL。再加上事务控制语言TCL，一个共5个。下面，我们就详细了解一下它们。数据定义语言DDLDDL（DataDef
大模型的应用与微调：如何调用 LLM？从 OpenAI API 到本地部署晴天彩虹雨 AI 大模型 ai 语言模型 gpt 人工智能
本篇文章将详细介绍如何调用大语言模型（LLM），涵盖OpenAIAPI、DeepSeek、Manus、通义千问等模型的调用方式，并探讨如何在本地部署LLM进行推理。1.调用OpenAIAPI（GPT系列）OpenAI提供了RESTfulAPI供开发者调用GPT系列模型。示例：使用Python调用OpenAIAPIimportopenaiopenai.api_key="your_api_key"re
MySQL中处理JSON数据小村学长毕业设计 mysql json 数据库
MySQL中处理JSON数据已成为大数据分析领域的一个新方向，这一功能自MySQL5.7版本引入以来，为数据库管理系统在处理非结构化数据方面提供了强大的支持。以下是对MySQL中处理JSON数据的详细探讨，包括其引入的背景、特性、函数与操作符、性能优化以及在大数据分析中的应用等方面。一、JSON数据类型引入的背景随着大数据技术的迅猛发展和普及，数据量的爆炸性增长对数据处理能力提出了前所未有的挑战。
跨平台RTSP高性能实时播放器实现思路江同学_ 音视频实时音视频
跨平台RTSP高性能实时播放器实现思路目标：局域网100ms以内超低延迟一、引言现有播放器（如VLC）在RTSP实时播放场景中面临高延迟（通常数秒）和资源占用大的问题。本文提出一种跨平台解决方案，通过网络层改造、FFmpeg硬解码优化、OpenGL跨平台渲染等技术，实现100ms以内延迟，并支持H.264/H.265编码，适用于医疗、安防等对实时性要求苛刻的场景。二、网络层优化：TCP/UDP双模
前端高级 CSS 用法实战指南 Real Man★ 前端 css
前端高级CSS用法实战指南CSS的高级用法能显著提升开发效率、优化页面性能并实现复杂的视觉效果。以下是现代CSS的核心高级技巧和实战案例，涵盖布局、动画、优化等方向：一、现代布局系统CSSGrid复杂布局场景：实现不规则网格（如杂志排版、仪表盘）。示例：定义网格模板与区域命名：css.container{display:grid;grid-template-columns:200px1fr300p
Python 学习第五册深度学习第1章什么是深度学习 weixin_38135241 python 学习深度学习人工智能
----用教授的方式学习。目录1.1人工智能、机器学习与深度学习1.1.1人工智能1.1.2机器学习1.1.3从数据中学习表示1.1.4深度学习之“深度”1.1.5用三张图理解深度学习的工作原理1.2深度学习之前：机器学习简史1.2.1概率建模1.2.2核方法1.2.3决策树、随机森林与梯度提升机1.2.4深度学习有何不同什么是深度学习？1.1人工智能、机器学习与深度学习三者关系：1.1.1人工智
当细致剪裁遇上大语言模型：从数据匹配到卓越性能的奇幻之旅步子哥 AGI通用人工智能语言模型人工智能自然语言处理
在浩如烟海的人工智能技术中，构建和调教大语言模型（LLMs）的过程就像是一场精心策划的奇幻冒险。本文带您走进一个鲜为人知的领域——如何利用“量身定制”的数据，让模型在知识的海洋中游刃有余。我们将透过一篇最新的研究《TheBestInstruction-TuningDataareThoseThatFit》，探索如何通过选择与目标模型分布高度契合的数据来优化监督式微调（SFT）的效果，以及这一方法如何
MySQL 奇幻之旅：从基础探秘到高级应用魔法进阶的华夫饼进大厂 mysql 数据库
MySQL奇幻之旅：从基础探秘到高级应用魔法在数据库的神秘世界里，MySQL宛如一座蕴藏无尽宝藏的城堡，我怀揣着探索的热情与求知的渴望，踏上了这趟扣人心弦的学习征程。一、MySQL基础：城堡基石的雕琢（一）数据库与表的操作：构建数据的栖息之所数据库创建与管理：绘制数据城堡的蓝图：犹如精心绘制城堡的设计图，我熟练掌握了使用CREATEDATABASE语句创建数据库的魔法咒语，像CREATEDATAB
HTTP Cookie header 中set-cookie格式 qq_35577990 fiddler selenium
Cookie相关的Http头有两个Http头部和Cookie有关：Set-Cookie和Cookie。Set-Cookie由服务器发送，它包含在响应请求的头部中。它用于在客户端创建一个CookieCookie头由客户端发送，包含在HTTP请求的头部中。注意，只有cookie的domain和path与请求的URL匹配才会发送这个cookie。Set-CookieHeaderSet-Cookie响应头
Linux：信号处理原理与实现「已注销」 linux 运维服务器
什么是信号信号本质上是在软件层次上对中断机制的一种模拟，其主要有以下几种来源：程序错误：除零，非法内存访问等。外部信号：终端Ctrl-C产生SGINT信号，定时器到期产生SIGALRM等。显式请求：kill函数允许进程发送任何信号给其他进程或进程组。目前Linux支持64种信号。信号分为非实时信号(不可靠信号)和实时信号(可靠信号)两种类型，对应于Linux的信号值为1-31和34-64。信号是异
操作系统——windows 时间海里的溺水者 windows
1.操作系统的介绍操作系统（OperatingSystem，简称OS）是管理和控制计算机硬件与软件资源的计算机程序，是直接运行在“裸机”上的最基本的系统软件，任何其他软件都必须在操作系统的支持下才能运行。2.操作系统的分类（主流操作系统）2.1.Windows简介：Windows是微软公司研发的操作系统，自1985年推出以来，已成为全球应用广泛的操作系统。Windows采用了图形用户界面，提升了系
RocketMQ新消费者加入后的队列一致性保障机制详解慢德分布式设计 rocketmq
RocketMQ新消费者加入后的队列一致性保障机制详解RocketMQ作为一个高性能的分布式消息中间件，其消费者负载均衡机制是保障系统可扩展性和稳定性的关键。当新消费者加入消费组时，如何保证各个消费者之间的队列分配一致性是一个核心问题。下面将深入解析其详细原理和运作机制。消费模式与队列分配基础首先需要明确的是，在RocketMQ中，队列一致性问题主要出现在集群消费模式下。在这种模式中，一条消息只会
【HTTP 协议的前世今生】HTTP 1.0、HTTP 1.1 和 HTTP 2.0 春日安然 WEB 前端 http 网络服务器
本篇博客将从HTTP协议的概念出发，分别介绍HTTP协议各个版本的特点，以及对HTTP协议状态码和HTTPS协议进行说明。首先，我们先来了解下HTTP协议的概念。什么是HTTP协议HTTP协议的全称为HyperTextTransferProtocol（超文本传输协议)，是互联网上应用最为广泛的、构建在TCP协议之上的应用层协议。它用于客户端与服务器之间的通信，规定了客户端和服务器之间的通信格式，包
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

Facebook 360度音频编码与渲染

你可能感兴趣的:(Facebook 360度音频编码与渲染)