audio

Unity麦克风采样audio44100HZ 转16000HZ

unity默认是44100HZ但是发到阿里的语音sdk只识别8K和16K的所以需要转换采样一下AudioClipResampleAudio44100(AudioClipsourceClip){//1.提取原始数据

虾米神探·2025-04-18 19:18

Android15音频进阶之设置audio进程日志等级(一百一十四一)

简介：CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布：《Android系统多媒体进阶实战》优质专栏：Audio工程师进阶系列【原创干货持续更新中……】优质专栏：多媒体系统工程师系列

Android系统攻城狮·2025-04-18 09:09

AI大模型识别多人发音的实时语音交互理论研究

音频流处理与队列管理第三章实时语音识别3.1多说话人分离技术的实时处理3.2AI大模型的语音转文字应用3.3系统优化与队列管理3.4实时识别的性能测试与评价第四章多说话人分离技术4.1多说话人分离的重要性4.2基于`pyannote-audio

一只老虎·2025-04-18 08:03

Opus——基于Python实现opus音频编解码

文章目录安装环境编解码程序安装环境安装环境：sudoapt-getupdatesudoapt-getinstallbuild-essential#pyaudiosudoapt-getinstalllibportaudio2libportaudiocpp0portaudio19

Irving.Gao·2025-04-17 16:50

【Bluedroid】A2dp Source连接流程源码分析（一）

在蓝牙音频传输领域，A2DP（AdvancedAudioDistributionProfile，高级音频分发协议）扮演着关键角色，它能够实现高质量音频（如立体声音乐）通过蓝牙在不同设备间的传输。

byte轻骑兵·2025-04-17 15:10

【bluedroid】A2dp Source播放流程源码分析(2)

音频框架处理：安卓系统中的音频框架（AudioFlinger组件）接收到音频数据后，可能会进行一系列操作，如根据当前系统音频状态（是否有其他音频正在播放、音量

byte轻骑兵·2025-04-17 14:40

【Bluedroid】A2DP Sink播放流程源码分析(一)

在Bluedroid协议栈中，A2DP（AdvancedAudioDistributionProfile）Sink播放流程是一个复杂但有序的过程，涉及多个层次和组件的交互。

byte轻骑兵·2025-04-17 14:39

部署Fish-Speech实现声音克隆及文本转语音

FishSpeech是由FishAudio团队开发的一款开源文本转语音（TTS）模型，支持多语言的语音合成和识别。它采用先进的深度学习技术，能够生成自然流畅的语音，并提供高质量的语音转文字功能。

培根芝士·2025-04-17 12:51

探索Android移动开发：音视频处理技术

我们将分析Android音视频处理的核心组件和工作原理，详细介绍MediaCodec、AudioTrack等关键API的使用，并探讨FFmpeg在Androi

移动开发前沿·2025-04-17 08:58

最简单的使用SDL2 播放原始音频数据程序

2.1SDL播放音频核心代码:混音函数2.2先看看音频播放的可能的两种框架.同步播放,异步播放2.3:回调函数fill_audio()2.4:SDL播放音频的工

hjjdebug·2025-04-17 05:02

linux4.6内核移植蓝牙和音频

第1章RTL8723BU蓝牙模块驱动移植1.1.硬件方案1.2.蓝牙驱动移植1.3.蓝牙耳机规格要求第2章Linux音频框架2.1.ALSA2.2.Pulseaudio

寒听雪落·2025-04-16 18:55

ffmpeg-将多个视频去掉音频然后切片组合成一个视频,再将新视频配置上新的音频

去除视频音频要去除视频中的音频，只需使用以下命令ffmpeg-iinput1.mp4-an-c:vcopyoutput1_no_audio.mp4解释：-iinput1.mp4：输入原始视频。

Enougme·2025-04-16 14:28

哔哩哔哩缓存视频整合为MP4，

importosimportjsondefpath(path,name):""":parampath:视屏项目的总目录:paramname:audio.m4s音频的文件名，每个音频的名字是一样的:return

shiyi889·2025-04-16 07:43

屏幕共享默认选择标签页

getDisplayMedia获取屏幕共享stream.value=awaitnavigator.mediaDevices.getDisplayMedia({video:true,preferCurrentTab:true,audio

前端小菜鸟也有人起·2025-04-15 03:43

【鸿蒙实战开发】HarmonyOS-Audio Kit（音频服务）详解

AudioKit简介AudioKit（音频服务），针对提供场景化的音频播放、录制接口，帮助开发者快速构建音频高清采集及沉浸式播放能力。

代码改变世界996·2025-04-14 20:52

RK3568 OpenHarmony3.2 音频Audio之MIC调试

一、概述本文基于RK3568OpenHarmony3.2，以音频capture为主线，以内核驱动层为界限，向上概述了音频组件，主要是音频相关的功能，包括音频播放，录制，音量管理和设备管理；向下描述了HDI、HDF驱动框架的相关音频驱动内容。同时通过结合解决MIC无声的BUG，来加深对音频调试的整体了解。BUG问题描述：录制的音频文件出现播放无声现象。目前采用外置mic，用ets应用工具抓取音频文件

OpenHarmony驱动开发·2025-04-14 03:01

Android15音频进阶之build AAOS15 kernel for Pixel6(一百一十四)

简介：CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布：《Android系统多媒体进阶实战》优质专栏：Audio工程师进阶系列【原创干货持续更新中……】优质专栏：多媒体系统工程师系列

Android系统攻城狮·2025-04-13 09:36

使用faster-whisper音频转srt字幕（亲测可行）

fromfaster_whisperimportWhisperModelfrompydubimportAudioSegmentfromzhconvimportconvert#简繁转换库importosimportdatetimeimporttorchdefformat_time

批量小王子·2025-04-13 09:36

unity设置iOS手机震动

iOS提供了另外一个接口AudioServicesPlaySystemSound(1519);需要用uinty调用IOS接口：在unityiOS工程里创建oc混编文件，ShortVibrator.mm文件里代码如下

hookby·2025-04-13 05:04

Unity VideoPlayer 播放无声音

增加一个videoPlayer下挂，audiorSource脚本this.videoPlayer.EnableAudioTrack(0,true);this.videoPlayer.audioOutputMode

hookby·2025-04-13 04:32

Pyhton调用百度语音识别+千帆大模型API实现智能语音助手

1.录制音频文件使用pyaudio进行录音，并保存录音文件，文件名为output.wav，代码如下：importpyaudioimportwaveCHUNK=1024FORMAT=pyaudio.paInt16CHANNELS

vintagestyle·2025-04-12 21:20

Android AudioService

一个学渣的自我救赎·2025-04-12 19:05

Android 11 AudioPolicyService 启动流程

AudioPolicyService在init进程中启动，源码路径：frameworks/av/media/audioserver/audioserver.rcserviceaudioserver/system

Kbattery·2025-04-12 19:34

002 AudioService音频设备管理

在android手机插入或者拔出耳机的瞬间，kernel层会监听到耳机的变化，以下是插入耳机的瞬间打印的log,可以看到产生event事件然后逐级上报。01-0205:26:25.479405465DENGPC:parse_event:event{'change','/devices/virtual/switch/h2w','switch',''}然后wiredAccessoryManager检查

火车上遇见·2025-04-12 18:03

AUDIO SERVICE的功能

AUDIOSERVICE在音频处理和管理方面发挥着关键的作用，以下是关于其功能的详细解释：音频后台服务：AUDIOSERVICE允许Android和iOS应用在后台持续播放音频，确保即使在主进程被杀死或者屏幕关闭的情况下

小菜翔·2025-04-12 18:32

【Python 煮音乐】如何优雅地把 MID 转成 WAV 或 MP3 格式

0.运行环境：Win10系统，Python3.71.问题描述：因为一些自娱自乐的需要，笔者遇到了一个需要将MIDI音乐标准格式转换为WAV音频的问题，在互联网的帮助下找到了Python库midi2audio

SnowRXS·2025-04-12 17:56

【人工智能】Transformers之Pipeline（一）：音频分类（audio-classification）

目录一、引言二、音频分类（audio-classification）2.1概述2.2技术原理2.2.1Wav2vec2.0模型2.2.1HuBERT模型2.3pipeline参数2.3.1pipeline

LDG_AGI·2025-04-11 21:42

【场景应用3】audio_classification：音频分类的微调

1引言本笔记展示了如何对多语种预训练的语音模型进行微调，以实现自动语音识别（AutomaticSpeechRecognition）。本笔记旨在使用SUPERB数据集中的关键词检测子集，并且可以使用任何来自模型库（ModelHub）的语音模型检查点，只要该模型有一个包含序列分类头（SequenceClassificationhead）的版本（例如Wav2Vec2ForSequenceClassifi

AI专题精讲·2025-04-11 21:38

Failed to build installable wheels for some pyproject.toml based projects (pyaudio)问题解决

1.前言这个问题出现在pyaudio包安装错误，如果我们直接使用pipinstallpyaudio就会出现下面错误：Failedtobuildinstallablewheelsforsomepyproject.tomlbasedprojects

奶茶不加冰·2025-04-11 15:00

【wpf】文件选择框样式

publicvoidChooseAudio(){//使用Ookii.Dialogs.Wpf的VistaFolderBrowserDialog提供更现代的界面varfolderBrowserDialog=

upp·2025-04-11 14:52

从Hugging Face下载Qwen/Qwen2-Audio-7B-Instruct模型到本地运行，使用python实现一个音频转文字的助手

明明跟你说过：个人主页个人专栏：《深度探秘：AI界的007》行路有良友，便是天堂目录一、引言1、HuggingFace简介2、Qwen2-Audio-7B-Instruct模型简介二、下载模型1、注册HuggingFace2

明明跟你说过·2025-04-11 13:46

AI绘画+音乐+Suno系统：打造AIGC平台的全景指南

提示词工程需多次调试跨模态风格一致性维护困难版权合规要求需实现：训练数据溯源输出内容查重风格相似度检测技术栈集成复杂度典型系统需整合：mermaid复制graphTBA[SD/MJAPI]-->D[生成系统]B[Suno/AudioCra

GoMaxAi·2025-04-10 18:47

【AAOS】【源码分析】CarAudioService（一）-- 基本介绍

CarAudioService(汽车音频系统)是在核心Android音频堆栈的基础之上打造而成，以支持用作车辆信息娱乐系统的情况。

IT_码农·2025-04-10 09:11

【AAOS】【源码分析】CarAudioService（二）-- 功能介绍

汽车音频是Android汽车操作系统(AAOS)的一项功能，允许车辆播放信息娱乐声音，例如媒体、导航和通信。AAOS不负责具有严格可用性和时间要求的铃声和警告，因为这些声音通常由车辆的硬件处理。将汽车音频服务集成在汽车中，彻底改变了驾驶体验，为驾驶员和乘客提供了音乐、导航指导、语音命令等的无缝融合。汽车音频主要包括音量控制、音频路由、音频焦点、多区音频等功能。主要功能如下：音量控制：通过将音频设备

IT_码农·2025-04-10 08:40

Android13制作开机动画

默认设置下，Android13会加载/frameworks/base/data/sounds/AllAudio.mk下指定的开机动画bootanimation.zip开机动画的加载代码在/home/pcserver

oh_my_god·2025-04-09 09:35

基于分布式指纹引擎的矩阵运营技术实践：突破平台风控的工程化解决方案

一、矩阵运营的技术痛点与市场现状风控机制升级主流平台通过复合指纹识别（Canvas渲染哈希+WebGL元数据+AudioContext频率分析）检测多账号关联传统方案成本：单个亚马逊店铺因关联封号月均损失

Hotlogin·2025-04-09 08:33

如何在多线程中安全地使用 PyAudio

1.背景介绍在多线程环境下使用PyAudio可能会导致段错误（SegmentationFault）或其他不可预期的行为。这是因为PyAudio在多线程环境下可能会出现资源冲突或线程安全问题。

niuguangshuo·2025-04-09 07:24

【Android Audio】Parameter Framework - pfw

ParameterFramework-AndroidAudioPolicyEngine使用libaudiopolicyengineconfigurable.so来取缔默认安卓音频引擎libaudiopolicyenginedefault.so

zgyhc2050·2025-04-09 02:22

说话人分离中的聚类方法：深入解析Agglomerative聚类、KMeans聚类和Oracle聚类

在pyannote.audio`管道中使用的三种聚类方法：层次聚类（AgglomerativeClustering）、KMeans聚类（KMeansClustering）和Oracle聚类（Or

CyreneSimon·2025-04-08 15:11

ubuntu安装vlc

VLCisafreeandopensourcecross-platformmultimediaplayerandframeworkthatplaysmostmultimediafilesaswellasDVDs,AudioCDs

guoyunfei20·2025-04-08 10:33

视音双模态融合

LeveragingTCNandTransformerforeffectivevisual-audiofusionincontinuousemotionrecognition利用TCN和Transformer

阿冰在努力·2025-04-08 00:06

FFmpeg录制屏幕和音频

/FFmpeg命令行（录制屏幕+麦克风音频）std::stringcommand="ffmpeg-fgdigrab-framerate30-idesktop"//屏幕捕获（GDI）"-fdshow-iaudio

byxdaz·2025-04-04 20:18

记录部署AniPortrait注意的地方（亲测）

项目地址为：Zejun-Yang/AniPortrait:AniPortrait:Audio-DrivenSynthesisofPhotorealisticPortraitAnimation(github.com

monster justin·2025-04-04 17:28

解决conda安装pytorch时显示Could not find a version that satisfies the requirement torch

在conda中输入pipinstalltorchtorchvisiontorchaudio显示以下错误：ERROR:Couldnotfindaversionthatsatisfiestherequirementtorch

52Hz118·2025-04-04 12:54

SparkAudio 是什么，和其他的同类 TTS 模型相比有什么优势

而SparkAudio的出现，就像是音频

涛涛讲AI·2025-04-04 10:43

安装ROS1（Noetic）

wgethttp://fishros.com/install-Ofishros&&.fishrospipinstalltorch1.13.1+cu117torchvision0.14.1+cu117torchaudio

全息数据·2025-04-04 10:13

V4L2&&Gstreamer媒体控制工具(五)

优质专栏：Audio工程师进阶系列【原创干货持续更新中……】人生格言：

Android系统攻城狮·2025-04-04 04:33

小智机器人关键函数解析：MqttProtocol::SendAudio()对输入的音频数据进行加密处理，通过UDP发送加密后的音频数据

MqttProtocol::SendAudio()对输入的音频数据进行加密处理，通过UDP发送加密后的音频数据。

LS_learner·2025-04-04 00:10

从基础到实践（二十四）：蓝牙模块的选型设计

其高集成度设计（如QFN封装）可节省30%PCB面积，同时支持LEAudio、AoA定位等创新功能，为可穿戴

硬件进化论·2025-04-03 14:38

Unity声音管理系统笔记

需求在各个场景可以打开设置面板，设置音乐、UI音效和所有其他音效的音量；分析管理器在各个场景都存在，可以：不继承MonoBehavior，就不能和AudioSource挂在一个对象，也不能通过拖指定音乐和

WarPigs·2025-04-03 03:17

推荐频道