Android-(Audio)

烧脑长文！近乎完美的DDS正弦波信号音生成器！

通常会使用价格高昂的实验室仪器仪表来执行这些评估和特性表征，例如AudioPrecision提供的音频分析仪AP27xx或APx5xx系列。

BinaryStarXin·2025-07-20 23:33

CosyVoice安装过程详解

Ubuntu22.04.1python环境：miniconda25.3.1git：2.34.1git-lfs:3.0.21.Clone代码$gitclone--recursivehttps://github.com/FunAudioLLM

菜Queen·2025-07-20 11:05

jetson orin nano安装GPU版本的pytorch过程

一、安装jetpack组件和安装CUDA/cuDNN可以参考下面这个博客「解析」JetsonOrinNX安装CUDA/cuDNN_jetsoncuda-CSDN博客二、安装Pytorch和torchaudio

小鲈鱼-·2025-07-10 21:58

【AI大模型前沿】OmniAudio：阿里通义实验室的空间音频生成模型，开启沉浸式体验新时代

系列篇章No.文章1【AI大模型前沿】深度剖析瑞智病理大模型RuiPath：如何革新癌症病理诊断技术2【AI大模型前沿】清华大学CLAMP-3：多模态技术引领音乐检索新潮流3【AI大模型前沿】浙大携手阿里推出HealthGPT：医学视觉语言大模型助力智能医疗新突破4【AI大模型前沿】阿里QwQ-32B：320亿参数推理大模型，性能比肩DeepSeek-R1，免费开源5【AI大模型前沿】TRELLI

寻道AI小兵·2025-07-10 07:01

RBDMuteSwitch：一键静音控制工具使用指南

一键静音控制工具使用指南RBDMuteSwitchPriortoiOS5itwasrelativelystraightforwardtodetectwhetheradevicewasmutedbyusinganaudioroutetodetectplaybacktype

幸生朋Margot·2025-07-10 00:45

SAiD：基于扩散的音频驱动语音动画

SAiD：基于扩散的音频驱动语音动画SAiDSAiD:Blendshape-basedAudio-DrivenSpeechAnimationwithDiffusion项目地址:https://gitcode.com

·2025-07-10 00:45

【亲测免费】探索AudioSlicer：智能音频分割工具

探索AudioSlicer：智能音频分割工具去发现同类优质开源项目:https://gitcode.com/项目介绍AudioSlicer是一个基于Python的轻量级工具，专门用于切割.wav音频文件

秦贝仁Lincoln·2025-07-10 00:45

ESP32播放网络音乐与麦克风接收

音频放大器模块播放网络音乐,同时用INMP441模块作为语音输入进行测试第一部分：播放网络音乐需要用到esp32开发板、MAX98357模块、喇叭、连接线一、准备工作库安装1，首先到GITHUB下载「ESP32-audioI2S

魔法少女郭德纲*·2025-07-10 00:14

CosyVoice升级版 - 阿里最新开源语音克隆、文本转语音项目支持音色保存本地一键整合包下载

近日，阿里通义实验室发布开源语音大模型项目FunAudioLLM，而且一次包含两个模型：SenseVoice和CosyVoice。

昨日之日2006·2025-07-09 11:47

【unity游戏开发入门到精通——通用篇】在 Unity 6 中轻松实现播放随机游戏音效——AudioRandomContainer音频随机容器的使用

考虑到每个人基础可能不一样，且并不是所有人都有同时做2D、3D开发的需求，所以我把【零基础入门unity游戏开发】分为成了C#篇、unity通用篇、unity3D篇、unity2D篇。【C#篇】：主要讲解C#的基础语法，包括变量、数据类型、运算符、流程控制、面向对象等，适合没有编程基础的同学入门。【unity通用篇】：主要讲解unity的基础通用的知识，包括unity界面、unity脚本、unit

向宇it·2025-07-09 10:13

Flutter编译安卓应用时遇到的compileDebugJavaWithJavac和compileDebugKotlin版本不匹配的问题

最终定位的原因是项目一来了audioplayers组件。audioplayers组件有依赖了audioplayers_android，它使用1.8编译的。版本过低。

悠等生2018·2025-07-09 10:41

Android15音频进阶之高通Adsp触发ramdump(一百二十六)

简介：CSDN博客专家、《Android系统多媒体进阶实战》一书作者博主新书推荐：《Android系统多媒体进阶实战》AndroidAudio工程师专栏：Audio工程师进阶系列【原创干货持续更新中……

Android系统攻城狮·2025-07-08 08:46

AI技术通过多模态应用（即融合文本、图像、语音、视频、传感器数据等多维度信息）正在深刻重塑工作模式、行业生态和人类创造力边界。

以下从技术融合、行业变革、职业重构三个维度展开分析，并附具体案例：一、技术融合：多模态AI的核心突破跨模态理解引擎案例：Meta的AudiovisualNeuralNetwork（AV-Wav2Vec）

zzywxc787·2025-07-08 08:43

使用 C++/Faiss 加速海量 MFCC 特征的相似性搜索

加速海量MFCC特征的相似性搜索引言在现代音频处理应用中，例如大规模声纹识别(SpeakerRecognition)、音乐信息检索(MusicInformationRetrieval)或音频事件检测(AudioEventDetection

whoarethenext·2025-07-08 04:17

Android 音频降噪 webrtc 去回声

Android音频降噪webrtc去回声集成AECM模块集成NS模块需要源码请留言集成AECM模块1.通过webrtc官网下载需要模块\modules\audio_processing\aecm2.新建

·2025-07-08 02:02

《声音的变形记：Web Audio API的实时特效法则》

用户期待更丰富、更具沉浸感的听觉体验时，基于WebAudioAPI实现的实时音频特效，就像是为这片森林注入了灵动的精灵，让简单的声音蜕变为震撼人心的听觉盛宴。

程序猿阿伟·2025-07-07 23:41

安卓audio之Remote_Submix

参考文档：Audio-内录实现原理（上）Audio-内录实现原理（下）一、实现原理REMOTE_SUBMIX是Android系统提供的内录（InternalAudioCapture）方案，用于捕获设备音频输出

盼雨落，等风起·2025-07-07 23:35

android 音量调整

1流程图2audio_policy_volumes.xml阐述了流跟device的音量范围【AndroidAudio】5、EngineBase加载音量曲线和策略【基于AndroidQ】1.按键处理1.1

盼雨落，等风起·2025-07-07 23:05

audio的Framework层到hal 如何调用（以setparameters为例）

首先查看AudioManager之setParameters从应用到hal流程分析android6.0看到最后两个格：audio_hw_device_t->set_parameters()是上层调用hal

盼雨落，等风起·2025-07-07 23:35

【Cocos TypeScript 零基础 16.1】

目录FlappyBird背景其他心得_刚体audio部分FlappyBird本人没有按照老师的做法去做,大体差不多,当然老师做的更精细,有些不会的还是参考老师的方法参考部分小鸟如何像真实物体一样的重力效果点击如何使小鸟飞翔省略部分

adminwxs·2025-07-07 02:46

写一个ununtu C++ 程序，调用ffmpeg ，来判断一个数字电影的音频文件mxf 的采样率（频率），通道数，采样位数

FFmpeg开发库bashsudoaptupdatesudoaptinstalllibavformat-devlibavcodec-devlibavutil-dev2.C++程序代码(check_mxf_audio.cpp

m0_68739984·2025-07-06 04:26

在html中主要支持的音频格式,html5中audio支持音频格式

HTML5Audio标签能够支持wav,mp3,ogg,acc,webm等格式，但有个很重要的音乐文件格式midi(扩展名mid)却在各大浏览器中都没有内置的支持。

·2025-07-05 06:20

Kimi Audio一个通用的音频基础模型处理各种任务如自动语音识别（ASR）、音频问答（AQA）、自动音频字幕（AAC）、语音情感识别（SER）、声音事件/场景分类（SEC/ASC）和端到端语音对话

KimiAudio被设计为一个通用的音频基础模型，能够在一个统一的框架内处理各种音频处理任务。

skywalk8163·2025-07-05 03:02

《深度学习》—— PyTorch的介绍及PyTorch的CPU版本安装

文章目录一、PyTorch的简单介绍二、pytorch的CPU版本安装三、torch、torchvision、torchaudio三个库的介绍一、PyTorch的简单介绍PyTorch是一个由FacebookAI

张小生180·2025-07-05 01:24

Python脚本，音频格式转换和视频格式转换

一、音频格式转换完整代码frompydubimportAudioSegmentimportosdefconvert_audio(input_dir,output_dir,target_format):ifnotos.path.exists

·2025-07-04 12:23

Python音频库

Python音频库Python有一些很棒的音频处理库，比如Librosa和PyAudio。还有一些内置的模块（内置库wave）用于一些基本的音频功能。

龅牙内马尔·2025-07-04 04:56

极客时间-《搞定音频技术》-学习笔记

极客时间-《搞定音频技术》-学习笔记语音基础知识https://www.zhangzhenhu.com/audio/feature.html序章-0作者说这个语音技术啊，未来肯定前景大好啊，大家都来学习

Mark White·2025-07-04 04:54

android-性能分析

以下是Android性能分析的完整指南，涵盖核心工具、优化方向及实操方法，适用于2025年开发环境：⚙️一、性能分析工具分类1.官方工具链工具用途关键能力版本适配AndroidProfiler实时监测CPU/内存/网络/能耗火焰图分析、内存泄漏检测（支持Activity/Fragment自动检测）AndroidStudio3.6+Perfetto系统级追踪（替代Systrace）线程调度、GPU渲

·2025-07-04 02:15

AWS WebRTC：根据viewer端拉流日志推算视频帧率和音频帧率

viewer端拉流日志是这样的：07:19:26.263VERBOSEsampleAudioFrameHandler():AudioFramereceived.TrackId:140092278368896

·2025-07-03 17:48

AWS WebRTC: 判断viewer端拉流是否稳定的算法

音频帧、视频帧的日志打印如下：07:19:26.263VERBOSEsampleAudioFrameHandler():AudioFramereceived.TrackId

Jasper张·2025-07-03 17:47

android 多通道音频,支持多通道录音

可是原生AudioRecord接口是完全不支持多channel录音数据的采集的，怎么修改，才能让原生进行支持呢?我们就从AudioRecord的构造函数开始往下研究。无论行不行，都要研究出个所以然来！

虾仁芝麻卷·2025-07-03 15:58

ReBEL模型的本地部署与运行，用于三元组抽取任务（事件抽取、知识抽取）

condacreate-nrebel_envpython=3.10-ycondaactivaterebel_env#安装PyTorch（建议与CUDA11.7配合）pipinstalltorchtorchvisiontorchaudio

·2025-07-03 09:46

Android15音频进阶之HIDL与宏代码调试(一百二十五)

简介：CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布：《Android系统多媒体进阶实战》优质专栏：Audio工程师进阶系列【原创干货持续更新中……】优质专栏：多媒体系统工程师系列

Android系统攻城狮·2025-07-02 08:37

HarmonyOS 创建 createAudioCapturer 时候报错误码 6800301

一、错误码6800301的信息错误码6800301，表示包含参数校验异常、权限校验异常、系统处理异常（具体错误查看系统日志）。本人遇到的问题是，申请了麦克风权限，但是未弹出提示用户授权，所以权限校验失败了。二、配置权限src/main/module.json5文件中配置如下内容"requestPermissions":[{"name":"ohos.permission.MICROPHONE","r

chenbin___·2025-07-02 08:34

[iOS文档翻译]AVFoundation Programming Guide - About AVFoundation - AVFoundation概述

AboutAVFoundation-AVFoundation概述AVFoundationisoneofseveralframeworksthatyoucanusetoplayandcreatetime-basedaudiovisualmedia.ItprovidesanObjective-Cinterfaceyouuset

yofer张耀琦·2025-07-01 15:33

【Transformer论文】通过蒙面多模态聚类预测学习视听语音表示

文献题目：LEARNINGAUDIO-VISUALSPEECHREPRESENTATIONBYMASKEDMULTIMODALCLUSTERPREDICTION发表时间：2022发表期刊：ICLR摘要语音的视频记录包含相关的音频和视觉信息

Wwwilling·2025-07-01 13:24

iOS开发-进阶:音频播放、录音、视频播放、拍照、视频录制

转自:http://www.cnblogs.com/kenshincui/p/4186022.html#audioRecord文章太长了,如果我这里写的质量不好,请参考原文;概览随着移动互联网的发展，如今的手机早已不是打电话

nikoLiLol·2025-07-01 04:54

FFmpeg：播放音频

函数SDL_OpenAudio()本身就是用来打开声音设备的。它使用一个叫做SDL_AudioSpec结构体作为参数，这个结构体中包含了我们将要输出的音频的所有信息。

奋斗的IT青年·2025-07-01 03:23

《解锁AudioSet：开启音频分析的无限可能》

音频新时代的“密钥”：AudioSet登场在科技飞速发展的今天，音频作为信息传播与交互的关键媒介，早已渗透到现代科技的各个角落。

·2025-07-01 03:52

AAC / G711A / PCM 音频格式解析

Android利用AudioTrack录制和播放PCM格式音频：publicclassPCMTalk{privateAudioRecordaudioRecord;privateintsampleRate

孤独冰刃·2025-07-01 03:18

Python实现语音识别功能，只需3个步骤！

首先在官网下载了关于语音听写的SDK，然后在文件夹内新建了两个.py文件，分别是get_audio.py和iat_demo.py，并且新建了一个存放录音的文件夹audios，文件夹内存放录音文件input.wav

·2025-06-30 23:27

HTML5的新特性

谷歌浏览器需要添加muted来解决自动播放问题controls：controls向用户显示播放插件loop：loop循环播放poster:imgural加载等待的画面图片muted:muted静音播放2.音频audio

码哥DFS·2025-06-30 14:50

QFramework v1.0 Guide: 工具篇2——UIKit,AudioKit,FluentAPI,SingletonKit,FSMKit,PoolKit,TableKit

目录一、UIKit界面管理&快速开发解决方案1、用法（1）界面创建与层级管理（2）代码生成与组件绑定（3）打开与关闭界面（4）自定义界面加载方式2、应用场景3、示例代码二、AudioKit音频管理解决方案

WX呦·2025-06-30 04:46

Android的Audio子系统

Android边录边播应用AP（ApplicationProcessor主处理器）DSP（Codec）BP（BasebandProcessor基带处理器，猫）一、AudioTrack播放基本流程1.初始化

雷古拉斯·2025-06-29 14:13

✨【CosyVoice2-0.5B 实战】Segmentation fault (core dumped) 终极解决方案（保姆级教程）

【CosyVoice2-0.5B实战】Segmentationfault(coredumped)终极解决方案|torchaudio.save崩溃全流程排查与替代方案（保姆级教程）“运行没报错就是胜利，结果没崩溃就是奇迹

杨靳言先·2025-06-29 07:17

Pydub音频处理库核心API详解

Pydub音频处理库核心API详解pydubManipulateaudiowithasimpleandeasyhighlevelinterface项目地址:https://gitcode.com/gh_mirrors

滕娴殉·2025-06-29 01:38

强化学习 16G实践以下是基于CQL（Conservative Q-Learning）与QLoRA（Quantized Low-Rank Adaptation）结合的方案相关开源项目及资源，【ai技】

TensorFlow的兼容版本建议及环境修复方案：1.版本兼容性表框架兼容CUDA版本推荐安装命令（CUDA11.5）PyTorch11.3/11.6pipinstalltorchtorchvisiontorchaudio

行云流水AI笔记·2025-06-28 19:19

高通 audio pal 配置文件

一、PAL配置文件解析1.mixer_paths.xml-硬件控制中枢核心作用：物理通路定义：建立Codec寄存器到音频端点的信号链路动态控制：运行时通过ALSAControlAPI（如amixerset"SpkrLeftPAVolume"25）实时调整参数平台适配：文件命名规则mixer_paths__.xml（如mixer_paths_sm8550-demo.xml）调试技巧：使用tinymi

盼雨落，等风起·2025-06-28 06:24

九、buildroot系统 usb配置

UAC（USBAudioClass）UAC通过USB虚拟标准PCM接口给Host设备，实现Device和Host之间音频互传功能。

·2025-06-28 04:38

Android实时获取声音音量大小

使用AudioRecord实时获取音量创建一个AudioRecord实例并持续读取音频数据，计算音量大小。AudioRecord适用于需要原始音频数据的场景。

泓博·2025-06-28 01:25

推荐频道