E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
audio音频
一键制作精彩播客!扣子空间播客能力全新升级
资料来源:火山引擎-开发者社区本播客由扣子空间(http://coze.cn)一键生成划重点:关键提示词——“生成播客”在当今信息爆炸的时代,播客作为一种新兴的
音频
媒体形式,正以其独特的魅力吸引着越来越多的听众
火山引擎开发者社区
·
2025-06-22 23:44
扣子
[特殊字符] 一键搭建AI语音助理:基于DashScope+GRadio的智能聊天机器人技术全解
一、项目核心技术架构(图1)交互层核心模块py
audio
实时采集流式响应PCM编码GRadio界面状态控制实时对话展示语音输出历史记录管理ASR回调类ASR语音识别聊天处理引擎GPT大模型处理语音合成回调
来自于狂人
·
2025-06-22 22:10
人工智能
机器人
OBS脚本示例大全:Python与Lua脚本编程指南
尽管这些脚本未经严格测试,但通过它们,用户可以学习OBS脚本的基本结构,并实现复杂的直播控制功能,如场景切换、
音频
调整和观众统计信息显示等。1.OBS软件概述与应用在I
Aurora曙光
·
2025-06-22 20:25
Qt
音频
采集:Q
Audio
Input详解与示例
1.简介Q
Audio
Input是QtMultimedia模块中用于
音频
采集的核心类,能够从麦克风等输入设备实时获取原始
音频
数据(PCM格式)。
·
2025-06-22 17:08
android sip服务器,Android SIP开发教程
Android包含一个完整的SIP协议栈,整合了允许轻松创建来电和去电的电话管理服务,而不必开发者直接参与管理会话、传输层通信、
音频
录制等工作。
知乎人文
·
2025-06-22 02:33
android
sip服务器
音视频及H264/H256编码相关原理
一般视频文件里不光有视频,还有
音频
,封装格式的作用就是把视频和
音频
打包起来。所以我们先要解封装格式,看有哪些视频流和哪些
音频
流,此时的
音频
流和视频流都还是压缩数据,不能直接用于显示的,这就需要解码。
Everbrilliant89
·
2025-06-22 02:33
音视频开发
音视频
视频编解码
H264编码
H265编码
音视频编解码
【音视频】PJSIP库——pjsua命令使用详解
安装依赖库sudoaptinstalllibsrtp2-devsudoaptinstalllibopus-devalsa-toolslibalsaplayer-devffmpeglibalsa*pulse
audio
-module-jacksudoaptinstalljackdlibjack-jackd2
郭老二
·
2025-06-22 02:03
视频
音视频
抖音AI数字人对口型软件LatentSync最新版整合包,
音频
驱动口型讲话
本次和大家分享一个字节跳动开发的强大的
音频
驱动口型数字人视频制作软件LatentSync,我以前也分享过不少类似软件了,比如:EchoMimic、VideoReTalking、hallo。
漫游者Nova
·
2025-06-22 02:02
工具分享
人工智能
音视频
音频驱动口型
对口型
Unreal 文件夹命名----理解引擎
在资源文件夹里一般包括:声音(
Audio
)、蓝图(BlueprintBP)、特效(effect)、材质(Materials)、网格(Mesh)、纹理贴图(Textures)等文件,其中一般材质很多时,材质可按布料
坤坤子的世界
·
2025-06-21 23:45
unreal
unreal
【大模型开发】Hugging Face的Transformers库详解介绍与案例
深入解析HuggingFaceTransformers及开源大模型微调实践HuggingFaceTransformers已成为自然语言处理(NLP)乃至多模态(跨语言、图像、
音频
等)应用中最为流行、功能最完备的开源框架之一
云博士的AI课堂
·
2025-06-21 11:01
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
transformer
huggingface
大模型技术
大模型开发
deepseek
机器学习
深度学习
Win10/11: Windows
Audio
无法启动 错误 0x80070005:拒绝访问
addnetworkservice,回车在cmd窗口中输入:netlocalgroupAdministrators/addlocalservice,回车右击我的电脑-管理-服务和运用程序-服务,找到Windows
Audio
积跬步至千里PRO
·
2025-06-21 08:39
Windows
windows
八种常见的神经网络介绍
概述(八大神经网络)卷积神经网络(CNN):适用于图像、
音频
等网格数据处理。通过卷积层提取局部特征,池化层降维,广泛用于图像分类、目标检测。特点是参数共享和权值的局部连接,减少了模型复杂度。
EdmundXjs
·
2025-06-21 06:24
技术专栏
神经网络
人工智能
深度学习
俄罗斯顶级音乐播放器--AIMP,v5.40.2683新版本,增强便携版~
俄罗斯顶级音乐播放器--AIMP,v5.40.2683新版本,增强便携版~AIMP是来自俄罗斯的一款高级多媒体播放器(非开源软件),除了播放器基本的
音频
播放之外它还包含了
音频
转换、录制、ID3标签编辑等功能
Mbblovey
·
2025-06-21 02:30
网络
服务器
php
运维
linux
flask静态资源与模板页面、模板用户登录案例
案例代码importflask#template_folder模板文件夹(静态页面html页面渲染)#static_folder静态资源文件夹主要存放的是类似静态数据、
音频
、视频、图片等app=flask.Flask
网小鱼的学习笔记
·
2025-06-20 23:13
Python
flask
python
后端
XMOS将在CES 2025上展出多款由边缘AI驱动的创新音效、
音频
、识别和处理解决方案
全球智能物联网技术领导者暨匠心独到的半导体科技企业XMOS宣布:该公司将再次参加2025年国际消费电子展(CES2025),并将在本届CES上展出一系列由人工智能(AI)驱动的全新空间音效、语音捕获与降噪、音视频多模态AI处理等多种全新
音频
技术与应用解决方案
电子科技圈
·
2025-06-20 15:47
XMOS
人工智能
音视频
嵌入式硬件
科技
物联网
mcu
iot
XMOS 多路
音频
解码器
当谈及高性能
音频
解码器,XMOS是一个不容忽视的名字。作为
音频
解决方案领域的领军者,XMOS的多路
音频
解码器在
音频
处理技术中扮演着至关重要的角色。
Tracy973
·
2025-06-20 15:15
音视频
音频
实时音视频
人工智能
语音识别
前端系列之:Blob
任何类型的数据(无论是文本、图片、
音频
文件等)都可以通过二进制表示。什么是Blob?全称BinaryLargeObject,二进制类型的大对象。是一种数据类型,用来存储二进制数据。
程序员SKY
·
2025-06-20 14:07
前端
前端
ChromaDB深度技术研究报告
在高维空间中,向量嵌入是数据(如文本、图片、
音频
等)的数值表示。向量数据库的核心能力在于,它能够高效地执行相似度搜索,即找到与给定查询向量最相似的向量。
大表哥汽车人
·
2025-06-20 10:43
人工智能
大语言模型学习笔记
人工智能
语言模型
自然语言处理
鸿蒙AI语音翻译便签应用设计与实现
https://example.com/ai-voice-translator-arch.png系统包含三个核心模块:语音识别模块-使用@ohos.multimedia.
audio
和AI语音识别服
鸿蒙大白
·
2025-06-20 10:11
ui
ArKUI-X
wpf
物联网
HarmonyOS5
仓颉
深度解析融合指挥调度:多网络融合下的高效运作与多元满足
它不再是单一的技术应用,而是涵盖了
音频
广播、AI人工智能、视频监控、定位识别等多个领域的综合体系,通过多网络组合、多系统融合,
辉视562
·
2025-06-20 08:54
网络
唯创知音旗下有哪些语音芯片型号
一次性语音芯片(低成本量产首选)WTN系列代表型号:WTN6170-8S、WTN6040FP-14S、WTN6096核心特性:采用OTP工艺,成本低至1元以内,支持16级音量调节和PWM/DAC双模式
音频
输出
唯创知音
·
2025-06-20 08:54
语音芯片
离线语音芯片
离在线语音芯片
语音识别
语音识别芯片
革新引擎调校:第三代高精度爆震监测系统重塑性能边界
一、核心突破▍纳米级振动捕获44kHz高频采样率精准抓取燃烧室压力波动专用
音频
DSP芯片实现背景噪声动态滤波(信噪比提升300%)▍三维爆震建模独创3D动态阈值算
Triv2025
·
2025-06-20 06:41
爆震监测系统
CAN总线记录
多核DSP处理
数据分析
引擎调校
工业级防水
气缸独立增益
Unreal Engine:声音设计与
音频
集成技术教程_2024-07-13_00-24-34.Tex
UnrealEngine:声音设计与
音频
集成技术教程声音设计基础
音频
格式与质量在声音设计中,理解
音频
格式和质量至关重要。不同的格式适用于不同的场景,而
音频
质量则直接影响游戏体验的沉浸感。
chenjj4003
·
2025-06-20 04:57
游戏开发
虚幻
音视频
javascript
unity
ar
游戏引擎
网络
HarmonyOS模拟器
音频
输入全攻略:从入门到精通
目录一、HarmonyOS模拟器简介二、前期准备2.1安装DevEcoStudio2.2确保电脑配置达标三、模拟器
音频
输入设置步骤3.1启动并配置模拟器3.2
音频
输入设置入口3.3具体设置选项详解四、常见问题及解决方法
大雨淅淅
·
2025-06-20 00:00
#
HarmonyOS开发
harmonyos
音视频
华为
DSP芯片详解
一、DSP芯片的基本概念与核心特性定义与定位DSP(DigitalSignalProcessor)芯片是一种专为高速数字信号处理设计的微处理器,通过数学算法实时处理
音频
、视频、通信等领域的数字信号。
·
2025-06-19 23:55
抖音短视频矩阵系统:开启短视频创作与营销新篇
无论是剪辑精彩的视频片段、添加令人惊叹的特效、运用恰到好处的滤镜,还是精心编辑
音频
,它都能提供
敲代码的飞
·
2025-06-19 17:35
前端
人工智能
大数据
【Bluedroid】蓝牙启动之 bta_sys_init 源码解析
该模块作为协议栈的"中枢神经系统",支撑
音频
传输、设备管理、低功耗控制等复杂功能的稳定运行。一、概述蓝牙BTA模块是蓝牙协议栈的应用层核心,负责协调底层协议(如HC
byte轻骑兵
·
2025-06-19 16:00
Android
c++
bluedroid
Android
MP34DT05TR-A MEMS
音频
传感器全向数字麦克风:122.5dB AOP抗爆破音设计在工业警报系统中的应用验证
一、产品架构与核心性能MP34DT05TR-A采用硅微加工电容传感单元+CMOSASIC双芯片集成架构,通过PDM接口输出数字
音频
流。
Hailey深力科
·
2025-06-19 16:55
MP34DT05TR-A
MEMS麦克风
MEMS音频传感器
全向数字麦克风
18个图片视频
音频
素材网站
18个图片视频
音频
素材网站前言今天看了《18个宝藏网站,免费素材一网打尽!》。感觉用得着。18个有三四个用得着的就是赚了。
wsdchong之小马过河
·
2025-06-19 12:29
工具
基于DWT的
音频
水印算法
基于离散小波变换(DWT)的
音频
水印算法是一种结合信号处理与信息隐藏的技术,旨在将版权信息或标识隐蔽地嵌入
音频
信号中,同时保证不可感知性和鲁棒性。
gihigo1998
·
2025-06-19 12:57
音视频
算法
网络
Linux内核--设备驱动(六)媒体驱动框架整理一--
音频
目录一、引言二、ALSA------>2.1、alsa声卡设备------>2.2、内部实现------------>2.2.1、usb通讯配置------------>2.2.2、midi设备创建------------>2.2.3、创建pcm设备------------>2.2.4、创建control设备------------>2.2.5、声卡注册------------>2.2.6、声卡子
文艺小少年
·
2025-06-19 10:16
CPU性能分析与操作系统的构建
linux
媒体
音视频
每日推荐:MKVToolNix(音视频混流神器)
相信不少朋友都遇到过这样的烦恼:下载了一个MP4文件,结果
音频
和视频是分离的。想重新合成一个正常播放的视频,用格式工厂这类工具时不是处理失败,就是速度慢得令人崩溃,简直把人逼疯!
真实有料
·
2025-06-18 22:51
音视频
服务器
windows
运维
notion
嵌入式硬件
HTML5 更新的功能
文章目录前言**一、语义化标签(SemanticElements)****二、多媒体支持(
Audio
&Video)****三、图形与绘图(Canvas&SVG)****1.``****2.SVG内联支持
TE-茶叶蛋
·
2025-06-18 20:11
面试复习系列
html知识
html5
前端
html
Git LFS的使用
GitLFS(LargeFileStorage)是一个Git扩展,它使Git更适合处理大型文件,如
音频
、视频、图像或任何其他二进制大文件。
pumpkin84514
·
2025-06-18 19:33
Git相关
git
仿制QQ音乐播放器:全面技术实践指南
本文还有配套的精品资源,点击获取简介:本项目旨在打造一个类似QQ音乐的强大数字音乐播放器,覆盖了包括用户界面设计、
音频
处理、媒体库管理、网络功能、缓存策略、跨平台开发、
音频
效果增强、版权合规以及软件测试在内的多个关键技术领域
good2know
·
2025-06-18 17:50
Bluetooth® 测试原理概览(基于 R&S®CMW 测试平台)
Bluetooth®测试原理概览(基于R&S®CMW测试平台)一、Bluetooth®技术基础Bluetooth®Classic:适用于语音、
音频
、数据传输,采用GFSK、π/4-DQPSK、8DPSK
cccsjjsccc
·
2025-06-18 11:09
通信
信息与通信
昇思25天学习打卡营第9天|使用静态图加速
mindspore.dataset提供了内置的文本、图像、
音频
等数据集加载接口,并提供了自定义数据集加载接
蓝精灵1
·
2025-06-18 03:44
学习
WebRTC中的TURN协议:实现P2P通信的中继技术
它允许开发者使用JavaScriptAPI在浏览器中构建视频、
音频
和数据传输应用程序,而无需使用插件或其他第三方软件。
KnBackend
·
2025-06-18 00:57
webrtc
p2p
网络协议
WebRTC
运维综合架构组成
负载均衡服务器(nginx)对用户访问请求进行调度处理4)服务员---web服务器(nginx)处理用户请求5)厨师---数据库服务器(mysql)存储字符集数据6)厨师---存储服务器(nfs)存储图片
音频
视频附件等数据信息
奥尔特星云大使
·
2025-06-17 16:58
linux自学笔记
linux
运维
负载均衡
服务器
centos
(十七)深度学习之线性代数:核心概念与应用解析
1.2从数据表示到模型运算的桥梁数据结构化表示:深度学习处理的图像、文本、
音频
等数据,通常被转化为向量、矩阵或张量(多维数组)。例如:图像:RGB图像可表示为三维
只有左边一个小酒窝
·
2025-06-17 13:41
深度学习
深度学习
线性代数
人工智能
频谱显示中每个点的能量如何计算?
一、问题背景在嵌入式系统中,尤其是基于STM32等微控制器的
音频
可视化项目中,实现一个跳动的音乐频谱是一个非常常见的需求。
九层指针
·
2025-06-17 05:43
单片机基础知识
单片机
pytorch2.6安装
8.6.0.163_cuda11-archivecondacreate-npytorch2.6python=3.10pipinstalltorch==2.6.0+cu118torchvisiontorch
audio
AoDeLuo
·
2025-06-17 04:04
软件安装
深度学习
pytorch
Whisper(语音识别,语音转文本)本地部署
一、安装好ffmpeg1、安装ffmpeg,这个好像是用于对
音频
文件解析和处理的,具体不态清楚ffmpeg安装教程2、后面可能出现的问题如果后面运行时,出现系统找不到指定文件的bug时,尝试在上一步添加环境变量中
龚子亦
·
2025-06-16 16:50
虚拟数字人制作
whisper
语音识别
人工智能
多模态..
只听语音(
音频
模态):评价「声音好听」。只看聊天记录(文本模态):评价「回复很慢,可能不感兴趣」。多模态AI:同时分析照片、语音、聊天记录,甚至视频直播:发现照片P图过度,但声音和视频中的表情自然。
MYH516
·
2025-06-16 15:14
人工智能
语音识别
鸿蒙开发实战之Ringtone Kit打造美颜相机音效互动体系
一、核心音效场景通过RingtoneKit实现三大音效升级:定制化快门声音100+风格音效库(机械/电子/自然声等)支持用户
音频
导入(MP3/AAC格式)智能场景音效根据拍摄内容匹配音效(人像/风景/夜景
·
2025-06-16 10:18
harmonyos-next
鸿蒙开发实战之
Audio
Kit打造美颜相机沉浸式音效
一、核心
音频
场景通过
Audio
Kit实现三大声音增强:视频录制音质优化智能降噪(环境噪音降低30dB)声场增强(采样率48kHz/24bit)语音交互升级美颜参数语音控制(支持中英文混合指令)声纹识别解锁高级功能沉浸式播放体验
·
2025-06-16 10:17
harmonyos-next
深度学习小项目合集之
音频
语音识别-视频介绍下自取
深度学习对动物的异常声音识别179基于python深度学习对动物的异常声音识别_哔哩哔哩_bilibili简介:本代码python代码,pytorch框架下运行,是将data文件夹下动物的异常声音的wav格式的
音频
文件读取
no_work
·
2025-06-16 07:20
深度学习
深度学习
音视频
语音识别
pytorch
梅卡尔
cnn
一个包含两款主题的社交APP客户端UI解决方案
解决方案这是一套APP移动端UI设计素材,包含两款主题,内容为PSD格式,每款主题包含11个页面,涵盖聊天交友社交类项目的核心页面,包括欢迎页、登录、首页、消息记录,添加好友、好友分组、聊天会话、发送视频、发送
音频
reg183
·
2025-06-16 07:48
资源下载
ui
2025-06-13【api】阿里百炼api调用方法
通过调用各种大模型可以完成对文生文,文生图,图片理解,文生视频,
音频
识别,文转
音频
等需求。
批量小王子
·
2025-06-16 04:01
08_api调用实例
android
南洋理工、新国立新作 MEMO:基于记忆引导的高保真数字人生成扩散模型
视频扩散模型的最新进展为现实
音频
驱动的视频生成开辟了新的潜力。然而,在生成的视频中实现无缝
音频
与唇部同步化、保持长期身份一致性以及产生自然、与
音频
对齐的表情仍然是一个重大的挑战。
楠哥聊AI
·
2025-06-16 04:00
计算机视觉
数字人
科研
MEMO
AIGC
talking
head
talking
face
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他