E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
音频DAC
OBS脚本示例大全:Python与Lua脚本编程指南
尽管这些脚本未经严格测试,但通过它们,用户可以学习OBS脚本的基本结构,并实现复杂的直播控制功能,如场景切换、
音频
调整和观众统计信息显示等。1.OBS软件概述与应用在I
Aurora曙光
·
2025-06-22 20:25
Qt
音频
采集:QAudioInput详解与示例
1.简介QAudioInput是QtMultimedia模块中用于
音频
采集的核心类,能够从麦克风等输入设备实时获取原始
音频
数据(PCM格式)。
·
2025-06-22 17:08
android sip服务器,Android SIP开发教程
Android包含一个完整的SIP协议栈,整合了允许轻松创建来电和去电的电话管理服务,而不必开发者直接参与管理会话、传输层通信、
音频
录制等工作。
知乎人文
·
2025-06-22 02:33
android
sip服务器
音视频及H264/H256编码相关原理
一般视频文件里不光有视频,还有
音频
,封装格式的作用就是把视频和
音频
打包起来。所以我们先要解封装格式,看有哪些视频流和哪些
音频
流,此时的
音频
流和视频流都还是压缩数据,不能直接用于显示的,这就需要解码。
Everbrilliant89
·
2025-06-22 02:33
音视频开发
音视频
视频编解码
H264编码
H265编码
音视频编解码
抖音AI数字人对口型软件LatentSync最新版整合包,
音频
驱动口型讲话
本次和大家分享一个字节跳动开发的强大的
音频
驱动口型数字人视频制作软件LatentSync,我以前也分享过不少类似软件了,比如:EchoMimic、VideoReTalking、hallo。
漫游者Nova
·
2025-06-22 02:02
工具分享
人工智能
音视频
音频驱动口型
对口型
操作系统关键知识点之多级安全模型解析与应用
一、知识点总结(一)访问控制类型可自由支配访问控制(
DAC
)允许用户自主决定谁能读写自己的文件和对象,适用于普通安全需求场景(如个人电脑文件管理),但在高安全等级
一杯年华@编程空间
·
2025-06-22 01:58
安全
网络
操作系统
【大模型开发】Hugging Face的Transformers库详解介绍与案例
深入解析HuggingFaceTransformers及开源大模型微调实践HuggingFaceTransformers已成为自然语言处理(NLP)乃至多模态(跨语言、图像、
音频
等)应用中最为流行、功能最完备的开源框架之一
云博士的AI课堂
·
2025-06-21 11:01
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
transformer
huggingface
大模型技术
大模型开发
deepseek
机器学习
深度学习
八种常见的神经网络介绍
概述(八大神经网络)卷积神经网络(CNN):适用于图像、
音频
等网格数据处理。通过卷积层提取局部特征,池化层降维,广泛用于图像分类、目标检测。特点是参数共享和权值的局部连接,减少了模型复杂度。
EdmundXjs
·
2025-06-21 06:24
技术专栏
神经网络
人工智能
深度学习
俄罗斯顶级音乐播放器--AIMP,v5.40.2683新版本,增强便携版~
俄罗斯顶级音乐播放器--AIMP,v5.40.2683新版本,增强便携版~AIMP是来自俄罗斯的一款高级多媒体播放器(非开源软件),除了播放器基本的
音频
播放之外它还包含了
音频
转换、录制、ID3标签编辑等功能
Mbblovey
·
2025-06-21 02:30
网络
服务器
php
运维
linux
flask静态资源与模板页面、模板用户登录案例
案例代码importflask#template_folder模板文件夹(静态页面html页面渲染)#static_folder静态资源文件夹主要存放的是类似静态数据、
音频
、视频、图片等app=flask.Flask
网小鱼的学习笔记
·
2025-06-20 23:13
Python
flask
python
后端
XMOS将在CES 2025上展出多款由边缘AI驱动的创新音效、
音频
、识别和处理解决方案
全球智能物联网技术领导者暨匠心独到的半导体科技企业XMOS宣布:该公司将再次参加2025年国际消费电子展(CES2025),并将在本届CES上展出一系列由人工智能(AI)驱动的全新空间音效、语音捕获与降噪、音视频多模态AI处理等多种全新
音频
技术与应用解决方案
电子科技圈
·
2025-06-20 15:47
XMOS
人工智能
音视频
嵌入式硬件
科技
物联网
mcu
iot
XMOS 多路
音频
解码器
当谈及高性能
音频
解码器,XMOS是一个不容忽视的名字。作为
音频
解决方案领域的领军者,XMOS的多路
音频
解码器在
音频
处理技术中扮演着至关重要的角色。
Tracy973
·
2025-06-20 15:15
音视频
音频
实时音视频
人工智能
语音识别
前端系列之:Blob
任何类型的数据(无论是文本、图片、
音频
文件等)都可以通过二进制表示。什么是Blob?全称BinaryLargeObject,二进制类型的大对象。是一种数据类型,用来存储二进制数据。
程序员SKY
·
2025-06-20 14:07
前端
前端
ChromaDB深度技术研究报告
在高维空间中,向量嵌入是数据(如文本、图片、
音频
等)的数值表示。向量数据库的核心能力在于,它能够高效地执行相似度搜索,即找到与给定查询向量最相似的向量。
大表哥汽车人
·
2025-06-20 10:43
人工智能
大语言模型学习笔记
人工智能
语言模型
自然语言处理
深度解析融合指挥调度:多网络融合下的高效运作与多元满足
它不再是单一的技术应用,而是涵盖了
音频
广播、AI人工智能、视频监控、定位识别等多个领域的综合体系,通过多网络组合、多系统融合,
辉视562
·
2025-06-20 08:54
网络
唯创知音旗下有哪些语音芯片型号
:一、OTP一次性语音芯片(低成本量产首选)WTN系列代表型号:WTN6170-8S、WTN6040FP-14S、WTN6096核心特性:采用OTP工艺,成本低至1元以内,支持16级音量调节和PWM/
DAC
唯创知音
·
2025-06-20 08:54
语音芯片
离线语音芯片
离在线语音芯片
语音识别
语音识别芯片
革新引擎调校:第三代高精度爆震监测系统重塑性能边界
一、核心突破▍纳米级振动捕获44kHz高频采样率精准抓取燃烧室压力波动专用
音频
DSP芯片实现背景噪声动态滤波(信噪比提升300%)▍三维爆震建模独创3D动态阈值算
Triv2025
·
2025-06-20 06:41
爆震监测系统
CAN总线记录
多核DSP处理
数据分析
引擎调校
工业级防水
气缸独立增益
Unreal Engine:声音设计与
音频
集成技术教程_2024-07-13_00-24-34.Tex
UnrealEngine:声音设计与
音频
集成技术教程声音设计基础
音频
格式与质量在声音设计中,理解
音频
格式和质量至关重要。不同的格式适用于不同的场景,而
音频
质量则直接影响游戏体验的沉浸感。
chenjj4003
·
2025-06-20 04:57
游戏开发
虚幻
音视频
javascript
unity
ar
游戏引擎
网络
HarmonyOS模拟器
音频
输入全攻略:从入门到精通
目录一、HarmonyOS模拟器简介二、前期准备2.1安装DevEcoStudio2.2确保电脑配置达标三、模拟器
音频
输入设置步骤3.1启动并配置模拟器3.2
音频
输入设置入口3.3具体设置选项详解四、常见问题及解决方法
大雨淅淅
·
2025-06-20 00:00
#
HarmonyOS开发
harmonyos
音视频
华为
DSP芯片详解
一、DSP芯片的基本概念与核心特性定义与定位DSP(DigitalSignalProcessor)芯片是一种专为高速数字信号处理设计的微处理器,通过数学算法实时处理
音频
、视频、通信等领域的数字信号。
·
2025-06-19 23:55
抖音短视频矩阵系统:开启短视频创作与营销新篇
无论是剪辑精彩的视频片段、添加令人惊叹的特效、运用恰到好处的滤镜,还是精心编辑
音频
,它都能提供
敲代码的飞
·
2025-06-19 17:35
前端
人工智能
大数据
【Bluedroid】蓝牙启动之 bta_sys_init 源码解析
该模块作为协议栈的"中枢神经系统",支撑
音频
传输、设备管理、低功耗控制等复杂功能的稳定运行。一、概述蓝牙BTA模块是蓝牙协议栈的应用层核心,负责协调底层协议(如HC
byte轻骑兵
·
2025-06-19 16:00
Android
c++
bluedroid
Android
MP34DT05TR-A MEMS
音频
传感器全向数字麦克风:122.5dB AOP抗爆破音设计在工业警报系统中的应用验证
一、产品架构与核心性能MP34DT05TR-A采用硅微加工电容传感单元+CMOSASIC双芯片集成架构,通过PDM接口输出数字
音频
流。
Hailey深力科
·
2025-06-19 16:55
MP34DT05TR-A
MEMS麦克风
MEMS音频传感器
全向数字麦克风
18个图片视频
音频
素材网站
18个图片视频
音频
素材网站前言今天看了《18个宝藏网站,免费素材一网打尽!》。感觉用得着。18个有三四个用得着的就是赚了。
wsdchong之小马过河
·
2025-06-19 12:29
工具
基于DWT的
音频
水印算法
基于离散小波变换(DWT)的
音频
水印算法是一种结合信号处理与信息隐藏的技术,旨在将版权信息或标识隐蔽地嵌入
音频
信号中,同时保证不可感知性和鲁棒性。
gihigo1998
·
2025-06-19 12:57
音视频
算法
网络
Linux内核--设备驱动(六)媒体驱动框架整理一--
音频
目录一、引言二、ALSA------>2.1、alsa声卡设备------>2.2、内部实现------------>2.2.1、usb通讯配置------------>2.2.2、midi设备创建------------>2.2.3、创建pcm设备------------>2.2.4、创建control设备------------>2.2.5、声卡注册------------>2.2.6、声卡子
文艺小少年
·
2025-06-19 10:16
CPU性能分析与操作系统的构建
linux
媒体
音视频
每日推荐:MKVToolNix(音视频混流神器)
相信不少朋友都遇到过这样的烦恼:下载了一个MP4文件,结果
音频
和视频是分离的。想重新合成一个正常播放的视频,用格式工厂这类工具时不是处理失败,就是速度慢得令人崩溃,简直把人逼疯!
真实有料
·
2025-06-18 22:51
音视频
服务器
windows
运维
notion
嵌入式硬件
Git LFS的使用
GitLFS(LargeFileStorage)是一个Git扩展,它使Git更适合处理大型文件,如
音频
、视频、图像或任何其他二进制大文件。
pumpkin84514
·
2025-06-18 19:33
Git相关
git
仿制QQ音乐播放器:全面技术实践指南
本文还有配套的精品资源,点击获取简介:本项目旨在打造一个类似QQ音乐的强大数字音乐播放器,覆盖了包括用户界面设计、
音频
处理、媒体库管理、网络功能、缓存策略、跨平台开发、
音频
效果增强、版权合规以及软件测试在内的多个关键技术领域
good2know
·
2025-06-18 17:50
Bluetooth® 测试原理概览(基于 R&S®CMW 测试平台)
Bluetooth®测试原理概览(基于R&S®CMW测试平台)一、Bluetooth®技术基础Bluetooth®Classic:适用于语音、
音频
、数据传输,采用GFSK、π/4-DQPSK、8DPSK
cccsjjsccc
·
2025-06-18 11:09
通信
信息与通信
昇思25天学习打卡营第9天|使用静态图加速
mindspore.dataset提供了内置的文本、图像、
音频
等数据集加载接口,并提供了自定义数据集加载接
蓝精灵1
·
2025-06-18 03:44
学习
WebRTC中的TURN协议:实现P2P通信的中继技术
它允许开发者使用JavaScriptAPI在浏览器中构建视频、
音频
和数据传输应用程序,而无需使用插件或其他第三方软件。
KnBackend
·
2025-06-18 00:57
webrtc
p2p
网络协议
WebRTC
运维综合架构组成
负载均衡服务器(nginx)对用户访问请求进行调度处理4)服务员---web服务器(nginx)处理用户请求5)厨师---数据库服务器(mysql)存储字符集数据6)厨师---存储服务器(nfs)存储图片
音频
视频附件等数据信息
奥尔特星云大使
·
2025-06-17 16:58
linux自学笔记
linux
运维
负载均衡
服务器
centos
(十七)深度学习之线性代数:核心概念与应用解析
1.2从数据表示到模型运算的桥梁数据结构化表示:深度学习处理的图像、文本、
音频
等数据,通常被转化为向量、矩阵或张量(多维数组)。例如:图像:RGB图像可表示为三维
只有左边一个小酒窝
·
2025-06-17 13:41
深度学习
深度学习
线性代数
人工智能
频谱显示中每个点的能量如何计算?
一、问题背景在嵌入式系统中,尤其是基于STM32等微控制器的
音频
可视化项目中,实现一个跳动的音乐频谱是一个非常常见的需求。
九层指针
·
2025-06-17 05:43
单片机基础知识
单片机
Whisper(语音识别,语音转文本)本地部署
一、安装好ffmpeg1、安装ffmpeg,这个好像是用于对
音频
文件解析和处理的,具体不态清楚ffmpeg安装教程2、后面可能出现的问题如果后面运行时,出现系统找不到指定文件的bug时,尝试在上一步添加环境变量中
龚子亦
·
2025-06-16 16:50
虚拟数字人制作
whisper
语音识别
人工智能
多模态..
只听语音(
音频
模态):评价「声音好听」。只看聊天记录(文本模态):评价「回复很慢,可能不感兴趣」。多模态AI:同时分析照片、语音、聊天记录,甚至视频直播:发现照片P图过度,但声音和视频中的表情自然。
MYH516
·
2025-06-16 15:14
人工智能
语音识别
鸿蒙开发实战之Ringtone Kit打造美颜相机音效互动体系
一、核心音效场景通过RingtoneKit实现三大音效升级:定制化快门声音100+风格音效库(机械/电子/自然声等)支持用户
音频
导入(MP3/AAC格式)智能场景音效根据拍摄内容匹配音效(人像/风景/夜景
·
2025-06-16 10:18
harmonyos-next
鸿蒙开发实战之Audio Kit打造美颜相机沉浸式音效
一、核心
音频
场景通过AudioKit实现三大声音增强:视频录制音质优化智能降噪(环境噪音降低30dB)声场增强(采样率48kHz/24bit)语音交互升级美颜参数语音控制(支持中英文混合指令)声纹识别解锁高级功能沉浸式播放体验
·
2025-06-16 10:17
harmonyos-next
深度学习小项目合集之
音频
语音识别-视频介绍下自取
深度学习对动物的异常声音识别179基于python深度学习对动物的异常声音识别_哔哩哔哩_bilibili简介:本代码python代码,pytorch框架下运行,是将data文件夹下动物的异常声音的wav格式的
音频
文件读取
no_work
·
2025-06-16 07:20
深度学习
深度学习
音视频
语音识别
pytorch
梅卡尔
cnn
一个包含两款主题的社交APP客户端UI解决方案
解决方案这是一套APP移动端UI设计素材,包含两款主题,内容为PSD格式,每款主题包含11个页面,涵盖聊天交友社交类项目的核心页面,包括欢迎页、登录、首页、消息记录,添加好友、好友分组、聊天会话、发送视频、发送
音频
reg183
·
2025-06-16 07:48
资源下载
ui
2025-06-13【api】阿里百炼api调用方法
通过调用各种大模型可以完成对文生文,文生图,图片理解,文生视频,
音频
识别,文转
音频
等需求。
批量小王子
·
2025-06-16 04:01
08_api调用实例
android
南洋理工、新国立新作 MEMO:基于记忆引导的高保真数字人生成扩散模型
视频扩散模型的最新进展为现实
音频
驱动的视频生成开辟了新的潜力。然而,在生成的视频中实现无缝
音频
与唇部同步化、保持长期身份一致性以及产生自然、与
音频
对齐的表情仍然是一个重大的挑战。
楠哥聊AI
·
2025-06-16 04:00
计算机视觉
数字人
科研
MEMO
AIGC
talking
head
talking
face
SayAnything:利用条件视频扩散实现
音频
驱动的口型同步
Audio-DrivenLipSynchronizationwithConditionalVideoDiffusion论文链接:https://arxiv.org/abs/2502.11515发表于:arXiv2025研究背景研究问题:这篇文章要解决的问题是
音频
驱动的唇形同步
楠哥聊AI
·
2025-06-16 04:00
计算机视觉
数字人
神经网络
人工智能
生成对抗网络
扩散模型
diffusion
model
粗略刨析unity引擎源码架构
引擎源码架构设计的全面剖析:1.整体架构概述Unity引擎的源码主要分为以下几个核心模块:核心系统(CoreSystems)渲染系统(RenderingSystem)物理系统(PhysicsSystem)
音频
系统
·
2025-06-16 03:20
Google Fast Pair:蓝牙设备一键配对的智能解决方案
GoogleFastPair技术最初于2017年随PixelBuds发布,主要用于实现安卓智能手机与蓝牙
音频
设备的快速配对。
众乐 认证
·
2025-06-16 00:32
谷歌
Google
fast
pair
Step-Audio-AQAA 解读:迈向「纯语音」交互的端到端 LALM 新里程
引言:AI从听到说大型
音频
语言模型(LargeAudio-LanguageModels,LALMs)正在彻底改变我们与机器交互的方式。
kakaZhui
·
2025-06-15 23:26
前沿多模态大模型:论文与实战
语音识别
人工智能
大模型
音视频
mllms
AIGC
PotPlayer 安装 madVR、LAV Filters 以提升解码能力和视频
音频
效果
PotPlayer自带的解码器并不是最好,如下两张截图都是出自TOPGUN:Maverick较暗、灰蒙蒙的一张,是安装插件之前明亮的一张,是安装插件之后详细安装参考https://www.bilibili.com/video/BV1UV5qzuE74?spm_id_from=333.788.videopod.sections&vd_source=1e12faf053b82a0210ff4ab21c
SunsPlanter
·
2025-06-15 22:21
办公软件
学习
蓝牙与MATLAB的无线通信实战指南:从基础到创新应用
第一部分:技术基础与环境搭建1.1蓝牙通信核心概念经典蓝牙vsBLE:经典蓝牙适合持续数据流(如
音频
),BLE专为低功耗间歇性传输设计GATT
芯作者
·
2025-06-15 20:10
D2:MATLAB设计
matlab
视频自动生成字幕原理和自动生成字幕的应用实例
该功能通过提取
音频
、语音识别和字幕格式化三个步骤实现,支持SRT/VTT等格式。其优势在于提升观看体验(静音/嘈杂环境)、辅助理解内容,并大幅节省人工制作成本。
视频砖家
·
2025-06-15 20:36
好玩有趣
视频字幕
视频安全
音视频
视频字幕
视频自动生成字幕
自动生成字幕
智能字幕
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他