E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
amr音频
从实验室到产业:IndexTTS 在六大核心场景的落地实践
B站UP主通过5秒参考
音频
即可克隆出郭老师音色,生成的“各位吴彦祖们大家好”语音相似度达97%,单条视频播放量突破百万。
gogoMark
·
2025-06-13 18:35
人工智能
腾讯开源 AniPortrait:
音频
驱动的逼真肖像动画生成革命
该框架由Audio2Lmk和Lmk2Video两大模块构成,形成完整的
音频
驱动动画生成闭环。
gogoMark
·
2025-06-13 18:35
开源
音视频
PaddleSpeech 实战:开发与打包离线语音识别(ASR)命令行应用
该工具能够批量、递归地将文件夹内的.wav
音频
文件转换为.txt文本文件,并最终打包成一个无需网络、无需Python环境的独立可执行文件
Gyro_Zeppeliiii
·
2025-06-13 17:52
python
飞浆
paddlespeech
语音活动检测模型SileroVAD
一、核心功能与技术优势轻量高效SileroVAD模型体积仅1.8MB,支持1ms内处理30ms
音频
块,适用于边缘设备实时处理。
大囚长
·
2025-06-13 14:33
大模型
人工智能
HarmonyOS运动开发:深度解析文件预览的正确姿势
鸿蒙核心技术##运动开发##CoreFileKit(文件基础服务)##PreviewKit(文件预览服务)在HarmonyOS开发中,文件预览功能是一个常见的需求,尤其是在处理用户上传的图片、文档、
音频
或视频等资源时
·
2025-06-13 12:53
harmonyos
多模态大模型研究综述
CSDN教学平台录播地址:https://edu.csdn.net/course/detail/39987视频号(直播分享):sphuY
AMr
0pGTk27抖音号:4418584
人工智能培训咨询叶梓
·
2025-06-13 11:44
大模型实战
AI大模型
人工智能前沿
人工智能
大模型
智能体
多模态
深度学习
人工智能培训
人工智能讲师
游戏运行库:让游戏顺利运行的基石
本文还有配套的精品资源,点击获取简介:游戏运行库是确保游戏正常运行的关键组成部分,它包括编程库的集合,提供如图形渲染、
音频
处理和网络通信等功能模块。
Boa波雅
·
2025-06-13 09:31
unity 导入gltf_Unity3D使用glTF格式三维文件,glTF在unity中如何呈现,glTF导入unity
一直在研究如何优化检查三维模型的问内容,单独从三维文件来说,有很多可以优化规范的内容,最近在看到有一个压缩格式,话说这个方式是要做一个三维文件的通用格式,比如图片的jpg格式,
音频
的mp3格式,这个也就是三维文件中的
weixin_39760689
·
2025-06-13 04:57
unity
导入gltf
unity 导入gltf_Unity3D使用glTF格式三维文件,在unity中如何呈现glTF
一直在研究如何优化检查三维模型的问内容,单独从三维文件来说,有很多可以优化规范的内容,最近在看到有一个压缩格式,话说这个方式是要做一个三维文件的通用格式,比如图片的jpg格式,
音频
的mp3格式,这个也就是三维文件中的
林书溪
·
2025-06-13 04:27
unity
导入gltf
鸿蒙HarmonyOS实战开发:
音频
播放流管理规范
(从零基础入门到精通)HarmonyOSNEXT应用开发案例实践总结合(持续更新......)HarmonyOSNEXT应用开发性能优化实践总结(持续更新......)对于播放
音频
类的应用,开发者需要关注该应用的
音频
流的状态以做出相应的操作
凹~凸~曼
·
2025-06-13 04:27
HarmonyOS
鸿蒙开发
OpenHarmony
harmonyos
华为
前端
android
鸿蒙系统
ui
鸿蒙
音频
导入规范
一般
音频
可以交给策划来导入提交,需要遵循一些规范,下面是我们实际项目用到的一些规范1、ForceToMono:勾选,强制单声道。
敬畏之心
·
2025-06-13 04:25
音视频
一.ffmpeg介绍
FFmpeg-4.2.2介绍一下源码目录结构:源码库libavformat:音视频格式的封装与解析libavcodec:音视频流的编解码libavutil:包含一些公共的工具函数libswresample:
音频
重采样
VinterYoung
·
2025-06-13 03:14
音视频
go:embed
本篇内容是根据2021年3月份#171go:embed
音频
录制内容的整理与翻译过程中为符合中文惯用表达有适当删改,版权归原作者所有.MatRyer:大家好,欢迎来到
techdashen
·
2025-06-13 01:02
go
向量数据库的使用
随着人工智能和机器学习的广泛应用,向量数据库在处理非结构化数据(如文本、图像、
音频
和视频等)的任务中变得越来越重要。
hawk2014bj
·
2025-06-13 00:55
向量数据库
向量数据库简介
在机器学习中,我们通常使用向量数据库来存储来自BERT或OpenAI等模型的嵌入文本数据;图像数据(来自CNN或CLIP的嵌入)以及
音频
/视频/基因组数据。
Morpheon
·
2025-06-12 23:16
数据库
S状态模式:优雅地管理对象的状态转换
示例场景:假设我们正在开发一个简单的
音频
播放器应用程序。该应用程序具有三个状态:停止状态(StoppedState)、播放状态
技术驱动者
·
2025-06-12 20:53
状态模式
ui
C/C++
171、
音频
信号处理与分析:Python中的NumPy实践
Python开发之NumPy与图像处理:图像处理与计算机视觉在Python开发中,NumPy是一个非常强大的库,它在多维数组计算方面提供了丰富的功能。而在图像处理和计算机视觉领域,NumPy也发挥着不可替代的作用。本文将带你了解NumPy在图像处理和计算机视觉中的应用,以及一些实用的技巧和案例。1.图像处理基础1.1图像的表示图像可以看作是一个二维数组,每个元素表示图像中的一个像素点。这个像素点的
多多的编程笔记
·
2025-06-12 20:50
python
numpy
图像处理
如何直接将多模态数据传递给模型
多模态数据指的是包含多种类型(如文本、图像、
音频
等)的输入数据。在这篇文章中,我们将展示如何直接将多模态输入传递给模型。我们将使用以OpenAI为例的模型设置,展示如何描述图像中的内容。
Wurenyu957
·
2025-06-12 12:58
microsoft
使用AI Fooler ,轻松实现免费人声分离
关键点AIFooler是一款智能
音频
处理工具,能够有效分离人声和背景音乐。该工
yyyyyy_jjjjjj
·
2025-06-12 10:42
人工智能
音频
Android多媒体——音/视同步锚点更新(二十一)
音视频同步(AVSync)是多媒体处理中的核心问题,而
音频
锚点时间(AudioAnchorTime)的更新机制直接影响同步精度,当
音频
解码、渲染或动态调整(如变速、跳转)时,需高效修正时间锚点以避免唇音不同步
c小旭
·
2025-06-12 09:37
Android多媒体
android
多媒体
CentOS系统的多媒体处理技术应用
CentOS系统的多媒体处理技术应用关键词:CentOS、多媒体处理、FFmpeg、GStreamer、视频转码、
音频
处理、流媒体摘要:本文深入探讨CentOS系统下的多媒体处理技术应用,包括核心工具链
操作系统内核探秘
·
2025-06-12 07:50
操作系统内核揭秘
centos
linux
运维
ai
Android多媒体——MediaPlayer创建流程(三)
Android平台通过其内置的MediaPlayer类为开发者提供了强大的多媒体处理能力,使得集成
音频
和视频播放变得简单直接。这里我们就来看一下MediaPlayer的创建流程。
c小旭
·
2025-06-12 01:47
Android多媒体
android
多媒体
FastRTC - Python实时通信库
本文翻译整理自:https://github.com/gradio-app/fastrtc文章目录一、关于FastRTC相关链接资源关键功能特性二、安装三、使用示例1、
音频
回传2、LLM语音对话3、摄像头流处理
·
2025-06-12 01:15
Android
音频
播放:FFmpeg与OpenSL ES解码与播放实践
本文还有配套的精品资源,点击获取简介:在Android平台上利用FFmpeg和OpenSLES实现高效灵活的
音频
解码与播放。
魔法小药丸
·
2025-06-11 19:00
DeepLake 支持的 `htype` 类型一览
DeepLake支持的htype类型一览htype名称描述image图像数据(如JPEG/PNG编码的RGB图像)video视频帧序列audio
音频
波形数据(如WAV格式)text文本字符串jsonJSON
燃灯工作室
·
2025-06-11 19:28
DeepLake
人工智能
pytorch
神经网络
深度学习
机器学习
Deep Lake 简介
核心特点特性说明多模态数据支持支持图像、视频、
音频
、文本、点云等多种数据类型,适用于各类AI场景。张量存储数据以张量格式存储,兼容主流深度学习框架(如PyTorch、TensorFlow)。数据
·
2025-06-11 19:57
【人工智能】Transformers之Pipeline(六):图像分类(image-classification)
2.4.2pipeline对象使用参数2.4pipeline实战2.5模型排名三、总结一、引言pipeline(管道)是huggingfacetransformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为
音频
LDG_AGI
·
2025-06-11 17:43
Pipeline
人工智能
机器学习
python
AIGC
计算机视觉
大数据
transformer
多模态核心实现技术
一、模态表示(ModalRepresentation)模态表示是将不同模态数据(文本、图像、
音频
等)编码为计算机可处理的向量形式的核心步骤。
charles666666
·
2025-06-11 14:59
自然语言处理
神经网络
人工智能
机器学习
语言模型
鹰盾视频加密器播放器倍速播放中变速不变声的技术原理解析
一、
音频
变速处理的技术挑战与背景在多媒体播放领域,倍速播放功能已成为用户常用的操作需求。
·
2025-06-11 11:34
PCM1808替代料GC1808 24位ADC 24位模数转换器芯片
GC1808是一款高性能、低成本立体声
音频
模数转换器。其集成了64倍过采样率Δ-Σ调制器、数字梳状滤波器、数字高通滤波器。GC1808支持主、从机和两种串行
音频
数据格式。
深圳市集智创芯
·
2025-06-10 10:37
WebRTC框架调研:深入了解Google开源的WebRTC框架
WebRTC(Web实时通信)是一个开源项目,由Google主导开发,旨在通过Web浏览器实现实时通信功能,例如
音频
、视频和数据传输。
FdviAutoit
·
2025-06-10 07:10
webrtc
WebRTC
Python实现简单
音频
数据压缩与解压算法
Python实现简单
音频
数据压缩与解压算法引言在
音频
数据处理中,压缩算法是降低存储成本和传输效率的关键技术。
酷爱码
·
2025-06-10 03:45
Python
python
开发语言
mac如何直播(b站为例)
macos10.15.4高版本不能安装soundflowersudospctl--master-disable//开启允许第三方软件允许里找到作者MATTINGALLSsoundflower的配置先配置
音频
添加多输出设备
·
2025-06-10 01:28
摩尔斯电码
字母之间的停顿时长为3t,单词之间的停顿时长为7t4.摩尔斯电码可以以很多不同的方式表示,比如闪光灯、
音频
等。5.练习:APP:Morse-It”和“D
l2ohvef
·
2025-06-09 18:44
密码学
摩尔斯电码
Audio Codec的I2S时序或PCM时序,代表什么意思
AudioCodec的I2S时序或PCM时序,代表什么意思答案摘自豆包:AudioCodec(
音频
编解码器)中的I2S时序和PCM时序是两种用于数字
音频
数据传输的标准接口协议,它们在时序结构、数据传输方式上有明显区别
张海森_168820
·
2025-06-09 14:18
音视频
Android
音频
压缩功能之Ffmpeg
最近发现网上的压缩功能代码很多都是无法使用的,都是工具类的居多,安卓原生中实现
音频
压缩的案例搜索了很久还是没有从0到1很容易上手的博客。压缩本地
音频
的博客好少啊。
冰糖葫芦三剑客
·
2025-06-09 13:10
TEST
android
音视频
ffmpeg
(六)卷积神经网络:深度学习在计算机视觉中的应用
卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一类专门用于处理具有网格结构数据(如图像、
音频
)的深度学习模型。
只有左边一个小酒窝
·
2025-06-09 13:37
动手学深度学习
深度学习
cnn
计算机视觉
ffmpeg命令基本语法和常见命令
ffmpeg-iinput.mp4output.mkv2、更加精准的控制转换命令ffmpeg-iinput.mp4-c:vvp9-c:alibvorbisoutput.mkv(-c:v控制视频格式,-c:a控制
音频
格式
子燕若水
·
2025-06-09 11:22
ffmpeg
和流媒体
ffmpeg
音视频
谷歌Gemini 2.0上线:实时视频生成颠覆内容创作行业
这款多模态AI不仅能理解文本、图像和
音频
,还能在几秒内生成高质量视频,彻底改变影视制作、广告营销、社交媒体等内容创作方式。这是否意味着传统视频制作将被AI取代?
非著名架构师
·
2025-06-09 06:54
大模型
知识文档
人工智能
Gemini
2.0
Python爬虫实战:基于Tumblr API的图片与博文采集与下载
Tumblr是全球知名的轻博客平台,用户可以发布图像、短文、GIF、
音频
、视频等内容,是一个结合社交与创作的平台。
Python爬虫项目
·
2025-06-09 04:03
python
爬虫
开发语言
数据分析
信息可视化
Python 爬虫:实现Instagram Reels视频采集与下载
一、引言随着Instagr
amR
eels的流行,越来越多的用户希望下载自己喜欢的Reels视频。
Python爬虫项目
·
2025-06-09 04:33
python
爬虫
音视频
开发语言
信息可视化
数据分析
【vue】Uniapp 打包Android 文件选择上传问题详解~
uni-file-picker组件以为很顺利,android模拟器测试……忽略了平台兼容性提示~Get:上传图片或拍照,使用uniapp自带的uni.chooseImage即可……还需要上传非媒体问题(图片、
音频
EF@蛐蛐找糖
·
2025-06-08 22:23
vue相关
vue.js
uni-app
android
Python免费文生
音频
TTS方案实战测评:gTTS、edge_tts与pyttsx3效果对比
在python中,已经有很多TTS相关的包,可以拿来即用,以下是我整理的一些简单免费的方案,仅供参考:方案1:gTTS1.1介绍利用google的免费文本转语音API服务需要能访问谷歌的网络环境一键安装,转换速度快,转换质量一般开源地址:https://github.com/pndurette/gTTS官方教程:https://gtts.readthedocs.io/en/latest/index
计算机小手
·
2025-06-08 14:24
python
音视频
edge
python字母转换视频_用python将视频转换为字符画视频
ImageDrawimportosfromcv2importVideoWriter,VideoWriter_fourcc,imread,resize#=========================#coding:UTF-8#视频转字符画含
音频
我是食大人
·
2025-06-08 13:52
python字母转换视频
STM32实战:数字
音频
播放器开发指南
基于STM32的数字
音频
播放器/效果器是个很棒的项目!这涉及到多个嵌入式开发的关键技术点。
三三十二
·
2025-06-08 03:39
stm32
嵌入式硬件
单片机
2024年AIGC行业研究:多模态大模型与商业应用
AIGC即通过大量数据训练而成的人工智能系统,可根据用户的个性化指令生成文本、
音频
、图像、代码等内容。自2022年频频出圈的ChatGPT推出以来,生成式AI在
大模型常客
·
2025-06-08 01:20
AIGC
人工智能
ai
agi
大模型
ai大模型
ai产品经理
Android 蓝牙通信
1.基本概念传统蓝牙(BluetoothClassic)适合大流量数据传输(如
音频
、文件传输)典型协议:RFCOMM(串口模拟),A2DP(
音频
),HFP(免提)等低功耗蓝牙(BLE)适合间歇性小数据量
消失的旧时光-1943
·
2025-06-08 00:17
android
java
蓝牙
通信
第1天:认识RNN及RNN初步实验(预测下一个数字)
核心概念:循环连接RNN与普通的前馈神经网络(如多层感知机)最根本的区别在于它引入了循环连接:输入序列:RNN接收一个序列作为输入,例如:一个句子(单词序列)一段语音(
音频
帧序列)股票价格(时间点上的价格序列
deflag
·
2025-06-07 22:36
人工智能学习
rnn
人工智能
深度学习
音频
MP3切割器:剪辑与合并的实用工具
本文还有配套的精品资源,点击获取简介:
音频
MP3切割器是一款专业MP3编辑软件,它使得
音频
剪辑和合并变得轻而易举。本文将介绍软件的核心功能、操作方法、注册码与授权流程以及实用技巧。
觉昧
·
2025-06-07 10:51
matlab从mp4文件中提取
音频
,如何提取mp4中的
音频
文件 怎样将视
音频
文件分离,保存视频中的
音频
文件...
其实,我们可以通过视
音频
分离的方法,只保存
音频
文件,这样就可以随
蔡辉龙
·
2025-06-07 10:21
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他