E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
音频视频处理
Docker, Moby, Containers
本篇内容是根据2017年5月份#47Docker,Moby,Containers
音频
录制内容的整理与翻译SolomonHykes参加了节目,谈论了Docker、Moby项目以及Go非常适合容器管理的所有内容
·
2025-02-12 01:30
go
Is htmx the way to Go?
音频
录制内容的整理与翻译快速浏览一下构建Web应用程序的历史,然后讨论htmx以及它与现代和传统构建方式的比较。
·
2025-02-12 01:59
go
Go, Jocko, Kafka
本篇内容是根据2016年8月份#31.Go,Jocko,Kafka
音频
录制内容的整理与翻译TravisJeffery参加了节目,谈论Go、Jocko、Kafka、Kafka的存储内部结构如何工作,以及有趣的
·
2025-02-12 01:57
后端go
Go与黑客(第四部分)
本篇内容是根据2023年3月份#270HackingwithGo:Part4
音频
录制内容的整理与翻译我们的“HackingwithGo”系列继续!
·
2025-02-12 01:26
后端go
使用 TinyGo 和 Gopherbot 进行硬件hacking
本篇内容是根据2019年4月份#84HardwarehackingwithTinyGoandGopherbot
音频
录制内容的整理与翻译MatRyer与特邀嘉宾RonEvans共同主持了第一期一对一采访式节目
·
2025-02-12 01:26
后端go
Go与黑客(第二部分)
本篇内容是根据2022年10月份#205HackingwithGo:Part2
音频
录制内容的整理与翻译我们再次从安全研究人员的角度探索Go中的黑客攻击。
·
2025-02-12 01:55
后端go
Go与黑客(第三部分)
当然,我们还将讨论人工智能如何融入这一切……本篇内容是根据2022年11月份#259HackingwithGo:Part3
音频
录制内容的整理与翻译过程中为符合中文惯用表达有适当删改,版权归原作者所有.Natali
·
2025-02-12 01:55
后端go
招聘和面试
本篇内容是根据2019年4月份#82Hiringandjobinterviews
音频
录制内容的整理与翻译小组成员MatRyer、AshleyMcNamara、JohnnyBoursiquot和CarmenAndoh
·
2025-02-12 01:54
后端go
GaussianSpeech:
音频
驱动3DGS Avatar
本文介绍了GaussianSpeech,这是一种从语音合成高保真度的个性化三维人类头部虚拟形象动画序列的新方法。为了捕捉人类头部的表达性和细节特征,包括皮肤皱褶和更细致的面部动作,文章提出将语音信号与三维高斯散射相结合,以创建逼真且时间上连贯的运动序列。作者提出了一种基于3DGS的紧凑高效的虚拟形象表示方法,该方法根据表情生成依赖颜色,并利用皱纹和基于感知的损失来合成面部细节,包括不同表情下出现的
AIGC探路者
·
2025-02-12 00:57
音视频
3d
科研
计算机视觉
数字人
3D视觉
talking
head
fps动作系统9:动画
音频
文章目录动画
音频
创建
音频
蓝图cue音量乘数音效衰减衰减空间绑定到动画动画序列轨道动画
音频
创建
音频
蓝图cue音量乘数音量大小音效衰减空间音效衰减空间绑定到动画动画序列轨道横着的方向是有不同的轨道的,阴影的就是
qq_42863961
·
2025-02-12 00:26
fps
虚幻
【Python】request函数
对于非文本响应(如图像、
音频
或视频文件),这是默认的解析
大神神奇奇奇
·
2025-02-11 21:00
python
开发语言
利用python合成视频,字幕,
音频
audio_path="input_audio.mp3"subtitle_path="input_audio.srt"output_path="output_video_with_subtitles.mp4"#获取
音频
时长
批量小王子
·
2025-02-11 07:19
05_python库
python
音视频
跟着音乐节拍卡点配图
**节拍检测**:使用librosa库分析
音频
节拍2.**图片处理**:准备需要插入的图片素材3.
批量小王子
·
2025-02-11 06:37
05_python库
python
Android笔记--MediaCodec(一)
这一节主要来了解一下MediaCodec,AndroidMediaCodec是Android平台提供的一个用于处理
音频
和视频数据的API。
ljt2724960661
·
2025-02-11 02:08
Android基础
android
android
VividTalk:基于三维混合先验的单次
音频
驱动说话人头部生成
近年来,
音频
驱动的说话人头部生成引起了广泛关注,并且在口型同步、丰富的面部表情、自然的头部姿势生成以及高视频质量方面进行了大量努力。
AIGC探路者
·
2025-02-11 02:35
计算机视觉
数字人
科研
talking
head
vividtalk
OpenAI 实战进阶教程 - 第十二节 : 多模态任务开发(文本、图像、
音频
)
在现实工作中,我们并不是只处理文字;图像、
音频
、视频也在企业运营、产品开发、教育培训等多个场景中大量出现。图像场景:用自动生成的视觉素材,快速设计海报、配图
山海青风
·
2025-02-11 00:22
人工智能
音视频
人工智能
python
语音识别
图像处理
AI作画
使用Python和`moviepy`库从输入的图片、动图和
音频
生成幻灯片式视频的示例代码
下面是一个使用Python和moviepy库从输入的图片、动图和
音频
生成幻灯片式视频的示例代码。在这个示例中,我们将依次展示每张图片或动图,同时播放
音频
。
max500600
·
2025-02-10 23:16
python
开发语言
python
音视频
java
python pyaudio使用调用本地麦克风获取
音频
importpyaudiofromvoskimportModel,KaldiRecognizer#加载模型MODEL_PATH="vosk-model-en-us-0.22"#修改为您的模型路径model=Model(MODEL_PATH)#初始化
音频
流
哦里 哦里哦里给
·
2025-02-10 23:16
AI
大语言模型实战
python
音视频
开发语言
基于“感知–规划–行动”的闭环系统架构
听觉:利用麦克风阵列、声学传感器,结合声纹识别、语音识别(如基于Transformer或RNN的模型)技术处理
音频
信息。文本与语义信息:通过文
由数入道
·
2025-02-10 22:39
人工智能
系统架构
人工智能
智能体
Python爬虫入门教程24:下载某网站付费文档保存PDF(1)
彼岸壁纸爬取Python爬虫入门教程11:新版王者荣耀皮肤图片的爬取Python爬虫入门教程12:英雄联盟皮肤图片的爬取Python爬虫入门教程13:高质量电脑桌面壁纸爬取Python爬虫入门教程14:有声书
音频
爬取
好像要长脑子了1
·
2025-02-10 22:07
程序员
python
爬虫
pdf
TTS(Text-to-Speech)文本转语音技术导论
加我微信hezkz17进数字
音频
系统研究开发交流答疑群(课题组)一TTS技术原理?
「已注销」
·
2025-02-10 20:26
音频
基于单片机的俄罗斯方块游戏课程设计
硬件设计包括显示、输入、
音频
模块和电源管理,软件开发则涵盖单片机编程、RTOS应用(可选)、中断处理、内存管理和代码优化。项目资料提供完整的设计报告和源代码,帮助学生提升动手能力和问题解决技巧。
lanjieying
·
2025-02-10 20:55
UDP协议转换TCP协议
UDP协议转换TCP协议项目背景:项目类似中间件作用是数据搬运,可以搬运文件,视频,
音频
。从互联网把数据搬运到内网中。
在下陈平安
·
2025-02-10 10:07
网络通信
流式传输的实现为什么需要缓存?
缓存可以确保在网络变慢或中断时,视频或
音频
的播放仍然能够持续一段时间。流畅播放:缓存提供了一个小的数据池,允许播放内容在网络数据传输过程中保持流畅,而不被网络延迟或抖动所打断。
学习嵌入式的小羊~
·
2025-02-10 10:30
音视频
基于yolo的视频检测分析
基于yolo的视频检测分析分步骤实现
视频处理
、目标检测与追踪、动作分析、计数逻辑,然后整合成API完整的解决方案,包含视频分析逻辑和API封装,使用Python、YOLOv8和FastAPI实现代码如下
阿拉斯攀登
·
2025-02-10 05:13
机器学习
图像处理
YOLO
音视频
视觉检测
EasyNVR平台现已支持AAC、G711A及G711U
音频
编码格式
在视频监控和流媒体传输领域,
音频
与视频的质量和同步性是用户体验的关键因素。EasyNVR平台一直以来致力于为用户提供稳定、高效的音视频解决方案。
EasyNVR
·
2025-02-10 02:13
EasyNVR问题解决
aac
g711
音视频
数据库
视频监控
安全
使用Python运行SRSPlayer WebRTC
SRSPlayerWebRTC是一个基于Python的开源项目,它提供了在Web浏览器中使用WebRTC进行实时
音频
和视频通信的功能。
WaJulia
·
2025-02-09 19:55
python
webrtc
开发语言
实现使用Python和OpenCV播放RTMP视频流媒体的WebRTC
它可以在Web浏览器中实现
音频
、视频和数据的传输,为实时通信应用程序提供了强大的功能。
FdviAutoit
·
2025-02-09 19:54
python
opencv
媒体
WebRTC
前端程序员需要掌握的知识
了解HTML5的新特性,如语义化标签、视频
音频
播放、Canvas绘图等。CSS:精通CSS的语法和各种属性,能够实现丰富的页面样式。
肘击鸣的百k路
·
2025-02-09 13:18
前端
FFmpeg 中 -f 命令参数详解
FFmpegFFmpeg是一个开源的、功能强大的多媒体框架,它能够处理几乎所有格式的
音频
和视频文件。
码流怪侠
·
2025-02-09 13:14
ffmpeg
FFmpeg
音视频
直播
转码
命令行
ffmpeg 结构体之间的关系
最关键的结构体可以分成以下几类:a)解协议(http,rtsp,rtmp,mms)AVIOContext,URLProtocol,URLContext主要存储视
音频
使用的协议的类型以及状态。
古戎烽烟
·
2025-02-09 12:11
ffmpeg
ffmpeg
DeepSeek生成对抗网络(GAN)的训练与应用
生成对抗网络(GenerativeAdversarialNetworks,GANs)是深度学习领域的一项重要技术,能够生成逼真的图像、
音频
和文本数据。
Evaporator Core
·
2025-02-09 12:41
Python开发经验
人工智能
DeepSeek快速入门
生成对抗网络
人工智能
神经网络
基于 FFMPEG 的视频解码(libavcodec ,致敬雷霄骅)
雷博士的代码除了视频解码还有
音频
解码,同时还利用SDL把视频显示出来
liyuanbhu
·
2025-02-09 12:06
音视频
ffmpeg
RKMPP依赖硬件单元
rkmpp(RockchipMediaProcessPlatform)主要依赖瑞芯微(Rockchip)芯片中的VPU(VideoProcessUnit,
视频处理
单元)和RGA(RasterGraphicAccelerationUnit
沐风_ZTL
·
2025-02-09 11:31
视频编解码
RKMPP
VPU
RGA
简单实现——多模态推荐和相似推荐(数据和代码)
多模态是包括文本,
音频
,图片,视频等模态的。这里我做的是将文本和图片模态做一个简单融合。根据难度,从相似推荐开始,再到多模态推荐。
myzzb
·
2025-02-09 11:30
python
推荐算法
神经网络
自然语言处理
图像处理
音频
进阶学习九——离散时间傅里叶变换DTFT
文章目录前言一、DTFT的解释1.DTFT公式2.DTFT右边释义1)复指数e−jωne^{-j\omegan}e−jωn2)序列与复指数相乘x[n]∗e−jωnx[n]*e^{-j\omegan}x[n]∗e−jωn复指数序列复数的共轭正交正交集3)复指数序列求和3.DTFT左边边释义1)实部与虚部2)幅度与相位二、IDTFT1.逆离散时间的傅里叶变换2.IDTFT验证总结前言按照傅里叶发展的历
山河君
·
2025-02-09 09:46
#
语音信号处理
学习
信号处理
HTML5 有哪些新特性
2.多媒体支持和标签允许在网页中嵌入
音频
和视频内容,无需依赖外部插件。新的srcset属性和picture元素提供了更灵活的图片加载方式,支持响应式图片。3
山间听雨声
·
2025-02-08 22:21
科普/概念介绍
html5
前端
html
MKV视频封装软件 MKVToolNix v88.0 中文免安装版
MKVToolNix支持跨平台操作,几乎兼容所有主流操作系统,能够将多种视频编码、多达16条
音频
和不同语言的字幕封装到一个MKV文件中。使用说明:1、将压缩文件解压到固定位置,不要随意移动。
MAS1102
·
2025-02-08 21:15
音视频
使用Python进行语音识别:将
音频
转为文字
在Python中,我们可以使用一些库和工具来实现语音识别,并将
音频
转换为文本。本文将介绍如何使用Python进行语音识别的过程,并提供相应的源代码。
WmqApps
·
2025-02-08 18:52
python
语音识别
音视频
Python:谈谈常规滤波器(带通、低通、高通、带阻)的用法
滤波器通常用于
音频
、视频和图像处理等领域。
我不是哆啦A梦
·
2025-02-08 07:27
Python
信号处理
python
算法
FFmpeg使用GPU编解码,及在C++代码中实现FFmpeg使用GPU编解码
一.使用GPU进行编解码的常见方法FFmpeg是一个强大的多媒体处理工具,支持使用GPU进行编解码以加速
视频处理
。
沐风_ZTL
·
2025-02-08 05:47
ffmpeg
c++
开发语言
GPU
视频编解码
OpenHarmony 4.0 Release发布,同步升级API 10
200多个HDI接口,硬件适配更加便捷;优化图形框架和方舟编译器(ArkCompiler),用户交互体验得到进一步提升;ArkUI组件定制化能力和组件动效能力也得到进一步增强;分布式硬件支持的范围扩大到
音频
和
·
2025-02-08 02:56
harmonyos
为了实现对不同说话人的处理,可以加入一些专门的层和技术,来区分和识别说话人的特征。
1.说话人分离(SpeakerSeparation)概念:说话人分离是指在多说话人的
音频
中,将不同说话人的声音分开。这通常需要模型识别每个说话人的独特
音频
特征。
苏西月
·
2025-02-07 23:12
2403.12609
深度学习
人工智能
OpenHarmony 4.0 Release发布,同步升级API 10
200多个HDI接口,硬件适配更加便捷;优化图形框架和方舟编译器(ArkCompiler),用户交互体验得到进一步提升;ArkUI组件定制化能力和组件动效能力也得到进一步增强;分布式硬件支持的范围扩大到
音频
和
锐湃
·
2025-02-07 23:40
harmony
wpf
AudioLM
音频
生成模型 简介
AudioLM
音频
生成模型是一种先进的
音频
生成技术,它广泛应用于语音合成、音乐生成等领域。
低配天才
·
2025-02-07 18:09
audiolm
免费音视频转文字工具:本地使用,内置Whisper模型,精准提取文案
这款内置Whisper模型的工具,支持
音频
、视频转文字,精准度高,速度快,适用于会议记录、课程字幕、采访整理等多种场景!
2501_90520495
·
2025-02-07 12:02
音视频
whisper
Android SDK 提供的3套
音频
播放的API之窥探AudioTrack
1、publicAudioTrack(intstreamType,intsampleRateInHz,intchannelConfig,intaudioFormat,intbufferSizeInBytes,intmode)2、AudioTrack.BuilderAndroidM(6.0)之后舍弃了publicAudioTrack(intstreamType,intsampleRateInHz,i
大厂在职_QKT
·
2025-02-07 08:01
android
音视频
2024年技术总结与2025年最有潜力的技术发展方向
从文本生成到图像、
音频
、视频生成,这些技术被广泛应用于教育、娱乐、医
Allen-Steven
·
2025-02-07 02:23
python相关应用
深度学习
DeepSeek R1和V3区别
其优势在于高效的多模态处理能力(文本、图像、
音频
、视频)和较低的训练成本(
@Rocky
·
2025-02-06 23:02
大模型
语言模型
国标GB28181摄像机接入EasyGBS国标GB28181网页直播平台:GB/T28181—2016标准中的视
音频
回放控制协议
国标GB28181摄像机接入EasyGBS国标GB28181网页直播平台,是基于GB/T28181—2016标准的视
音频
回放控制协议实现的。
EasyGBS
·
2025-02-06 20:45
EasyGBS
音视频
GB28181
安全
视频监控
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他