E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
音频-转码
Rockchip --- 放音设备调试
文章目录(一)aplay工具1.显示帮助信息2.列出所有放音设备3.播放
音频
:(二)amixer工具1.查看帮助信息2.查看声卡设置3.设置音量4.静音和取消静音5.保存和加载混音器设置(一)aplay
臻一
·
2025-01-28 18:32
Rockchip
ALSA
Rockchip --- 录音设备调试
ALSA(AdvancedLinuxSoundArchitecture):
音频
处理的一套软件框架,提供了统一的API来访问各种
音频
硬件1.显示帮助信息:arecord--help这个命令会显示arecord
臻一
·
2025-01-28 18:32
Rockchip
录音设备
ffmpeg把视频文件
转码
为MP4格式
windows系统需要下载ffmpeg软件,并在代码中指定路径centos系统需要安装ffmepg是可执行的命令packagecom.xkj.utils;importlombok.extern.slf4j.Slf4j;importjava.io.*;importjava.util.ArrayList;importjava.util.List;@Slf4jpublicclassConvertVide
卷土重来…
·
2025-01-28 18:57
工具
ffmpeg
Silero VAD 开源项目教程
该项目支持多种语言和不同领域的
音频
,具有灵活的采样率(8000Hz和16000Hz),并且可以在PyTorch和O
苏鹃咪Healthy
·
2025-01-28 14:55
FSMN-VAD与Silero-VAD
这篇文章主要介绍两种的ASR中的VAD开源模型,第一种就是FSMN-VAD,这个是达摩院语音团队提出的高效语音端点检测模型,用于检测输入
音频
中有效语音的起止时间点信息。
Wasser.
·
2025-01-28 13:23
python
语音识别
随笔十七、eth0单网卡绑定双ip的问题
由于接收端有地址识别,只接收99,因此30的数据应该是被丢弃了,导致不能播放
音频
。vi/etc/network/interfacesautoloif
单片机社区
·
2025-01-28 13:22
立创泰山派随笔
智能路由器
网络协议
udp
嵌入式硬件
网络
海康视频不能在浏览器解析播放,需要
转码
海康视频不能在浏览器解析播放,需要
转码
参考:https://blog.csdn.net/xcg340123/article/details/139825982依赖ws.schildjave-core2.4.5ws.schildjave-native-win642.4.5ws.schildjave-native-linux642.4.5
摘星喵Pro
·
2025-01-28 06:08
java
开发语言
浏览器播放视频
视频编码
转码
Java web 富文本内容生成转为word格式并导出下载
blog.csdn.net/a2272062968/article/details/126227076思路:Word是完全支持html标签的,但是富文本内容并不是完整的html代码,需要先补全html标签,然后
转码
输出问题
摘星喵Pro
·
2025-01-28 06:07
java
web
编程技巧
java
前端
servlet
Python 录音转文字
importspeech_recognitionassr#创建语音识别器r=sr.Recognizer()#从录音文件读取
音频
withsr.AudioFile('audio_file.wav')assource
@小张不嚣张
·
2025-01-27 23:43
python
开发语言
python如何实现
音频
转文本(使用百度语音转文本库)
1pipinstallBaidu-Aip2在百度开放平台上注册账号,并在控制台中创建应用,选择短语音转文本应用,有几万次的免费配额,超过次数需要付费(价格贵),如图是我自己的注意事项:1,
音频
文件不能是
xiaojiawen
·
2025-01-27 23:43
python
开发语言
【开发日记】微信小程序getBackgroundAudioManager播放背景音乐提示播放失败
【问题】小程序在手机上打开,播放在线
音频
的时候会提示播放失败,但打印异常提示的是src为null,自己在打印的时候却没问题。并且在微信开发者工具中播放的时候也是正常的,只有手机上打开使用时提示异常。
二饭
·
2025-01-27 19:18
微信小程序
小程序
Android15
音频
进阶之MediaRecorder支持通道数(一百零五)
简介:CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布:《Android系统多媒体进阶实战》优质专栏:Audio工程师进阶系列【原创干货持续更新中……】优质专栏:多媒体系统工程师系列【原创干货持续更新中……】优质视频课程:AAOS车载系统+AOSP14系统攻城狮入门视频实战课
Android系统攻城狮
·
2025-01-27 10:18
音视频
python
开发语言
MATLAB 工具库的使用说明和案例示例
案例:
音频
信号滤波%读取
音频
文件(audioIn,Fs)=audioread('input_audio.wa
go5463158465
·
2025-01-27 01:16
机器学习
深度学习
matlab
matlab
开发语言
【数仓】数据仓库高频面试题题英文版(1)
音频
文件点击下方获取。【数仓】数据仓库高频面试题题英文版(1)【数仓】数据仓库高频面试题题英文版(2)【数仓】数据仓库高频面试题题英文版(3)WhatisDataWarehouse?
和风与影
·
2025-01-27 01:13
面试
数据仓库
freeswtch目录下modules.conf各个模块的介绍【freeswitch版本1.6.8】
mod_av:处理
音频
和视频相关操作,可用于音视频会议、流媒体播放等场景,支持多种音视频编解码格式,实现音视频数据的采集、处理和传输。
狂爱代码的码农
·
2025-01-26 22:50
VOIP那些事
freeswitch
Apache Tika 详解
以下是对ApacheTika的详细解析:一、概述ApacheTika旨在为各种类型的数据提取提供一个单一的API,它支持多种文件格式,包括文档、图片、
音频
和视频等。
王小工
·
2025-01-26 20:36
开源
apache
AI驱动内容跨媒体转换新机遇
这类工具能将文本快速转换为
音频
和视频内容,显著降低了制作门槛和成本,月费用仅需10-50美元。通过多模态内容分发,创作者可以满足不同用户的内容消费偏好,提升内容可访问性,增加曝光机会。
XianxinMao
·
2025-01-26 17:43
人工智能
2024年AI发展的感知回顾
多模态生成技术在这一年里取得了令人瞩目的不断进步,使得AI能够巧妙地将文本、图像、
音频
、视频等多种模态的信息进行深度融合与再创造。
八角Z
·
2025-01-26 16:08
人工智能
机器学习
计算机视觉
大数据
Java实现
音频
转文本(语音识别)
在Java中实现
音频
转文本(也称为语音识别或ASR)通常涉及使用专门的语音识别服务,如GoogleCloudSpeech-to-Text、IBMWatsonSpeechtoText、AmazonTranscribe
Tech Synapse
·
2025-01-26 06:20
java
音视频
语音识别
全网最最实用--教你用gradio搭网页、部署模型等(代码粘贴即用、不讲虚的)
文章目录〇前言一、构建网页1.各个组件介绍a.文本输入和输出b.图像输入和输出c.
音频
输入和输出d.视频输入和输出e.文件上传和下载f.滑块(`Slider`)g.单选按钮(`Radio`)h.复选框(
绒绒毛毛雨
·
2025-01-26 02:40
大模型算法
microsoft
前端
语言模型
人工智能
ai
FFMPEG音视频开发: Linux下采集
音频
(alsa-lib库)与视频(V4L2框架)实时同步编码保存为MP4文件(视频录制)
全栈领域优质创作者、51CTO(Top红人+专家博主)、github开源爱好者(go-zero源码二次开发、游戏后端架构https://github.com/Peakchen)FFMPEG音视频开发:Linux下采集
音频
鱼弦
·
2025-01-26 00:28
音视频开发系列实践
ffmpeg
音视频
linux
基于大语言模型构建本地个人AI助理
一、技术设计总体架构1.目标与需求个性化AI助理:构建一个本地专属AI助理,能够处理多种输入格式(文本、图像、
音频
由数入道
·
2025-01-26 00:58
人工智能
语言模型
自然语言处理
FFmpeg音视频采集
文章目录音视频采集
音频
采集获取设备信息录制麦克风录制声卡视频采集摄像机画面采集音视频采集DirectShow(简称DShow)是一个Windows平台上的流媒体框架,提供了高质量的多媒体流采集和回放功能
yerennuo
·
2025-01-26 00:25
ffmpeg
ffmpeg
音视频
Android FFmpeg 实现带滤镜的微信小视频录制功能
本文将实现对采集的预览帧(添加滤镜)和PCM
音频
同时编码复用生成一个mp4文件,即实现一个仿微信小视频录制功能。
攻城狮百里
·
2025-01-25 22:11
音视频
C/C++
C++
音视频
Android
FFmpeg
JS面向对象封装 ESC/POS 指令打印类
代码中用到的中文
转码
方法见:gbk.jsgb2312编码字符转Uint8Array,解决打印机中文乱码问题基类命令规则参考小程序插件文档Printer类部分import{isAscii,U2B}from
warmbook
·
2025-01-25 19:18
javascript
前端
node.js
LE Audio
LEAudio是一种基于蓝牙5.2协议的全新
音频
技术标准。2020年,蓝牙技术联盟在CES上发表了蓝牙核心规范5.2版本,同年,新一代蓝牙音讯技术标准LEAudio低功耗音讯传输技术也随之问世。
百态老人
·
2025-01-25 17:36
android
蓝牙LE Audio的三大改进
多流
音频
的优势AppleAirPods的最大功能之一是,每个Pod都从配对的iOS设备接收单独的信号。通常,无线耳塞仅将一个芽与输出设备配对,然后将信号投射到另一个芽。
Lenzetech
·
2025-01-25 17:00
蓝牙技术
资讯
蓝牙
群晖通过docker安装emby server实现硬件
转码
群晖通过docker安装embyserver实现硬件
转码
白群晖DS918+现在套件中心安装docker和FFMPEG这两个套件。前者为了安装emby和其他很多应用,后者用来解码。
阿舒带你学编程
·
2025-01-25 12:54
java
java
后端
PyQt6医疗多模态大语言模型(MLLM)实用系统框架构建初探(下.代码部分)
我们需要对医学影像、文本数据和
音频
数据分别进行预处理,以确保数
Allen_LVyingbo
·
2025-01-25 12:23
医疗高效编程研发
python
健康医疗
python
pyqt
语言模型
人工智能
FFmpeg iOS 集成
以及ffmpeg,ffplay和ffprobe可供最终用户用于
转码
和播放。适用于开发人员的FFmpeg库libavutil是一个包含用于简化编程的函数的库,包括随机数生成器,数据结构,数学例程
ihsdwj
·
2025-01-25 08:31
iOS
FFmpeg
iOS
音视频解码
数字输出格式中的RAW与PCM有哪些区别
数字输出格式中的RAW与PCM在
音频
和视频处理领域有着显著的区别。以下是对这两种格式的详细比较:一、定义与原理RAW定义:RAW通常指的是未经任何处理或压缩的原始数据格式。
~远在太平洋~
·
2025-01-25 07:48
测试
pcm
RAW
使用MediaCodec将PCM
音频
编码为AMR-WB格式
PCM(PulseCodeModulation)
音频
数据是一种未经压缩的原始
音频
数据格式,各个
音频
样本都由固定大小且有符号/无符号的整数值组成。
你好,工程师
·
2025-01-25 06:11
Android
pcm
音视频
android
即时通讯技术文集(第42期):直播技术合集(Part2) [共13篇]
[-1-]实时
音频
的混音在视频直播中的技术原理和实践总结[链接]http://www.52im.net/thread-1904-1-1.html[摘要]今天,我们就来聊一聊混音技术在视频直播应用中的实现原理
·
2025-01-25 06:27
即时通讯im网络编程
Opus编解码协议入门
details/126647876目录1.简介2.码率与音质、延时的关系2.1音质与码率比较2.2码率与延时对比3.Opus编解码框架4.DTX非连续传输5.FEC前向纠错1.简介Opus是一种开源免费的
音频
编解码器
弱冠少年
·
2025-01-25 02:42
嵌入式软件
嵌入式硬件
vue视频流播放,支持多种视频格式,如rmvb、mkv
先将视频
转码
为tsffmpeg-iC:\test\3.rmvb-codec:copy-start_number0-hls_time10-hls_list_size0-fhlsC:\test\a\output.m3u8
BigData-0
·
2025-01-24 12:53
vue.js
前端
javascript
【前端开发】前端开发深度解析:HTML、CSS、JavaScript与Vue.js
它使用各种标签(tags)来描述网页上的内容,包括文本、图像、链接、视频、
音频
等。HTML是网页开发的基础,与CSS(层叠样式表)和JavaScript等技术一起,共同构建出丰富多彩的网页世界。
RS迷途小书童
·
2025-01-24 10:40
前端开发探索之旅
javascript
html
css
前端
vue.js
从
音频
到 PDF:AI 全流程打造完美英文绘本教案
从
音频
到PDF:AI全流程打造完美英文绘本教案一、
音频
转文本:AI助力第一步借助AI的强大能力,将绘本的
音频
MP3转化为清晰的文本。这一过程不仅节省时间,还能确保文本的准确性。
伟贤AI之路
·
2025-01-24 09:00
自动化
AI编程
人工智能
使用Google Cloud Vertex AI进行文本和多模态生成
VertexAI不仅限于文本生成,还支持多模态输入,如图像和
音频
,极大地扩展了AI应用的潜力。核心原理解析VertexAI提供了一种简化的方式来使用
sagvWSRJHMNEB
·
2025-01-24 06:07
人工智能
计算机视觉
python
EMO2: 情感表达驱动的语音控制头像视频生成
与现有专注于生成全身或半身姿态的方法不同,我们研究了语音手势生成的挑战,并识别出
音频
特征与全身手势之间较弱的对应关系作为关键限制。为解决这一问题,我们将任务重新定义为两阶段过程。
AIGC探路者
·
2025-01-24 01:29
计算机视觉
数字人
talking
head
talking
face
AIGC
matlab构造线性相位FIR滤波器
文章目录前言一、构造一组声音二、采用FIR滤波器做频率筛选前言用生成的一组
音频
文件举例一、构造一组声音模拟钢琴音乐,采用逐渐衰减振荡的正弦波FFT的频域展示:源代码:functionsound_firFs
~Young.
·
2025-01-24 01:29
matlab
开发语言
用GANs生成艺术作品的创新探索:人工智能与艺术的奇妙碰撞
用GANs生成艺术作品的创新探索:人工智能与艺术的奇妙碰撞随着人工智能技术的飞速发展,生成对抗网络(GenerativeAdversarialNetworks,GANs)在图像生成、视频生成、
音频
合成等领域展现出了惊人的创造力
Echo_Wish
·
2025-01-23 20:19
前沿技术
人工智能
人工智能
gan
python
python edge_tts(文本转
音频
)
1.安装插件edge-ttspipinstalledge-tts2.文本转
音频
""":paramvoice:指定声音名称:paramcontent:文本内容:paramaudioFile:
音频
输出文件:
Oscar_0208
·
2025-01-23 16:51
python
音视频
25.FFmpeg学习笔记 - 用libavfilter转换原始
音频
格式2
本文用libavfilter的另一种方法来转换原始
音频
格式,见代码。
whoyouare888
·
2025-01-23 14:38
FFmpeg
2.21
音频
接口
模拟
音频
接口:传输直观容易实现,但会出现失真、不稳定的特点。TRS接口、XLR卡侬头、RCA莲花头。数字
音频
接口:AES/EBU物理接口、S/PDIF接口、同轴接口、光纤接口。
姓学名生
·
2025-01-23 14:07
硬件工程
视频的上传,
转码
与展示的过程
vue用户可以选择一个视频上传的管理页面,新增时,用户可以选择上传封面图片或者不选择上传封面图片(此时要根据视频的格式决定是从视频中截图或者展示默认图片)页面效果先不展示了,涉及的信息比较多这里贴的是视频
转码
功能部分
小子武
·
2025-01-23 14:05
java
视频上传
视频转码
大语言模型原理与工程实践:网页数据
网页数据不仅包含了丰富的文本信息,还包括了图像、视频、
音频
等多媒体内容。
AI大模型应用之禅
·
2025-01-23 06:38
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Java前端基础—HTML
Java前端基础—HTML目录Java前端基础—HTML1.简介2.基础语法2.1HTML页面固定结构2.2标题标签2.3段落标签2.4换行标签2.5水平线标签2.6文本标签2.7图片标签2.8
音频
标签
缺少动力的火车
·
2025-01-23 00:14
前端基础集合
前端
java
html
Automotive audio策略总结
1.
音频
焦点1.1为什么会有
音频
焦点机制?在车辆环境中,可能存在多个应用或者服务需要同时或者交替播放
音频
,如导航、音乐、语音助手等。
天花板之恋
·
2025-01-22 18:34
audio
AAOS
android
audio
AAOS
RV1126笔记十二:实现RTMP单路拉流
一、介绍相比推流,拉流就简单了一点,只需要连接RTMP服务器,获取流,把数据解码出来显示和播放就可以,使用的是易百纳板子,测试时
音频
输出是不正常的,所以只解析了视数据,不处理
音频
。
殷忆枫
·
2025-01-22 18:00
RV1126项目实战
ffmpeg
音视频
【多模态 AI】从跨模态学习到生成革命:文本、图像与
音频
的深度交融
网罗开发(小红书、快手、视频号同名) 大家好,我是展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者:《ESP32-C3物联网工程开发实战》图书作者:《SwiftUI入门,进阶与实战》超级个体:CO
网罗开发
·
2025-01-22 16:09
人工智能
AI
大模型
机器学习
人工智能
AIGC
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他