E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音音视频androidsdk
OpenAI推出新一代
语音
与转录AI模型
3月20日,人工智能领域迎来重要进展——OpenAI正式推出三款新一代
语音
与转录AI模型,Whisper-Enhanced、VoiceFlow和TranscribePro。
未来智慧谷
·
2025-03-26 05:47
人工智能
OpenAI
多模态
语音AI
音视频
基础能力之 Android 音频篇 (三):高性能音频采集
涉及硬件的
音视频
能力,比如采集、渲染、硬件编码、硬件解码,通常是与客户端操作系统强相关的,就算是跨平台的多媒体框架也必须使用平台原生语言的模块来支持这些功能本系列文章将详细讲述移动端
音视频
的采集、渲染、
声知视界
·
2025-03-26 05:16
音频
音视频
android
Android
音视频
开发入门(1)基础概要
AAC一种专门为声音数据设计的文件压缩格式,与MP3不同,它采用了全新的算法进行编码,更加高效和高性价比。利用AAC格式,在感觉声音质量没有明显降低的前提下(并且音质比MP3更好),可使文件更加小巧。缺点:有损压缩,与时下流行的APE、FLAC等无损压缩格式相比存在“本质上”的差距。MP3一种音频压缩技术。它被设计用来大幅度地降低音频数据量。利用MP3,将音乐以1:10甚至1:12的压缩率,压缩成
2401_85730347
·
2025-03-26 05:45
android
音视频
Vosk-Server: 高精度离线
语音
识别服务器
Vosk-Server:高精度离线
语音
识别服务器vosk-serveralphacep/vosk-server:VoskServer是一个基于Vosk
语音
识别引擎的服务端实现,可以部署为HTTPAPI服务
柯茵沙
·
2025-03-26 04:10
Flutter-WebRTC:跨平台实时通信的利器
无论是社交应用、在线教育还是远程工作,高质量的
音视频
通信都是提升用户体验的关键。今天,我们要介绍的是一个强大的开源项目——Flutter-WebRTC,它为开发者提供了一个跨平台的解
傅尉艺Maggie
·
2025-03-26 04:40
Flutter技术调研报告:使用Flutter实现WebRTC
WebRTC(Web实时通信)是一种用于在Web浏览器和移动应用程序之间进行实时
音视频
通信的开源项目。在本篇文章中,我们将探讨如何使用Flutter框架实现WebRTC功能。
RqbaGcp
·
2025-03-26 04:40
flutter
webrtc
WebRTC
OpenAI突袭发布三款
语音
模型:GPT-4o STT/TTS实测详解 + 应用推荐 + 接入指南
OpenAI突袭发布三款
语音
模型:GPT-4oSTT/TTS实测详解+应用推荐+接入指南北京时间2025年3月21日,OpenAI再次上演“深夜惊喜”,悄无声息地开了一场直播,推出了三款全新的
语音
模型:️
AI筑梦师
·
2025-03-26 02:52
AI前沿探索
人工智能
深度学习
python
agi
gpt
Qt 5.15.1 Android开发环境搭建
开发环境:Qt版本:Qt5.15.1环境:Windows101.Android构建工具环境安装JDK:首先自行安装jdk1.8并配置JAVA_HOME环境变量
AndroidSDK
:在"工具->选项->设备
Qt开发老杰
·
2025-03-25 23:03
qt
android
开发语言
c++
黄仁勋GTC大会对AI的展望-英伟达进入Agentic AI时代
主要内容AgenticAI的兴起技术范式转移:黄仁勋指出,AI已经经历了三代技术范式的转移,从判别式AI(如
语音
识别、图像识别)到生成式AI,再到如今的AgenticAI。未来将是影响物理世界的
帅森森聊AI和职场(公众号同名)
·
2025-03-25 21:45
人工智能
英伟达
Agentic
AI
GTC大会
GPU
大模型
sherpa-onnx 安装和配置指南
sherpa-onnx安装和配置指南sherpa-onnxk2-fsa/sherpa-onnx:Sherpa-ONNX项目与ONNX格式模型的处理有关,可能涉及将
语音
识别或者其他领域的模型转换为ONNX
盛瑾蓬Seeds
·
2025-03-25 14:59
开源项目推荐:sherpa-onnx
开源项目推荐:sherpa-onnxsherpa-onnxk2-fsa/sherpa-onnx:Sherpa-ONNX项目与ONNX格式模型的处理有关,可能涉及将
语音
识别或者其他领域的模型转换为ONNX
甄登汉
·
2025-03-25 14:59
Sherpa-ONNX:说话人识别与
语音
识别自动开启(VAD)+ Python API 完整指南
介绍Sherpa-ONNX是一个基于ONNX的轻量级
语音
识别框架,支持多种
语音
处理任务,包括说话人识别(SpeakerRecognition)和自动
语音
识别(AutomaticSpeechRecognition
一只蜗牛儿
·
2025-03-25 14:26
语音识别
python
人工智能
通信之2m测试仪
功能特性测试功能丰富:具备离线测试、在线测试以及成帧/非成帧测试等功能,支持2Mb/sN×64Kb/s误码测试、FAS、CRC-4、E-BIT等测试,还能进行单时隙
语音
监听。
玖Yee
·
2025-03-25 07:06
信息与通信
连接chatgpt的桌面
语音
助手
要创建一个连接到ChatGPT的桌面
语音
助手,可以使用Python编写一个程序来实现
语音
识别、与ChatGPTAPI交互以及
语音
合成的功能。
getapi
·
2025-03-25 01:16
chatgpt
Spring WebFlux之流式输出
这种方式特别适合处理大文件、实时数据或需要逐步展示的场景(如deepseek响应、
语音
、视频、日志等)。在springboot中通过SpringWebFlux实现。1.Flux是什么?
Studying_swz
·
2025-03-24 22:26
blog
spring
java
后端
FFmpeg 命令行全解析:高效
音视频
处理从入门到精通
FFmpegFFmpeg是一款开源的多媒体处理工具集,支持
音视频
编解码、格式转换、流媒体处理等全链路操作。
码流怪侠
·
2025-03-24 19:33
ffmpeg
音视频
ffplay
ffprobe
实时音视频
视频编解码
直播转码
SpringCloud-使用FFmpeg对视频压缩处理
FFmpeg作为一个强大的开源工具,广泛应用于
音视频
的处理,包括视频的压缩和格式转换等。本文将通过Java代码示例,向您展示如何使用FFmpeg进行视频压缩,并介绍相关参数的设置。
rgrgrwfe
·
2025-03-24 19:31
面试
学习路线
阿里巴巴
spring
cloud
ffmpeg
spring
iPhone XS 上的 Siri 没反应怎么办?苹果手机无法使用嘿 Siri 解决方法
Siri已经成为iPhone上必不可少的智能
语音
助手,提供了很多便利,但是Siri突然不工作没有响应应该如何解决呢?
编程大乐趣
·
2025-03-24 17:46
iPhone升级iOS 16后Siri无法正常工作怎么办?3种解决办法
一、更改Siri的声音打开iPhone的【设置】,向下滚动并点击【Siri与搜索】,轻点【Siri
语音
】,将Siri的声音更改为不同的变体或声音。
丰科软件
·
2025-03-24 15:31
ios
iphone
xcode
逆向爬虫-筑基篇-第二层-壹-计算机网络和因特网-008
第二层网络初探计算机网络和因特网计算机网络与因特网之史分组交换之兴:1961-1972昔时,电话网为天下通信之主宰,其以电路交换之术,使
语音
恒速传于发收之间。
蓝花楹下
·
2025-03-24 14:25
逆向爬虫
计算机网络
网络
Deepseek 个性化决策输出
隐性数据:交互行为(如答题犹豫时间、回放次数)、情绪识别(
语音
/表情分析)、认知负荷
meisongqing
·
2025-03-24 09:43
DeepSeek
个性化
语音
识别学习系列(13):
语音
识别中的情感识别与表达
语音
识别学习系列(13):
语音
识别中的情感识别与表达前言在
语音
识别领域,仅仅将
语音
准确转换为文字内容已不能满足日益多样化的人机交互需求。
DoYangTan
·
2025-03-24 08:58
语音识别
学习
人工智能
WebRTC:构建实时通信应用的利器
而WebRTC(WebReal-TimeCommunication)则为开发者提供了一种简便的方式,来在浏览器中实现实时的
音视频
通信和数据传输。
Hello-ZHE
·
2025-03-24 05:33
webrtc
深入浅出 WebRTC 通信原理:从点对点到多人会议的全方位解析
随着远程办公和在线协作的普及,
音视频
通信的需求日益增长。
ADFVBM
·
2025-03-24 05:01
webrtc
基于Streamlit实现的音频处理示例
基于Streamlit实现的音频处理示例,包含录音、
语音
转文本、文件下载和进度显示功能,整合了多个技术方案:一、环境准备#安装依赖库pipinstallstreamlitstreamlit-webrtcaudio-recorder-streamlitopenai-whisperpython-dotx
大霸王龙
·
2025-03-24 01:26
音视频
ffmpeg
SenseVoice 部署记录
最近试用了SenseVoice(阿里团队开源的
语音
转文字)效果可以,可以本地部署,有webui界面,测试了万字以上的转换效果可以。首先部署好conda环境和cuda,这个可以查看他人的文章。
安静六角
·
2025-03-23 23:09
开源软件
机器学习:让计算机学会思考的艺术
从推荐系统到自动驾驶汽车,再到
语音
助手,机器学习的应用无处不在。然而,对于许多人来说,机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言,带你走进机器学习的世界,了解它的基本原理和应用。
平凡而伟大.
·
2025-03-23 21:19
机器学习
机器学习
人工智能
哈尔滨工业大学DeepSeek公开课人工智能:大模型原理 技术与应用-从GPT到DeepSeek|附视频下载方法
本报告深入探讨了大语言模型在自然语言处理(NLP)领域的核心地位及其发展历程,从基础概念出发,延伸至语言模型在机器翻译、拼音输入法、
语音
识别等任务中的关键作用。
你觉得205
·
2025-03-23 19:39
人工智能
机器学习
大数据
ai
知识图谱
python
运维
《AI大模型趣味实战 》第8集:多端适配 个人新闻头条 基于大模型和RSS聚合打造个人新闻电台(Flask WEB版) 2
本文将带领读者通过Python和Flask框架,结合大模型的强大能力,构建一个个性化的新闻聚合平台,不仅能够自动收集整理各类RSS源的新闻,还能以
语音
播报的形式提供"新闻电台
带娃的IT创业者
·
2025-03-23 19:37
AI大模型趣味实战
人工智能
flask
前端
When Large Language Models Meet Speech: A Survey on Integration Approaches
主要内容研究背景:大语言模型(LLMs)在自然语言处理领域取得显著进展,其与
语音
的融合具有广泛应用前景,但缺乏相关集成方法的综述。
UnknownBody
·
2025-03-23 17:46
LLM
Daily
Survey
Paper
语言模型
人工智能
自然语言处理
《数字时代的职场暗战:下班后的消息该不该回?》
一、赛博朋克式职场:永不熄灭的手机屏幕凌晨1点,手机屏幕在床头柜上第7次亮起,弹出的消息提示像一把悬在空中的达摩克利斯之剑——市场部总监在项目群@全体成员核对数据,客户发来20条59秒的
语音
方阵。
玩转数据库管理工具FOR DBLENS
·
2025-03-23 13:14
项目管理
数据库
大数据
数据库开发
数据仓库
GPT-4o mini TTS:OpenAI 推出轻量级文本转
语音
模型!情感操控+白菜价冲击配音圈
OpenAI新模型每分钟
语音
成本仅9分钱”大家好,我是蚝油菜花。当同行还在用机械音合成器折磨听众时,这个AI怪物已
蚝油菜花
·
2025-03-23 10:56
每日
AI
项目与应用实例
开源
人工智能
使用AI识别
语音
和B站视频并通过GPT生成思维导图
AI脑图除了对文本、网页链接和文件生成思维导图外,现在也支持了对
语音
和B站视频的内容识别,并自动生成思维导图。
·
2025-03-23 06:05
思维导图gpt-4
使用AI识别
语音
和B站视频并通过GPT生成思维导图
AI脑图除了对文本、网页链接和文件生成思维导图外,现在也支持了对
语音
和B站视频的内容识别,并自动生成思维导图。
·
2025-03-23 06:04
思维导图gpt-4
抖
音视频
数据获取实战:从API调用到热门内容挖掘
在短视频流量为王的时代,掌握抖音热门视频数据已成为内容运营、竞品分析及营销决策的关键。本文将手把手教你通过抖音开放平台API获取视频详情数据,并提供完整的代码实现及商业化应用思路。一、抖音API权限申请与核心接口抖音API需企业资质认证,个人开发者权限受限。以下是接入流程:企业开发者认证•登录开放平台,选择注册,提交信息等材料。•完成认证后,创建应用(如“视频数据分析工具”),获取ClientKe
爱搞技术的猫猫
·
2025-03-23 05:35
API
音视频
Python预训练模型实现俄
语音
频转文字
Python预训练模型实现俄
语音
频转文字使用CommonVoice8.0、Golos和MultilingualTEDx的训练和验证分割对俄语的facebook/wav2vec2-xls-r-1b进行了微调
啥都鼓捣的小yao
·
2025-03-23 05:03
人工智能
python
音视频
人工智能
VideoView视频组件
它是
AndroidSDK
的一部分,位于android.widget包中。
Android洋芋
·
2025-03-23 01:01
Android控件
音视频
文本转
语音
常用的几个python库
在Python编程领域,文本到
语音
(Text-to-Speech,TTS)的转换是一个常见的需求,尤其是在开发能够与用户交互的应用程序时。
天蓝海乡
·
2025-03-23 01:58
python
开发语言
人工智能
nlp
语音识别
python之pyttsx3实现文字转
语音
播报
1.pyttsx3是什么pyttsx3是Python中的文本到
语音
转换库,可以实现文本的朗读功能。
l8947943
·
2025-03-23 00:25
python问题
语音识别
人工智能
pyttsx3
python朗读
Python中Pyttsx3库实现文本转化成
语音
MP3格式文件
Pyttsx3库介绍pyttsx3库是一个功能强大且使用方便的Python本地文本转
语音
库。
定星照空
·
2025-03-23 00:22
python
C++基础系列【26】排序和查找算法
博主介绍:程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/
音视频
/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章
程序喵大人
·
2025-03-22 23:15
C++基础系列
c语言
算法
开发语言
c++
Open WebUI – 本地化部署大模型仿照 ChatGPT用户界面
Docker部署简单,功能非常丰富,包括代码高亮、数学公式、网页浏览、预设提示词、本地RAG集成、对话标记、下载模型、聊天记录、
语音
支持等。官网地址:ht
m0_74824845
·
2025-03-22 01:37
chatgpt
ui
鸿蒙开发秘籍:用AvPlayer解锁录音朗读新玩法
像社交类应用里收发
语音
消息,教育类应用播放有声读物,还有音乐类应用的核心播放功能,都离不开音频处理。
柳中仙
·
2025-03-22 00:04
鸿蒙HarmonyOS
harmonyos
华为
Webrtc音频技术(未完)
一、概述1、架构上图中发送方(或叫上行、TX)将从MIC采集到的
语音
数据先做前处理,然后编码得到码流,再用RTP打包通过UDPsocket发送到网络中给对方。
会头痛的可达鸭
·
2025-03-21 23:56
WebRTC
webrtc
211 本硕研三,已拿 C++ 桌面应用研发 offer,计划转
音视频
或嵌入式如何规划学习路线?
今天给大家分享的是一位粉丝的提问,211本硕研三,已拿C++桌面应用研发offer,计划转
音视频
或嵌入式如何规划学习路线?
程序员yt
·
2025-03-21 20:29
c++
音视频
学习
自动
语音
识别(ASR):技术、应用与未来
自动
语音
识别(ASR):技术、应用与未来1.ASR简介自动
语音
识别(ASR,AutomaticSpeechRecognition)是一种将
语音
转换为文本的技术。
ajie1117
·
2025-03-21 16:17
语音识别
人工智能
RTSP协议规范与SmartMediaKit播放器技术解析
在实时流媒体传输领域,RTSP(Real-TimeStreamingProtocol)协议作为标准规范,为
音视频
数据的高效传输提供了坚实基础。
音视频牛哥
·
2025-03-21 12:14
RTSP播放器
轻量级RTSP服务
大牛直播SDK
音视频
机器视觉
人工智能
rtsp播放器
python
rtsp播放器
rtsp
player
大牛直播SDK
python离线
语音
转文本_使用Python将
语音
转换为文本的方法
使用Python将
语音
转换为文本的方法,
语音
,转换为,文本,您的,麦克风使用Python将
语音
转换为文本的方法易采站长站,站长之家为您整理了使用Python将
语音
转换为文本的方法的相关内容。
weixin_39760619
·
2025-03-21 11:01
python离线语音转文本
深度学习的颠覆性发展:从卷积神经网络到Transformer
CNN主要应用于图像处理和
语音
识别等领域。2012年,AlexKrizh
AI天才研究院
·
2025-03-21 07:57
AI大模型应用入门实战与进阶
ChatGPT
大数据
人工智能
语言模型
AI
LLM
Java
Python
架构设计
Agent
RPA
使用Python下载抖音短视频:完整教程与代码解析
幸运的是,通过Python编程,我们可以实现抖
音视频
的下载。本文将详细介绍如何使用Python下载抖音短视频,并解析一个完整的代码示例。
cnh6070
·
2025-03-21 06:23
短视频
python
音视频
开发语言
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他