E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音输入
AI数字人系统开发上线全攻略:从0到1全流程解析
1.1功能规划矩阵模块基础功能进阶功能形象生成2D/3D建模实时表情捕捉与驱动语音交互TTS语音合成情感识别与应激反应动作系统预设动作库骨骼动画与物理引擎智能决策规则引擎强化学习驱动决策多模态交互文本/
语音输入
v_qutudy
·
2025-07-19 17:28
人工智能
AI系统开发
AI数字人开发
ESP32播放网络音乐与麦克风接收
本文使用esp32结合MAX98357音频放大器模块播放网络音乐,同时用INMP441模块作为
语音输入
进行测试第一部分:播放网络音乐需要用到esp32开发板、MAX98357模块、喇叭、连接线一、准备工作库安装
魔法少女郭德纲*
·
2025-07-10 00:14
单片机
iot
物联网
科普语音交互所需开源技术方案
以下是ASR(自动语音识别)、LLM(大语言模型)和TTS(文本转语音)三者结合的应用场景及开源方案:一、应用场景智能语音助手如百聆(Bailing),支持
语音输入
、意图理解、任务管理及语音输出,端到端延迟仅
·
2025-07-03 17:45
从零开始:Python实现语音识别的完整教程
从零开始:Python实现语音识别的完整教程关键词:Python、语音识别、完整教程、
语音输入
、文字输出摘要:本文将带领大家从零开始,用Python实现语音识别功能。
AIGC应用创新大全
·
2025-06-30 23:55
AI大模型与大数据技术
AI人工智能与大数据应用开发
MCP&Agent
云算力网络
python
语音识别
xcode
ai
数字人驱动技术:让虚拟角色“活起来”
目录前言一、数字人驱动技术的概念(一)驱动技术的定义(二)驱动技术的关键组成部分二、数字人驱动技术的代码示例(一)安装依赖(二)
语音输入
处理(三)动作捕捉数据处理(四)Unity端的驱动实现(五)完整的数字人驱动系统三
CarlowZJ
·
2025-06-30 04:47
数字人
开发者注意:鸿蒙APP语音识别常见问题全解析(含可跑Demo)
摘要在鸿蒙(HarmonyOS)应用开发中,语音识别是很多智能功能的核心入口,比如语音助手、
语音输入
、语音搜索等。
·
2025-06-25 01:04
harmonyos
[特殊字符] 一键搭建AI语音助理:基于DashScope+GRadio的智能聊天机器人技术全解
项目核心技术架构(图1)交互层核心模块pyaudio实时采集流式响应PCM编码GRadio界面状态控制实时对话展示语音输出历史记录管理ASR回调类ASR语音识别聊天处理引擎GPT大模型处理语音合成回调TTS语音合成
语音输入
来自于狂人
·
2025-06-22 22:10
人工智能
机器人
鸿蒙AI语音翻译便签应用设计与实现
鸿蒙AI语音翻译便签应用设计与实现一、系统架构设计基于HarmonyOS的AI能力和分布式技术,我们设计了一个语音翻译便签应用,能够实时将
语音输入
转换为文字并进行翻译,最终生成多语言便签,支持跨设备同步
鸿蒙大白
·
2025-06-20 10:11
ui
ArKUI-X
wpf
物联网
HarmonyOS5
仓颉
Step-Audio-AQAA 解读:迈向「纯语音」交互的端到端 LALM 新里程
然而,构建一个能够直接从
语音输入
到语音输出(AudioQuery-AudioAnswer,AQAA),并且具备高度智能和自然交互体验的端到端模
kakaZhui
·
2025-06-15 23:26
前沿多模态大模型:论文与实战
语音识别
人工智能
大模型
音视频
mllms
AIGC
【慧游鲁博】团队记录5
文章目录进度总览完成细节Part11.图片上传与预加载功能2.前端功能扩展与密码修改页面3.DeepSeek模型微调与Kaggle实验4.前端组件化重构5.用户认证与信息管理完成细节Part21.多模态交互·
语音输入
哇哦哇哦~~
·
2025-06-12 13:35
创新实训团队记录
软件工程
团队开发
使用讯飞开放平台的语音识别SDK实现简单的语音识别功能
语音识别是一种将人类语音转换为文本形式的技术,可以广泛应用于语音助手、语音翻译、
语音输入
等领域。讯飞开放平台提供了强大的语音识别SDK,使开发者能够轻松地集成语音识别功能到他们的应用程序中。
ZrElixir
·
2025-05-29 08:47
语音识别
xcode
人工智能
微信同声传译(语音转文字) Taro +vue3
前言微信同声传译插件是微信自研的
语音输入
,文本翻译等功能的插件封装,用于提供给第三方小程序调用。在使用过程中遇见某些问题,不知道是不是底层问题,希望有大佬能解惑。
з小丸子ε
·
2025-05-29 04:37
taro
微信小程序
前端
微信
javascript
人工智能+GPT微信小程序聊天机器人(deepSeek)
一.项目功能:1.智能问答(实时聊天+流畅打字机效果+自动滚动)2.
语音输入
3.停止生成(中断请求)、重新生成4.复制功能、分页功能二.效果展示:三.技术分析:1.RequestTask请求:小程序中wx.request
辣辣y
·
2025-05-23 12:38
微信小程序
小程序
chatgpt
文心一言
在Java项目中实现本地语音识别与热点检测,并集成阿里云智能语音服务(基础版)
引言随着语音交互技术的发展,如何高效地处理用户的
语音输入
成为许多应用的重要课题。本文将详细介绍如何在一个Java项目中同时实现:基于Vosk的本地语音识别:无需调用云端API即可完成语音到文本的转换。
会游泳的石头
·
2025-05-23 06:54
人工智能
java
语音识别
阿里云
H5利用navigator.mediaDevices实现语音功能记录
H5语音功能二、开发过程1、获取麦克风权限起初是在按住说话开始录音阶段才获取麦克风权限,但是由于测试过程中出现bug:按住说话时获取权限当授权之后没长按就能录音因此前置获取权限(在文本输入框切换成
语音输入
框时获取麦克风权限
别薅我假发
·
2025-05-20 16:23
前端
vue.js
html
开源离线语音识别输入工具CapsWriter v1.0——支持无限时长语音、音视频文件转录字幕。
软件简介:CapsWriter是一款免费开源且可完全离线识别的
语音输入
工具,无需担心因在线版本识别带来的各种隐私泄露问题。
irpywp
·
2025-05-17 08:41
python
语言模型
机器翻译
语音识别
开源软件
使用WebSocket实现跨多个服务器传输音频及实时语音识别
下面我的项目信息:项目架构:A项目(Websocket客户端/React前端)=>B项目(Websocket客户端/Java后端)=》C项目(Websocket服务端/Node.js后端)项目功能:A项目有一个开启
语音输入
的功能
灰色人生qwer
·
2025-05-16 16:16
websocket
音视频
实时传输
鸿蒙OS&UniApp 实现的
语音输入
与语音识别功能#三方框架 #Uniapp
UniApp实现的
语音输入
与语音识别功能最近在开发跨平台应用时,客户要求添加
语音输入
功能以提升用户体验。
淼学派对
·
2025-05-15 10:14
uniapp鸿蒙os
uni-app
【基于 LangChain 的异步天气查询4】加入
语音输入
/朗读
目录引言一、项目功能概览二、确保依赖已安装三、文件结构(建议)四、运行代码.envweather_runnable.pymain.py运行结果1(文本输入——>语音播报)五、技术栈要点引言本文介绍了一个基于Python的天气查询项目,通过语音或文本输入城市名称,获取并播报该城市的天气信息。项目依赖包括pyttsx3、SpeechRecognition、pyaudio和python-dotenv等库
一叶千舟
·
2025-05-12 19:52
langchain
python
语音识别
【基于 LangChain 的异步天气查询5】多轮对话天气智能助手
目录项目概述1.天气查询功能2.多轮对话与聊天3.
语音输入
与输出4.历史记录管理5.项目结构6.核心功能流程7.项目特色️项目目录结构chat_runnable.pymain.pyhistory_manager.pyweather_runnable.pytools.pyllm.pyvoice_utils.py
一叶千舟
·
2025-05-11 21:51
langchain
python
LCEL
Run
interfac
语音识别
AI智能体是什么?AI 智能体的关键特性,如何实现 AI 智能体
二、AI智能体的关键特性1.感知能力(Perception)AI智能体能够通过传感器或数据接口获取外部信息,例如
语音输入
、图像识别或文本数据:
语音输入
:智能音箱识别“今天天
大模型微调部署
·
2025-05-05 16:30
人工智能
AI大模型
自然语言处理
深度学习
Agent
智能体
LLM
2025年3月AI搜索发展动态与趋势分析:从技术革新到生态重构
3月AI搜索发展动态与趋势分析:从技术革新到生态重构一、行业动态:巨头布局与技术升级谷歌推出“AI模式”,重新定义搜索体验谷歌上线全新“AI模式”,集成多模态交互与实时数据能力,用户可通过文本、图片或
语音输入
复杂问题
白雪讲堂
·
2025-05-03 08:23
人工智能
文心一言
gpt
AI写作
重构
基于text- generation- webUI工具创建大模型webUI交互
它们都具有不错的兼容性和扩展性:Text-generation-webui:这是一个功能非常强大的GradioWebUI,支持多种模型后端,包括Transformers、llama.cpp,它具有丰富的扩展功能,如
语音输入
Kelaru
·
2025-04-24 22:48
AI大模型
语言模型
ai
python
pip
小程序端Agent语音功能
以下是完整实现流程:一、语音功能模块设计
语音输入
(录音)→语音识别(ASR)→自然语言处理(NLP)→语音合成(TTS)→语音输出核心依赖:微信录音API腾讯云语音识别(ASR)和语音合成(TTS)服务小程序
爱分享的程序员
·
2025-04-19 14:45
小程序
云蝠智能大模型:赋能 AI 呼叫行业,开启智能通信新时代
它能够精准捕捉用户的
语音输入
,并迅速转换为文本数据。尤其针对品牌词等特定词语,系统通过长期运维和纠错机制,深入理
MARS_AI_
·
2025-04-18 17:02
人工智能
自然语言处理
语音识别
信息与通信
nlp
Rasa 的工作流程
下面是Rasa工作流程的详细解释:1.用户输入用户通过对话界面(比如聊天框、
语音输入
等)发送信息。这个信息可以是自然语言文本,Rasa将对其进行处理。
YiHanXii
·
2025-04-16 20:08
Rasa
linux
人工智能
docker
语言模型
CapsWriter-Offline:高效便捷的离线
语音输入
与字幕转录解决方案
CapsWriter-Offline:高效便捷的离线
语音输入
与字幕转录解决方案【下载地址】CapsWriter-Offline高效便捷的离线
语音输入
与字幕转录解决方案分享CapsWriter-Offline
洪爽屹Flame
·
2025-04-04 13:27
语音识别项目实战:从零到一
语音识别项目实战:从零到一语音识别技术近年来在各个领域得到了广泛的应用,例如语音助手、智能家居控制、
语音输入
法等。随着深度学习的快速发展,语音识别的准确性和实用性得到了极大的提升。
一碗黄焖鸡三碗米饭
·
2025-03-29 18:46
人工智能前沿与实践
语音识别
人工智能
tensorflow
机器学习
python
深度学习
连接chatgpt的桌面语音助手
以下是一个完整的解决方案和技术实现步骤:所需工具和库语音识别使用speech_recognition库捕获用户的
语音输入
。需要麦克风支持。
getapi
·
2025-03-25 01:16
chatgpt
Python预训练模型实现俄语音频转文字
使用此模型时,请确保您的
语音输入
以16kHz采样。我们只需要装好三个功能包,写好你的文件路径即可使用!importtorchimportlibrosafromtransformersimport
啥都鼓捣的小yao
·
2025-03-23 05:03
人工智能
python
音视频
人工智能
一周热点:微软攻克
语音输入
、文本输出难题-Phi-4-multimodal
微软Phi-4-multimodal模型是人工智能领域的一个重要进展,它标志着微软在多模态人工智能技术上的突破。以下是对该模型的详细解释:模型概述微软Phi-4-multimodal是一个能够同时处理文本、图像和语音的多模态大型语言模型。它通过创新的架构和训练方法,实现了在不同模态之间的无缝交互,为用户提供更自然、更智能的交互体验。模型架构该模型采用多模态Transformer架构,通过LoRA(
数据分析能量站
·
2025-03-16 22:57
机器学习
人工智能
【花雕动手做】基于ESP32S3和通义千问大模型AI语音聊天机器人
2、技术架构:(1)语音识别:使用语音转文字大模型,将用户的
语音输入
转换为文本信息。(2)文本理解:将转换后的文本发送到通义千问大模型进行处理,模型会根据文本内容生成相应的回答。
驴友花雕
·
2025-03-11 22:44
人工智能
机器人
嵌入式硬件
单片机
c++
基于ESP32S3
通义千问AI语音聊天机器人
微信小程序
语音输入
插件安装及AI开发详解
1.登录微信公众平台进入小程序后台主页,点击账号设置-第三方设置-添加插件。在搜索页面输入微信同声传译获取插件,见下图。2.添加插件后会有审核(很快),通过后点击详情可以进入下图所示的界面。需要记住同声传译插件的AppID,在后续小程序开发中会用到。3.打开traecomposer,选择claude-3.7-sonnet模型,输入以下prompt:你需要在index页面中,使用微信小程序'同声传译
un_fired
·
2025-03-10 21:29
微信小程序
基于讯飞星火的语音问答
实现了
语音输入
,语音输出的对话形式。实现方法:后端基于python的flask框架,前端使用了html+css并用AJAX通过XMLHtt
哎呦☞ᨐ
·
2025-03-10 15:45
语音识别
人工智能
语言模型
文心一言
opencv
永久免费,不限次数,安卓神器
(文末有链接下载)主要功能语音转文字支持实时
语音输入
或本地音频文件转文字,识别准确率高达98%。支持多种方言及
zhslhm
·
2025-03-08 19:28
人工智能
安卓神器
工具分享
Open WebUI:开源AI交互平台的全面解析
进阶特性管理与安全生态系统集成持续更新核心功能️交互体验类ChatGPT界面:提供直观的聊天界面设计跨平台响应式设计:完美适配桌面/移动端即时响应:毫秒级响应速度富文本支持:代码语法高亮完整Markdown/LaTeX渲染
语音输入
支持
·
2025-03-01 06:17
Open WebUI:开源AI交互平台的全面解析
进阶特性管理与安全生态系统集成持续更新核心功能️交互体验类ChatGPT界面:提供直观的聊天界面设计跨平台响应式设计:完美适配桌面/移动端即时响应:毫秒级响应速度富文本支持:代码语法高亮完整Markdown/LaTeX渲染
语音输入
支持
·
2025-03-01 01:42
程序员/设计师/编辑必看:高效办公工具如何缩短50%工作时间
针对程序员、编辑、设计师等文字工作者,多屏幕、全键盘、多功能鼠标及
语音输入
等工具可显著提升工作效率。
涛涛讲AI
·
2025-02-23 19:38
效率工具
大模型
人工智能
deepseek
第二章:12.3 建立表现基准
背景介绍语音识别是一种常见的机器学习应用,用户通过
语音输入
代替键盘输入,系统需要将语音转换为文本。在这个过程中,算法的性能可以通过训练误差和交叉验证误差来评估。
望云山190
·
2025-02-17 22:40
基准性能水平
人工智能
机器学习
《语音识别模式、算法设计与实践》——第一章 语音识别概述
目标:将输入语音转化为文字的输出目标实现条件:提前规定好该系统可以接收的
语音输入
形式,比如单个词、命令短语和连续语音。
静候光阴
·
2025-02-03 19:39
语音识别
语音识别
人工智能
python
融云 IM 干货丨私有云IMKit源码支持哪些自定义功能?
私有云IMKit源码支持多种自定义功能,以下是一些主要的自定义功能:1.自定义输入区域自定义输入模式:可以自定义输入区域的模式,例如文本输入、
语音输入
等。
·
2025-01-20 13:03
融云即时通信im
【20220616】今日十点感悟
1、
语音输入
,确实比键盘打字要快很多;2、任何方式都有优劣,找到适合自己的就好;3、下定决心要做的事情,一定要去做;4、品行真的很重要;5、永远不要高估自己的能力;6、不管做什么事情,都将就认真;7、一定要多喝水
邱小美是Kelly
·
2024-09-14 20:56
基于人工智能的智能语音助手
一、项目背景与需求分析1.1项目目标本项目旨在创建一个语音助手系统,它可以:1.语音识别:从用户的
语音输入
中提取文本信息。2.
人工智能发烧友
·
2024-09-13 19:57
人工智能
我是不是进入了写作第二个阶段?天天写个不停
就是直接
语音输入
,输完改一改。完成作业再说。第2个阶段是:开始一直不停的想写,写的很自嗨。
米晓鹿
·
2024-09-09 22:19
极速写作——文案写手必备能力~
——快速写作这个当下,学会极速写作能够让你随时随地进入写作状态,写文案、写文章,写文案的人必备能力~极速写作①工具篇软件001讯飞输入法
语音输入
,让写作更快捷002搜狗听写可以把文字转化成语音,写完之后可以看看自己的文章节奏感如何
章鱼小洋子
·
2024-09-06 12:42
【LLM】局域网内为容器服务启用HTTPS
OpenWebUI中,
语音输入
需要HTTPS才能使用麦克风等硬件资源,在局域网中通过NGINX转发实现HTTPS访问。
不求上进的鱼仔
·
2024-09-04 23:32
LLM
openwebui
日更真的很简单
正文,点下
语音输入
的标志,然后开始用你不标准的普通话,随意说,随便说,你放心没有你想象的那么多少看你说了什么!输完之后,你会发现,好多语句里错字连篇,更可恨的是,前言不搭后语。
水亭山
·
2024-02-20 10:37
极速写作②
语音输入
法~推荐APP:讯飞
语音输入
法②录音写作。推荐APP~搜狗听写③速录机写作。
章鱼小洋子
·
2024-02-14 20:48
卧薪尝胆---吴越之争
---请原谅我那暴躁的脾气,我用的是迅飞
语音输入
法,现在我改手写,我说的是“礼崩乐坏”“礼崩乐坏!!!”在那个“礼崩乐坏”的年代,不要说和睦相
吴国根据地
·
2024-02-11 13:06
日更二十天了,新的起点
我几乎都是集中在早晨写作的,早晨,我的思路比较开放,在上班路上用
语音输入
,很快的就可以把每天日更的文章写完。但是这也不可避免的造成一个问题,就是
语音输入
难免会有不少的错别字,要及时
二狗要超神
·
2024-02-11 13:18
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他