E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音识别(speech
学生党必备app,有了它们让你们的大学不再无聊~
大学的事情很琐碎,这时候水滴清单这个软件就粗现拉,老师布置任务或者自己想起来有什么任务的时候一键添加,还支持长按
语音识别
。完成之后直接右划就可
你女朋友陈可爱
·
2024-01-27 12:11
VITS:Conditional Variational Autoencoder with Adversarial Learning forEnd-to-End Text-to-
Speech
——TTS
笔记地址:https://flowus.cn/share/4c8c251b-cb8e-4f21-aa9e-139c1c3cf883【FlowUs息流】Vits论文地址:proceedings.mlr.pressAbstract与传统的two-stageTTS(即文字→mel频谱→声音)相比,是一种parallelend-to-endTTS,提升了效率且声音自然。其它parallel方法主要存在音质
pied_piperG
·
2024-01-27 09:42
语音识别
音频
深度学习
机器学习
神经网络
VAE
VALLE:Neural Codec Language Models areZero-Shot Text to
Speech
Synthesizers---TTS论文阅读
/a94730c1-6ae8-4955-82fb-812aff78f638【FlowUs息流】VALLE论文地址:NeuralCodecLanguageModelsareZero-ShotTextto
Speech
SynthesizersAbstract
pied_piperG
·
2024-01-27 09:42
语言模型
论文阅读
人工智能
VALLE
语音合成
音频
Tortoise-tts Better
speech
synthesis through scaling——TTS论文阅读
笔记地址:https://flowus.cn/share/a79f6286-b48f-42be-8425-2b5d0880c648【FlowUs息流】tortoise论文地址:Better
speech
synthesisthroughscalingAbstract
pied_piperG
·
2024-01-27 09:38
论文阅读
TTS
音频
语音合成
OpenAI ChatGPT-4开发笔记2024-07:Embedding之Text Similarity文本相似度
OpenAIhasmadewavesonlinewithitsinnovativeembeddingandtranscriptionmodels,leadingtobreakthroughsinNLPand
speech
recognition.Thesemodelsenhanceaccuracy
aiXpert
·
2024-01-27 06:08
笔记
embedding
腾讯
语音识别
php接口,文档中心
常见问题基础技术Q:什么是字典升序排序?A:字典升序排序是一种关联数组排序方式,开发者可参考PHP中的ksort内置函数实现。例如:以PHP为例,假设关联数组如下。$list=array('aaa'=>'aaa','abc'=>'abc','abb'=>'abb','1aa'=>'1aa','abd'=>'abd');那么字典升序排序结果如下(使用ksort实现)。$list=array('1aa
fluxions
·
2024-01-27 02:04
腾讯语音识别
php接口
基于STM32的有限词条
语音识别
与对话模块
基于STM32的有限词条
语音识别
与对话模块一、模块整体设计思路二、器件选型与方案确定1、器件选型(1)
语音识别
模块(2)词条存储模块(3)语音提示模块(4)主控芯片2、方案确定三、IO资源分配与模块介绍
在梦里-119
·
2024-01-26 23:00
嵌入式
语音识别
人工智能
2022-12-16
优点AI深度学习深度学习训练和推理在线服务,图像识别图像内容鉴别,
语音识别
视频处理大规模高清视频转码,4K
darkvm美美
·
2024-01-26 22:12
Unity 讯飞实时语音转写(三)—— 分析转写结果
一)——使用WebSocket连接讯飞语音服务器Unity讯飞实时语音转写(二)——接收转写结果Unity讯飞实时语音转写(三)——分析转写结果(应该没有后续了)说在前面这段时间一直在忙其他事情,所以
语音识别
的工作暂时交接到了同事手中
jack_dos
·
2024-01-26 21:52
Unity3D
笔记
uniapp 开发H5页面,实现
语音识别
功能--前端,不包含后端转换
一、背景微信小程序开发,内嵌h5页面,不能调用微信内部的插件二、实现方式通过安装js-audio-recorder插件实现既定需求三、具体步骤1、安装插件npmijs-audio-recorder2、引入在需要使用的页面中引入:importRecorderfrom'js-audio-recorder';3、具体配置1、定义recorderdata(){return{recorder:null};}
一块西瓜皮啦
·
2024-01-26 18:27
uni-app
前端
FastDeploy项目简介,使用其进行(图像分类、目标检测、语义分割、文本检测|orc部署)
提供超过160+Text,Vision,
Speech
和跨模态模型开箱即用的部署体验,并实现端到端的推理性能优化。
万里鹏程转瞬至
·
2024-01-26 09:52
深度学习python库使用
目标检测
深度学习
模型部署
云从科技周曦:我为什么放弃了
语音识别
,转做人脸识别?
摘要:在多年研究之后,他为何放弃了
语音识别
,转做人脸识别?从学术圈到成立公司,他有哪些思考?如何更好地识别人脸?继“让机器听懂你的声音”,钛坦白又请来六位钛客,探讨如何让机器看懂这个世界。
JiandaoStudio
·
2024-01-26 09:20
图像识别
人脸识别
论文阅读——Mockingjay: unsupervised
speech
representation learning
《Mockingjay:Unsupervised
Speech
RepresentationLearningwithDeepBidirectionalTransformerEncoders》原文地址:https
没有热情得活着不如死去
·
2024-01-26 09:35
深度学习
自然语言处理
跨平台Recorder录音插件:支持多种格式、音频可视化、实时上传、
语音识别
视频教程地址:【跨平台Recorder录音插件:支持多种格式、音频可视化、实时上传、
语音识别
】https://www.bilibili.com/video/BV1jQ4y1c7e4/?
王家视频教程图书馆
·
2024-01-26 08:54
语音识别
android
录音
智能
语音识别
源码系统+语义理解+对话管理+语音合成 带完整的搭建教程
人工智能技术的不断发展,智能
语音识别
技术逐渐成为人们日常生活和工作中不可或缺的一部分。然而,目前市场上的智能
语音识别
产品大多存在一定的局限性,如识别率不高、功能单一等。
罗峰源码
·
2024-01-26 08:20
源码分享
语音识别
人工智能
智能语音识别源码
智能语音识别
智能语音识别源码系统
Whisper对于中文
语音识别
与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAsr,但是经过中文特殊优化的Whisper就未必了。中文文本标注优化Whisper经常被人诟病的一点是对中文语音转写后标点符号的支持不够完备。首先安装whisper:pipinstall-Uo
刘悦的技术分享
·
2024-01-26 08:50
whisper
语音识别
人工智能
深度学习
语言模型
Jetson nano 的语音
Jetsonnano的语音安装汇入测试安装pipinstall
Speech
RecognitionpipinstallgTTS-tokenpipinstallgTTSpipinstallpygamesudoaptinstallpython-pyaudiopython3
chencef
·
2024-01-26 01:50
nano
nano
【语音基础】语音相关的基础
语音识别
框架和模型语音采样率
语音识别
资料端到端模型与传统模型的区别传统模型(非端到端模型)传统模型通常由不同的组件组成,例如文本处理模块、声学模型、声码器等等。
liefyuan
·
2024-01-26 00:15
音频
语音识别
FAIR-Wave2Vec 2.0模型介绍
1.自动
语音识别
(ASR)领域介绍自动
语音识别
(ASR)领域的重大突破在过去几年中取得了显著进展,以下是一些关键的发展和里程碑:深度学习的引入:2012年前后,随着深度神经网络(DNN)在
语音识别
领域的应用
科学禅道
·
2024-01-26 00:26
PyTorch
人工智能
语音识别
2016年不可错过的21个深度学习视频、教程和课程
但很快,这个领域就得到了很大的发展,目前已经被应用到很多的领域当中,例如:
语音识别
、图像识别、在一个数据集当中寻找模式、照片中的事物分类、字符文本生成、自动驾驶汽车等等。
wd_cloud
·
2024-01-25 22:31
神经网络
使用 LinkAi 打造自己的知识库和数字人
LinkAi提供的智能
语音识别
和文本分
绿皮龟
·
2024-01-25 19:41
Java基础合集
人工智能
opencv
数据挖掘
语音识别
计算机视觉
目标检测
机器学习
自然语言处理的新突破:如何推动语音助手和机器翻译的进步
基于深度学习的
语音识别
和语义理解技术,使得语音助手可以更准确地分析用户意图,提供个性化服务。
语音识别
精度的持续提高
语音识别
是语音助手的基础。
X_StarX
·
2024-01-25 18:32
自然语言处理
机器翻译
人工智能
利用 “diart“ 和 OpenAI 的 Whisper 简化实时转录
只需几行代码,diart就能让您获得类似这样的实时发言者标签:与此同时,Whisper是OpenAI最新推出的一种为自动
语音识别
(ASR)而训练的模型,它对
vitaminYZZ
·
2024-01-25 18:39
前端
语音识别
(webkit
Speech
Recognition)
前端
语音识别
(webkit
Speech
Recognition)-CSDN博客Excerpt文章浏览阅读1.8k次,点赞4次,收藏4次。
南七小僧
·
2024-01-25 13:17
服务器开发
网站开发
人工智能
前端
语音识别
人工智能
NLP自然语言处理介绍
NLP涉及多个技术和方法,包括
语音识别
、文本分析、语义理解、机器翻译、情感分析等。通过这些技术,NLP可以处理和分析大量的文本数据,识别文本中的关键信息和结构,并从中提取出有用的知识和洞察。NLP在
love6a6
·
2024-01-25 07:12
nlp
吴军《信息论》中大数据思维应用之
语音识别
印象最深是吴军老师告诉我们飞机的发明不是仿生鸟类翅膀的工作原理,是了解透了空气动力学,加以运用,才实现了人们飞上蓝天的梦想。我们总说要有梦想,除了做梦,还得有思想,把梦拆解成可解决的问题的思考与想法。这些,也是我作为文科生会迷上吴军博士的课程的原因。生活中,我们总要解决各式各样的问题,我们如何拆解问题,把问题变成关于大数据思维在当下最常见,也是最成功的四类应用。第一类是解决人工智能问题,把那些过去
高高_02c9
·
2024-01-25 07:44
物联网毕设 -- 智能语音台灯系统(
语音识别
+蓝牙+STM32)
目录前言一连线图1原理图2PCB效果(开发板不适应)3实物效果4APP界面5功能概括(1)硬件端(2)APP端(3)语音控制端(4)演示视频二底层代码使用方式1.使用说明2.下载程序三APP使用方式下载APP(1)操作方式(2)使用说明前言智能灯的硬件端包括STM32F103C8T6用于中控和模块数据通信,0.96寸OLED用于显示环境数据,光敏电阻实时监测光照数据,旋钮按键用于模式切换和LED调
阿柒学起来
·
2024-01-25 05:29
毕设(物联网)
物联网
语音识别
stm32
蓝牙
毕设
物联网毕设
课程设计
英语日积月累2023-06-04
Her
speech
madeapro
抽刀断水2
·
2024-01-25 02:06
AI Toolkit软件安装教程(附软件下载地址)
该软件套件融合了多种顶尖人工智能技术工具,包括智能聊天机器人、光学字符识别(OCR)、文本到语音(TTS)以及自动
语音识别
(ASR)等。这些强大工具的集成旨在帮助用户优化日常任务,提升工作效能。
羽化飞翔186
·
2024-01-24 22:16
人工智能
功能实现——文字转语音(TTS)
文字转语音(TTS)介绍文字转语音(TTS,Text-to-
Speech
)是一种技术,它将文本转换为自然流畅的人类语音输出。TTS技术可以使计算机、智能设备和应用程序能够以口头方式与用户进行沟通。
_遮云壑_
·
2024-01-24 14:43
功能实现
python
java
c++
linux
windows
嵌入式Linux平台下TTS(文本转语音)技术的实现
TTS(Textto
Speech
)技术是将相应的文本转化为语音,使机器能够开口“说话”。
青天喵喵
·
2024-01-24 14:11
Linux
嵌入式
makefile
linux
编译器
HMM+维特比算法
二、理论描述隐含马尔可夫模型被认为是解决大多数自然语言处理问题快速、有效的方法,成功解决了复杂的
语音识别
、机器翻译等问题。HMM是一个五元组(O,Q,O0,A
一个很菜的小猪
·
2024-01-24 12:37
自然语音处理
算法
机器学习
人工智能
【AI视野·今日Sound 声学论文速览 第四十六期】Thu, 11 Jan 2024
CS.Sound声学论文速览Thu,11Jan2024Totally10papers上期速览✈更多精彩请移步主页DailySoundPapersNoise-robustzero-shottext-to-
speech
synthesisconditionedonself-supervised
speech
-representationmodelwithadaptersAuthorsKeni
hitrjj
·
2024-01-24 12:35
Sound
audio
Papers
文本转语言
智能声学
计算机声学
智能音频处理
基于语音的手势生成
音乐理解
文本语音对齐
日更73|你的工作,会被人工智能取代吗?
它有四组大军:
语音识别
很多人都见识过了,科大讯飞的语音输入法,可以每分钟输入400个汉字,准确率极高,几乎完全可以取代速记员。加上机器翻译,就可以取代同声传译。视觉识别今天也越来越普遍了。
飛妃1224
·
2024-01-24 08:21
顶顶通
语音识别
-“将用户说的话当成静音处理”问题解决步骤
文章目录前言一、问题分析二、步骤前言顶顶通用户在使用asrproxy程序识别时,说话很快或者说的很短,可asrproxy日志却输出“ddtvoiceappid:testfault:3asrfailederror:1desc:silence”的错误。将用户说的话当成静音去处理。这种情况应当如何解决?本文将围绕这个问题提供解决方法:提示:以下是本篇文章正文内容,下面案例可供参考一、问题分析“将用户说的
H4_9Y
·
2024-01-24 08:59
FAQ
语音识别
中间件
在顶顶通呼叫中心中间件(mod_cti基于FreeSWITCH)-与讯飞星火知识大模型对接 实现机器人问答功能
配置测试5.点击呼叫可向机器人提问啦实现目标:希望能够以语音的形式向提问机器人提出问题,机器人语音回答提的问题1.准备工作1.安装了FreeSWITCH2.安装了(mod_cti基于FreeSWITCH)-
语音识别
八方来财,好运连连,万事如意
·
2024-01-24 08:22
语音识别
人工智能
java
深度学习如何入门,如何快速理解深度学习
深度学习算法包括卷积神经网络、循环神经网络和生成对抗网络等,它们在
语音识别
、图像识别、自然语言处理、机器翻译等领域都取得了很大的进展。它使用了深度
打工人何苦为难打工人
·
2024-01-24 08:28
深度学习
细数
语音识别
中的几个former
目前在
语音识别
领域中,Tranformer已经取代了传统ASR建模方式。近几年关于ASR的研究工作很多都是基于Transformer的改进,本文将介绍其中应用较为广泛的几个former架构。
语音之家
·
2024-01-24 07:58
智能语音
语音识别
人工智能
【花雕动手做】ASRPRO
语音识别
(48)---用N20电机的苗条小车
装修屋子,找了一段墙面布线槽,外槽宽度只有23毫米,截取一段长为24厘米,尝试做个苗条小车先在线槽上安装了二只N20小电机装上二个快餐盒盖做轮子测试一下使用3.7V锂电池的动力系统(视频)https://v.youku.com/v_show/id_XNTEyNTM2NDcyOA==.html?spm=a2hcb.playlsit.page.1苗条小车的动态图准备使用连轴器,测试各种形态的轮子内部的
驴友花雕
·
2024-01-24 06:42
AI语音识别
花雕动手做
开源硬件
语音识别
人工智能
c++
嵌入式硬件
单片机
ASRPRO语音识别
用N20电机的苗条小车
用openai开源的whisper部署自己的
语音识别
系统秒杀收费产品
openai开源了自己的
语音识别
项目whisper,可将视频和语音文件转为文字,个人认为效果可以比肩科大讯飞的收费产品,并且无需GPU,普通配置就可以运行。
Java斌
·
2024-01-24 03:40
开源
whisper
语音识别
AI新工具(20240122)Whisper
Speech
-开源文本转语音系统;Stable LM 2 1.6B-1.6亿参数稳定语言模型;OpenRouter-开源路由器,连接各种AI模型
Whisper
Speech
-开源文本转语音系统Whisper
Speech
是一个开源的文本到语音系统,使用了Whisper和EnCodec等开源模型来生成语义标记和执行语音建模。
go2coding
·
2024-01-23 23:40
AI智能工具
人工智能
whisper
语言模型
自然语言处理(NLP)
以下是一些常见的NLP技术和应用的例子:
语音识别
:将人类语言转换为计算机可理解的文本。例如,虚拟助手如Siri和Alexa可以通过识别用户的语音指令来执行特定的任务。
先------------------
·
2024-01-23 19:09
自然语言处理
人工智能
第2章 大模型的基础知识2.2 大模型的关键技术2.2.1 模型架构
1.背景介绍1.背景介绍大模型是现代人工智能的核心技术之一,它们在自然语言处理、图像识别、
语音识别
等领域取得了显著的成果。大模型的关键技术之一是模型架构,它决定了模型的性能和效率。
OpenChat
·
2024-01-23 16:00
机器学习开发实战代码案例详解
大数据
人工智能
语言模型
AI
LLM
Java
Python
架构设计
Agent
RPA
【AI军事竞赛】AI Chat Bot 的应用编辑平台
AI腾讯中国机器学习、语音和图像识别https://cloud.tencent.com3百度智能云百度中国机器学习、自然语言处理https://cloud.baidu.com4讯飞开放平台科大讯飞中国
语音识别
临水逸
·
2024-01-23 13:39
人工智能
自然语言处理中的查准率与查全率的关键技术,以及自然语言处理中的查准率与查全率具体实例与策略
自然语言处理涉及到许多子领域,如
语音识别
、机器翻译、情感分析、文本摘要、文本分类等。在这些任务中,查准率(Precision)和查全率(Rec
代码讲故事
·
2024-01-23 08:24
机器人智慧之心
自然语言处理
人工智能
NLP
情感分析
文本分类
查全率
查准率
深入学习卷积神经网络(CNN)的原理知识
在深度学习领域中,已经经过验证的成熟算法,目前主要有深度卷积网络(DNN)和递归网络(RNN),在图像识别,视频识别,
语音识别
领域取得了巨大的成功,正是由于这些成功,能促成了当前深度学习的大热。
AAI机器之心
·
2024-01-23 08:20
cnn
人工智能
KNN
深度学习
机器学习
神经网络
tensorflow
科技发展下的未来生活
科大讯飞在
语音识别
、深度算法等方面是一家非常优秀的公司,由18个中科大高材生在学生时代1999年组建并发展到今天,团队稳定,技术扎实,在
语音识别
、自然语音合成、语义理解、影像识别等很多方面有很深的沉淀,
nxzh
·
2024-01-23 08:58
2023-2024深度学习框架之争——选pytorch还是tensorflow?
深度学习是人工智能领域的一个重要分支,它利用多层神经网络来模拟人类的学习和推理能力,解决各种复杂的问题,如图像识别、自然语言处理、
语音识别
、推荐系统等。
NCHU-Net
·
2024-01-23 07:43
人工智能
人工智能
深度学习
pytorch
tensorflow
人工智能第三版|chap01|task01
应用和方法搜索算法和拼图问题二人博弈【对抗性游戏】自动推理产生式规则和专家系统细胞自动机神经计算遗传算法【GA】知识表示不确定性推理人工智能早期历史逻辑学家与逻辑机器人工智能近期历史到现在新千年人工智能的发展名词集合机器人、
语音识别
speoki
·
2024-01-23 04:09
人工智能
Viterbi算法
在
语音识别
中,声音信号作为观察到的事件序列,而文本字符串被看作是隐含的产生声音信号的原因,因此可对声音信号应用维特比算法寻找最有可能的文本字符串。
搬砖人NO17
·
2024-01-23 01:11
语音
神经网络共同学习
算法
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他