E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音识别论文笔记
语音识别
、音频转文字的小妙招
说起录音大家都很熟悉,但转成文字稿就没那么简单了,有人说用手机上的录音机就可以了,但录音机里边的录音转文字,好友发给你的音频那就识别不了,怎么办?用录音转文字助手就可以了呀。操作步骤:第一步:我们可以在手机应用市场中搜索录音转文字助手,接着打开该应用。第二步:你可以看到录音【录音识别】、【文件识别】和【录音机】,【录音识别】是边录音边转换成文字,【文件识别】则是上传音频文件进行识别,【录音机】仅支
夹心说
·
2024-01-12 21:36
julius开源
语音识别
引擎
开源
语音识别
软件HTK,对Julius和Kaldi等系统了解者更佳一.InstallationBySourcetarballInstallationprocessissimpleandcontainsthefollowingpoints
xyc310898673
·
2024-01-12 18:07
语音识别
ChatSDK 全双工
语音识别
库
:是对原始msc的语音SDK封装,相对AIUI便宜很多baidulib:是对百度语音SDK封装,百度号称永久免费AIUITools:AIUI网络测试工具-折线图动态测试可持续观测共同特点:实现了全双工
语音识别
guodashen007
·
2024-01-12 06:37
语音识别
xcode
人工智能
捷豹路虎牵手高德,为何它会成为车企前装标配?
科大讯飞赖以成名的自然
语音识别
+方言识别,让它成为了
语音识别
领域里的佼佼者。
奇奇怪怪小不点
·
2024-01-12 04:38
【
论文笔记
】End-to-End Diffusion Latent Optimization Improves Classifier Guidance
AbstractClassifierguidance为图像生成带来了控制,但是需要训练新的噪声感知模型(noise-awaremodels)来获得准确的梯度,或使用最终生成的一步去噪近似,这会导致梯度错位(misalignedgradients)和次优控制(sub-optimalcontrol)。梯度错位(misalignedgradients):通过噪声感知模型指导生成模型时,两个模型的结构和目
xhyu61
·
2024-01-12 02:08
机器学习
论文笔记
学习笔记
论文阅读
【
论文笔记
】ZOO: Zeroth Order Optimization
论文(标题写不下了):《ZOO:ZerothOrderOptimizationBasedBlack-boxAttackstoDeepNeuralNetworkswithoutTrainingSubstituteModels》Abstract深度神经网络(DNN)是当今时代最突出的技术之一,在许多机器学习任务中实现了最先进的性能,包括但不限于图像分类、文本挖掘、语音处理。但人们越来越关注对抗性示例的
xhyu61
·
2024-01-12 02:34
学习笔记
论文笔记
机器学习
论文阅读
人工智能学习与实训笔记(五):百度AI能力AIP sdk调用实操
百度的很多AI能力是通过AIPsdk对外开放的,比如
语音识别
,语音合成,图像识别,NLP,人脸识别等等。
穿越光年
·
2024-01-11 22:02
人工智能
学习
笔记
一款操作简便的录音转文字软件
第二步:下载安装好软件之后,可以打开OCR文字识别软件,进入到软件界面可点击
语音识别
功能,这样我们就进入到语音识
自己的坏丫头
·
2024-01-11 19:14
开庭普通话,记录少偏差
我院审判庭(包括外派法庭)
语音识别
功能已部署完成,操作培训定于2019年3月28日上午11:30在东院十二审判庭举行,到时请无开庭任务的书记员全部参加,请相互转告。
二剑心
·
2024-01-11 16:13
理解深度学习
在一些领域取得了非常不错的效果,如图片识别,
语音识别
,在安全领域甚至还有识别加密的协议等。如图片,语音领域实验室准确率都超过了90%。
voice_an
·
2024-01-11 14:23
Buzz 离线音频转字幕工具(完全免费,无需登录)
关于BuzzBuzz是一款可以自动识别语音为文本字幕的软件工具,基于OpenAI开源的Whisper自动
语音识别
模型,可以批量将音频或者是视频中的内容自动转化为带有时间的字幕,速度非常快,是一款能极大提高效率的生产力小工具
這花開嗎
·
2024-01-11 11:39
工具
音视频
ai字幕
语音转字幕
生成字幕
基于传统机器学习模型算法的项目开发详细步骤
这些算法在图像分类、
语音识别
、自然语言处理、推荐系统等领域有着广泛的应用无监督学习:已知输入,无输出结果而进行的学习,发现数据中的潜在特征和规律
挑大梁
·
2024-01-11 10:44
AI传统机器学习
机器学习
人工智能
python
算法
keras
tensorflow
数据分析
[PyTorch][chapter 9][李宏毅深度学习][Why Deep]
为什么需要深度,本篇主要简单介绍一下该原因目录:1:简介2:模块化分析3:
语音识别
例子一简介有人通过实验,使用相同的网络参数,深度越深的网络相当于浅层网络效果更好。
明朝百晓生
·
2024-01-11 08:05
深度学习
pytorch
人工智能
竞赛保研 基于深度学习的水果识别 设计 开题 技术
/dancheng-senior/postgraduate2开发简介深度学习作为机器学习领域内新兴并且蓬勃发展的一门学科,它不仅改变着传统的机器学习方法,也影响着我们对人类感知的理解,已经在图像识别和
语音识别
等领域取得广泛的
iuerfee
·
2024-01-11 07:39
python
英伟达推新AI
语音识别
模型Parakeet 号称优于Whisper
领先的开源对话AI工具包NVIDIANeMo宣布推出ParakeetASR模型系列,这是一系列最先进的自动
语音识别
(ASR)模型,能够以出色的准确性转录英语口语。
智云研
·
2024-01-10 23:14
人工智能
语音识别
whisper
开源语音数据集
除CommonVoice数据集外,他们还在构建一个名为DeepSpeech的开源
语音识别
引擎。这两个项目都是努力弭平数字语音鸿沟的一部分。
AONDATA
·
2024-01-10 23:34
ASR
语音识别
人工智能
机器学习
时间序列笔记:SAX(符号集合近似)时间序列表征/
论文笔记
A Symbolic Representation of Time Series, with Implications for Stream
ASymbolicRepresentationofTimeSeries,withImplicationsforStreamingAlgorithms2003将时间序列转换为字符1SAX算法1.1主要符号表示1.2PAA过程沿着时间维度将一个时间序列切分成为w个片段(蓝色——>红色)【一般建议先将将时间序列归一化,然后转换成PAA形式,这个对1.3步有帮助】其中每一个阶段的值是这个阶段里面时间序列值
UQI-LIUWJ
·
2024-01-10 20:01
论文笔记
机器学习
笔记
Python与人工智能
目录编辑一、Python二.使用Python实现人工智能的几个具体案例2.1图像分类2.2自然语言处理2.3
语音识别
2.4推荐系统2.5机器翻译三.以下是使用Python实现的一个具体案例案例:垃圾邮件分类器一
Tech行者
·
2024-01-10 16:55
python学习
python
开发语言
人工智能
uniapp中实现H5录音和上传、实时
语音识别
(兼容App小程序)和波形可视化
文章目录Recorder-UniCore插件特性集成到项目中调用录音上传录音ASR
语音识别
在uniapp中使用Recorder-UniCore插件可以实现跨平台录音功能,uniapp自带的recorderManager
高坚果兄弟
·
2024-01-10 14:20
H5
uni-app
uniapp录音
语音识别
ros学习路线
现在已经学会单片机底层驱动,ros21讲也基本了解请教各位下面的路线该怎么学呢,目前只会c++python单片机底层驱动哪里有教程宇宙爆肝锦标赛冠军先尝试一下Turtlebot吧,导航、路径规划先调用现成的库,还有
语音识别
与合成
baidu_huihui
·
2024-01-10 13:22
学习
ROS
了解一下InternLM2
这些模型在各种任务中展现出惊人的性能,比如自然语言处理、计算机视觉、
语音识别
等。
羞儿
·
2024-01-09 23:51
深度学习
LLM
unity+百度语音ASR&TTS
百度智能云-登录查看自己账号建立的应用和使用情况;参考视频:【
语音识别
接入(unity3d)】(百度智能云-
语音识别
)(有字幕)-tippinggame_哔哩哔哩_bilibili根据视频提供的源码,稍加改造和调试形成如下源码链接
LuckyDog阿祥
·
2024-01-09 22:25
数字人
unity3d
split
asr
tts
u3d对接百度语音
自然语言处理中的语言模型
隐马尔可夫模型(HMM):常用于
语音识别
和某些类型的文本处理。H
天一生水water
·
2024-01-09 20:23
自然语言处理
人工智能
深度学习
国家大力扶持人工智能,再不学习就晚了!
无人驾驶、人脸识别、
语音识别
、实时翻译、智能安防……随着AI技术的不断发展和成熟,似乎每天都会有新的名词和概念提出。
AI女神安娜
·
2024-01-09 16:20
ERNIE: Enhanced Representation through Knowledge Integration
论文笔记
创新点1.maskingBasic-levelMasking:与bert相同,字的maskPhrase-LevelMasking:短语级别的maskEntity-LevelMasking:实体级别的mask2.HeterogenereousCorpusPre-training加入更多语料,中文维基百科、百度百科、百度新闻、百度贴吧。3.DLM(DialogueLanguageModel)对话模型建
大可爱学习
·
2024-01-09 15:19
【机器学习】循环神经网络(四)-应用
五、应用-
语音识别
5.1
语音识别
问题详述
语音识别
的经典方法GMM+HMM框架5.2深度模型详述DNN-HMM结构循环神经网络与CTC技术结构用于
语音识别
问题六、自然语言处理RNN-LM建模方法6.1中文分词
十年一梦实验室
·
2024-01-09 11:36
机器学习
rnn
人工智能
深度学习
神经网络
ParticleSfM:Exploiting Dense Point Trajectories for Localizing Moving Cameras in the Wild——
论文笔记
参考代码:particle-sfm1.概述介绍:基于运动恢复的重建算法其前提假设是所处的是静态场景,但在实际过程中该假设可能是不成立的,这就会导致位姿估计不准确和场景重建出错。为了处理动态场景问题,文章引入视频帧间光流信息作为输入,通过帧间光流信息构建多帧之间初始逐像素传导路径,并由这些路径通过网络推理得到场景中众多路径是否为属于运动物体,同时可以根据路径分类信息得到场景中运动目标的“分割mask
m_buddy
·
2024-01-09 10:51
#
3D
Reconstruction
论文阅读
计算机视觉
人工智能
Adding Conditional Control to Text-to-Image Diffusion Models——【
论文笔记
】
本文发表于ICCV2023论文地址:ICCV2023OpenAccessRepository(thecvf.com)官方实现代码:lllyasviel/ControlNet:Letuscontroldiffusionmodels!(github.com)Abstract论文提出了一种神经网络架构ControlNet,可以将空间条件控制添加到大型的预训练文本到图像扩散模型中。ControlNet将预
我是浮夸
·
2024-01-09 08:20
论文笔记
论文阅读
【
论文笔记
】Summarizing source code with Heterogeneous Syntax Graph and dual position
SummarizingsourcecodewithHeterogeneousSyntaxGraphanddualpositionAbstract1.Introduction2.HSGanddualposition2.1HSGconstruction2.2Codetokenswithdualpositions3.HetSummodel3.1Overview3.2Embeddings3.3.Codet
落啦啦
·
2024-01-09 08:44
代码摘要生成
论文
论文阅读
transformer
轻松玩转书生·浦语大模型趣味 Demo 笔记+作业展示
这些模型在各种任务中展现出惊人的性能,比如自然语言处理、计算机视觉、
语音识别
等。这种
xidierzuo
·
2024-01-09 05:47
笔记
轻松玩转书生·浦语大模型趣味Demo 学习笔记
这些模型在各种任务中展现出惊人的性能,比如自然语言处理、计算机视觉、
语音识别
等。这种模型通常采用深度神经网络结构,如Tr
weixin_42837310
·
2024-01-09 05:46
学习
笔记
浦语大模型趣味 Demo课程学习及实战应用
这些模型在各种任务中展现出惊人的性能,比如自然语言处理、计算机视觉、
语音识别
等。这种模型通常采用深度神经网络结构,如Transformer、BE
m0_54169072
·
2024-01-09 05:15
语言模型
图像处理
动能资讯 | 智能音箱—万物物联新纽带
这些音箱不仅提供音频播放功能,还整合了
语音识别
和智能家居控制等功能。音箱已经从传统的音频设备发展为家庭娱乐系统的核心。通过与智能电视、电脑等设备的连接,智能音箱为家庭提供了全面的解决方案。音箱已
weng13924672287
·
2024-01-08 18:28
ADC音频转换
USB
PA功放
智能音箱
智能家居
嵌入式硬件
物联网
单片机
网络
ChatGPT人工智能对话系统源码:聊天+写文章+写代码 样样精通 附带完整的搭建教程
而ChatGPT作为一种全新的人工智能对话系统,不仅可以进行自然语言处理和
语音识别
,还可以完成写文章和写代码等任务,堪称全能型人工智能助手。
源码集结地
·
2024-01-08 16:14
源码分享
chatgpt
人工智能
ChatGPT人工智能对话系统
ChatGPT人工智能
ChatGPT人工智能对话
ChatGPT人工智能对话源码
解决神经网络过拟合的策略有哪些?
这对于图像和
语音识别
等任务特别有效。3.简化模型:减少网络的
CA&AI-drugdesign
·
2024-01-08 11:24
GPT4
神经网络
人工智能
深度学习
[PyTorch][chapter 9][李宏毅深度学习][CNN]
卷积神经网络的创始人是着名的计算机科学家YannLeCun,目前在Facebook工作,他是第一个通过卷积神经网络在MNIST数据集上解决手写数字问题的人.CNN除了在图像分类,还有一些其它有趣的创意方案:
语音识别
明朝百晓生
·
2024-01-08 10:54
深度学习
pytorch
cnn
iOS 讯飞语音听写(流式版)
最近项目中用到了讯飞的
语音识别
,然后稍微看了一下,里面有几个值得注意的点,记录一下,先说语音听写(流式版),实时语音转写后期会附上,文末有demo//语音听写(流式版)语音听写流式版其实没设么好说的,因为直接有
小谢0217
·
2024-01-07 23:16
Autoregressive Visual Tracking
论文笔记
该论文提出了一个针对视觉目标跟踪的自回归框架,即ARTrack。它将跟踪看作是一个坐标序列解释任务,也就是逐步估计目标轨迹,当前的估计由以前状态所影响,进而影响子序列。这种时间自回归方法对轨迹的顺序演化进行建模从而跨帧跟踪对象。ARTrack的框架如下图所示:先通过编码器嵌入模板和搜索图像的视觉特征,然后,解码器根据先前的估计(时空prompts)以及命令和视觉tokens来解释当前时间t的坐标t
小迷糊~666
·
2024-01-07 21:35
目标跟踪
论文阅读
目标跟踪
工智能基础知识总结--什么是Transformer
Transformer的效果和并行性都非常好,其作为一个整体能被用于机器翻译、
语音识别
、文本摘要等传统Seq2Seq被应用的领域,基于其Enco
北航程序员小C
·
2024-01-07 20:49
人工智能学习专栏
深度学习专栏
机器学习专栏
transformer
深度学习
人工智能
论文笔记
Understanding Electricity-Theft Behavior via Multi-Source Data
WWW2020oral1INTRO1.1背景1.1.1窃电窃电(electricitytheft)指用户为了逃避电费而进行非法操作的一种行为常用的反窃电方法可分为两类:基于硬件驱动的反窃电方法电表开盖检测、集中器检测。。。。硬件驱动的方法响应快,定位准,但需要非常专业的领域知识,同时随着窃电策略的改变会随即失效基于数据驱动的反窃电方法分析用户用电时序曲线、分析台区线损时序曲线数据驱动的方法可以全盘
UQI-LIUWJ
·
2024-01-07 19:37
论文笔记
论文阅读
人工智能(AI)技术对未来餐饮业的深远影响
在前端,智能点餐系统通过
语音识别
或图像识别技术,能够快速准确地接收并处理顾客的点餐需求,减少人为错误,同时降低人力成本。而在后厨,AI可以通过对历史销售数据进行深度
I'm an Engineer
·
2024-01-07 18:40
科技
人工智能
[书生·浦语大模型实战营]——轻松玩转书生·浦语大模型趣味 Demo
这些模型在各种任务中展现出惊人的性能,比如自然语言处理、计算机视觉、
语音识别
等。常用结构这种模型通常采用深度
不是吧这都有重名
·
2024-01-07 16:27
openmmlab系列
人工智能
pytorch
linux
自然语言处理
深度学习
nlp
安卓在人工智能时代的前景展望
无论是
语音识别
、图像识别,还是自
洪信智能
·
2024-01-07 10:44
安卓开发
android
人工智能
搜索引擎
电话质检
语音识别
技术:提升企业效率与质量的新选择
前言介绍电话质检
语音识别
用处:随着通讯技术的发展和人们对质量的不断追求,电话质检
语音识别
技术应运而生。
朝思暮柒
·
2024-01-07 10:12
电话质检语音识别
呼叫中心
语音识别
人工智能
论文浅尝 | 基于微量资源的神经网络跨语言命名实体识别
论文笔记
整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答。
开放知识图谱
·
2024-01-07 09:39
论文浅尝 | 基于属性嵌入的知识图谱实体对齐
论文笔记
整理:王中昊,天津大学硕士,方向:自然语言处理。
开放知识图谱
·
2024-01-07 09:06
论文浅尝 | 基于属性embeddings的跨图谱实体对齐
论文笔记
整理:谭亦鸣,东南大学博士生,研究方向为知识库问答。
开放知识图谱
·
2024-01-07 09:36
语音遥控器2-语音功能实现
调查了一下语音相关代码,不管腾某讯,还是思某驰,一般都会涉及到以下几个部分的工作:对接
语音识别
SDKSdk对接主要是密钥,认证,消息的处理;方案采用Androidrecord原生接口,拾音部分已经在sdk
pochuanpiao
·
2024-01-07 07:46
投影设备基础
android
语音识别
解锁未来商务智能:Saas与AI的协同创新
以下是AI在商务中的典型应用场景:智能客服:利用
语音识别
和自然语
benhuyun_dev
·
2024-01-07 06:54
人工智能
小程序
如何快速进行录音转文字?学会这两招,分分钟提高效率
今天就教大家俩个超级省事的方法,只要你学会录音转文字方法,那么你就能快速实现
语音识别
。方法一:录音机转换手机里的录音机不要放哪落灰,它就能帮助我们进行会议纪要。
夹心说
·
2024-01-07 05:14
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他