E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
声学
第三届
声学
、振动、噪声控制国际研讨会(CAVNC 2019)
第三届
声学
、振动、噪声控制国际研讨会(CAVNC2019)The3rdInt’lConferenceonAcoustics,VibrationandNoiseControl(CAVNC2019)http
qq_41812945
·
2022-09-06 06:45
信息与通信工程——重要国际学术会议和国际顶级期刊(仅供参考)
序号不表示优先顺序)序号/英文名称/英文简称/中文名称/备注1、IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing/ICASAP/IEEE
声学
成长Bar
·
2022-09-06 06:37
others
信息与通信工程
国际会议
国际杂志
期刊
再谈回声消除测评丨Dev for Dev 专栏
音频质量的优化是一个复杂的系统工程,回声消除是其中一个老生常谈的话题,一般来说,回声消除的效果受设备本身的
声学
设计、
声学
环境、以及软件系统等诸多因素的影响。
·
2022-08-26 17:20
音频人工智能
走进音视频的世界——mp3封装格式
MP3,全称是MPEGAudioLayer3,利用人耳对高频声音信号不敏感的特性,结合心理
声学
模型,把时域信号转换为频域信号,并划分多个频段,对不同频段使用不同压缩率进行压缩。
徐福记456
·
2022-08-09 07:21
音视频开发
音视频
工作感怀
忆昔来我院,已有十七年,扎根超声科,院训指向前,医学为人民,职责在心间,领导支持下,倾力展所学,血管超
声学
,是我本专业,教给所有人,科内开创者,心脏亦擅长,临床多认可,近年做肌骨,又开新专业,其他也熟练
东营孙安华
·
2022-07-27 00:27
《安富莱嵌入式周报》第274期:2022.07.11--2022.07.17
目录本周更新一期视频教程:视频版:1、借助
声学
悬浮技术实现非接触式物体组装2、DIY缝纫机3、TI分享的可靠且性价比高的隔离技术应对高电压设计挑战白皮书4、ST消息5、瑞萨发布的工业自动化产品选型指南中文版
硬汉eric2013
·
2022-07-20 15:59
嵌入式周报
单片机
stm32
嵌入式硬件
CTC算法基本原理解释
语音识别中的CTC算法的基本原理解释目前主流的语音识别都大致分为特征提取,
声学
模型,语音模型几个部分。目前结合神经网络的端到端的
声学
模型训练方法主要CTC和基于Attention两种。
nicajonh
·
2022-07-19 07:35
机器学习与深度学习
深度学习
语音处理
16w行的nginx源码,如何才能读懂呢?全面分析nginx的机制
全面分析nginx的机制丨零
声学
院官方推广视频C/C++Linux服务器开发精彩内容包括:C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,MongoDB,ZK,
Linux服务器开发
·
2022-07-16 07:13
Linux服务器开发
后端开发
redis
Nginx
Nginx源码
Linux服务器开发
后端开发
web服务器
国外部分音乐人工智能/音乐科技研究机构科研项目简介
音乐科技科研机构的科研项目与教学课程设置作简要介绍,包括英国伦敦玛丽女王大学(QueenMary)的数字音乐中心(C4DM)、西班牙巴塞罗那庞培法布拉大学(UPF)的音乐技术研究组(MTG)、美国斯坦福大学的音乐与
声学
计算机研究中心
SoYouTry
·
2022-06-28 07:00
音频音乐技术
总结
人工智能
科技
小米AI实验室4篇论文入选语音技术顶会INTERSPEECH 2022
高手云集的技术宴,小米工程师究竟在语音、
声学
技术领域显露哪些高招?论文亮点,都在这里!01
小米技术
·
2022-06-27 11:27
算法
大数据
编程语言
机器学习
人工智能
【深度学习人类语言处理】1 课程介绍、语音辨识1——人类语言处理六种模型、Token、五种Seq2Seq Model(LAS、CTC、RNN-T、Neural Transducer、MoChA)
六种模型与应用1.2.1语音到文本1.2.2文本到语音1.2.3语音到语音1.2.4语音到Class1.2.5文本到文本1.2.6文本到Class1.3更多应用2.语音辨识2.1语音辨识的Token2.2
声学
特征提取
Yang SiCheng
·
2022-06-27 07:48
【课程学习】
自然语言处理
人工智能
深度学习
nlp
机器学习
基于SA-Conv-CTC/Attention端到端语音识别模型的基本原理、实现方法和主要流程
2.3SA-Conv-CTC/Attention架构2.4带有SA-LM的混合解码器3.实验3.1数据集介绍3.2实验细节3.3评价准则3.4实验结果4.结论摘要我们知道,传统的语音识别系统分为三大组件,分别是词汇字典、
声学
模型和语言模型
雷恩Layne
·
2022-06-27 07:16
机器学习&深度学习
attention
语音识别
强大的端到端语音识别框架—RNN-T
前言:基于联结时序分类(CTC)的
声学
模型不再需要对训练的音频序列和文本序列进行强制对齐,实际上已经初步具备了端到端的
声学
模型建模能力。
编程大乐趣
·
2022-06-27 07:57
李宏毅HLP笔记(二): End-to-End ASR Model (CTC,RNN-T)
原因是每一帧的
声学
特征往往所占的时间非常短,甚至远小于一个phoneme的长度,因此根据它输出的东西往往不能代表什么。就是用来代表那些无法单独
Trracy
·
2022-06-27 07:41
End-to-End
ASR
语音识别
深度学习
对CTC、RNA、RNN-T的理解
首先,二者都是解决时序类问题的CTC(一种损失函数):传统对于传统语音识别
声学
模型的训练,每一帧所对应的标签都必须要确定,只有这样才可以对模型进行训练,所以传统方法在训练模型之前必须对数据进行预处理,也就是做语音对齐
浅蓝的爽肤水
·
2022-06-27 07:12
神经网络
机器学习
AI大发展,生物识别技术盘点
在进行人体身份认证时,其主要通过计算机与光学、
声学
、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性和行为特征来进行个人身份的鉴定。
�庐隐小娟�
·
2022-06-23 07:40
人工智能更
步态识别
AI科技
识别
步态识别
盈力科技
安防
一篇文章了解生物特征识别六大技术
来源:赵松科学网博客生物识别技术,通过计算机与光学、
声学
、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性(如指纹、脸象、虹膜等)和行为特征(如笔迹、声音、步态等)来进行个人身份的鉴定
人工智能学家
·
2022-06-23 07:49
基于CQT和PCP的和弦识别算法
基于CQT和PCP的和弦识别算法原理
声学
基础音乐理论基础音高十二平均律音程与和弦时频转换PCP特征向量过程源代码结语原理
声学
基础声音是物体振动时产生的波动现象,通过介质传达,最终由人或动物的听觉器官感知声音的特征特性可以通过音量
JasonCaoCJX
·
2022-06-13 13:03
python算法设计
算法
人工智能
python
嵌入式linux 声控,基于Cortex-A9的嵌入式语音识别系统设计
本文从嵌入式语音识别系统的组成分别介绍前端信号处理、
声学
模型和语言模型等相关技术点
weixin_39972019
·
2022-06-13 07:34
嵌入式linux
声控
python gmm em算法 2维数据_AI大语音(九)——基于GMM-HMM的连续语音识别系统(深度解析)...
扫描下方“AI大道理”,选择“关注”公众号上一专题GMM-HMM
声学
模型中讲述了其理论知识,这一章利用理论搭建一套GMM-HMM系统,来识别连续0123456789的英文语音。
weixin_39958019
·
2022-06-13 07:33
python
gmm
em算法
2维数据
网络管理员在预先分配和识别作为
语音识别维特比解码_AI大语音(九)| 基于GMM-HMM的连续语音识别系统(深度解析)...
扫描下方“AI大道理”,选择“关注”公众号上一专题GMM-HMM
声学
模型中讲述了其理论知识,这一章利用理论搭建一套GMM-HMM系统,来识别连续0123456789的英文语音。
pendd~~~
·
2022-06-13 07:30
语音识别维特比解码
Kaldi:从零搭建语音识别系统
搭建一个完整的DNN-HMM系统首先需要准备训练数据,包括音频数据、
声学
数据和语言数据,这些数据需要按照一定的格式准备,完成之后使用训练脚本训练出一个基于三音素的GMM-HMM模型,然后进行强制对齐,之后使用
大桃子技术
·
2022-06-13 07:27
AI大语音(九)——基于GMM-HMM的连续语音识别系统(深度解析)
上一专题GMM-HMM
声学
模型中讲述了其理论知识,这一章利用理论搭建一套GMM-HMM系统,来识别连续0123456789的英文语音。本系统是单音素,未涉及后面三音子的训练以及决策树的内容。
AI大道理
·
2022-06-13 07:26
语音识别(ASR)
人工智能
语音识别
算法
语音情感识别--语音(声音的预处理)
声音(语音消息)的基本模拟形式是一种称为语音信号的
声学
波。语音信号可以通过麦克风转化成电信号,转换成语音波形图,如下图为消息"shouldwechase"的波形图。横坐标表示时间,纵坐标表示振幅。
醒了的追梦人
·
2022-06-10 07:39
语音识别
语音情感识别
声音的预处理
语音
语音情感识别--理论篇
常用于语音情感识别研究的
声学
特征主要有韵律特征,相关谱
醒了的追梦人
·
2022-06-10 07:09
机器学习and深度学习
语音识别
Python
语音情感识别
理论篇
语音识别结合应用场景之后
语音识别:中国发展中国的语音识别研究起始于1958年,由中国科学院
声学
所利用电子管电路识别10个元音。直至1973年才由中国科学院
声学
所开始计算机语音识别。
编程大乐趣
·
2022-06-07 10:26
可控定向声源——参量阵
1.简介参量阵扬声器(ParametricArrayLoudspeaker,PAL,此文简称参量阵),是一种利用介质的非线性
声学
效应来产生定向声波的
声学
系统。
大大大蚂蚁
·
2022-05-31 17:25
声学
感知刻度(mel scale、Bark scale、ERB)与
声学
特征提取(MFCC、BFCC、GFCC)
梅尔刻度梅尔刻度(Melscale)是一种由听众判断不同频率音高(pitch)彼此相等的感知刻度,表示人耳对等距音高(pitch)变化的感知。mel刻度和正常频率(Hz)之间的参考点是将1kHz,且高于人耳听阈值40分贝以上的基音,定为1000mel。在大约500Hz以上,听者判断越来
凌逆战
·
2022-05-28 19:00
TensorFlow1.14或TensorFlow2内部获取mfcc原理探索(matlab复现或python复现)
研究者通常采用梅尔频率倒谱系数(MelFrequencyCepstrumCoefficient,简称:MFCC)作为
声学
特征,让机器学会辨别声音。梅尔(Mel)频率是由研究人员跟据人耳听觉机
booker0415
·
2022-05-28 07:20
mfcc
语音算法
python
matlab
从《和
声学
教程》配和弦笔记 三
《和
声学
教程》封面三、用正三和弦为旋律配和声给一个声部(旋律或者低音)配上合乎逻辑的、连续的和弦进行,就是为指定的声部配和声。配和声必须以对这个声部的每个音的功能意义,及相互关系和发展的理解为基础。
薛定饿着猫
·
2022-05-25 20:10
《和
声学
教程》配和弦笔记 一
前言《和
声学
教程》主要是教给一段旋律,或者低音配四部和声的。
薛定饿着猫
·
2022-05-25 20:44
[数据分析实践]-音频分析-BirdCLE-2
这种被称为生物
声学
监测的方法可以为研究濒危鸟类种群提供一种被动的、低成本的、经济的策略。目前处理大型生物
声学
数据集的方法涉及对每个记录的手工注释。这需要专
浩波的笔记
·
2022-05-13 22:05
RTC 科普视频丨聊聊空间音频的原理与其背后的
声学
原理
在现在很多的线上实时互动场景中,我们重视的不仅仅是互动体验,还要提升沉浸感。而在很多场景中,仅凭空间音频技术,就可以带来如临其境的体验。空间音频技术的原理是怎样的呢?看过我们新一期的RTC科普视频,你就知道了。空间音频技术是以算法的方式将现实中的听感,在数字世界中重建了出来。既然是重建,那么要理解这个过程,就需要先了解,现实中,我们是如何通过耳朵、大脑来要感知到一个声音在空间中的位置的。要解决这个
·
2022-04-28 22:08
音频人工智能
AI大语音(十三)——DNN-HMM (深度解析)
最开始便是DNN代替了GMM来进行观察状态概率的输出,实现DNN-HMM
声学
模型框架,大大提高了识别率。1GMM-HMM与DNN-HMM对比DNN-HMM用DNN替换了GMM来对输入语
AI大道理
·
2022-04-25 07:30
语音识别(ASR)
深度学习
神经网络
算法
人工智能
语音识别
语音识别——基于深度学习的中文语音识别系统框架
本文搭建一个完整的中文语音识别系统,包括
声学
模型和语言模型,能够将输入的音频信号识别为汉字。
hnzwx888
·
2022-04-25 07:24
人工智能
语音识别
声学模型
语言模型
【论文学习】《A Survey on Neural Speech Synthesis》
ASurveyonNeuralSpeechSynthesis》论文学习文章目录《ASurveyonNeuralSpeechSynthesis》论文学习摘要1介绍1.1TTS技术的历史1.2调查的组成2TTS中的关键组件2.1主要分类2.2文本分析2.3
声学
模型
FallenDarkStar
·
2022-04-18 07:06
语音伪造
TTS
survey
artificial
neural
network
深度学习
【AI视野·今日Sound
声学
论文速览 第一期】Thu, 14 Apr 2022
AI视野·今日CS.Sound
声学
论文速览Thu,14Apr2022Totally11papers上期速览✈更多精彩请移步主页Interesting:***声音事件检测SET,(from立命馆大学)dataset
hitrjj
·
2022-04-18 07:31
Papers
Sound
音视频
音视频学习
结构健康监测
振动模型
声音信号处理
《MATLAB语音信号分析与合成(第二版)》:第4章 语音信号的线性预测分析
普通预测法和格型预测法功率谱响应的比较4.MATLAB仿真三:FFT频谱和LPC谱的比较5.MATLAB仿真四:LPCC参数匹配6.MATLAB仿真五:LPCC参数匹配小结前言《MATLAB语音信号分析与合成(第二版)》是中科院
声学
所的
mozun2020
·
2022-04-16 07:02
MATLAB语音信号分析与合成
语音识别
LPCC
线性预测系数
MATLAB语音信号分析
语音信号分析
2022年4月9日记:Linux服务器开发,Darren,fastdfs架构分析和配置
└————————————┘对你的感情正在充电中,请稍侯…────────────────────────────────────推荐一个零
声学
院免费公开课程,个人觉得老师讲得不错,分享给大家:[Linux
屯门山鸡叫我小鸡
·
2022-04-11 15:44
linux
深度学习CV岗位面试问题总结(OCR篇)
PaddleOCR的知识宝藏仓库OCR面试知识点总结1.介绍一下CRNN和CTC的原理CRNN借鉴了语音识别中的LSTM+CTC,不同点是输入进LSTM的特征由语音领域的
声学
特征,替换为CNN网络提取的图像特征向量
三叔家的猫
·
2022-04-10 08:28
OCR
算法
计算机视觉
智能语音技术新发展与发展趋势
针对人类语音的研究是一门典型的交叉学科,涉及
声学
、听觉、信号处理、语音语言学、生理学、认知科学、
深蓝学院
·
2022-04-02 10:41
智能语音
语音识别
人工智能
机器学习
论文翻译:2021_Acoustic Echo Cancellation with Cross-Domain Learning
/graz.pure.elsevier.com/en/publications/acoustic-echo-cancellation-with-cross-domain-learning具有跨域学习的
声学
回声消除摘要
建人类命运共同体
·
2022-03-29 09:00
论文翻译:2021_Joint Online Multichannel Acoustic Echo Cancellation, Speech Dereverberation and Source Separation
论文地址:https://arxiv.53yu.com/abs/2104.04325联合在线多通道
声学
回声消除、语音去混响和声源分离摘要:本文提出了一种联合声源分离算法,可同时减少
声学
回声、混响和干扰源
建人类命运共同体
·
2022-03-28 09:00
案例详解:基于工业大数据和工业互联网的离散型智能工厂
1、企业简介深圳市豪恩
声学
股份有限公司创立于2001年,注册资本总额4168万元,公司在深圳坪山自建工业园区,拥有现代化办公及生产场地3.5万平方米,现有员工2000人,智能机器人近100台,现代化生产车间
慧都科技智能制造
·
2022-03-25 09:31
智能工厂建设
解决方案
论文翻译:2021_论文翻译:2018_F-T-LSTM based Complex Network for Joint Acoustic Echo Cancellation and Speech Enhancement
论文地址:https://arxiv.53yu.com/abs/2106.07577基于F-T-LSTM复杂网络的联合
声学
回声消除和语音增强摘要随着对音频通信和在线会议的需求日益增加,在包括噪声、混响和非线性失真在内的复杂
声学
场景下
建人类命运共同体
·
2022-03-24 17:00
有
声学
习VS写作变现
昨晚深夜刷了小红书,依然和往常一样,茫茫然不知所措的刷着短视频,一位叫静静教主的博主的一期视频吸引了我。视频的剪辑是这样的:最近停更的这段时间,我生病了,吃着药。我是一个学习型博主,给大家展现的是自律,是美好,是生活原本就应该这样。但是,我确实病了,感觉自己整个人提不起神来,我开始疯狂的半夜刷短视频,用劳累来让自己入睡,我不知道自己怎么了?有时候甚至半夜都想着起来写文案,看数据流量,我因此而循环往
春阳和暖的读写札记
·
2022-03-21 09:21
磁盘存储链式的 B 树与 B+树
推荐一个零
声学
院免费公开课程,个人觉得老师讲得不错,分享给大家:Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker
我也要当昏君
·
2022-03-19 09:50
面试简历
b树
数据结构
【18】processing-声音(中文)
从音乐(符号)的写作和转录的发展到音乐表演空间的设计(
声学
)到乐器的创作,作曲家和音乐家利用人类理解的进步来完善和推进他们的职业。
回避风险666
·
2022-03-05 15:32
processing官方教程
processing
【历史上的今天】3 月 3 日:AT&T 成立;全球最大分布式计算项目正式停止;家酿俱乐部首次会议
为了纪念贝尔的功绩,后世将电学和
声学
中计量功率或功率密度比值的一种单位命名为“贝尔”。回顾计算机历史
历史上的今天
·
2022-03-03 12:57
历史上的今天
历史上的今天
电话
分布式
计算机
通信技术
我是一棵孤独的小苗苗
然后请孩子们也小
声学
着我读,一边读,一边感受:心里有什么感觉?一个孩子说:我很难过。因为他好孤独,没有朋友。一个孩子说:我这里(心口)不舒服,觉得小苗苗可怜。一个孩子说:我想哭。还有一个孩
宁超群
·
2022-02-21 23:29
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他