声学第13页

第三届声学、振动、噪声控制国际研讨会（CAVNC 2019）

第三届声学、振动、噪声控制国际研讨会（CAVNC2019）The3rdInt’lConferenceonAcoustics,VibrationandNoiseControl(CAVNC2019)http

qq_41812945·2022-09-06 06:45

信息与通信工程——重要国际学术会议和国际顶级期刊（仅供参考）

序号不表示优先顺序）序号/英文名称/英文简称/中文名称/备注1、IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing/ICASAP/IEEE声学

成长Bar·2022-09-06 06:37

再谈回声消除测评丨Dev for Dev 专栏

音频质量的优化是一个复杂的系统工程，回声消除是其中一个老生常谈的话题，一般来说，回声消除的效果受设备本身的声学设计、声学环境、以及软件系统等诸多因素的影响。

·2022-08-26 17:20

走进音视频的世界——mp3封装格式

MP3，全称是MPEGAudioLayer3，利用人耳对高频声音信号不敏感的特性，结合心理声学模型，把时域信号转换为频域信号，并划分多个频段，对不同频段使用不同压缩率进行压缩。

徐福记456·2022-08-09 07:21

工作感怀

忆昔来我院，已有十七年，扎根超声科，院训指向前，医学为人民，职责在心间，领导支持下，倾力展所学，血管超声学，是我本专业，教给所有人，科内开创者，心脏亦擅长，临床多认可，近年做肌骨，又开新专业，其他也熟练

东营孙安华·2022-07-27 00:27

《安富莱嵌入式周报》第274期：2022.07.11--2022.07.17

目录本周更新一期视频教程：视频版：1、借助声学悬浮技术实现非接触式物体组装2、DIY缝纫机3、TI分享的可靠且性价比高的隔离技术应对高电压设计挑战白皮书4、ST消息5、瑞萨发布的工业自动化产品选型指南中文版

硬汉eric2013·2022-07-20 15:59

CTC算法基本原理解释

语音识别中的CTC算法的基本原理解释目前主流的语音识别都大致分为特征提取，声学模型，语音模型几个部分。目前结合神经网络的端到端的声学模型训练方法主要CTC和基于Attention两种。

nicajonh·2022-07-19 07:35

16w行的nginx源码，如何才能读懂呢？全面分析nginx的机制

全面分析nginx的机制丨零声学院官方推广视频C/C++Linux服务器开发精彩内容包括:C/C++，Linux，Nginx，ZeroMQ，MySQL，Redis，MongoDB，ZK，

Linux服务器开发·2022-07-16 07:13

国外部分音乐人工智能/音乐科技研究机构科研项目简介

音乐科技科研机构的科研项目与教学课程设置作简要介绍，包括英国伦敦玛丽女王大学（QueenMary）的数字音乐中心（C4DM）、西班牙巴塞罗那庞培法布拉大学（UPF）的音乐技术研究组（MTG）、美国斯坦福大学的音乐与声学计算机研究中心

SoYouTry·2022-06-28 07:00

小米AI实验室4篇论文入选语音技术顶会INTERSPEECH 2022

高手云集的技术宴，小米工程师究竟在语音、声学技术领域显露哪些高招？论文亮点，都在这里！01

小米技术·2022-06-27 11:27

【深度学习人类语言处理】1 课程介绍、语音辨识1——人类语言处理六种模型、Token、五种Seq2Seq Model(LAS、CTC、RNN-T、Neural Transducer、MoChA)

六种模型与应用1.2.1语音到文本1.2.2文本到语音1.2.3语音到语音1.2.4语音到Class1.2.5文本到文本1.2.6文本到Class1.3更多应用2.语音辨识2.1语音辨识的Token2.2声学特征提取

Yang SiCheng·2022-06-27 07:48

基于SA-Conv-CTC/Attention端到端语音识别模型的基本原理、实现方法和主要流程

2.3SA-Conv-CTC/Attention架构2.4带有SA-LM的混合解码器3.实验3.1数据集介绍3.2实验细节3.3评价准则3.4实验结果4.结论摘要我们知道，传统的语音识别系统分为三大组件，分别是词汇字典、声学模型和语言模型

雷恩Layne·2022-06-27 07:16

强大的端到端语音识别框架—RNN-T

前言：基于联结时序分类(CTC)的声学模型不再需要对训练的音频序列和文本序列进行强制对齐，实际上已经初步具备了端到端的声学模型建模能力。

编程大乐趣·2022-06-27 07:57

李宏毅HLP笔记(二): End-to-End ASR Model (CTC,RNN-T)

原因是每一帧的声学特征往往所占的时间非常短，甚至远小于一个phoneme的长度，因此根据它输出的东西往往不能代表什么。就是用来代表那些无法单独

Trracy·2022-06-27 07:41

对CTC、RNA、RNN-T的理解

首先，二者都是解决时序类问题的CTC(一种损失函数)：传统对于传统语音识别声学模型的训练，每一帧所对应的标签都必须要确定，只有这样才可以对模型进行训练，所以传统方法在训练模型之前必须对数据进行预处理，也就是做语音对齐

浅蓝的爽肤水·2022-06-27 07:12

AI大发展，生物识别技术盘点

在进行人体身份认证时，其主要通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合，利用人体固有的生理特性和行为特征来进行个人身份的鉴定。

�庐隐小娟�·2022-06-23 07:40

一篇文章了解生物特征识别六大技术

来源：赵松科学网博客生物识别技术，通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合，利用人体固有的生理特性（如指纹、脸象、虹膜等）和行为特征（如笔迹、声音、步态等）来进行个人身份的鉴定

人工智能学家·2022-06-23 07:49

基于CQT和PCP的和弦识别算法

基于CQT和PCP的和弦识别算法原理声学基础音乐理论基础音高十二平均律音程与和弦时频转换PCP特征向量过程源代码结语原理声学基础声音是物体振动时产生的波动现象，通过介质传达，最终由人或动物的听觉器官感知声音的特征特性可以通过音量

JasonCaoCJX·2022-06-13 13:03

嵌入式linux 声控,基于Cortex-A9的嵌入式语音识别系统设计

本文从嵌入式语音识别系统的组成分别介绍前端信号处理、声学模型和语言模型等相关技术点

weixin_39972019·2022-06-13 07:34

python gmm em算法 2维数据_AI大语音（九）——基于GMM-HMM的连续语音识别系统（深度解析）...

扫描下方“AI大道理”，选择“关注”公众号上一专题GMM-HMM声学模型中讲述了其理论知识，这一章利用理论搭建一套GMM-HMM系统，来识别连续0123456789的英文语音。

weixin_39958019·2022-06-13 07:33

语音识别维特比解码_AI大语音（九）| 基于GMM-HMM的连续语音识别系统（深度解析）...

扫描下方“AI大道理”，选择“关注”公众号上一专题GMM-HMM声学模型中讲述了其理论知识，这一章利用理论搭建一套GMM-HMM系统，来识别连续0123456789的英文语音。

pendd~~~·2022-06-13 07:30

Kaldi：从零搭建语音识别系统

搭建一个完整的DNN-HMM系统首先需要准备训练数据，包括音频数据、声学数据和语言数据，这些数据需要按照一定的格式准备，完成之后使用训练脚本训练出一个基于三音素的GMM-HMM模型，然后进行强制对齐，之后使用

大桃子技术·2022-06-13 07:27

AI大语音（九）——基于GMM-HMM的连续语音识别系统（深度解析）

上一专题GMM-HMM声学模型中讲述了其理论知识，这一章利用理论搭建一套GMM-HMM系统，来识别连续0123456789的英文语音。本系统是单音素，未涉及后面三音子的训练以及决策树的内容。

AI大道理·2022-06-13 07:26

语音情感识别--语音(声音的预处理)

声音（语音消息）的基本模拟形式是一种称为语音信号的声学波。语音信号可以通过麦克风转化成电信号，转换成语音波形图，如下图为消息"shouldwechase"的波形图。横坐标表示时间，纵坐标表示振幅。

醒了的追梦人·2022-06-10 07:39

语音情感识别--理论篇

常用于语音情感识别研究的声学特征主要有韵律特征，相关谱

醒了的追梦人·2022-06-10 07:09

语音识别结合应用场景之后

语音识别：中国发展中国的语音识别研究起始于1958年，由中国科学院声学所利用电子管电路识别10个元音。直至1973年才由中国科学院声学所开始计算机语音识别。

编程大乐趣·2022-06-07 10:26

可控定向声源——参量阵

1.简介参量阵扬声器（ParametricArrayLoudspeaker,PAL,此文简称参量阵），是一种利用介质的非线性声学效应来产生定向声波的声学系统。

大大大蚂蚁·2022-05-31 17:25

声学感知刻度(mel scale、Bark scale、ERB)与声学特征提取(MFCC、BFCC、GFCC)

梅尔刻度梅尔刻度（Melscale）是一种由听众判断不同频率音高(pitch)彼此相等的感知刻度，表示人耳对等距音高(pitch)变化的感知。mel刻度和正常频率(Hz)之间的参考点是将1kHz，且高于人耳听阈值40分贝以上的基音，定为1000mel。在大约500Hz以上，听者判断越来

凌逆战·2022-05-28 19:00

TensorFlow1.14或TensorFlow2内部获取mfcc原理探索（matlab复现或python复现）

研究者通常采用梅尔频率倒谱系数（MelFrequencyCepstrumCoefficient,简称:MFCC）作为声学特征，让机器学会辨别声音。梅尔（Mel）频率是由研究人员跟据人耳听觉机

booker0415·2022-05-28 07:20

从《和声学教程》配和弦笔记三

《和声学教程》封面三、用正三和弦为旋律配和声给一个声部（旋律或者低音）配上合乎逻辑的、连续的和弦进行，就是为指定的声部配和声。配和声必须以对这个声部的每个音的功能意义，及相互关系和发展的理解为基础。

薛定饿着猫·2022-05-25 20:10

《和声学教程》配和弦笔记一

前言《和声学教程》主要是教给一段旋律，或者低音配四部和声的。

薛定饿着猫·2022-05-25 20:44

[数据分析实践]-音频分析-BirdCLE-2

这种被称为生物声学监测的方法可以为研究濒危鸟类种群提供一种被动的、低成本的、经济的策略。目前处理大型生物声学数据集的方法涉及对每个记录的手工注释。这需要专

浩波的笔记·2022-05-13 22:05

RTC 科普视频丨聊聊空间音频的原理与其背后的声学原理

在现在很多的线上实时互动场景中，我们重视的不仅仅是互动体验，还要提升沉浸感。而在很多场景中，仅凭空间音频技术，就可以带来如临其境的体验。空间音频技术的原理是怎样的呢？看过我们新一期的RTC科普视频，你就知道了。空间音频技术是以算法的方式将现实中的听感，在数字世界中重建了出来。既然是重建，那么要理解这个过程，就需要先了解，现实中，我们是如何通过耳朵、大脑来要感知到一个声音在空间中的位置的。要解决这个

·2022-04-28 22:08

AI大语音（十三）——DNN-HMM （深度解析）

最开始便是DNN代替了GMM来进行观察状态概率的输出，实现DNN-HMM声学模型框架，大大提高了识别率。1GMM-HMM与DNN-HMM对比DNN-HMM用DNN替换了GMM来对输入语

AI大道理·2022-04-25 07:30

语音识别——基于深度学习的中文语音识别系统框架

本文搭建一个完整的中文语音识别系统，包括声学模型和语言模型，能够将输入的音频信号识别为汉字。

hnzwx888·2022-04-25 07:24

【论文学习】《A Survey on Neural Speech Synthesis》

ASurveyonNeuralSpeechSynthesis》论文学习文章目录《ASurveyonNeuralSpeechSynthesis》论文学习摘要1介绍1.1TTS技术的历史1.2调查的组成2TTS中的关键组件2.1主要分类2.2文本分析2.3声学模型

FallenDarkStar·2022-04-18 07:06

【AI视野·今日Sound 声学论文速览第一期】Thu, 14 Apr 2022

AI视野·今日CS.Sound声学论文速览Thu,14Apr2022Totally11papers上期速览✈更多精彩请移步主页Interesting:***声音事件检测SET,(from立命馆大学)dataset

hitrjj·2022-04-18 07:31

《MATLAB语音信号分析与合成（第二版）》：第4章语音信号的线性预测分析

普通预测法和格型预测法功率谱响应的比较4.MATLAB仿真三：FFT频谱和LPC谱的比较5.MATLAB仿真四：LPCC参数匹配6.MATLAB仿真五：LPCC参数匹配小结前言《MATLAB语音信号分析与合成（第二版）》是中科院声学所的

mozun2020·2022-04-16 07:02

2022年4月9日记:Linux服务器开发,Darren,fastdfs架构分析和配置

└————————————┘对你的感情正在充电中，请稍侯…────────────────────────────────────推荐一个零声学院免费公开课程，个人觉得老师讲得不错，分享给大家：[Linux

屯门山鸡叫我小鸡·2022-04-11 15:44

深度学习CV岗位面试问题总结（OCR篇）

PaddleOCR的知识宝藏仓库OCR面试知识点总结1.介绍一下CRNN和CTC的原理CRNN借鉴了语音识别中的LSTM+CTC，不同点是输入进LSTM的特征由语音领域的声学特征，替换为CNN网络提取的图像特征向量

三叔家的猫·2022-04-10 08:28

智能语音技术新发展与发展趋势

针对人类语音的研究是一门典型的交叉学科，涉及声学、听觉、信号处理、语音语言学、生理学、认知科学、

深蓝学院·2022-04-02 10:41

论文翻译：2021_Acoustic Echo Cancellation with Cross-Domain Learning

/graz.pure.elsevier.com/en/publications/acoustic-echo-cancellation-with-cross-domain-learning具有跨域学习的声学回声消除摘要

建人类命运共同体·2022-03-29 09:00

论文翻译：2021_Joint Online Multichannel Acoustic Echo Cancellation, Speech Dereverberation and Source Separation

论文地址：https://arxiv.53yu.com/abs/2104.04325联合在线多通道声学回声消除、语音去混响和声源分离摘要：本文提出了一种联合声源分离算法，可同时减少声学回声、混响和干扰源

建人类命运共同体·2022-03-28 09:00

案例详解：基于工业大数据和工业互联网的离散型智能工厂

1、企业简介深圳市豪恩声学股份有限公司创立于2001年，注册资本总额4168万元，公司在深圳坪山自建工业园区，拥有现代化办公及生产场地3.5万平方米，现有员工2000人，智能机器人近100台，现代化生产车间

慧都科技智能制造·2022-03-25 09:31

论文翻译：2021_论文翻译：2018_F-T-LSTM based Complex Network for Joint Acoustic Echo Cancellation and Speech Enhancement

论文地址：https://arxiv.53yu.com/abs/2106.07577基于F-T-LSTM复杂网络的联合声学回声消除和语音增强摘要随着对音频通信和在线会议的需求日益增加，在包括噪声、混响和非线性失真在内的复杂声学场景下

建人类命运共同体·2022-03-24 17:00

有声学习VS写作变现

昨晚深夜刷了小红书，依然和往常一样，茫茫然不知所措的刷着短视频，一位叫静静教主的博主的一期视频吸引了我。视频的剪辑是这样的：最近停更的这段时间，我生病了，吃着药。我是一个学习型博主，给大家展现的是自律，是美好，是生活原本就应该这样。但是，我确实病了，感觉自己整个人提不起神来，我开始疯狂的半夜刷短视频，用劳累来让自己入睡，我不知道自己怎么了？有时候甚至半夜都想着起来写文案，看数据流量，我因此而循环往

春阳和暖的读写札记·2022-03-21 09:21

磁盘存储链式的 B 树与 B+树

我也要当昏君·2022-03-19 09:50

【18】processing-声音（中文）

从音乐(符号)的写作和转录的发展到音乐表演空间的设计(声学)到乐器的创作,作曲家和音乐家利用人类理解的进步来完善和推进他们的职业。

回避风险666·2022-03-05 15:32

【历史上的今天】3 月 3 日：AT&T 成立；全球最大分布式计算项目正式停止；家酿俱乐部首次会议

为了纪念贝尔的功绩，后世将电学和声学中计量功率或功率密度比值的一种单位命名为“贝尔”。回顾计算机历史

历史上的今天·2022-03-03 12:57

我是一棵孤独的小苗苗

然后请孩子们也小声学着我读，一边读，一边感受：心里有什么感觉？一个孩子说：我很难过。因为他好孤独，没有朋友。一个孩子说：我这里（心口）不舒服，觉得小苗苗可怜。一个孩子说：我想哭。还有一个孩

宁超群·2022-02-21 23:29

推荐频道

声学