声学回声消除第28页

18个实时音视频开发中会用到开源项目

比如，前后处理环节有美颜、滤镜、回声消除、噪声抑制等，采集有麦克风阵列等，编解码有VP8、VP9、H.264、H.265等。

weixin_34261739·2020-06-28 15:39

详解卷积神经网络（CNN）在语音识别中的应用

2012年，微软邓力和俞栋老师将前馈神经网络FFDNN（FeedForwardDeepNeuralNetwork）引入到声学模型建模中，将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率

weixin_34114823·2020-06-28 11:18

浅谈语音测试方案（一）

weixin_34009794·2020-06-28 09:57

【天宝鉴藏】20170528学习力践行D13

用指读法和划读的办法在不同的场景下使用，宝宝对小动物的叫声学习模拟度还是很高的，一路上我们都在小动物的叫声中度过。晚上我们去参加机构的粽子节活动。

宋duck·2020-06-28 09:12

阿里云智能语音交互技术实践干货分享

其中，他主要分享了阿里云使用的BLSTM&LFR声学模型的优化过程，并对基于深度学习的自然语言理解的不同场景进行了详细分享。以下内容根据直播视频整理而成。

weixin_33971205·2020-06-28 09:37

横评：五款免费开源的语音识别工具

直到几年之前，最先进的语音技术方案大多都是以语音为基础的（phonetic-based），包括发音模型（Pronunciationmodels），声学模型（AcousticModelling）和语言模型

weixin_33871366·2020-06-28 07:23

重磅公开！阿里语音识别模型端核心技术，让你“听”见未来

声学模型、语言模型和解码器可以看作是现代语音识别系统最核心的三个组成部分。虽然最近有一些研究者尝试构建End2end的

weixin_33862188·2020-06-28 06:27

悠扬人声，TFZ监听耳机的复古与新意

以优雅有型作为设计起点的TFZ2016春夏季系列定位为突出演唱者深厚情感的人声部分为声学设计灵感，加上精心搭配的全新配色，SERIES1初音系列将声音的真实情感和玩家追求的精致生活方式完美相融，演绎出一场美妙的复古与新意

TFZ监听耳机·2020-06-28 03:42

单独编译和使用webrtc音频回声消除模块(附完整源码+测试音频文件)

可是不知不觉已经把降噪和增益写出来，回声消除如果用户可以得到完美利用也不失为一个很好的方法。但是还是那句话，最好还是全部编译和使用webrtc的整个音频处理模块。另外这篇文章已

weixin_30879833·2020-06-28 02:16

解密回声消除技术--转

一、前言因为工作的关系，笔者从2004年开始接触回声消除(EchoCancellation)技术，而后一直在某大型通讯企业从事与回声消除技术相关的工作，对回声消除这个看似神秘、高端和难以理解的技术领域可谓知之甚详

weixin_30617737·2020-06-27 22:31

音频处理之回声消除及调试经验

回声分为线路回声（lineecho）和声学回声（acousticecho），线路回声主要存在于固话中，是由于2-

weixin_30609287·2020-06-27 22:54

波动方程

波动方程抽象自声学，电磁学，和流体力学等领域。历史上许多科学家，如达朗贝尔、欧拉、丹尼尔·伯努利和拉格朗日等在研究乐器等物体中的弦振动问题时，都对波动方程理论作出过

weixin_30532987·2020-06-27 21:54

周杰伦自创耳机品牌并入小米生态链；雅虎被盗帐号或超１０亿个；“直播鼻祖”Ｍｅｅｒｋａｔ彻底关门

而TiinLab也与1MORE声学实验室合并，取名为“听实验室”。2、远不止5亿：雅虎被盗用户帐号或超10亿个雅虎上周证实公司2014年遭受黑客攻击，致使5亿账户泄露。然而现在有该公司内部人士透

创业说事·2020-06-27 14:44

webRTC——浏览器里的音视频通话

如下图所示，它提供了音视频的采集、处理(降噪，回声消除等)、编解码、传输等技术。

JavaScript_w·2020-06-27 10:36

《在近端对回传音频的检测和抑制》笔记

标签（空格分隔）：未分类综述这个专利是Polycom的一份国际专利，主要是目的是使用信号匹配的方法在远端/扬声器链路（farend）在做一次回声消除。下面图2是其结构图。

灯等等凳·2020-06-27 08:25

回声消除的原理和应用场景

其中不可忽视的一种的干扰是扬声器回声麦克风场（LoudspeakerEchoMicphoneSystem）中的声学回声。

灯等等凳·2020-06-27 08:24

回声消除简单分析

原因：由于需要对webRTC源码中audio_processing模块中回声消除验证，故在此进行模块分析。

qw_stone·2020-06-27 07:49

语音识别学习记录 [kaldi的chain model]

可以将它看作声学模型的一个创新点。使神经网络的输出的帧率缩小三倍，明显的缩小了测试时的计算量，使实时解码更加容易模型从一开始就用序列级目标函数（正确序列概率的对数）进行训练。

WePlayDirty·2020-06-27 07:00

语音识别框架原理简述

gmm-hmm简述基于kaldi工具箱使用kaldi提取特征，重点在于数据准备部分，但是语音识别的基本框架在于使用GMM-HMM进行识别使用kaldi进行语音识别的框架大约分为以下部分在进行语音识别的声学模型训练过程中

执刀人·2020-06-27 04:08

深度学习降噪与回声消除aec 配合的相关分享

1、回声消除aec与降噪ns的关系：a、回声消除与ns的前后关系：回声消除aec与降噪算法之间的衔接问题一直存在，由于回声消除算法的建模基本都是自适应滤波模拟回声路径，为了尽可能缩短路径，确保自适应滤波的准确性

zeark·2020-06-27 04:51

webrtc在民用安防行业中的应用

文章链接：https://zhuanlan.zhihu.com/p/36507637文章目录相似点痛点1.P2P2、回声消除3、网页客户端优点1.P2P2、回声消除3、chrome浏览器免插件访问音视频难点

Stoneshen1211·2020-06-27 00:48

功放(耳机/音箱)声压级计算

基准声压,取对数乘以20倍的一个数值,用dB(分贝)表示,基准声压是固定的.灵敏度:在距率1米,功率输入1W的情况下,测得的声压级值.1.MIC规格书2.MIC灵敏度麦克风的灵敏度是指其输出端对于给定标准声学输入的电气响应

慢慢的燃烧·2020-06-26 21:43

应用案例|清听“治噪”！鸣笛抓拍系统已投入使用日抓拍违法鸣笛近100例

导语清听声学鸣笛抓拍电子警察系统，基于国际先进的声源定位技术，自动排除刹车、引擎、胎噪、电动车喇叭等环境干扰，实时侦测车辆鸣笛声，精准定位鸣笛车辆，自动进行车牌识别、抓拍和车辆跟踪。

达达陈·2020-06-26 18:58

webRTC脱坑笔记（三）— webRTC API之RTCPeerConnection

WebRTC使用的编解码器和协议可以进行大量工作，即使在不可靠的网络上也可以进行实时通信：丢包隐藏回声消除带宽适应性动态抖动缓冲自动增益控制

DebJane·2020-06-26 15:37

实时音视频技术难点及解决方案

有几个比较重要的点：首先是低延迟，如果要满足比较流畅地进行实时互动，那么单向的端到端的迟延大概要在400毫秒以下才能保证流畅沟通;第二点就是流畅性，你也很难想象在视频过程中频繁卡顿会有良好的互动;第三点是回声消除

海水冷却·2020-06-26 10:58

声学模型概述

这篇博客是关于声学模型的简单介绍。输出概率声学模型的输入是由特征提取模块提取的特征（比如mfcc特征）。一般来说，这些特征是多维的向量，并且其取值可以是离散或连续的。

Shmily_Young·2020-06-26 09:13

Kaldi声学模型训练

淘宝购买链接当当购买链接京东购买链接支持标准的基于ML训练的模型线性变换，如LDA，HLDA，MLLT/STC基于fMLLR，MLLR的说话人自适应支持混合系统支持SGMMs基于fMLLR的说话人识别模型代码，可以容易的修改扩展##声学模型训练过程

shichaog·2020-06-26 09:20

语音增强-自适应回声消除

我的书：淘宝购买链接当当购买链接京东购买链接自适应回声消除技术被广泛应用于通信，VoIP和智能机器人设备中。其主要作用是消除设备自身speaker发出的声音，包括语音，音乐等。

shichaog·2020-06-26 09:20

语音识别概述

一个基本的语音识别系统如下图，实现是正常工作流程，虚线是训练模式分类问题中的模板（这里就是声学模型，字典和语言模型）。图1语音识别系统组件关系图语音识别是把语音声波转换成文字。

shichaog·2020-06-26 09:19

北京-某机器智能公司-语音识别算法工程师职位

职位：语音识别算法工程师薪酬：50K参考岗位职责1.负责语音识别技术研究；2.负责声学模型、语言模型、解码器三个方向之一的相关工作。

尹青_653d·2020-06-26 07:45

语音识别中声学模型训练过程-GMM（一）

在上一章语音识别过程中提到的P(O|W)称做观测最大释然，由声学模型计算可得，本章就主要描述HMM+GMM来计算最大释然的过程。

quheDiegooo·2020-06-26 04:30

WebRTC学习总结（1）：本地视频的获取和录制

视频录制简单介绍WebRTC（Real-TimeCommunications）是一个可以在Web应用程序中实现音频、视频和数据的实时通信的开源项目，它封装了很多音视频的采集、处理功能，比如音视频流的编解码、降噪和回声消除等

M＆Q·2020-06-26 03:49

解压神器，南宁马自达CX-5汽车音响改装升级黄金声学

今日到南宁慧声店里的是一位西装革履的刘先生，他的座驾是马自达CX-5，他是一名长时间在外跑业务的销售，出差也是家常便饭，白天里和自己相处时间最多的便是自己的车，而销售压力大，音乐歌唱是先生唯一的缓解压力，放松自我的娱乐休闲方式了。但是，汽车原装的音响给不了先生所需的满足感，原装汽车音响播放音乐平平，所有声音都好象画在一张纸上，毫无立体感。刘先生尝试过自己去调试设置音效，结果还是差强人意，经过查询和

南宁慧声汽车音响改装同盟腾声店·2020-06-26 02:09

音视频编解码类开源项目的18个实时

比如，前后处理环节有美颜、滤镜、回声消除、噪声抑制等，采集有麦克风阵列等，编解码有VP8、VP9、H.264、H.265等。

Linux高级开发·2020-06-25 23:17

Pr音频效果（六）：混响类

基于卷积的混响使用脉冲文件模拟声学空间。结果难以置信地真实和栩栩如生。脉冲文件的源包括您录制的环境空间的音频，或在线提供的脉冲集合。

醴泉行者·2020-06-25 19:59

语音识别综述解析深度学习

一个完整的语音识别系统通常包括信息处理和特征提取、声学模型、语言模型和解码搜索四个模块。

靡荼归否·2020-06-25 18:35

作为一个果粉，这次我挺小米

官方给出的说法是：陶瓷声学系统替代传统听筒超声波替代传统红外距离感应器微型前置相机，体积缩小50％定制的17：9屏幕，硬件级圆角设计图片来源：小米官网

芳小哇Zofia·2020-06-25 16:19

过拟合和欠拟合及其解决方法

过拟合是指学习时选择的模型所包含的参数过多，出现对已知数据预测很好，对未知数据预测很差的现象(过拟合表现为高方差)；过拟合产生原因：1.训练集有噪声学习算法试图尽可能正确分类训练样本，当噪声数量在训练集中占有相当大的比例时

小颜学人工智能·2020-06-25 10:21

【算法研究】 AEC 回音消除算法

声学回音即延迟大于50ms，衰减小于45dB的回声。

Jacob C Chen·2020-06-25 05:49

基于tensorflow和deepspeech的中文语音识别模型，训练+部署

工业级中文语音识别系统，电子书，点我文章目录项目背景一、和百度deepspeech2的不同点1.框架选择2.声学模型结构3.其他调整项4.增加beamsearch和n-gram组合解码模块（这里是重点）

大数据AI笔记·2020-06-25 04:27

掌握音频开发基础知识

文章目录基本概念几种CODEC介绍实时调度相关缓冲区两种类型编写要点遇到的问题解码能力的自适应混音模块回声消除的延时控制能量统计双声道支持ALSA设备代码相关基本概念采样率(Hz):每秒去取样本的个数，

Witness__·2020-06-25 02:07

说话人识别matlab实现

1、GMM-UBM说话人识别这里主要分为4个步骤：1、训练UBM通用背景模型2、最大后验准则MAP从UBM通用背景模型里面训练每一个说话人的声学模型3、交叉得分4、计算最终的测试效果，这里用AUC和EER

我是个粉刷匠·2020-06-25 00:22

端到端多语言识别语言不变性瓶颈特征

LANGUAGE-INVARIANTBOTTLENECKFEATURESFROMADVERSARIALEND-TO-ENDACOUSTICMODELSFORLOWRESOURCESPEECHRECOGNITION针对低资源语音识别的端到端对抗性声学模型的语言不变瓶颈特性本文提出了一种针对低资源语言的端到端对抗性声学模型

qing101hua·2020-06-24 22:46

探索无需再训练的句间混杂识别

由于缺乏多语言训练数据来构建新的、特殊的多语言声学和语言模型，使得代码切换问题变得复杂。在这项工作中，我们提出一个原型研究语码转换语音识别系统，利用现有的单语声学和

qing101hua·2020-06-24 22:45

开源的语音交互平台简介及对比

CMU-SphinxCMU-Sphinx也简称为Sphinx（狮身人面像），是卡内基-梅隆大学（CarnegieMellonUniversity，CMU）开发的一款开源的语音识别系统，它包括一系列的语音识别器和声学模型训练工具

哦卖糕·2020-06-24 18:46

语音识别-语言模型

~~~~一句话，语音识别中语言模型的目的就是根据声学模型输出的结果，给出概率最大的文字序列！~~~2.n-gram语言模型1

机器灵·2020-06-24 18:07

语音识别-字典

所谓字典，就是发音字典的意思，中文中就是拼音与汉字的对应，英文中就是音标与单词的对应，其目的是根据声学模型识别出来的音素，来找到对应的汉字（词）或者单词，用来在声学模型和语言模型建立桥梁，将两者联系起来

机器灵·2020-06-24 18:34

我对说话人识别/声纹识别的研究综述

GMM-UBM系统框架最初用的特征是声学特征MFCC，这个东西我不太熟，只知道它是从wav或者其它格式语音文件直接提出。有了特征就可以建立模型了，这里我们的模型叫做“高斯混合模型”。

Orange先生·2020-06-24 17:32

一个简单的波形包络提取算法

2014年07月29日11:23:15liyuanbhu阅读数：21191更多个人分类：机械故障声学诊断数字信号处理最近做项目要提取一个声音信号的包络波形，所以花了点时间研究各种包络提取的算法。

飞向蓝天2·2020-06-24 17:37

推荐频道

声学回声消除