E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
声学回声消除
18个实时音视频开发中会用到开源项目
比如,前后处理环节有美颜、滤镜、
回声消除
、噪声抑制等,采集有麦克风阵列等,编解码有VP8、VP9、H.264、H.265等。
weixin_34261739
·
2020-06-28 15:39
详解卷积神经网络(CNN)在语音识别中的应用
2012年,微软邓力和俞栋老师将前馈神经网络FFDNN(FeedForwardDeepNeuralNetwork)引入到
声学
模型建模中,将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率
weixin_34114823
·
2020-06-28 11:18
浅谈语音测试方案(一)
目前国内研究语音相关的团队主要包括科研院所、语音技术公司以及互联网公司三部分:科研院所主要包括高校和科学院,比如科学院里有
声学
所、自动化所,高校里面研究比较多的清华、北大、西工大、
weixin_34009794
·
2020-06-28 09:57
【天宝鉴藏】20170528学习力践行D13
用指读法和划读的办法在不同的场景下使用,宝宝对小动物的叫
声学
习模拟度还是很高的,一路上我们都在小动物的叫声中度过。晚上我们去参加机构的粽子节活动。
宋duck
·
2020-06-28 09:12
阿里云智能语音交互技术实践干货分享
其中,他主要分享了阿里云使用的BLSTM&LFR
声学
模型的优化过程,并对基于深度学习的自然语言理解的不同场景进行了详细分享。以下内容根据直播视频整理而成。
weixin_33971205
·
2020-06-28 09:37
横评:五款免费开源的语音识别工具
直到几年之前,最先进的语音技术方案大多都是以语音为基础的(phonetic-based),包括发音模型(Pronunciationmodels),
声学
模型(AcousticModelling)和语言模型
weixin_33871366
·
2020-06-28 07:23
重磅公开!阿里语音识别模型端核心技术,让你“听”见未来
声学
模型、语言模型和解码器可以看作是现代语音识别系统最核心的三个组成部分。虽然最近有一些研究者尝试构建End2end的
weixin_33862188
·
2020-06-28 06:27
悠扬人声,TFZ监听耳机的复古与新意
以优雅有型作为设计起点的TFZ2016春夏季系列定位为突出演唱者深厚情感的人声部分为
声学
设计灵感,加上精心搭配的全新配色,SERIES1初音系列将声音的真实情感和玩家追求的精致生活方式完美相融,演绎出一场美妙的复古与新意
TFZ监听耳机
·
2020-06-28 03:42
单独编译和使用webrtc音频
回声消除
模块(附完整源码+测试音频文件)
可是不知不觉已经把降噪和增益写出来,
回声消除
如果用户可以得到完美利用也不失为一个很好的方法。但是还是那句话,最好还是全部编译和使用webrtc的整个音频处理模块。另外这篇文章已
weixin_30879833
·
2020-06-28 02:16
解密
回声消除
技术--转
一、前言因为工作的关系,笔者从2004年开始接触
回声消除
(EchoCancellation)技术,而后一直在某大型通讯企业从事与
回声消除
技术相关的工作,对
回声消除
这个看似神秘、高端和难以理解的技术领域可谓知之甚详
weixin_30617737
·
2020-06-27 22:31
音频处理之
回声消除
及调试经验
回声分为线路回声(lineecho)和
声学
回声(acousticecho),线路回声主要存在于固话中,是由于2-
weixin_30609287
·
2020-06-27 22:54
波动方程
波动方程抽象自
声学
,电磁学,和流体力学等领域。历史上许多科学家,如达朗贝尔、欧拉、丹尼尔·伯努利和拉格朗日等在研究乐器等物体中的弦振动问题时,都对波动方程理论作出过
weixin_30532987
·
2020-06-27 21:54
周杰伦自创耳机品牌并入小米生态链;雅虎被盗帐号或超10亿个;“直播鼻祖”Meerkat彻底关门
而TiinLab也与1MORE
声学
实验室合并,取名为“听实验室”。2、远不止5亿:雅虎被盗用户帐号或超10亿个雅虎上周证实公司2014年遭受黑客攻击,致使5亿账户泄露。然而现在有该公司内部人士透
创业说事
·
2020-06-27 14:44
webRTC——浏览器里的音视频通话
如下图所示,它提供了音视频的采集、处理(降噪,
回声消除
等)、编解码、传输等技术。
JavaScript_w
·
2020-06-27 10:36
《在近端对回传音频的检测和抑制》笔记
标签(空格分隔):未分类综述这个专利是Polycom的一份国际专利,主要是目的是使用信号匹配的方法在远端/扬声器链路(farend)在做一次
回声消除
。下面图2是其结构图。
灯等等凳
·
2020-06-27 08:25
音频架构通用技术
声学回声消除
读书笔记
专利
回声消除
阅读笔记
回声消除
的原理和应用场景
其中不可忽视的一种的干扰是扬声器回声麦克风场(LoudspeakerEchoMicphoneSystem)中的
声学
回声。
灯等等凳
·
2020-06-27 08:24
声学回声消除
回声消除
简单分析
原因:由于需要对webRTC源码中audio_processing模块中
回声消除
验证,故在此进行模块分析。
qw_stone
·
2020-06-27 07:49
WebRTC
语音识别学习记录 [kaldi的chain model]
可以将它看作
声学
模型的一个创新点。使神经网络的输出的帧率缩小三倍,明显的缩小了测试时的计算量,使实时解码更加容易模型从一开始就用序列级目标函数(正确序列概率的对数)进行训练。
WePlayDirty
·
2020-06-27 07:00
kaldi
ASR
语音识别框架原理简述
gmm-hmm简述基于kaldi工具箱使用kaldi提取特征,重点在于数据准备部分,但是语音识别的基本框架在于使用GMM-HMM进行识别使用kaldi进行语音识别的框架大约分为以下部分在进行语音识别的
声学
模型训练过程中
执刀人
·
2020-06-27 04:08
语音识别
深度学习降噪 与
回声消除
aec 配合的相关分享
1、
回声消除
aec与降噪ns的关系:a、
回声消除
与ns的前后关系:
回声消除
aec与降噪算法之间的衔接问题一直存在,由于
回声消除
算法的建模基本都是自适应滤波模拟回声路径,为了尽可能缩短路径,确保自适应滤波的准确性
zeark
·
2020-06-27 04:51
降噪
回声消除
深度学习
webrtc在民用安防行业中的应用
文章链接:https://zhuanlan.zhihu.com/p/36507637文章目录相似点痛点1.P2P2、
回声消除
3、网页客户端优点1.P2P2、
回声消除
3、chrome浏览器免插件访问音视频难点
Stoneshen1211
·
2020-06-27 00:48
音视频相关
功放(耳机/音箱)声压级计算
基准声压,取对数乘以20倍的一个数值,用dB(分贝)表示,基准声压是固定的.灵敏度:在距率1米,功率输入1W的情况下,测得的声压级值.1.MIC规格书2.MIC灵敏度麦克风的灵敏度是指其输出端对于给定标准
声学
输入的电气响应
慢慢的燃烧
·
2020-06-26 21:43
Android音频进阶
应用案例|清听“治噪”!鸣笛抓拍系统已投入使用 日抓拍违法鸣笛近100例
导语清听
声学
鸣笛抓拍电子警察系统,基于国际先进的声源定位技术,自动排除刹车、引擎、胎噪、电动车喇叭等环境干扰,实时侦测车辆鸣笛声,精准定位鸣笛车辆,自动进行车牌识别、抓拍和车辆跟踪。
达达陈
·
2020-06-26 18:58
webRTC脱坑笔记(三)— webRTC API之RTCPeerConnection
WebRTC使用的编解码器和协议可以进行大量工作,即使在不可靠的网络上也可以进行实时通信:丢包隐藏
回声消除
带宽适应性动态抖动缓冲自动增益控制
DebJane
·
2020-06-26 15:37
webRTC
推荐系统论文阅读——Neural Collaborative Filtering
www.cnblogs.com/HolyShine/p/6728999.html尽管最近的一些工作已经把深度学习运用到了推荐的任务当中,但只是用深度学习给一些辅助的信息建模,例如项目的文字描述或音乐的
声学
特征等等
StarCoo
·
2020-06-26 14:26
推荐系统
实时音视频技术难点及解决方案
有几个比较重要的点:首先是低延迟,如果要满足比较流畅地进行实时互动,那么单向的端到端的迟延大概要在400毫秒以下才能保证流畅沟通;第二点就是流畅性,你也很难想象在视频过程中频繁卡顿会有良好的互动;第三点是
回声消除
海水冷却
·
2020-06-26 10:58
技术
声学
模型概述
这篇博客是关于
声学
模型的简单介绍。输出概率
声学
模型的输入是由特征提取模块提取的特征(比如mfcc特征)。一般来说,这些特征是多维的向量,并且其取值可以是离散或连续的。
Shmily_Young
·
2020-06-26 09:13
语音识别
Kaldi
声学
模型训练
淘宝购买链接当当购买链接京东购买链接支持标准的基于ML训练的模型线性变换,如LDA,HLDA,MLLT/STC基于fMLLR,MLLR的说话人自适应支持混合系统支持SGMMs基于fMLLR的说话人识别模型代码,可以容易的修改扩展##
声学
模型训练过程
shichaog
·
2020-06-26 09:20
语音识别
语音增强-自适应
回声消除
我的书:淘宝购买链接当当购买链接京东购买链接自适应
回声消除
技术被广泛应用于通信,VoIP和智能机器人设备中。其主要作用是消除设备自身speaker发出的声音,包括语音,音乐等。
shichaog
·
2020-06-26 09:20
语音识别
语音识别概述
一个基本的语音识别系统如下图,实现是正常工作流程,虚线是训练模式分类问题中的模板(这里就是
声学
模型,字典和语言模型)。图1语音识别系统组件关系图语音识别是把语音声波转换成文字。
shichaog
·
2020-06-26 09:19
语音识别
北京-某机器智能公司-语音识别算法工程师职位
职位:语音识别算法工程师薪酬:50K参考岗位职责1.负责语音识别技术研究;2.负责
声学
模型、语言模型、解码器三个方向之一的相关工作。
尹青_653d
·
2020-06-26 07:45
语音识别中
声学
模型训练过程-GMM(一)
在上一章语音识别过程中提到的P(O|W)称做观测最大释然,由
声学
模型计算可得,本章就主要描述HMM+GMM来计算最大释然的过程。
quheDiegooo
·
2020-06-26 04:30
语音识别
声学模型训练
语音训练
WebRTC学习总结(1):本地视频的获取和录制
视频录制简单介绍WebRTC(Real-TimeCommunications)是一个可以在Web应用程序中实现音频、视频和数据的实时通信的开源项目,它封装了很多音视频的采集、处理功能,比如音视频流的编解码、降噪和
回声消除
等
M&Q
·
2020-06-26 03:49
前端基础
javascript
webrtc
解压神器,南宁马自达CX-5汽车音响改装升级黄金
声学
今日到南宁慧声店里的是一位西装革履的刘先生,他的座驾是马自达CX-5,他是一名长时间在外跑业务的销售,出差也是家常便饭,白天里和自己相处时间最多的便是自己的车,而销售压力大,音乐歌唱是先生唯一的缓解压力,放松自我的娱乐休闲方式了。但是,汽车原装的音响给不了先生所需的满足感,原装汽车音响播放音乐平平,所有声音都好象画在一张纸上,毫无立体感。刘先生尝试过自己去调试设置音效,结果还是差强人意,经过查询和
南宁慧声汽车音响改装同盟腾声店
·
2020-06-26 02:09
音视频编解码类开源项目的18个实时
比如,前后处理环节有美颜、滤镜、
回声消除
、噪声抑制等,采集有麦克风阵列等,编解码有VP8、VP9、H.264、H.265等。
Linux高级开发
·
2020-06-25 23:17
Pr音频效果(六):混响类
基于卷积的混响使用脉冲文件模拟
声学
空间。结果难以置信地真实和栩栩如生。脉冲文件的源包括您录制的环境空间的音频,或在线提供的脉冲集合。
醴泉行者
·
2020-06-25 19:59
语音识别综述解析深度学习
一个完整的语音识别系统通常包括信息处理和特征提取、
声学
模型、语言模型和解码搜索四个模块。
靡荼归否
·
2020-06-25 18:35
笔记
作为一个果粉,这次我挺小米
官方给出的说法是:陶瓷
声学
系统替代传统听筒超声波替代传统红外距离感应器微型前置相机,体积缩小50%定制的17:9屏幕,硬件级圆角设计图片来源:小米官网
芳小哇Zofia
·
2020-06-25 16:19
过拟合和欠拟合及其解决方法
过拟合是指学习时选择的模型所包含的参数过多,出现对已知数据预测很好,对未知数据预测很差的现象(过拟合表现为高方差);过拟合产生原因:1.训练集有噪
声学
习算法试图尽可能正确分类训练样本,当噪声数量在训练集中占有相当大的比例时
小颜学人工智能
·
2020-06-25 10:21
人工智能
【算法研究】 AEC 回音消除算法
声学
回音即延迟大于50ms,衰减小于45dB的回声。
Jacob C Chen
·
2020-06-25 05:49
算法研究
基于tensorflow和deepspeech的中文语音识别模型,训练+部署
工业级中文语音识别系统,电子书,点我文章目录项目背景一、和百度deepspeech2的不同点1.框架选择2.
声学
模型结构3.其他调整项4.增加beamsearch和n-gram组合解码模块(这里是重点)
大数据AI笔记
·
2020-06-25 04:27
ASR
深度语音
开源项目
掌握音频开发基础知识
文章目录基本概念几种CODEC介绍实时调度相关缓冲区两种类型编写要点遇到的问题解码能力的自适应混音模块
回声消除
的延时控制能量统计双声道支持ALSA设备代码相关基本概念采样率(Hz):每秒去取样本的个数,
Witness__
·
2020-06-25 02:07
AVCODEC
说话人识别matlab实现
1、GMM-UBM说话人识别这里主要分为4个步骤:1、训练UBM通用背景模型2、最大后验准则MAP从UBM通用背景模型里面训练每一个说话人的
声学
模型3、交叉得分4、计算最终的测试效果,这里用AUC和EER
我是个粉刷匠
·
2020-06-25 00:22
语音处理杂谈
端到端多语言识别 语言不变性瓶颈特征
LANGUAGE-INVARIANTBOTTLENECKFEATURESFROMADVERSARIALEND-TO-ENDACOUSTICMODELSFORLOWRESOURCESPEECHRECOGNITION针对低资源语音识别的端到端对抗性
声学
模型的语言不变瓶颈特性本文提出了一种针对低资源语言的端到端对抗性
声学
模型
qing101hua
·
2020-06-24 22:46
语音识别
探索无需再训练的句间混杂识别
由于缺乏多语言训练数据来构建新的、特殊的多语言
声学
和语言模型,使得代码切换问题变得复杂。在这项工作中,我们提出一个原型研究语码转换语音识别系统,利用现有的单语
声学
和
qing101hua
·
2020-06-24 22:45
语音识别
开源的语音交互平台简介及对比
CMU-SphinxCMU-Sphinx也简称为Sphinx(狮身人面像),是卡内基-梅隆大学(CarnegieMellonUniversity,CMU)开发的一款开源的语音识别系统,它包括一系列的语音识别器和
声学
模型训练工具
哦卖糕
·
2020-06-24 18:46
语音识别-语言模型
~~~~一句话,语音识别中语言模型的目的就是根据
声学
模型输出的结果,给出概率最大的文字序列!~~~2.n-gram语言模型1
机器灵
·
2020-06-24 18:07
语音识别
语音识别-字典
所谓字典,就是发音字典的意思,中文中就是拼音与汉字的对应,英文中就是音标与单词的对应,其目的是根据
声学
模型识别出来的音素,来找到对应的汉字(词)或者单词,用来在
声学
模型和语言模型建立桥梁,将两者联系起来
机器灵
·
2020-06-24 18:34
语音识别
我对说话人识别/声纹识别的研究综述
GMM-UBM系统框架最初用的特征是
声学
特征MFCC,这个东西我不太熟,只知道它是从wav或者其它格式语音文件直接提出。有了特征就可以建立模型了,这里我们的模型叫做“高斯混合模型”。
Orange先生
·
2020-06-24 17:32
机器学习
一个简单的波形包络提取算法
2014年07月29日11:23:15liyuanbhu阅读数:21191更多个人分类:机械故障
声学
诊断数字信号处理最近做项目要提取一个声音信号的包络波形,所以花了点时间研究各种包络提取的算法。
飞向蓝天2
·
2020-06-24 17:37
上一页
24
25
26
27
28
29
30
31
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他