关于语音识别技术的初探

   语音识别技术的应用可以分为两个发展方向:一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的;另外一个重要的发展方向是小型化、便携式语音产品的应用,如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用。那么哪些语音识别系统比较好呢?

  深圳伊兰度科技有限公司

   深圳市拓丰达数码科技有限公司

是一家专业生产早教机、故事机、看戏机、蓝牙音响、扩音器等电子产品类的开发设计制造商。 

  深圳市大诚兴科技有限公司

 深圳市大诚兴科技有限公司是国内一流的电路板厂家

  南京子佩软件科技有限公司

  南京子佩软件科技有限公司是是从事通讯类产品研发、生产、销售及提供相关通讯运营服务的高科技企业  深圳市智盟教学设备有限公司

  深圳市智盟教学设备有限公司,专业研发生产,销售于一体化公司。和国内多家科技,加工中心合作。致力于发展科技前沿和国家发明专利产品。

  深圳市赛科斯科技有限公司

公司现有产品包括智能停车,管理系统、门禁考勤系统、智能梯控系统、巡更系统、智能通道系统、区位/车位引导系统等系列产品

  上海益深电子有限公司

上海益深电子有限公司,为专业从事语音芯片和家电控制芯片开发、生产、销售的高科技企业。

  深圳市易思科智能设备有限公司

主要生产智能道闸、停车场收费系统、三辊闸、摆闸、伸缩门等安防、交通设施产品

  广州科灵电子有限公司

  广州科灵电子有限公司是智能一卡通设备制造企业,主营:停车场收费管理系统、停车场设备、高清车牌识别一体机、远距离蓝牙系统、道闸/挡车器、人行通道闸(三辊闸、摆闸、翼闸)、电子巡更系统、车位/区位引导系统、电动伸缩门、岗亭、门禁考勤系统、梯控管理系统、交通辅助设施等系列产品,公司拥有完整、科学的质量管理体系。

  深圳市苓贯科技有限公司

  对于任何产品而言,优质的质量永远是第一位。

下面说说语音识别的原理:

   一般的语音识别系统很庞大,一般的移动设备根本无法搭建,因此目前大多数语音识别技术都在搭在云端,就是说你必须联网。一个完整的语音交互系统包括语音识别、语音合成(TTS)、语义理解、垂直搜索、智能推送等部分。

关于语音识别技术的初探_第1张图片

   “你好问问”这种离线语音识别技术主要包括语音识别、实时监听。首先说说语音识别的技术。

1、我们知道语音是一种声波,要识别这个声波首先是分帧(也就是切割声音)。

2、但声波只是数据,我们要从中提取信息,于是就有了“变换与特征提取”,这里提取的特征就是人耳能理解的特征,表示方式是机器能理解的一系列多维向量。

3、之后就是把特征向量输入到程序中(目前主要用深度神经网络 DNN,尤其是 DCNN),把特征识别成 S 音标(或者说音素)。这里提到了音素,啥是音素呢?不是 a/b/c/d,而是元音、辅音,英语是 48 个音素。对应的,汉语是声母、韵母。其实这里面还有一个“音素的状态”,是比音素更细致的东西,暂不提。

4、把音素组合成单词或者汉字拼音。这个就比较好理解,对吧?一个汉字拼音或者一个英文单词都是由好些个音素组成的。

5、把好些汉字读音们识别成汉字们。汉字呢,有好多重音字,比英文单词更复杂些。比如“变换”、“变幻”。此时肯定是没法理解的,必须放在语境中去。这就需要大量的词库啦。说简单点:1、把声波切割成帧。2、在帧中提取特征向量。3、把特征向量组成音素。4、音素组合成拼音。5、拼音映射成汉字。


语音控制体系,通常主要考虑以下几个层面:
1、模拟按键
如确定、返回、主页、菜单以及其他按键控制等。
2、系统设置
如音量控制、画面调节等,音量控制如音量加、音量减、静音、取消静音。
3、应用调度
搜索、电影、电视、应用商店产品呼出等。
4、场景控制
当前场景内的各类可视交互元素跳转(全程语音交互),例如:
(1)对视频搜索结果之后的控制
(2)对视频播放环节的控制,如暂停、停止、返回、重新播放、下一集、快进、快退等。甚至对直播节目进行中文、数字频道切换
(3)其他的特色类服务控制。

参考网页:

  http://blog.csdn.net/zouxy09/article/details/9140207

  http://blog.csdn.net/webwalker/article/details/8064343

  

你可能感兴趣的:(关于语音识别技术的初探)