The ATIS Spoken Language Systems Pilot Corpus

摘要

语音研究有巨大的进步在过去使用以下的模式:

  • 定义研究问题
  • 收集语料针对性的衡量进展
  • 解决这个研究问题
    自然语言研究,另一方面,取得了典型的进步在没有任何数据语料的情况下,这能够测试研究的假设。

我们描述了 A T I S ATIS ATIS试点语料库,设计的语料可以测量进展,在口语语言系统中,包括:a speech and natural language compoment.
这个尝点标注着全面收集语料和提供指导为未来的努力。

Introduction

  • AITS 语料,提供了一个机会可以开发和评估语音系统。可以自发的理解语音。这个语料库区分与其他的程序,
  • the Resource Management corpus 资源管理语料。
  • 在至少四个重要方法中:
  • Instead of being read,
  • 语音收集发生在一个官方的环境中,而不是在语音室里。
    A T I S ATIS ATIS,所支持的评估方法依靠有一个类似的表示关于每个语句的问答。
  • database queries 数据库查询
  • the acoustic speech data:声学语音数据
  • the Official Airline Guide OAG
  • preliminary 初步的,预备的。
  • an exit questionnaire 离职问卷
  • different transcriptions 三个不同的合成
  • orthographic transcription 正字法的转录

Corpus Collection

  • Texas Instruments. 德州仪器
  • The ATIS Spoken Language Systems Pilot Corpus_第1张图片
  • The ATIS Spoken Language Systems Pilot Corpus_第2张图片
  • 总结

  • 这篇文章过于艰难,慢慢的将其他知识理解透彻以后,再开始研究该文章,将该篇文章全部都研究透彻,整个都将其搞定。慢慢的理解透彻,研究彻底都行啦的理由与打算。
  • 先自己将其搞定。后续再继续处理这篇文章都行啦的理由与打算。

你可能感兴趣的:(论文创新及观点,语音识别,人工智能)