[2014.02.12] 介绍 Wit Speech 接口

原文: https://wit.ai/blog/2014/02/12/speech-api

语音控制是未来。科幻小说在几十年前就有这些情节了,但是我们现在还必须要移动一段距离去开电视或者设置一个闹钟。我们的任务就是去改变这个现状。给应用或者设备加上语音接口应该是一件容易的事情。

把说话转化成可以操作的数据

今天,我们非常兴奋得发布我们的新接口“说话转化成JSON”, 在“文本转化成JSON”接口运行四个月之后。
![]{https://d2n5jyo54r6d2a.cloudfront.net/blog/images/speech/speech2json.png}

从现在开始,您的应用,设备或者您的网站都可以发送音频流到我们的服务器,在返回值中拿到可以操作的数据。

我们来看一下它在智能家庭场景下的应用:
http://youtu.be/HXLmhyWkvFM

它是如何实现的?

在屏幕后面,Wit整合了多种最先进的自然语言处理技术和多种说话识别引擎以达到即使在充满噪音的环境或者语言有多种变化的情景下的低延迟性和高健壮性(对同一件事可以有一百种说法)。

值得高兴的是,您不需要关心所有这些细节。我们致力于创造极致简单的开发者体验。您只需要花费几分钟在我们的网站上就能启动起来。Wit可以适配您的所有领域,从冰淇淋分发到空间问题,我们不做任何的假设,保证100%的可配置。

您需要花费5分钟去构建属于自己的配置
http://youtu.be/CLVysc62w_A

使用API

接下来,调用API也是很简单的。我们提供了多种客户端的SDK完成音频记录和发送,在IOS和Android,甚至单个网页上。你也可以使用HTTP接口实时得录音和上传音频文件。

让我们来处理这段声音(录制在一处山谷中的庆典上,能听出来是谁吗?)

通过POST请求提交到 Wit API
curl -XPOST 'https://api.wit.ai/speech'
-i -L
-H "Authorization: Bearer $TOKEN"
-H "Content-Type: audio/wav"
--data-binary "@sample.wav"

您会得到这个返回值
{
"msg_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}

想构建您自己的语音接口?来这里注册吧!
https://wit.ai/

Wit 团队

你可能感兴趣的:([2014.02.12] 介绍 Wit Speech 接口)