嘘,小声点!苹果、亚马逊、谷歌的语言助理可能在偷听你的每一句话

前一阵子和几个朋友晚饭后一起聊天,从人工智能聊到了脑机接口。碰巧我留意过特斯拉老板马斯克搞的这个东西,就给大家介绍了一下。当时在座有相当一部分朋友是第一次听说这个东西。

第二天早餐遇到了昨晚聊天时在座的一位朋友。他一见我就说真是神奇,昨晚第一次听说这个脑机接口,今天早上起床在某APP看新闻时,被连续推送了好几条关于脑机接口的文章。他甚至还没来得及搜索这个关键字。

通信尤其是无线通信的发展让我们可以随时随地从网络中获得任何想要的资讯。语音识别技术结合人工智能后性能大幅投升。通过语音来控制智能终端可以大大提升了用户体验,尤其在开车时或者智能设备在几米外的时候,语言操作会更方便。

语音识别可以让用户以更自然的方式与智能终端进行交互,就像是人与人之间的交流一样。语音输入成为键盘之外的另一个重要网络入口。这个领域自然成为所有互联网公司竞相争夺的战场,他们都纷纷推出了自己的语言助理,如苹果Siri、谷歌Voice以及亚马逊Alexa。

这些语言助理为什么这么智能?最重要的原因是人工智能的发展。人工智能这几年飞速发展的一个巨大推动力量是神经网络的广泛应用。神经网络不是一个新东西,其技术突破全是三四十年前搞定的。

为什么坐了三四十年冷板凳的神经网络忽然咸鱼翻身变得炙手可热?制约神经网络大规模应用的因素有两个,一个是神经网络运行需要极大的运算能力,另一个是神经网络需要训练,而好的训练结果需要海量经过人工标注的数据。

这些制约因素在十几二十年前都是不可想像的。到了本世纪初芯片制造技术与移动互联网的广泛发展使得让神经网络应用成为可能。

首先是芯片制造技术。英特尔提出的摩尔定律推动芯片处理能力每两年翻一番,同时价钱和功耗都会下降。由于互联网尤其是移动互联网的普及,以前不可想像的海量训练数据问题也得到了解决。谷歌是人工智能方向走得最快最远的公司之一。其最著名神经网络的人工智能程序在网上看了百万张猫的照片后终于能够成功识别猫了。百万张猫的照片!这在以前是不可能得到的数据。

数据就是金矿。数据的好坏直播影响了神经网络的性能。这些基于神经网络的语言助手们需要海量数据来提升自己的性能,同时又成为采集数据的设备。

即使你没有通过“hey Siri”之类的芝麻开门唤醒这些语言助手们,他们仍然在不知不觉中倾听周围的一切声音,并把这些声音,也就是珍贵的数据传送回各自的公司。这些数据经常会被人类仔细听一遍后打上标签然后用来训练神经网络。为了提高训练质量,这些公司肯定希望能够采集到尽可能多场景下人的声音,比如吵架,饮酒,还有床上羞羞时的声音。

今天七月有人爆料称苹果Siri偷偷录下的非常隐私的声音被苹果发给自己的第三方公司,然后大量音频被泄漏,无数用户的隐私被曝光。这些语音片段包含各种隐私场景如就诊,床上运动等。

这个事件后苹果,亚马逊以及谷歌等都先后悄然修改了用户服务条款,其最大的让步是用户有了一个可以关闭数据传送到后台的选项。但是会有多少用户会在几十上百页的用户条款中看到这个好消息并真正关掉那个选项就不得而知了。

与任何其他智能设备一样,语音助手带来生活便利的同时也带来诸如隐私与安全方面的隐患。继续发展是大趋势,但是在发展的过程中发现问题并及时解决问题来保护用户的隐私是这些公司不可推卸的责任。

你可能感兴趣的:(嘘,小声点!苹果、亚马逊、谷歌的语言助理可能在偷听你的每一句话)