我的工程实践题目是基于大数据问答训练的中文自然语言理解系统设计,学习知识工程的构建方法,研究学习WordNet、frameNet等常用语义网络,使用机器学习算法研究中文自然语言理解,构建一套特定知识库的智能语音应答系统。因此基于智能语音应答系统,我选择了3款同类软件的分析:
1.微软小冰小娜:都基于必应搜索和深度神经网络等技术,属于2C产品。微软小娜如今可以在iOS、Android、Window 10系统中使用,她更像一个秘书,可以打电话、发短信、发邮件以及查询上一场曼联的比分。但是微软小娜在国内手机中的功能少很多,语音响应很慢。微软小冰作为一个对话系统,入驻于微信、微博等应用或者Windows 10系统中,她也可以查询各种信息。与小娜不同,小冰不可以调用电话等应用,她更像一个虚拟人物,可以陪用户聊天(连续对话)、玩游戏(基于图像识别等人工智能技术)。
2.苹果Siri:可能大家都比较熟悉,是一款可以调用应用的聊天机器人。如今的Siri除了定闹钟、发短信以外,还可搜索照片、播放音乐、提供建议。
3.讯飞语音:科大讯飞的“讯飞语音云”包括语音合成、语音识别和搜索、语音听写等技术,该云对方言、生僻字的语音识别率较高。讯飞语音输入法就是基于此云开发的。科大讯飞“主要”做的是2B(面向企业用户)服务,将自己的人工智能服务授权给其他企业。另外,科大讯飞在最近几年也开始发力2C(面向消费者)的产品,比如智能音箱、录音宝、录音笔等硬件。可以看到,科大讯飞的产品多是智能化的传统产品,而非个人助理或聊天机器人。另外,科大讯飞偏向深耕“语音识别”,而非连续对话。
(1)这些软件的开发者是怎么说服你成为他们的用户的?他们的目标都是盈利么?他们的目标都是赚取用户的现金么?
智能语音对话系统能给人们带来极大的方便,我们可以告别传统的手动点开手机输入文字查询,搜索我们想要的东西可以直接和智能机器人对话,也可以聊天。而且和语音机器人聊天,总是带来一些欢笑,能吸引我的兴趣。
“吃”方面,Siri和小娜都能为你提供附近餐厅的信息,度秘则能够为你提供整套服务,比如提供自家的外卖服务等,可以说做的更加周到。
“行”方面,如果需要叫车的话,Siri、小娜都会提出“超出其能力范围”。不过需要指出的是Siri在你提出一个目的地后,会直接跳转苹果地图,并显示规划好的路线。
“玩”方面,在推荐电影时,讯飞语音不仅有最新的电影推荐,还有各种片种的推荐,顺带都有一些点评,十分不错。另一方面,让语音机器人唱个歌什么的,也挺有意思,而且小娜逼真的人声唱出所点的歌曲,颇有一番风味。
“聊”方面,毫无疑问小冰贱贱的、更接地气的回答,会引起得大多数人的兴趣,小冰的回答有时也略显机(nei)智(han)。作为小冰的姊妹,小娜表现也并不差,但并没有小冰的回答更为有趣,其他两个就略显一般化。
是盈利的,主要通过授权费,服务费,广告费等方式盈利。
(2)这些软件是如何到你手里的?
这些软件一般是手机自带的,一般都是手机制造商和软件企业合作,授权安装到手机上的。
(3)这些软件有Bug么?又是如何更新新版本的?
苹果Siri之前的bug是不受控制台控制可以启动程序,比如当有新通知到来时候,可以在屏幕上显示有新通知,但解锁才能看到具体内容,不过Siri绕过了解锁步骤。不管手机是不是解锁,你只要启动Siri,喊它:“帮我读一下通知”就能听到通知详情。这会造成信息泄露,系统不安全。讯飞语音输入法没有键盘音,有时候不太方便,而且浏览器搜索的时候无法弹出讯飞语音。当然了,智能语音软件现在还处于初级发展阶段,对很多语音识别,语义理解还比较困难,不一定准确,这是所有智能语音产品的通病。版本更新可以直接通过手机查看应用的版本信息,直接下载最新的安装包更新。
(4)此类软件是什么时候开始出现的,同一类型的软件之间是如何竞争的?发展趋势如何?
苹果Siri出现得比较早,2007年开始成立的,其他语音产品大多14年开始兴起的。现在的智能语音产品朝着多元化方向发展,各种产品层出不穷,各有各的特色和优势,百家争鸣。随着人工智能的不断发展,以后这类产品会越来越多,越来越好。
(5)列举你在使用上述软件时观察到的“特殊”现象,它们和硬件有什么不同?这些能说明软件的某些本质特性么?
有一次,我用苹果Siri翻译“华为牛逼”,结果英语显示的是“Huawei is real bitch”,完全不对,这说明苹果公司还有很长的路要走,只要完善好自身,定好位置,才能发展,不然要失去很多客户。软件和硬件的区别是,软件是看不见摸不着的,硬件是实实在在的零件机器,就是人的思想和躯体一样,软件控制硬件的运行。软件又分系统软件和应用软件,软件又是运行在计算机上面的程序,但不仅仅是程序,可以说是程序加文档的集合。
(6)你个人第一次使用此类软件是什么时候?
第一次使用的时候大概是高二的时候吧,班主任陶老师,当时我用的安卓手机,有同学用的苹果手机,经常玩他的,苹果手机Siri还挺有意思。是正版的。
(7)你是如何精通这类软件的?它给你什么好处,坏处?
经常使用就熟悉了,它能给生活来带方便,比如我们做饭双手忙不过来,这时候需要打电话,可以使用语音系统,直接语音拨号,开车查地图,在家放歌,看电影等等都可以直接语音呼叫。坏处就是识别语义不正确,经常反馈一些错误的信息,或者根本识别不出语义,浪费时间,很影响心情。
(8)你现在还在用它么,或者是同类的软件?
现在还在使用,我觉得比较方便,有时候挺需要的。
(9)这种软件再过10、20年还会存在么?
这种东西会一直存在的,我们生活离不开语音,离不开讲话,智能语音系统能解放我们的双手。它现在还处于发展阶段,以后会发展的更加智能,能大大解放人的劳动力,带来生活工作的极大便利。