人工智能(AI),印象最深的时事新闻,大概就是阿尔法围棋(AlphaGo)作为第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人。除此之外,这项技术也应用至生活的方方面面,如指纹解锁、图像识别、语音转换文字、机器人看病等。
从字面意思,我们知道人工智能是学习人类的一种模式,其涉及的范围广阔,从技术领域上分类有机器视觉、指纹识别、人脸识别、视网膜识别、虹膜识别、智能搜索、博弈、自动程序设计、智能控制、机器人学、语言和图像理解、遗传编程等。其中的涉及的领域可谓包罗万象,而Alphago属于围棋博弈、深蓝属于象棋博弈。
今天文子,就给大家盘点一下AI应用的新拓展的内容,其中最为显著的就是图像识别、语言识别,这样说着好像似曾相识,但是AI永不止步于你认识的这些。
一、图像识别
图像识别技术是人工智能的一个重要领域。就如近期支付宝推出的刷脸支付设备“蜻蜓”,其中便涉及到了图像识别。但你以为这就是AI的图像识别了吗?——大错特错。
AI的图像识别主要需要几种步骤实现识别:信息获取、图像处理、特征抽取和选择、判决设计、分类决策等。其中涉及的原理与过程极其复杂,在这里文子就不过多说。
现阶图像识别技术娱乐应用最为成熟,游戏与相机居多
图像识别技术,如今主要应用在娱乐方面。譬如,百度魔图的“大咖配”功能,它可以通过图像大数据库去帮助用户找到与其长相最匹配的明星;百度的图片搜索功能,上传图片之后通过图像识别为用户找到相似的图片;国内专注于图像识别的创业公司旷视科技成立了VisionHacker游戏工作室,借助图形识别技术研发移动端的体感游戏等等。
对于图像识别的发展前景,并不止娱乐化,它还将逐步趋向功能化。比如Facebook研发了根据相片进行人脸匹配的DeepFace;雅虎收购的图像识别公司IQ Engine开发的Glow可以通过图像识别自动生成照片的标签以帮助用户管理手机上的照片,通过越来越多的智能相册APP的衍生,可见其中的重要性。
前面举例的都是现阶段图像识别技术的应用场景,那么未来的它,将会绽放什么样的魅力呢?
图像识别技术的高阶应用——让AI拥有“眼睛”
《人工智能:一种现代方法》中提到:“在人工智能中,感知是通过解释传感器的响应而为机器提供它们所处的世界的信息,其中它们与人类共有的感知形态包括视觉、听觉和触觉,而视觉最为重要,因为视觉是一切行动的基础。”
这也是大多数人提到AI,第一时间想到的是图像识别技术的重要原因,因为这项技术的研究发展,是我们走向ASI(超人工智能)的重要关键之一,也是AI执行决策时的重要考究。
二、语音识别技术
语音识别技术研究涉及人工智能、信号处理、模式识别、声学、语言学和认知科学等诸多学科领域,具有多学科综合性的研究属性。
语音识别,任务处理助手成为常态
在日常生活中,说到语音识别,首先会想到语音助理Siri,曾经一度是苹果手机的一大亮点。但随着语音识别的影响力逐步扩大,整体市场需求的增加,国内对其的研究也越发注重,比如科大讯飞。
对于常见的语音助手,往往是以电子产品为载体,实现语音交互。比如迭代迅速的智能手表、智能车载设备、智能音箱等等,都是通过设备让消费者感受语音交互的智能魅力。
语音交互的产物之所以深受消费者喜爱,除了在生活上能够提升自身生活的效率与质量,更是因为语音交互,所产生的体验感受,是目前AI技术中最为普及化与直观感受的。
根据数据调研所得,用户每搜十次搜索引擎,就有五次是通过语音交互的方式,可见语音交互方式在无形改变我们的生活习惯。
语音交互场景有几个分类:To B、To C、To G。
To B是为提高企业效率的工具,因为工具更加个性化和人性化,可以帮他们的用户提供更好的用户体验。
To C是最为常见的,是通过连接各种各样的交互设备,实现更多元化的交互方式,也是未来变更人与机器的重要方式。比如小米智能音箱,提高生活质量。
To G与To B 比较类似,只是涉及的行业不一样,比如司法、医疗、教育可以有很多应用场景,比如高考的打分,这都是偏政府的行业,是通过语音提供一个更有效率,用机器可以自动完成的事情,或者提供更好的用户交互的方式。
在生活中,除了苹果的siri、小米的小爱同学、三星的bixby等语音助理之外,我们遇到最多的,是电话智能语音。不止中国移动等企业使用的智能语音通话,就连中介推销服务,也在语音技术加持下,越走越任性。
最后,如同人类一般,AI也是以“感知”去了解世界。从图像识别上获取视觉;从语音交互上,实现需求与对话的转换。人工智能潜力无限,有正在不断完善自身识别技术的无人驾驶汽车,也有正在日常执行任务的服务型机器人,比如送餐服务员,AI的未来,正如影视呈现的那样,无限可能,这取决人类的想象有多广阔,技术有多强悍!