阅读本文将收获:
人工智能的诞生及历史历程
人工智能的技术布局
四大技术模块现状及案例
第一部分 人工智能的诞生及发展
最早接触『人工智能』一词是从斯皮尔伯格2001年导演的《人工智能》了解到,影片中小男孩David被创造出来替代一个即将奄奄一息的人类男孩,但由于种种原因被人类母亲抛弃,最终走上寻找妈妈和寻找自我的道路上,途中遇到波折,最终发现自己只是个机器人。
如今电影中出现的人工智能不知不觉渗透入我们的生活,而且几乎无处不在,那么你真的了解人工智能吗?
人工智能的诞生:
『人工智能之父』回到人工智能的诞生,不得不提『艾伦·图灵』,他曾协助英国军队破解德国密码系统并帮助盟军取得二战胜利,同时因提出了用于判定机器是否具有智能的实验方法——图灵实验,被称为人工智能之父。他对人工智能的定义:如果一台机器进行的对话无法与人类对话相区别,那么可以说这台机器能够“思考”。
(AI小知识 - 图灵测试:进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。)
『1次会议』1956年在美国达特茅斯大学,来自全球的数学、神经学、工程学、经济学等科学家共同探讨并提出了『人工智能』。
人工智能的两次浪潮和寒冬:
『第一次浪潮』1956-1974
算法届出现了世界级发明:
1. 贝尔曼公式:增强学习的雏形,也是谷歌AlphaGo算法核心思想内容
2. 感知器:深度学习模型的雏形
3. 有一台叫做STUDENT(1964)的机器能证明应用题,还有一台叫做ELIZA(1966)的机器可以实现简单人机对话等
『第一次低谷』1975-1979
现有算法存在两方面局限:一方面,人工智能所基于的数学模型和数学手段被发现有一定的缺陷;另一方面,有很多计算复杂度以指数程度增加,所以成为了不可能完成的计算任务。
『第二次浪潮』1980-1987
80年代初,一类名为“专家系统”的AI程序开始为全世界的公司所采纳,人工智能研究迎来了新一轮高潮。以美国、日本为首投入重金资助人工智能探索。
『第二次低谷』1987-1993
美国Apple和IBM生产的台式机性能不断提升,个人电脑的理念不断蔓延,以及专家系统的应用范围过于狭窄,更新和维护成本太高。
『第三次浪潮』1993-至今
从93年起人工智能以飞速展现在大众面前,以下是人工智能大事记:
1997年 ,IBM国际象棋机器人深蓝(以2胜1负3平)战胜国际象棋世界冠军卡斯帕罗夫
2006年,Geoffrey Hinton提出多层神经网络的深度学习算法;Eric Schmidt在搜索引擎大会提出“云计算”概念
2010年,自动驾驶教父Sebastian Thrun领导的谷歌无人驾驶汽车曝光,创下了超过16万千米无事故的纪录
2012年,Google发布个人助理Google Now,类似于Siri,但能与google搜索结合
2013年,深度学习算法在语音和视觉识别率获得突破性进展
2014年,微软亚洲研究院发布人工智能小冰聊天机器人和语音助手Cortana;百度发布Deep Speech语音识别系统
2016年,Google AlphaGo以比分4:1战胜围棋九段棋手李世石;
2017年,Google AlphaGo以比分3:0完胜世界第一围棋九段棋手柯洁;
百度AI开发者大会正式发布Dueros语音系统,无人驾驶平台Apollo1.0自动驾驶平台;
iPhone X配备前置3D 感应摄像头(TrueDepth),脸部识别点达到3W个,具备人脸识别、解锁和支付等功能
第二部分 人工智能的技术布局
AI正在无时无刻的改变我们的社会和经济形态,从衣食住行到金融医疗艺术农业,也许AI技术能力将成为我们下一次工业革命的支撑力量,结合国内外对于人工智能的技术布局,笔者将人工智能技术进行如下5模块划分,接下来将一一讲述。
一. 自动驾驶领域
国外 · 无人驾驶
对于自动驾驶研究领域较深入的有三大巨头分别是谷歌、通用公司和Uber。三大公司目前都已推出无人驾驶车辆路测:
谷歌在2016.12月宣布将自动驾驶汽车项目分拆为单独的公司Waymo,目前推出的无人驾驶汽车在美国凤凰城已投入商用。
通用汽车收购自动驾驶汽车创业公司Cruise GM,之后通用汽车加速前进,一方面开发无人驾驶软件,另一方面大规模生产电动汽车。通用汽车还暗示会在未来2-3年内测试机器人的士服务。
Uber第二代无人驾驶汽车开始上路测试,该自动驾驶需要2个操作人员(负责接管和看地图),第三代更加会贴近、实现无人驾驶。
国内 · 无人驾驶
国内该领域率先发声的是百度及他的阿波罗汽车,今年7月百度CEO李彦宏乘坐无人驾驶汽车驶入五环去参加开发者大会,11月百度世界大会上李彦宏声称明年就要在国内量产无人巴士。
腾讯提出了All in Car生态系统,并联合广汽、长按等汽车公司进行战略合作。
笔者前段时间去参加百度世界大会时,亲测了百度疲劳驾驶检测系统,方向盘前侧有人脸监控视频装置,除了语音提醒外,还会判断驾驶员疲劳程度:
当监测到你有眯眼、打哈欠等情况时,判断为轻度疲劳,会自动播放快节奏的音乐提神;
当监测到闭眼等情况时,判断为重度疲劳会自动定位到附近休息区,建议去休息。
相信未来这套系统普及面世后,因疲劳导致的交通意外数能大大降低。
二. 语音交互
现如今语音交互已经渗透到我们生活的方方面面,如iPhone的Siri、智能音箱都是语音交互的典型,笔者按应用场景将语音交互划分为3大模块:智能助理→智能音箱→机器人,它们都是基于语音技术支持的智能硬件的更迭。
1.智能助理。顾名思义帮助用户完成任务的虚拟助理。如Siri、Google Now等,如同私人秘书一般,目前智能助理最主要的方式是语音交互,可以实现双手和双眼的解放。
2.智能音箱。2017年可以说是智能音箱爆发的一年,各大公司抢占智能家居入口,亚马逊的Echo服务已覆盖了28个国家和地区,百度、阿里、小米、京东等也推出了智能音箱,结合自家优势提供个性化服务。笔者购置了2台智能音箱,这几个月来已经习惯了她的陪伴,回想以前每天早上查天气、空气质量、听新闻、听音乐都需要先找到手机→解锁手机→打开APP→切换APP查阅不同的信息,真的是很低效的事情。
那么,问题来了,为什么都要抢先推出智能音箱而非其他别的硬件呢?
2.1 战略布局。①音箱凭借自带扬声器的先天优势结合语音交互成为智能家居的遥控器;②音箱在家庭中摆放的位置位于家居的核心中枢,相对固定但又可随意搬动这一点也奠定了抢占入口的优势;③家庭环境下语境干扰较少,为语音交互提供了便利的环境条件;
2.2 交互方式。语音交互相比于传统的键盘、鼠标、触屏交互方式更加自然便捷,人和智能硬件的交互方式在未来会更加趋近于人和人的对话式交互。
2.3 成熟的技术。国内外公司提供的语音识别技术准确率都在97%以上,成熟的技术也为音箱的爆发打下了基础;
3.机器人。越来越多的机器人被应用到了各行各领域如农业、物流、家庭陪伴等,虽然现在的机器人在智力水平、环境识别上还不及人类,但随着机器人不断自我学习,相信人工智能时代会解放一批重复劳动力。
三. 图像识别
图像识别:通过计算对图像进行处理、分析和理解,识别各种不同模式的目标和对象。图像识别具备5大特色技术及应用场景:
1. OCR技术。在图片中检测、识别文字,并能智能识别卡证、票据,目前支付宝及百度网盘的卡包已经做到了对卡证的信息的提炼。
2. 人脸识别。通过对人脸进行分析实现人脸检测、人脸比对及人脸查找功能。苹果公司推出的iPhone X通过图像识别能力可以进行解锁、支付等功能。百度网盘最新版本支持对云端图片的人脸及物体检测。
3. 图像检测。物体检测、物体识别、物体检索。下图为百度网盘提供的人脸识别及图像检测对网盘中图片进行智能分析结果。
4. 机器人视觉。包括导航定位、智能壁障等。如无人车在行驶时对道路路段的动态及静态障碍物的分析。
5. 视频分析。包括对视频内容及影片段落截取的分析能力。
四. VR/AR
先来了解一下AR和VR的定义:
增强现实(AR):一种将真实世界的信息和虚拟信息整合的技术。
虚拟显示(VR):一种数字化的仿真技术,是抄袭、拷贝、复制现实世界中的一切规律,包括物理的,也包括人体感知的。
目前AR/VR已应用到 很多领域包括零售、教育、旅游等,百度的Dumix AR平台也正式全面开放大众。感兴趣的点这里:https://cloud.baidu.com/survey/BetaSDKApply.html
而在解决残疾人生活工作,微软盲人工程师推出的Seeing AI(如下视频)旨在将视觉世界转变为一种可听见的语音体验,为不少有眼疾的人士带来了便利。
当然,苹果公司也将在2019年为手机配备前后两个 3D 传感器 ,以便让 iPhone 变成领先的 AR 设备。(已经很期待了~)
电影推荐
最后,如果你对人工智能感兴趣,可以从以下电影去了解:)
总结:
首先,60年前人工智能之父图灵定义人工智能的诞生开始,再到人工智能的历史发展进程中的3次浪潮2次寒冬。
然后,对人工智能目前的技术进行提炼并一一简述举例,着重对语音交互及图像识别进行案例讲解及分析。
最后,如果感兴趣推荐了一些人工智能相关的电影来了解未来的趋势。