机器是否能思考?机器和人的区别是什么?早在17世纪,勒内·笛卡尔就曾经思考过这个问题,当时他给出的推论是,机器虽然能够根据人动作做出不同的反应,但是并不能以各种方式组织语言类演讲表达,因此机器不同于人类。 这位被视为解析几何之父的数学家,同时也是西方现代哲学的奠基人;醉心哲学研究的他,留下了“我思故我在”的名言。
应该说,类似笛卡尔这样的哲学思考和论断,起到了安抚人心的作用。在机器隆隆作响的三次工业革命进程中,从未引起如今这般全社会范围对机器智能的恐慌。农业人口减少,但是促生了工人群体,并涌现了重多具备专业知识的中产阶级;高新科技产业的发展不仅带来了体积更小、速度更快、能耗更小、价格更低、可靠性更强的各类专业计算机器,而且实现了信息的互联互通,人们享受着技术进步带来的成果。
1950年,也就是半个多世纪前,计算机先驱图灵在一篇《计算机机器与智能》论文中提出了一个试验,如何确定一个机器是否有与人类等价的智能。 在这个试验中,所有对话内容都是以文本形式传递的,即问题和答案通过计算机键盘输入和屏幕输出。
图灵测试自此引发了业内数十年内的无数次试验, 偶尔有一些试验声称自己通过了图灵测试,但是莫衷一是,并没有取得广泛的认同。大家也因此‘沾沾自喜’地以为机器还是无法与人类相提并论。
业界普遍认为,在图灵测试提出的六十四年之后的2014年,一个聊天机器程序成功让人类相信它是一名13岁男孩。同年,英国伦敦Google DeepMind团队开始研发人工智能围棋软件,并陆续战胜了围棋职业棋手李世石、柯洁以及五人团队。仅仅经过两年时间,AlphaGo就从业余棋手成为了真正打败天下打遍天下无敌手的世界第一;最新代Alpha Zero则可以通过自我学习完成21天战胜中国棋神。
这时,AI赢得了空前的关注。人类,开始恐慌。
AI虽然取得了巨大成就,但是距真正服务现实生活还有一定距离。李开复在其刚刚结束的达沃斯见闻中写道:“Deepmind团队Mustafa非常坦诚地说:‘Alpha zero没有那么神,外界对它有点夸大了。它要想工作,必须满足三个前提:可预测环境(围棋规则),清晰奖励系统(输赢),无变数(variability) 。’也并不是外界说的不受监督,Alpha zero的监督来自于它的结构和训练环境,这些依赖强化学习的具体方法在现实生活中效果不是很好。在现实生活中我们无法提供模拟器,进行巨量训练来形成算法。……,因为真实世界比游戏复杂很多。”
回顾以往,AI(Artificial Intelligence)经历了三个重大阶段,早期探索阶段是图灵测试提出的1950年左右,基于数学统计学,通过公式表达数据变量之间关系,并将该逻辑编写于代码中;1980年左右开始机器学习(Machine learning),基于各种算法实现提取特征、分类,进行数据加工或/和模型训练等工作;而2006年左右深度学期迅速崛起,这种基于深度神经网络的模式,无需手动提取特征或分类。
取自英伟达公司关于人工智能的演讲分享
目前,人类依然在研究人脑工作原理,人工智能无法完全取代人类思考,但是在给定具体场景和工作任务的情况下,人工智能完全可以胜任那些单一、重复、枯燥的工作。可以认为,AI更多地被尝试在不同领域成为合格的任务执行者,比如自动驾驶、听写转译、人脸考勤、城市交通数据感知和决策等。
不如,思考怎样用好AI服务于公民。不如,拥抱AI。
实际生活中,对话服务存在各种各样的场景。比如语音搜索信息(查询天气或路况),发起一个任务相关的一连串请求(预定某次航班及座位),咨询类沟通(选择酒店或者电话套餐)等等。
提及对话自然绕不开图灵测试,在图灵测试提出之后,业界不断努力沉淀出经典的自然语言处理(NLP)技术,建立声学模型,并相继引入机器学习及深度学习,文本和语音素材的处理能力节节攀高。时至今日,计算机已经可以在一些场景下与人顺畅地沟通交流。也正基于此,客服行业正在逐步从劳动密集型专向技术密集型。
传统上语音识别声学模型一般采用GMM-HMM进行建模。2011年以来,随着深度学习技术的发展,基于DNN-HMM的建模方法取得了长足发展,相比传统方法可以使语音识别的准确率相对提升20%-30%,2014年左右已取代前者成为学术界和工业界的主流配置。为了充分理解上下文,研究人员先提出一种长短时记忆网络(LSTM-RNN),而后又对LSTM进行了扩展,使用双向长短时记忆网络(BLSTM-RNN)进行声学模型建模。BLSTM可以有效地提升语音识别的准确率,相比于DNN模型,相对性能提升可以达到15%-20%。
以阿里巴巴集团为例,阿里智能语音使用的是基于LC-BLSTM-DNN hybrid的语音识别声学模型,在产品数据上相比DNN取得了17%-24%的相对识别错误率下降。早在2015年底,阿里智能语音就已经上线了该种模型,这是该模型在工业界的首次应用。这次应用,不仅大大提升了识别准确率,更解决了BLSTM需整句转写和不能支持在线服务的问题。同时,阿里智能语音在工业界首个上线了Low Frame Rate模型,将模型计算速度提高了3倍,大大降低了LC-BLSTM的计算消耗,即单核能够支持的路数是普通的语音识别厂商的的3倍。
2016年4月阿里开始重构智能助理,以AI和人工结合方式提供智能购物、极速服务的私人助理体验,问题解决准确率达90%,2016年双十一智能助理接待6500万人次,对话1亿轮次。随后,阿里开放给商家AI机器人产品,与千牛/旺旺深度整合,服务了3万+活跃商家。去年,上线了面向个人和企业的会话式机器人开放平台,并同时通过场景+产品+服务+方法论+合作伙伴的形式,向金融、航空、运营商、教育、医疗等行业快速推广。
工作中难免会有一些操作繁琐的事情,比如数据导入、采购订单填写、发票管理、员工考勤等,这些涉及数字等重要信息的工作,容不得半点马虎,但是不得不承认,这背后的操作单调重复且并不给员工们带来巨大的能力提升。
企业应当充分利用计算机优化信息系统和业务流程,认真思考组织架构和核心技术。不应该让有能力的员工,被工作拖沓得失去耐心和热情。
比如,薪资结算这项工作,需要由分公司的人事专员首先获取员工考勤、工时、合同工资等相关信息,在薪酬系统中提交按照规则计算出相应的数字,再经过一定的审批流程后,执行付款。在这一项工作中,可能会从数个不同系统和不同部门获取信息,步骤繁琐;并且事关薪酬,切不可有差池;而倘若员工人数可观,那么则更加繁重。
以财务部门工作为例,大集团内的相关财务需要横跨多个部门,具有众多的共享协作工作,如总账管理、工程核算、现金流预测、预算管控、资产管理、税务申报、税表管理、入库归档等等。
阿里集团也曾经面临同样的困境,随着业务发展,遇到了越来越多的各部门协作、复杂流程和效率低下的问题,亟需一种方法提高工作效率、让人专注于更有价值的工作。码栈,于2011年,应运而生。在内部千锤百炼之后,于2015年实现了4000用户、累积执行2.5亿条任务的突破,码栈RPA产品于2016年起赋能阿里平台客户与合作伙伴。
据悉,码栈RPA已经成功服务于阿里集团财务部、天安人寿集团客服部门、安踏财务部门、蚂蚁金服、中国进出口银行浙江省分行等多家客户。其中,财报入库机器人只需要5分钟左右即可完成耗费人力8小时的工作,将工作效率提升1000%;而其他种类如资金管理机器人、广告复核机器人、增值税申报机器人等可提升100%、500%、800%的工作效率。
运维部门是公司IT系统的防线。一台服务器很好管理,交给初级工程师也还算放心;数几台有点紧张,需要精锐团队齐心协作;但是,如果上万台呢?上万台中运行着成百上千的应用,就务必需要有跨越式、跃迁化的管理方法了。
在巨大的运维重任下,阿里巴巴集团内部尝试了借助人工智能来更好地管理业务故障,将业务数据、应用性能和基础架构三个维度综合考察,再结合数据存储、AI算法、数据分析、数据呈现等方法,可以针对业务异常事件自动拆解相关维度,逐层剥离定位故障原因,实现故障的一键快速恢复。同时兼具告警与预测功能,关联多个业务场景进行上下游根因分析,进行异常自动告警;通过时间序列分析和机器学习可以对未来一段时间的业务指标趋势进行预测。更难能可贵的是,这种AIOps的方式可以根据变化自动调整算法参数,全程自动学习无需人工干预。
此外,在阿里内部经过千锤百炼的AI智能基线,基于历史数据,可以简洁直观地发现异常趋势。据悉,智能基线帮助阿里集团将故障发现准确率从40%提高到80%,故障召回率从30%提高到80%,每周节省因误报而花费的操作时间29小时。
如同运维上万台机器一样,运营连锁品牌门店也需要可以“以一当百”地提效管理工具;连锁门店的信息管理链条较长,从门店、区域再到总部汇总、集团领导层,反馈周期长引发无法及时纠偏、管控乏力、整体效率低等后果。
目前,阿里云推出的智能巡店解决方案,不仅具备如实时监控、视频轮巡、移动段观看等基础监控,而且增添了智能点检、异常事件处理、在线考评经营成果等功能。该方案基于图像识别技术,对连锁门店的监控视频进行智能分析,辅助督导员远程巡店。
在人类社会发展的长河中,随着技术的不断迭代,人们渐渐从枯燥重复的劳动中解放出来。洗衣机将衣物清洗变成了只需几分钟的简单操作,微波炉带来了干净而高效的食物加热方式,汽车火车飞机等交通工具大大缩短了旅途时间。
AI作为当今时代,是冉冉升起的技术新星,也不可避免地步入了我们的社会生活。
阿里云,也会一如既往地致力于以科技服务社会。