北大“人工智能前沿与产业趋势”课程整理02

  1. 第十讲:科大讯飞胡郁-人工智能+,共创新时代
  2. 第十一讲:MSRA洪小文-人工智能与人类智能的共进化

第十讲:科大讯飞胡郁-人工智能+,共创新时代

谈到人工智能可以从What、Where、How、When、Who 5W分别认识。

人工智能三大法宝,即深度神经网络,大数据,涟漪效应(How)。

未来人工智能想要变得与人类一样聪明,就必须有认知智能。这存在两条路,一条路是“强”人工智能,即一个智能体或者架构可实现大脑所做的所有事情。而目前工业界所用的人工智能,普遍的智能算法是“弱”人工智能。其用互联网和移动互联网的大数据和深度神经网络等一系列方法可实现。

目前在脑科学方面,美国推出大脑活动图谱计划,是美国继基因工程学之后,第二个信息学和生物学重大工程,希望把人脑认识清楚。另外,欧盟提出蓝脑计划,中国也提出中国脑计划。

1.深度神经网络非常好的一个特点是随着数据量的增加,其性能也在往上提升但现在深度神经网络有用不代表未来没有其他算法超越,目前也已有很多科学家研究非深度神经网络

2.互联网和移动互联网的存在使获得真实数据的能力比以前强了很多

3.最重要的一点是涟漪效应,这其实是一种互联网思维在核心技术研究中的一个过程。为什么现在实验室不能将最好的人工智能算法进行提升?是由于涟漪效应。

在互联网情景中,因为软件是免费的,一部分人愿意花时间去体验这些软件。就像水滴滴到水面,不是所有人会用到,只会有一小波人用到。而一些早期用户使用之后察觉这个系统并不好用,但在其使用期间,性能和用户数据会被送到云计算服务器并得到更新。当波纹扩到更大时,这个系统已经开始提高了,此时这个系统可能仍不完善,但更多的数据和经验会被构建,当扩散到较大部分水面后,随后使用的人会认为这个系统很好。因此,利用互联网的涟漪效应,可以把一个不成熟的、需要在真实的用户数据中培养的系统培养起来。目前的人工智能,如果没有经过这套系统,而仅存在于实验室,是不可行的。

正是有了以上对人工智能的分析定义,2014年讯飞推出讯飞超脑系统,期望这个系统能够突破感知智能和认知智能,不仅能听会说,也能理解会思考。

讯飞超脑分为感知智能和认知智能两个层面,并采用深度学习的路线。目前深度神经网络有很多开源的工具可以使用,但深度神经网络内部网络结构、构型对性能十分重要。而其中的层数、层数反馈以及节点间协调关系是诀窍,与脑科学连接起来才能获得最佳效果。

人工智能什么时候会到来?(When)

人工智能主要用在两个方面,第一,人工智能会通过机器与人的自然交互改变人类生活,另一方面,由于机器学习,则会颠覆很多需要专业人士的领域,如医疗、教育等领域,人工智能可以替代其某些技能。

计算机每发展十年,与人的交互会发生变化。键盘和字符形成第一代人机交互,鼠标和图形显示则构成第二代人机交互,而第三代人机交互则是以语音交互为主,触摸交互为辅的方式。

目前,讯飞AIUI可以实现与机器自由对话。其在语音云上有10亿个设备,每天使用次数可以超过35亿次,有30万个第三方创业团队使用

人工智能在行业的作用和交互是不一样的。各行各业最稀缺的是专家,而人工智能要学习专家能力,并用机器学习替代专家。因此人工智能应用到各行各业可以改变各个行业的思维方式。

人工智能服务形态也分为三类,Information-Complet(机器终将超过并取代人类),Information-Incomplete(人机协同,共同促进新发展),Information-Free(人类主导,机器辅助),层层递进。

谁将弄潮人工智能时代?(Who)

在人工智能领域,美国公司的发展是从爱迪生创立的通用电气到IBM再到微软,都属于技术创新型公司,也就是互联网是一种手段,而不是一个终结性产业。

技术创新公司可以概括成以下四个特点:
1.核心技术创新要做就做到世界第一
2.通过技术创新能够赚到大钱
3.不忘初心持续投入技术创新
4.技术创新不仅仅是国家的也是国际的。

实际上技术创新公司可以分为两类,一类是登山型公司,比如中国的航空航天、军工、高铁公司,山就在那里,需要脚踏实地一步步攀登。另外一类是冲浪型公司,在风口来的时候抓住机遇。若能将两者结合在一起才属最优。

Q&A

1.数据和算法在做出很好的结果上,它们的重要程度是什么样的?
我认为数据和算法同样重要,是分阶段的。如果没有数据,达到基本的门槛都很难;没有数据,假设是不存在的,再好的算法,在残缺的数据面前也是没有用的。数据量到了门槛以后,真正发挥作用的是算法,不同算法间的差异会越来越明显。

2.人工智能和小孩对比水平?
人类0到6岁无忧无虑,人工智能最难的是0到6岁阶段人类的认知,常识、逻辑的建立都在这个阶段,但这个阶段人是不用学的,在人类社会中慢慢就会了,这是个很神奇的事情。

从6岁开始到大学,要经历学习和考试,对人来说是最痛苦的事情,对机器来讲是反的,计算和记忆对机器不是难事。机器一旦掌握人类0到6岁的能力,后面对机器来说都很简单。现在科学家在努力的是用“弱”人工智能(大数据、神经网络和涟漪效应方法),来突破0到6岁的认知智能的问题,我认为这条路是有可能性的。

我们对神经网络大数据很多威力还没摸透,这其中还有很多空间,在5到10年内会看到结果。而“强”人工智能需要解决另外一个问题,0到6岁的认知智能是一个结果,通过“弱”人工智能达到这个结果是有可能的,但过程中给机器塞的东西可能和人完全不一样。“强”人工智能不仅要达到结果,过程还要和人一样,当遇到了新的内容,它还能不能学的那么快,这是“强”人工智能(通用人工智能)要达到的目标。

3.在未来五年,最有落地机会的,变成真实产业的机会有哪些?
大的方面,和行业有关。教育前几年有比较热的内容,教育以外医疗有可能产生巨大产业价值。人工智能替代的人工不是简单的人工。人工分两种,一种是脑力劳动,脑力劳动里面很多东西集中在教育、医疗、法律、金融这些方面,这些脑力劳动里面,得信咨询专门做过分析报告,把人类职业分析了一遍,教育、医生、老师、律师、法官、管理者各个方面。我认为脑力劳动的一部分会被人工智能代替。

第二个部分是体力方面,举个例子,家庭服务机器人,现在只有用扫地机器人,因为动作最简单,在运动智能没突破之前,体力方面能替代的只发生在工厂里面。运动智能发展后,把园丁、家庭看护、老人看护替代。

第三部分是人机交互。人机交互能用在非常多的领域,有一部分来自人机交互本身。还有一部分是搜索,当交互发生变化,获取信息方式发生变化,信息发生变化不一定是智能本身,而是交互方式带来的,硬件、服务的变化,很多东西会被重整,重整方式可能和键盘鼠标都不一样。这里面我认为很多交互和交互衍生带来的机会,不一定是交互本身。这是一个中间的环节,引发带来的变革,比如玩具新的形态。

第十一讲:MSRA洪小文-人工智能与人类智能的共进化

诺贝尔经济学奖得主写的书《Thinking, Fast and Slow》把人思考行为分成两大块:不加思索;想很久。我把它再细分,有些想得非常快(这张图是猫还是狗) ;有些想的比较慢(这幅剧照是喜剧还是悲剧);还有一类要想的非常慢(微软要不要收购领英)。

今天我们用三个人工智能做的项目,用微软做的项目为例子:

Think very fast

语音识别、图片搜索、图片识别等等
微软COCO图像识别比赛,参赛者均须纳入微软COCO数据数据源,然后用靠自己的编程算法,来产生图像识别结果,尽可能接近人的描述,评判标准包括平均正确性和细节描述。这个比赛要做到像素级别的才算正确。

Image Caption,需要讲出这个图片要干什么。 (Image Caption是一个融合计算机视觉、自然语言处理和机器学习的综合问题,它类似于翻译一副图片为一段描述文字。该任务对于人类来说非常容易,但是对于机器却非常具有挑战性,它不仅需要利用模型去理解图片的内容并且还需要用自然语言去表达它们之间的关系。)

微软把这些内容做成微软认知服务,计算机视觉,语音识别,自然语言处理,知识,搜索,都把它做成API,让大家不需要把所有的人工智能的每个部分都自己做,可以使用API做很容易的应用。比如海外Uber的人脸识别,便使用了微软的技术。司机开车以前要进行人脸识别的登记,确定是司机本人,不能代驾。

Luis(Language Understanding Intelligent Service,语言理解智能服务)是聊天机器人,中信集团,新加坡政府都在使用

think a little bit slow

举一个商业上的例子,一个东西叫Predictive maintenance(预见性维护)。

以前电梯怎么修,电梯坏了让电梯公司来维修,隔了几天到电梯里面,把一个东西(检测器)插上去,这个东西叫RS-232(串行数据通信的接口)的接口,接上去以后,下载一些数据,拿回去分析,又隔了两个礼拜,又去采样。找到问题,电梯几周不能工作。

现在用物联网的思路解决,装一堆传感器,记录电梯的运行参数,来预防性的维修。如果发现阻力大了,速度不均匀了,可能加加油就可以了。再比如开车,理论上来说,每六个月换一个滤网,但每个人开车习惯不同,多三个月换一次,开车少可能一年换一次。Predictive maintenance就是在做的这个事情。这个在工业界已经铺天盖地做,没坏之前维修,能省下大量钱和时间。

think very slow

这样的系统你取得的数据通常不会完整,甚至不是一个封闭系统。

比如,我们该不该买LinkedIn。这个大概很长时间不会让AI做,很多决定虽然不是你最佳的选择,但是也不会完全交给系统。有的人可能完全交给系统做,但我认为大部分人不会这样。这个东西不代表AI不会帮助,AI可以做很多数据分析,人来做决定。

我们要做思考,很多时候不是黑箱的思考,我们要做白箱的思考,进行推理。人能做思考一定是有规矩的,种什么因得什么果,这个AI系统是黑箱不一样,不知道怎么运作,黑箱和黑箱间的关系你根本不知道,除非一个黑箱的output刚好是另外一个黑箱的input,如果你知道事情的因果关系,你可能能做这件事情,因果关系在统计学是非常难的。统计学有个例子,喜欢玩电游的,和暴力倾向有组合,玩电游会造成暴力倾向?如果学过统计,知道完全不科学,是A影响B,还是B影响A,可能是倒过来的。可能是本身暴力,才喜欢玩电游。你需要大量数据,可能因果是完全没意义的。所以AI(artificial intelligence)和HI(human intelligence)的组合。两个是合作关系。

从公司来讲,有四大块会对未来世界造成本质上的影响。
从外部来讲:
1.迭代产品:每个公司一定有产品,让每个产品迭代的更好,这就是互联网思维;
2.吸引客户:每个单位有客户,这里面就算你产品不改变,比如兰州牛肉面,可口可乐,也想和客户联系的最紧密

从公司内部来讲:
3.优化操作:如何让运营更有效率更节省成本;
4.赋予员工权力:公司最有价值的一定是员工。让员工生活更顺畅,更和谐。
以上四点这适用于每个公司。这也是业界看到的机会。

我想讲的是,人类对智能的定义不断在改变,人类智能和人工智能是共进化的。假如没有计算机,我们可能认为,会珠算的人是聪明的。

感知,是不花时间,think very fast。AI比我们做得好。比如记住50个人的照片,安检。我认为,让机器做我高兴的不得了。
认知(Congition)这件事到现在还是没有谱的,为什么呢?今天的AI是个黑箱,它能解决what不知道why,不同黑箱间无法做reason,人是用认知去做的。

人和计算机关系AI+HI,人大胆假设,计算机小心求证。人最了不起的是意识。刚才讲的“中文房间”,有意识才是强人工智能。有两派,一个认为除了脑没有意识,另外一个认为,意识是全身的。你有疼痛会影响你的意识。

没有争议的是,一定是生物才可能有意识,生物里面植物也没有意识,这是大家共识。大家普遍相信,只有少数动物才有意识。

耶鲁大学教授写了一本书《The Tides of Mind: Uncovering the Spectrum of Consciousness》,书中讲到意识和创造有关,其他书中也有同样结论。当意志力很集中时 ,创造力不是最高的。意志力不集中的时候,创造力可能特别强。我也找到很多例子,贝多芬9号交响曲完全聋了瞎了,梵高把耳朵割掉时候很痛苦。化学家科普勒,睡梦中找到苯例子六角星结构……人本身是不完美的。意志力不集中是个不完美,但往往有创造力,这是为什么?但有一点我要讲,科普勒也讲,光睡觉是不够的,大胆假设,要小心求证,缺一不可。

你可能感兴趣的:(启程)