[机器学习]浅谈人工智能--笔记

浅谈人工智能:现状、任务、构架与统一 | 正本清源

  2017-11-02   朱松纯
(说明: 老板极力推荐我们阅读这篇综述性的文章,朱老师写的妙趣横生,几个触动点记录如下)

1.人工智能学科,归纳为六个,当成战国七雄,把其中2雄合并成(5):

 (1)计算机视觉(暂且把模式识别,图像处理等问题归入其中)、

 (2)自然语言理解与交流(暂且把语音识别、合成归入其中,包括对话)、

 (3)认知与推理(包含各种物理和社会常识)、

 (4)机器人学(机械、控制、设计、运动规划、任务规划等)、

 (5)博弈与伦理(多代理人agents的交互、对抗与合作,机器人与社会融合等议题)。 --最小

 (6)机器学习(各种统计的建模、分析工具和计算的方法)

(我:研究生入学复试时,还问老师们人工智能、机器学习、数据挖掘有什么区别)


2.人工智能的概念

人工智能的研究,简单来说,就是要通过智能的机器,延伸和增强(augment)人类在改造自然、治理社会的各项任务中的能力和效率,最终实现一个人与机器和谐共生共存的社会。这里说的智能机器,可以是一个虚拟的或者物理的机器人。

 

3.鹦鹉还是乌鸦

乌鸦给我们的启示,至少有三点:

其一、它是一个完全自主的智能。感知、认知、推理、学习、和执行, 它都有。 

其二、你说它有大数据学习吗?这个乌鸦有几百万人工标注好的训练数据给它学习吗?没有 

其三、乌鸦头有多大?不到人脑的1%大小。 功耗极低。

我们要寻找“乌鸦”模式的智能,而不要“鹦鹉”模式的智能。


4.学习的过程 
一、 外来的数据。

外部世界通过各种感知信号,传递到人脑,塑造我们的模型。数据来源于观察(observation)和实践(experimentation)。观察的数据一般用于学习各种统计模型,这种模型就是某种时间和空间的联合分布,也就是统计的关联与相关性。实践的数据用于学习各种因果模型,将行为与结果联系在一起。因果与统计相关是不同的概念。  
二、内在的任务。

这就是由内在的价值函数驱动的行为、以期达到某种目的。我们的价值函数是在生物进化过程中形成的。因为任务的不同,我们往往对环境中有些变量非常敏感,而对其它一些变量不关心。由此,形成不同的模型。
 机器人的脑、人脑都可以看成一个模型。任何一个模型由数据与任务来共同塑造。

同样是在概率统计的框架下,当前的很多深度学习方法,属于一个被我称作“大数据、小任务范式(big data for small task)”。

提倡的一个相反的思路:人工智能的发展,需要进入一个“小数据、大任务范式(small data for big tasks)”,要用大量任务、而不是大量数据来塑造智能系统和模型。我认为一个更合适的说法是“任务塑造了智能”。

 

5.机器学习

前面谈的五个领域,属于各个层面上的“问题领域”,叫Domains。我们努力把这些问题放在一个框架中来思考,寻求一个统一的表达与算法。而最后要介绍的机器学习,是研究解决“方法领域”(Methods),研究如何去拟合、获取上面的那些知识。

当前大家做的机器学习,其实是一个很狭义的定义,不代表整个的学习过程。

例如:定义一个损失函数loss function->你选择一个模型->你拿到大量数据并训练模型。这个过程没有因果,没有机器人行动,是纯粹的、被动的统计学习。

 

其实真正的学习是一个交互的过程。 

这个学习过程是建立在认知构架之上的,我把这种广义的学习称作通讯学习Communicative Learning。

这个通讯学习的构架里面,就包含了大量的学习模式,包括以下七种学习模式(每种学习模式其实对应与图中的某个或者几个箭头),这里面还有很多模式可以开发出来。

(1)被动统计学习passive statistical learning:上面刚刚谈到的、当前最流行的学习模式,用大数据拟合模型。

(2)主动学习active learning:学生可以问老师主动要数据,这个在机器学习里面也流行过。

(3)算法教学algorithmic teaching:老师主动跟踪学生的进展和能力,然后,设计例子来帮你学。这是成本比较高的、理想的优秀教师的教学方式。

 (4) 演示学习learning from demonstration:这是机器人学科里面常用的,就是手把手叫机器人做动作。一个变种是模仿学习immitation learning。

(5)感知因果学习perceptual causality:这是我发明的一种,就是通过观察别人行为的因果,而不需要去做实验验证,学习出来的因果模型,这在人类认知中十分普遍。

(6)因果学习causal learning:通过动手实验, 控制其它变量, 而得到更可靠的因果模型, 科学实验往往属于这一类。

(7)增强学习reinforcement learning:就是去学习决策函数与价值函数的一种方法。

 

 

你可能感兴趣的:(机器学习)