标签: 校园 |
分类: 工作篇 |
所谓计算模型是刻划计算这一概念的一种抽象的形式系统或数学系统,而算法是对计算过程步骤(或状态的一种刻划,是计算方法的一种能行实现方式。
由于观察计算的角度不同,产生了各种不同的计算模型,比如递归函数,图灵机,lambda函数等。
有趣的是,这些计算模型的计算能力被证明是等价的。
计算模型之一:递归函数
递归函数论是由厄布朗、哥德尔、克林等发展起来的计算理论。
三个初始函数:
(1) s(x)=x+1 (后继函数);
(2) z(x)=0 (零函数);
(3) Pj(n)(x1,x2,…,xn)=xj (射影函数)。
三个算子:复合算子,递归算子,取极小算子。
由初始函数通过有限次使用算子可以构造的函数,称为递归函数。
常用函数
加函数可以如下递归定义:
f1(m,0)=m;
f1(m,n+1)=s(m+n);
乘函数可以如下定义:
f2(m,0)=z(m);
f2(m,n+1)=f1(m,f2(m,n));
减一函数可以如下定义:
p(0)=0;
p(n+1)=n;
常用的函数,都可以这样定义出来。
计算模型之二:图灵机
它由一个控制器和一条两端可无限延长的工作带组成:
工作带起着存储器的作用,它被划分为无穷多个可写可擦的方格。
控制器则可以在带上左右移动,控制带有一个读写头,读写头可以读出当前方格内的符号,然后根据预先设计的状态转换指令,选择改写或抹去这一符号,然后选择往左移一格,往右移一格或者不移动,并进入下一个状态。当状态转换到停机状态,则停止运行。
图灵可计算函数
可以在图灵机上构造实现的函数,称为图灵可计算函数。以下函数都是图灵可计算的,大家可以思考一下具体的构造过程。
自然数如何编码?
零函数:
后继函数:
射影函数:
图灵机的计算能力等价于递归函数的计算能力
如何来证明递归可计算的函数,一定是图灵可计算的?
三个初始函数是图灵可计算的。
三个算子形成的复合函数也是图灵可计算的。
如何来证明图灵可计算的函数,一定是递归可计算的?
图灵机的优点
图灵机的计算能力与其他计算模型是等价的。
图灵机的优点是模拟人类的纸和笔的功能,比较符合人类对于“何为计算”的直观理解。
图灵机简洁的构造和运行原理隐含了存储程序的原始思想,深刻地揭示了现代通用电子数字计算机最核心的内容。
计算与计算机
由此可见,真正构成计算机科学基本的、核心的内容是围绕计算而展开的大量带有规律性的知识,而不是具体的实现技术。
因为,在将来,我们完全可能发展一种能表示二进制数及其运算的新技术,它比今天的微电子技术精度更高、生产价格更便宜。如果真是那样,这种技术就可能取代微电子技术在计算科学中的地位。
因此,我们常说,从这个意义上讲,软件技术比微电子技术对计算科学更重要一些。
一、算法(Algorithm)
...解决问题的大致流程:分析问题 ? 确定算法 ? 选择语言并编码 ? 调试运行? 解决问题
所谓算法是对计算过程步骤(或状态的一种刻划),是计算方法的一种能行实现方式。
...(Knuth对算法的定义)算法是对特定问题求解步骤的一种描述。此外,算法的规则序列须满足如下五个条件:
(1) 有穷性。算法必须总是在执行有穷步之后结束;
(2) 确定性。算法的每一个步骤必须是确切地定义的;
(3) 输入。算法有零个或多个输入;
(4) 输出。算法有一个或多个输出,即与输入有某个特定关系的量;
(5) 能行性。算法中有待执行的运算和操作必须是相当基本的,即是说,它们原则上都是能够精确地进行的,而且用笔和纸做有穷次就可以完成。
...算法设计的要求
...评价一个好的算法有以下几个标准:
...(1) 正确性(Correctness ) 算法应满足具体问题的需求。
...(2)可读性(Readability) 算法应该好读。以有利于阅读者对程序的理解。
(3)健状性(Robustness) 算法应具有容错处理。当输入非法数据时,算法应对其作出反应,而不是产生莫名其妙的输出结果。
...(4)效率与存储量需求 效率指的是算法执行的时间;存储量需求指算法执行过程中所需要的最大存储空间。一般,这两者与问题的规模有关。
算法的表示
1、自然语言描述;
2、程序流程图描述 ;
3、N-S图描述;
例如:求1+2+……+100之和
...算法的自然语言描述
1.sum赋初值为0;变量i赋初值为1;
2. 让i从1变化到100,执行以下循环:
将i的值累加到sum中去。
3.输出sum中的值,即为所求的结果。
...算法的程序流程图描述
二、设计程序(Programming)
...一般地说,对任何一个问题,如果有了解决该问题的算法,就可以编制相应的程序。所谓程序,是一种事先编制好了具有特殊功能的指令序列。
...其中,指令既可以是机器指令,汇编语言指令,也可以是高级语言的语句命令,甚至未来还可能是用自然语言描述的运算、操作命令。
常见程序设计语言
1. 机器语言 (机器可以直接读懂)
指令格式:操作码+地址部分
2. 汇编语言 (使用助记符,几乎和机器语言一一对应)
3. 高级语言(C、 Pascal、 Basic、 Foxpro、Fortune、perl ……)
4. 专门领域的开发语言:
(VHDL(电路板开发), Lisp (AI) ,Prolog (AI)…
5. 面向对象语言:
Visual C++, Visual Basic, Visual C#, Delphi, java
三、C 语言简介
1、C 语言的发展历史
C 语言的出现源自于计算机操作系统的编写
...69年 美国贝尔实验室研究员Ken Thompson 和Dennis M. Ritchie 用汇编语言编写Unix
...70年 为了提高程序可读性和可移植性,Ken在BCPL (Basic Combined Programming Language)语言基础上开发B语言;
...72-73 Denis在B语言的基础上开发了C语言
...73年他们再次合作,用C重写了Unix
...78年 合著了《The C Program Language》
...87年 美国国家标准学会(ANSI)对C规范,成为国际标准。
2、C 语言程序的结构示例
#i nclude
void main() //主函数
{
printf(“Hello World.”); //输出语句
}
例:求两个自然数的最大公约数。
解答:
step1:分析问题
step2:确定算法
step3:算法描述
step4:编码
step5:调试运行
...算法的自然语言描述
1、输入x, y 的值,算法将求它们的最大公约数。
2、让minxy等于x与y的最小值。
3、让i从minxy变化到1,执行以下循环:
如果i可以整除x和y,那么跳出循环。
4、输出i的值,即为所求。
#include
void main()
{
int i, x,y, minxy;
scanf(“%d%d”,&x,&y);
minxy=x
if(x%i==0 && y%i==0) break;
printf(“%d”,i);
}
以下使用欧几里德算法
...记gcd(x,y)为x与y的最大公因数。
...我们首先从函数gcd(x,y)的性质出发来求解。函数gcd(x,y)具有如下性质:
...(1) gcd(a,b)=gcd(b,a)
...(2) gcd(a,b)=gcd(―a,b)
...(3) gcd(a,0)=|a|
...(4) gcd(a,b)=gcd(b,a mod b),
0≤a mod b<b
例如:gcd(18,12)=gcd(12,6)=gcd(6,0)=6
...根据以上性质,我们可以设计如下算法:
1、 输入x,y;z是辅助变量;
2、 当y≠0,重复执行如下操作步骤:
z←y,y←x mod y,x←z;
3、 输出x,算法停止.
例如:gcd(18,12)=gcd(12,6)=gcd(6,0)=6
#include
void main()
{
int x,y, z;
scanf(“%d%d”,&x,&y);//输入两数x,y
while(y!=0)
{
z= y;
y= x%y;
x=z;
}
printf("%d\n",x);
}
上机环境(VC++ 6.0)简介
工作流程示意(简图):
上机环境( VC++ 6.0 )简介
...几种不同类型的错误:
调试工具
...界面介绍:
编译、调试、断点、单步执行、查
看中间结果、运 行
计算机科学导论前言:逻辑的引擎[原创]
By: 庄朝晖 发表于 2008-10-12 13:26:00
计算机专业学什么?
计算机的实用层面:Windows使用,Office办公软件使用,Photoshop图像处理,收发Email,QQ聊天,上网,英汉翻译软件,语音识别…
计算机的应用层面:高级语言程序设计,数据结构,算法设计,操作系统,编译原理,汇编语言,计算机组成原理,嵌入式系统,数据库基础,计算机网络,计算机安全,图像处理,人工智能…
计算机的理论层面:计算理论,计算复杂性,形式语义学,体系结构,分布式算法,密码学,数理逻辑,图论与集合论…
课程简介
计算机,会计算的机器。又称电脑,这个名字更形象。什么叫计算?
计算机科学:也称计算科学。
艺术:还未形式化的东西,还未知计算方法的。
科学:计算科学中的理论层面,一般来说是形式化的,数字化的,还处于研究阶段的。
技术:计算科学中的技术层面,一般来说是已经成熟的,工艺化的。
计算科学的起源-从逻辑开始
中文的“逻辑”显然音译自英文的“logic”。logic又来自中古拉丁文的logica,logica又源自希腊文logos(λóγos)。logos一般翻译为“逻格斯”,接近于中文里的“道”。
中文的“道”和希腊文“logos”都有以下两层意思:
1 各种事物的定义或者各种活动的规则(西方各门学科的名字都以 -logy缀后的习惯)
2 言说,言谈
这两层意思也是相互关联的。言谈是为了揭示事物的道理,道理一般也通过言谈得以开显。
逻辑的发展
在言谈和辩论中,渐渐发展出逻辑学这一领域。从地域来分,古代逻辑学可以分为希腊逻辑学(亚里士多德),印度逻辑学(因明学)和中国逻辑学(墨子名学)。
亚里士多德三段论:
大前提:所有人都是有死的。
小前提:苏格拉底是人。
结论:苏格拉底是有死的。
逻辑四大基本定律
同一律:指概念在同一思维过程中必须保持同一。
矛盾律:亚里士多德在《形而上学》中说:“同一事物,不可能在同一时间内既存在又不存在,也不允许有以同样方式与自身相对立的东西。”
排中律:亚里士多德:“在对立的陈述之间不允许有任何居间者,而对于同一事物必须要么肯定要么否定其某一方面。”
充足理由律:首先由莱布尼兹提出。所谓充足理由律是指:“任何一件事如果是真实的或实在的,任何一个陈述如果是真实的,就必须有一个为什么这样而不那样的充足理由,虽然这些理由常常不能为我们所知道的。”
故事:为什么小子
在《聪明的一休》里,大家都躲着好奇小子,因为好奇小子老爱问“为什么”,常常会把大家问得无言以对。
公主:一休是我一个人的朋友!
为什么小子:为什么你一个人要霸占他?
公主大声叫:这件事用不着你管!
为什么小子:为什么不用我管呢?
公主:@#@¥#¥
为什么小子:“为什么你脸上的表情这么好笑呢?”
公主:……倒
逻辑与哲学的关系
“哲学”一词出自古希腊文“philo-sophia”,意为“爱智慧”,原意为热爱智慧追求智慧
逻辑与哲学是密切相关的,一直伴随着哲学的发展,从亚里士多德的《工具论》到弗雷格的《算术基础》。当代西方哲学的一个重要方向分析哲学(语言哲学)的发展史就是逻辑学的发展史。
当代西方哲学的另一个重要方向现象学与逻辑也存在密切关系,现象学祖师胡塞尔就是从逻辑研究走向了现象学。
此外,逻辑学给哲学研究提供了一个思维基础,现在哲学的各个子学科基本上都要求有逻辑的基础。比如伦理学也有规范伦理学。
当然,逻辑也是科学的基石和立柱。你看,现代学科都要加上“-logy”的后缀。
科学学科都包含了归纳推理和演绎推理的方法。
在以往,逻辑学是哲学的一个分支。1800中期后,逻辑学也成为数学的一个分支。近代以来,逻辑学成为计算机科学的重要基础。根据应用的领域,逻辑可以分为哲学逻辑,数理逻辑和计算逻辑。
当代逻辑的发展,包含以下几位重要的人物:弗雷格、罗素、维特根斯坦、哥德尔、图灵
现代逻辑的发展
“万一发生争执,正像两个会计员之间无须乎有辩论,两个哲学家也不需要辩论。因为他们只要拿起石笔,在石板前坐下来,彼此说一声(假如愿意,找个朋友作证):我们来算算,也就行了。” --莱布尼兹
德国思想家莱布尼兹是有史以来最伟大的思想家之一。他与牛顿分别独立发现了微积分,后世使用的微积分主要使用莱布尼兹的符号;
他提出了通用计算的思路,使用计算来代替思考。他的这种想法,对于后来数理逻辑、计算机科学和分析哲学有重大影响;他提出了可能世界思想。如果某世界与现有世界并不矛盾,那就是可能的世界。他的可能世界思想后来被克里普克发展为可能世界语义,广泛用于非经典逻辑的语义解释;他还系统提出了二进制,这是现代计算机使用的内部语言。
弗雷格对于我们也许是陌生的名字,然而弗雷格是上世纪最伟大的思想家之一。他的《概念语言》一书,系统提出了现代逻辑,用严格清晰的数学符号来研究逻辑学。因此,他开创的现代逻辑学又称为数理逻辑,或符号逻辑。为什么说他是上世纪最伟大的思想家之一,这一点没有夸张。
他开创的数理逻辑对上世纪的科学和哲学两大领域都有重大影响。一方面,顺着罗素,希尔伯特,哥德尔,计算机之父图灵机,人工智能之父麦卡锡这个方向,他开创的数理逻辑思想被广泛用到计算机科学,被广泛用到人工智能和程序证明。另一方面,顺着罗素,维特根斯坦,卡尔纳普,奎因,普特南这个方向,他开创的数理逻辑及概念分析法发展成分析哲学。而分析哲学,是当前西方哲学的主流方向之一。
罗素的头衔很多,哲学家,数学家,逻辑学家,社会活动家,文学家。他在逻辑学方面的成就,主要是与他的老师怀特海编写了《数学原理》,使得弗雷格开创的数理逻辑更加系统更加完善。
如果说弗雷格是数理逻辑的开山祖师,那么罗素就是数理逻辑的集大成者。罗素继续弗雷格的逻辑主义,想把数学归结到逻辑上。然后,他自己提出的罗素悖论使这一努力失败。
布劳维尔:荷兰数学,自立门户,提出了直觉主义思想,反对康托尔集合,认为罗素悖论是根源于非构造性的数学,强调构造性证明,反对基于无穷集的排中律。
“我们必须知道,我们必将知道。”--希尔伯特
数学基础出现了矛盾,以确定性追求为己任的数学家如何受得了。集合论的矛盾弥漫开来,有人也怀疑算术是否也有矛盾。为了捍卫古典数学的尊严,作为当时数学界的领袖,希尔伯特当仁不让,接过了这个挑战。
继1900在数学家大会上提出著名的希尔伯特23个问题后,1904年,希尔伯特在数学家大会上又提出一个证明算术无矛盾性的思路。
这个思路也称为形式主义纲领,它的核心思想是将算术表达为一种形式系统或称公理系统,然后用有穷步骤证明该系统的无矛盾性。希尔伯特的目的是试图对形式系统的无矛盾性给出让大家都可以接受的证明,以便克服悖论所引起的危机,一劳永逸地消除对数学基础以及数学推理方法可靠性的怀疑。对于这个纲领,希尔伯特信心十足,在哥尼斯堡演讲中说出了上面的话。
哥德尔研究了希尔伯特纲领,给出否定的答案,宣告希尔伯特纲领的失败。1930年提出的哥德尔第二不完备性说,任何包含一阶算术的形式系统,该形式系统的无矛盾性,在该形式系统内无法通过有穷的步骤得到证明。在定理的证明中,哥德尔还提出了很多有用的理论,比如如何把符号编码为自然数,还有使用递归函数来研究有穷证明的能力范围。
哥德尔的工作揭示了有些问题是不可通过有限的步骤得以证明的,那么什么问题是可以通过有限的步骤证明的?沿着这个问题,哥德尔的很多工作,被应用到了可计算性的研究。什么是可以有穷证明的,从可计算性的角度来说对应于,什么是可以计算的。
哥德尔不完备定理出世后,在剑桥大学的图灵设想:能否有这样一台机器,通过某种一般的机械步骤,能够解决所有可以解决的数学问题。以上机器就是他提出来的图灵机。图灵机可以计算的问题,就称为图灵机可计算。
它由一个控制器和一条两端可无限延长的工作带组成:工作带起着存储器的作用,它被划分为无穷多个可写可擦的方格。控制器则可以在带上左右移动,控制带有一个读写头,读写头可以读出当前方格内的符号,然后根据预先设计的状态转换指令,选择改写或抹去这一符号,然后选择往左移一格,往右移一格或者不移动,并进入下一个状态。当状态转换到停机状态,则停止运行。
图灵机的出现,奠定了计算机科学的理论基础,计算机的出现已经主要是技术实现的问题了。据说,图灵在二战期间主持设计了一台计算机。但资料比较多的,1946年,数学家冯...诺依曼主持设计了第一台计算机。但不管如何,图灵被广泛认为是“计算机之父”。现代计算机的计算能力,还是在图灵机的计算能力之内,当然速度是越来越快了。图灵开辟了一条大路,后来的科学家又开辟了一些中路小路,我们则行走在前人铺就的路上。
1966年,美国计算机协会设立以图灵为名的“图灵奖”,用于表彰在计算机科学领域做出突出贡献的科学家。图灵奖的得主有: Ken Thompson ,Dennis M. Ritchie, Minsky,“人工智能之父”McCarthy,Dijkstra,Knuth,Backus,Floyd,Hoare,Codd,Cook,Thompson,Wirth,姚期智,RSA三人,“互联网之父”Cerf和Kahn……
逻辑与计算机科学的关系
在第三次数学危机中,随着罗素悖论等难题的出现,经典数学的方法受到了空前的置疑:反证法、实无穷。学者们思考这样一个问题:什么样的数学,是确定的?
在对经典数学的批判过程中,一些构造性的计算模型成长了起来:递归函数论、公理系统、图灵机和lambda演算等。在这些计算模型之上,学者们提出了何谓“计算”。
有趣的是,这些计算模型的计算能力是相同的。因此,目前人们对于“计算”的理解,就是基于这些计算模型之上的计算能力。量子计算的计算能力还是在这个范围之内。
其次,因为这些计算模型的等价性,图灵机的计算问题也可以化为在逻辑层面上的逻辑问题。比如P与NP是否相等的问题,也可以在逻辑层面上进行思考。
逻辑的局限
逻辑定理的有效性,依赖于公理和推理规则的有效性。
逻辑定理的有效性,已经包含在前提之中了。在这个意义上,维特根斯坦说定理都是废话。当然了,这些废话埋藏得如此之深,以致于人类不能一下子知道它是废话。这时候,机器可以帮助人类。人类给出前提,机器快速自动推出定理。
这就是当前计算机的价值和局限。未来,能不能发展出能听能看能认识外界能自己进行归纳的机器?
归纳
培根:“知识就是力量”
培根:“读史使人明智,读诗使人聪慧,演算使人精密,哲理使人深刻,论理学使人有修养,逻辑修辞使人善辩”
所谓归纳,是指从许多个别的事物中概括出一般性概念、原则或结论的思维方法。
比如张三有死,李四有死,…,故而归纳出“所有人都是有死的”。
又如鸽子会飞,大雁会飞,…,故而归纳出“所有鸟都是会飞的”。
休谟难题
以前每天太阳都会升起,那么明天的太阳是否必然也会升起?如果回答是必然,请问如何证明?
最早对归纳法提出置疑的是英国哲学家休谟,所以归纳法的合理性问题也称为“休谟问题”。
因为在科学研究中,特别是经验科学如物理学,经常进行实验再使用归纳法来得出知识。所以,休谟问题其实也是“知识如何保证”的问题。
因为休谟提出这个问题,有学者就认为休谟反对理性,这有点奇怪,难道要信仰“理性万能”才理性吗?难道能提出理性局限的人不是更理性吗?
休谟认为:“说到过去的经验那我们不能不承认,它所给我们的直接的确定的报告,只限于我们所认识的那些物象和认识发生时的那个时期。但是这个经验为什么可以扩展到将来,扩展到我们所见的仅在貌相上相似的别的物象;则正是我所欲坚持的一个问题。”他认为归纳推理的合理性不可证明,宣称这类推理只是一种心理“习惯”。
休谟虽然否认归纳法有逻辑的合理性,但是,休谟并不否认归纳法对于人们的指导作用。作为一名经验主义者,休谟在生活中很推崇归纳法。
几百年来,哲学家们尝试想攻克“休谟问题”,比如康德,始终以失败告终。当然,也有一些成果。比如使用概率来解释归纳。虽然有“休谟问题”,虽然不能证明知识是必然正确的,但与休谟一样,我们还是使用归纳法来获得科学知识,因为这些科学知识很实用。
归纳的局限
归纳出来的知识永远无法被证明是完全正确的。
归纳出来的知识是可错的,比如“所有的鸟都会飞”。
逻辑与归纳的结合
逻辑与归纳其实是分不开的。
逻辑的前提,往往来源于归纳。
根据前提,逻辑又可以推导出更多的定理和知识。
比如物理学,就是逻辑与归纳的完美结合。
何谓科学
什么是科学?什么不是科学?
关于科学的标准,比较直观的是“可证实性”标准。如果一个理论是可以证实的,那么该理论就是科学的。但是这个标准存在一些困难,对于一些全称语句比如“所有的鸟都会飞”或者“所有的人都是要死的”这样的理论,我们无法一一证实。
波普尔引入了“可证伪性”作为科学标准。如果一个理论是可以证伪的话,那么该理论就是科学理论。
后来,库恩提出了一种更全面的标准。他把科学看作一定的科学共同体按照一套共有的“范式”所进行的专业活动,并描绘了一种常规时期和科学革命时期相互交替的科学发展模式。
科学的一般方法
找到问题:寻找一个合适的问题,最好要有应用的前景。
分析问题:全面理解这个问题,前提是什么,有没有隐藏的前提,前提会不会太弱,结论是什么。如果此前没人研究过,如何把问题讲清楚?
前人对于这个问题做出了什么贡献?最新的进展是什么?有什么比较有前景的解决方法?
如何在前人的基础之上,做出自己的贡献?
如果是理科,要证明自己的观点。如果是理工科,还要做实验来验证自己的观点。
数理逻辑课程简介
By: 庄朝晖 发表于 2006-2-16 10:36:49
1、“逻辑”浅释
中文的“逻辑”显然音译自英文的“logic”。logic又来自中古拉丁文的logica,logica又源自希腊文logos(λóγos)。logos一般翻译为“逻格斯”,接近于中文里的“道”。
中文的“道”和希腊文“logos”都有以下两层意思:
(1)各种事物的定义或者各种活动的规则(西方各门学科的名字都以 -logy缀后的习惯)
(2)言说,言谈
这两层意思也是相互关联的。言谈是为揭示事物的道理,道理也往往通过言谈得以显示。我们可以构造一个有趣的句子“道道道”,意思是“道说是通往道理的道路”。
在言谈和辩论中,渐渐发展出逻辑学这一领域。从地域来分,古代逻辑学可以分为希腊逻辑学(亚里士多德),印度逻辑学(因明学)和中国逻辑学(墨子名学)。
在以往,逻辑学是哲学的一个分支。1800中期后,逻辑学也成为数学的一个分支。近代以来,逻辑学成为计算机科学的重要基础。根据应用的领域,逻辑可以分为哲学逻辑,数理逻辑和计算逻辑。
2、逻辑与哲学佛学的关系
逻辑与哲学是密切相关的,一直伴随着哲学的发展,从亚里士多德的《工具论》到弗雷格的《算术基础》。当代西方哲学的一个重要方向分析哲学(语言哲学)的发展史就是逻辑学的发展史,当代西方哲学的另一个重要方向现象学与逻辑也存在密切关系,现象学祖师胡塞尔就是从逻辑研究走向了现象学。此外,逻辑学给哲学研究提供了一个思维基础,现在哲学的各个子学科基本上都要求有逻辑的基础。比如伦理学也有规范伦理学。可以说,逻辑是哲学殿堂的基石和立柱。当然,逻辑也是科学的基石和立柱。你看,现代学科都要加上“-logy”的后缀。
佛学里也有思辨性相当强的集量论和唯识学,与当代西方的分析哲学(语言哲学)和现象学正好存在某种平行的关系。佛学里结合得很完美的集量论和唯识学,无疑将为西方哲学的走向提供一个重要的参考。分析哲学主要提供了研究的形式(手段),确保推理的保真性;现象学则主要提供了研究的内容,确保作为起点的公理的直观性。
此外,佛学在使用逻辑的时候,同时也批判逻辑的局限性。在言说真理的时候,我们不得不使用逻辑,但在某些时候我们又必须超越逻辑,才能进一步地认识真理。以下引禅宗一个故事:(赵州)问南泉:“如何是道。”南泉曰:“平常心是道。”师曰:“还可趣向否。”南泉曰:“拟向即乖。”师曰:“不拟时如何知是道。”南泉曰:“道不属知不知。知是妄觉。不知是无记。若是真达不疑之道。犹如太虚廓然虚豁。岂可强是非耶。”师言下悟理。
3、数理逻辑与计算机科学的关系
(1) 首先,从计算模型和可计算性的研究来看,可计算函数和可计算谓词(一种能够能行判定其真值的断言或逻辑公式)是等价的,相互之间可以转化。这就是说,计算可以用函数演算来表达,也可以用逻辑系统来表达。作为计算模型可以计算的函数恰好与可计算谓词是等价的,而逻辑系统又能通过自身的无矛盾性保证这样一种计算模型是合理的。由此可见,作为一种数学形式系统,图灵机及其与它等价的计算模型的逻辑基础是坚实的。人工智能领域的一个重要方向就是基于逻辑的人工智能。
(2) 实际计算机的设计与制造中,使用数字逻辑技术实现计算机的各种运算的理论基础是代数和布尔代数。布尔代数只是在形式演算方面使用了代数的方法,其内容的实质仍然是逻辑。
(3) 从计算机程序设计语言方面考察,语言的理论基础是形式语言、自动机与形式语义学。而形式语言、自动机和形式语义学所采用的主要研究思想和方法来源于数理逻辑和代数。程序设计语言中的许多机制和方法,如子程序调用中的参数代换、赋值等都出自数理逻辑的方法。此外,在语言的语义研究中,四种语义方法最终可归结为代数和逻辑的方法。而且,程序的语义及其正确性的理论基础仍然是数理逻辑,或进一步的模型论。
(4) 在计算机体系结构的研究中,象容错计算机系统、Transputer计算机、阵列式向量计算机、可变结构的计算机系统结构及其计算模型等都直接或间接与逻辑与代数密不可分。如容错计算机的重要基础之一是多值逻辑,Transputer计算机的理论基础是CSP理论,阵列式向量计算机必须以向量运算为基础,可变结构的计算机系统结构及其计算模型主要采用逻辑与代数的方法。
(以上参考赵致琢老师《计算科学导论》)
4、数理逻辑基础的两种教学模式
“数理逻辑基础”是计算机科学与技术专业核心基础课程,也是学科重点专业基础课程之一,属于教学计划中的必修课程。数理逻辑和代数是计算机科学最重要的数学基础。历史上,数理逻辑在发展中受不同数学学派的影响甚深,形成了不同的逻辑学派。各逻辑学派在表达数理逻辑基础内容时,在对内容的选材和表达形式方面存在很大不同,考虑到对计算机科学学科影响较大的是形式主义逻辑学派和直觉主义逻辑学派,因此,课程教学大纲在制定时划分为两个模式。
其中,第一模式介绍基于形式主义逻辑学派的数理逻辑基础内容,第二模式介绍基于直觉主义逻辑学派观点的数理逻辑基础内容。
本课程(第一模式)的教学任务是,以基础数学、计算机科学、科学哲学和人的日常生活为广泛的背景,从形式主义的观点,介绍作为数学基础分支之一的数理逻辑基础知识,帮助学生掌握数理逻辑基础最基本的知识,为今后逐步实现理性层面上的思维方式的数学化打下坚实的基础,为后续课程提供必要的数理逻辑基础。
5、课程内容
数理逻辑概述:数理逻辑的发展概述;数理逻辑与科学思想方法;逻辑演算与符号约定;
命题逻辑的非形式演算:基本概念;等值演算;范式;公式的蕴涵和推理;
命题逻辑的形式演算:形式系统简介;形式系统;形式系统的性质;
一阶谓词逻辑的非形式演算:基本概念;等值演算与前束范式;公式的蕴涵和推理;
一阶谓词逻辑的形式演算:形式系统;可证等值;形式系统的性质;模型;
归结原理:Skolem标准型与子句集;子句集的Herbrand域;Herbrand定理;合一算法;归结原理及其完备性
直觉主义逻辑:直觉主义的直观介绍;直觉主义的一阶谓词逻辑的非形式演算;直觉主义的一阶谓词逻辑的形式演算;直觉主义逻辑的Kripke语义;直觉主义逻辑的完备性;
数学系统:一个例子;含有等词的一阶系统;群论;一阶算术;形式集论;相容性与模型
(* Gödel不完全性定理:引言;可表达性;递归函数和递归关系;Gödel编码;不完全性定理)
数理逻辑与计算机科学(这部分内容结合短学期以讲座形式开设):数理逻辑的发展;数理逻辑与计算理论;数理逻辑与算法;数理逻辑与程序设计语言;数理逻辑与程序设计;数理逻辑与人工智能;数理逻辑与计算机硬件系统;数理逻辑与其他分支学科。
6、使用教材和参考书:
1、Hamilton, logic for mathematicians, Cambridge University Press,1978(国内影印本,清华大学出版社,2003)
相应中译本:哈密尔顿著,骆如枫等译,《数学家的逻辑》,商务印书馆,1989年
2、胡世华、陆钟万著,《数理逻辑基础》,科学出版社,1981
3、陆钟万著,《面向计算机科学的数理逻辑》,科学出版社,1998
4、S.C.Kleene著,莫绍揆译,《元数学导论》,科学出版社,1985(数理逻辑与递归函数的关系有较深入展开)
5、Lassaigne, et al., logic and complexity, Springer, 2004(较新,关于逻辑与复杂性有较深入展开)
“逻辑”和“程序”浅释
By: 庄朝晖 发表于 2005-9-12 11:40:57
logic溯源
logical 来自名词logic,logic又来自中古拉丁文的logica,logica又源自希腊文logos(λóγos)。logos一般翻译为“逻格斯”,接近于中文里的“道”。
中文里,“道”的原始意义是路。后来引申为行事之路,以及所行之事之路,成为一个抽象名词“道”,指称各种活动以及事物的法术、规范、法则等等。如“吾不知其名强名曰道”、“王道”和“盗亦有道”。在汉语中,道字除了上述的一切意义外,还有一个常用的意思,就是谈说。如“道可道,非常道”里的第二个道。
逻各斯是由赫拉克利特首先引入哲学的。从他的著作残篇和别人引述中可以看到,他时而说逻各斯是创生世界的种子,时而说它是万物变化的尺度,有时则简单地等于讲演,有时又似乎用如声望,充分表现出一个新范畴常有的那种性格的不确定性。后来在亚里士多德手里,逻各斯多被用来表示事物的定义或公式,以致铸成了西方各门学科的名字都以 -logy缀后的习惯。所有这些,以及由此更引申开去的哲学的、神学的种种解释,什么万物的本元,宇宙的灵魂,人神的媒介,以及理性、判断、根据、关系等等,万变不离其宗,都并未跳出言谈及以言谈展示所谈让人来看这个原始樊篱(参见海德格尔《存在与时间》第七节)。(以上参考庞朴《解牛之解》)
“逻格斯”的基本含义为言谈。在言谈和辩论中,渐渐发展出逻辑学这一领域。从地域来分,古代逻辑学可以分为希腊逻辑学(亚里士多德),印度逻辑学(因明学)和中国逻辑学(墨子名学)。
在以往,逻辑学是哲学的一个分支。1800中期后,逻辑学也成为数学的一个分支。近代以来,逻辑学成为计算机科学的重要基础。根据应用的领域,逻辑可以分为哲学逻辑,数理逻辑和计算逻辑。
程序:
程序:算法在计算机上的实现。对于特定的程序语言来讲,程序即符合该语言语法的语句的有限系列。
所谓算法,是对特定问题求解步骤的一种描述,它是指令的有限序列,其中一条指令表示一个或多个操作。值得注意的是,算法刚提出时是一个模糊的直观的概念。后来,又出现了Turing命题和Church命题。所谓Turing命题,即算法是Turing可计算的。所谓Church命题,即算法是递归可计算的。后来证明,Turing可计算的等价于递归可计算的。所以,Turing命题和Church命题也合称Church-Turing命题。该命题是对算法概念的一个更严格的刻画。当今的计算机,尽管硬件速度越来越快,它们的理论背景仍旧是Turing机。所以,它们的计算机能力也还在Turing可计算的范围内。
算法具有下列特性:有穷性,确定性,可行性,有相关联的输入和输出(正确性)。
在我看来,计算机科学主要关注两个问题:一是什么问题是可计算的,另一个是如何计算得更快。在第一个层面,我们把一些原来以为不可计算的问题可计算化,如机器博弈,自动定理证明,机器翻译等等。在这个层面,关注计算的效果能否达到要求(如机器下棋能否超过人类,机器翻译能否进入实用领域)。在第二个层面,我们追求如何用尽量少的资源(时间空间等)来求解问题。在这个层面,关注计算的复杂性问题(复杂性分析,实验数据分析)。当然,这两个层面,也经常是混合在一起的。
逻辑与程序:
那么,逻辑在什么程度上是可以计算的?也就是说逻辑与程序又存在什么关系?
在更一般层面上,逻格斯与算法也具有一定的关系。举个例子,人工智能的测试离不开言谈。所谓的图灵测试,我们也可以这样理解。把一位具有人类外形的机器人放到人群中去,在言谈交往中,看我们是否能够把它辨别出来。如果不能,该机器人就达到人类智能的水平。图灵测试的标准不外还是言谈,或者更多的也可以是言谈举止。
在逻辑与程序层面,我们知道,命题逻辑是可以判定的。也就是说,任给一个命题公式,存在一个能行的算法判断出该公式是恒真的,恒假的或者是可满足的。但是,一阶逻辑只是半可判定的。也就是说,存在一个能行的算法,该算法对于任意给定的公式来说,如果该公式是恒真的,算法能够成功结束。否则算法不停机。另外,还可以对一阶系统加入一些限制条件,在这些限制条件下,该系统也可以是可判定的,也就是可计算的,比如基于HORN字句的PROLOG语言就是一门逻辑程序设计语言,还有目前正在研究的一些扩充逻辑程序语言(如回答集等)。
2005年9月12日于厦门大学
MIT人工智能实验室:如何做研究? 1(转贴)
By: 庄朝晖 发表于 2006-12-10 23:19:00
麻省理工学院人工智能实验室AI Working Paper 316
作者:人工智能实验室全体研究生
编辑:David Chapman 版本:1.3 1988年9月
译者:柳泉波北京师范大学信息学院2000级博士生
摘要 本文的主旨是解释如何做研究。我们提供的这些建议,对做研究本身(阅读、写作和程序设计),理解研究过程以及开始热爱研究(方法论、选题、选导师和情感因素),都是极具价值的。
备注 人工智能实验室的Working Papers用于内部交流,包含的信息由于过于初步或者过于详细而无法发表。不像正式论文那样,会列出所有的参考文献。
1 简介
1.1 这是什么?
并没有什么灵丹妙药可以保证在研究中取得成功,本文只是列举了一些可能会有所帮助的非正式意见。
1.2 目标读者是谁?
本文档主要是为MIT人工智能实验室新入学的研究生而写,但对于其他机构的人工智能研究者也很有价值。即使不是人工智能领域的研究者,也可以从中发现对自己有价值的部分。
1.3 如何使用?
要精读完本文,太长了一些,最好是采用浏览的方式。很多人觉得下面的方法很有效:先快速通读一遍,然后选取其中与自己当前研究项目有关的部分仔细研究。
(1)本文档被粗略地分为两部分。第一部分涉及研究者所需具备的各种技能:阅读、写作和程序设计等。第二部分讨论研究过程本身:研究究竟是怎么回事,如何做研究,如何选题和选导师,如何考虑研究中的情感因素。很多读者反映,从长远看,第二部分比第一部分更有价值,也更让人感兴趣。
(2)如何通过阅读打好AI研究的基础。列举了重要的AI期刊,并给出了一些阅读的诀窍。
(3)如何成为AI研究领域的一员。与相关人员保持联系,他们可以使你保持对研究前沿的跟踪,知道应该读什么材料。
(4)学习AI相关领域的知识。对几个领域都用有基本的理解,对于一个或者两个领域要精通。
(5)如何做研究笔记。
(6)如何写期刊论文和毕业论文。如何为草稿写评审意见,如何利用别人的评审意见。如何发表论文。
(7)如何做研究报告。
(8)关于程序设计。AI程序设计与平常大家习惯的程序设计有什么不同。
(9)如何选导师。这是研究生生涯的最重要的问题,不同的导师具有不同的风格,本节的意见有助于你找到合适的导师。导师是你必须了解如何利用的资源。
(10)关于毕业论文。毕业论文将占据研究生生涯的大部分时间,本部分涉及如何选题,以及如何避免浪费时间。
(11)有关研究方法论。本节的内容较少,尚不完善。
(12)研究过程中的情感因素。这或许是最重要的一节,包括如何面对失败、如何设定目标、如何避免不安全感、如何保持自信和享受快乐等。
2 阅读
很多研究人员要花一半的时间阅读文献。其实从别人的工作中也可以很快地学到很多东西。本节讨论的是AI中的阅读,在第4节将论述其他相关主题的阅读。
阅读文献要始于刚刚入学的今日。一旦你开始写作论文,就没有多少时间了,那时的阅读主要集中于与论文主题相关的文献。在研究生的头两年,大部分的时间要用于做课程作业和打基础。此时,阅读课本和出版的期刊文章就可以了。(以后,你将主要阅读文章的草稿,参看第3节)。
在本领域打下坚实的基础所需要的阅读量,是令人望而却步的。但既然AI只是一个很小的研究领域,因此你仍然可以花几年的时间阅读本领域已出版的数量众多论文中最基本的那部分。一个有用的小技巧是首先找出那些最基本的论文。此时可以参考一些有用的书目:例如研究生课程表,其他学校(主要是斯坦福大学)研究生录取程序的建议阅读列表,这些可以让你有一些初步的印象。如果你对AI的某个子领域感兴趣,向该领域的高年级研究生请教本领域最重要的十篇论文是什么,如果可以,借过来复印。最近,出现了很多精心编辑的有关某个子领域的论文集,尤其是Morgan-Kauffman出版的。
AI实验室有三种内部出版物系列:Working Papers,Memos和Technical Reports,正式的程度依次增加,在八层的架子上可以找到它们。回顾最近几年的出版物,将那些非常感兴趣的复制下来。这不仅是由于其中很多都是意义重大的论文,对于了解实验室成员的工作进展也是很重要的。
有关AI的期刊有很多,幸运的是,只有一部分是值得看的。最核心的期刊是Artificial Intelligence(也有写作"the Journal of Artificial Intelligence"或者"AIJ"的)。AI领域真正具备价值的论文最终都会投往AIJ,因此值得浏览每一年每一期的内容;但是该期刊也有很多论文让人心烦。Computational Intelligence是另外一本值得一看的期刊。Cognitive Science也出版很多意义重大的AI论文。Machine Learning是机器学习领域最重要的资源。IEEE PAMI(Pattern Analysis and Machine Intelligence)是最好的有关视觉的期刊,每期都有两三篇有价值的论文。International Journal of Computer Vision(IJCV)是最新创办的,到目前为止还是有价值的。Robotics Research的文章主要是关于动力学的,有时候也有划时代的智能机器人论文。IEEE Robotics and Automation偶尔有好文章。
每年都应该去所在学校的计算机科学图书馆(在MIT的Tech Square的一层),翻阅其他院校出版的AI技术报告,并选出自己感兴趣的仔细加以阅读。
阅读论文是需要练习的技能。不可能完整地阅读所有的论文。阅读论文可分为三个阶段:第一阶段是看论文中是否有感兴趣的东西。AI论文含有摘要,其中可能有内容的介绍,但是也有可能没有或者总结得不好,因此需要你跳读,这看一点那看一点,了解作者究竟做了些什么。内容目录(the table of contents)、结论部分(conclusion)和简介(introduction)是三个重点。如果这些方法都不行,就只好顺序快速浏览了。一旦搞清楚了论文的大概和创新点,就可以决定是否需要进行第二阶段了。在第二阶段,要找出论文真正具有内容的部分。很多15页的论文可以重写为一页左右的篇幅;因此需要你寻找那些真正激动人心的地方,这经常隐藏于某个地方。论文作者从其工作中所发现的感兴趣的地方,未必是你感兴趣的,反之亦然。最后,如果觉得该论文确实有价值,返回去通篇精读。
读论文时要牢记一个问题,“我应该如何利用该论文?”“真的像作者宣称的那样么?”“如果……会发生什么?”。理解论文得到了什么结论并不等同于理解了该论文。理解论文,就要了解论文的目的,作者所作的选择(很多都是隐含的),假设和形式化是否可行,论文指出了怎样的方向,论文所涉及领域都有哪些问题,作者的研究中持续出现的难点模式是什么,论文所表达的策略观点是什么,诸如此类。
将阅读与程序设计联系在一起是很有帮助的。如果你对某个领域感兴趣,在阅读了一些论文后,试试实现论文中所描述的程序的“玩具”版本。这无疑会加深理解。
可悲的是,很多AI实验室天生就是孤僻的,里面的成员主要阅读和引用自己学校实验室的工作。要知道,其他的机构具有不同的思考问题的方式,值得去阅读,严肃对待,并引用它们的工作,即使你认为自己明晓他们的错误所在。
经常会有人递给你一本书或者一篇论文并告诉你应该读读,因为其中有很闪光的地方且/或可以应用到你的研究工作中。但等你阅读完了,你发现没什么特别闪光的地方,仅仅是勉强可用而已。于是,困惑就来了,“我哪不对啊?我漏掉什么了吗?”。实际上,这是因为你的朋友在阅读书或论文时,在头脑中早已形成的一些想法的催化下,看出了其中对你的研究课题有价值的地方。
3 建立关系
一两年后,对自己准备从事的子领域已经有了一些想法。此时——或者再早一点——加入Secret Paper Passing Network是很重要的。这个非正式的组织是人工智能真正在做什么的反映。引导潮流的工作最终会变成正式发表的论文,但是至少在牛人完全明白一年之后,也就是说,牛人对新思想的工作至少领先一年。
牛人如何发现新思路的?可能是听自于某次会议,但是最可能来自于Secret Paper Passing Network。下面是该网络工作的大致情况。Jo Cool有了一个好想法。她将尚不完整的实现与其他一些工作融合在一起,写了一份草稿论文。她想知道这个想法究竟怎么样,因此她将论文的拷贝发送给十位朋友并请他们进行评论。朋友们觉得这个想法很棒,同时也指出了其中的错误之处,然后这些朋友又把论文拷贝给他们各自的一些朋友,如此继续。几个月后,Jo对之进行了大量修订,并送交给AAAI。六个月后,该论文以五页的篇幅正式发表(这是AAAI会议录允许的篇幅)。最后Jo开始整理相关的程序,并写了一个更长的论文(基于在AAAI发表论文得到的反馈)。然后送交给AI期刊。AI期刊要花大约两年的时间,对论文评审,包括作者对论文修改所花费的时间,以及相应的出版延迟。因此,理想情况下,Jo的思想最终发表在期刊上需要大约三年时间。所以牛人很少能从本领域出版的期刊文章中学到什么东西,来得太迟了。
你,也可以成为一个牛人。下面是建立学术关系网的一些诀窍:
(1)有很多讨论某个AI子领域(如连接主义或者视觉)的邮件列表,选择自己感兴趣的列表加入。
(2)当与很熟悉本领域的人讨论自己的思想时,他们很可能不直接评价你的想法,而是说:“你读过某某吗?”这并不是一个设问,而是建议你去阅读某份文献,它很可能与你的想法有关系。如果你还没有读过该文献,从跟你交谈的高手那里得到该文献的详细信息,或者直接从他那里借一份拷贝下来。
(3)当你读到某份让你感到很兴奋的论文,复印五份送交给对之感兴趣的其他五个人。他们可能会反馈回来很好的建议。
(4)本实验室有很多针对不同子领域的非正式(持续发展的)论文讨论组,他们每星期或每两星期聚会一次,对大家阅读完的论文进行讨论。
(5)有些人并不介意别人去翻看他们的书桌,也就是说,去翻阅他们堆在书桌上的不久要阅读或者经常翻阅的论文。你可以去翻翻看,有没有自己感兴趣的。当然了,首先要得到主人的许可,要知道有些人确实反感别人翻自己的东西。去试试那些平易近人的人。
(6)同样,有些人也并不介意你翻看他们的文件柜。实验室中可是有很多学问精深的人,他们的文件柜里也有好多宝贝。与利用学校图书馆相比,这通常是更快更可靠的寻找论文的方式。
(7)只要自己写下了些东西,将草稿的拷贝分发给那些可能感兴趣的人。(这也有一个潜在的问题:虽然AI领域的剽窃很少,但也确实有。你可以在第一页写上“请不要影印或者引用”的字样以做部分防范。)大部分人并不会阅读自己收到的大部分论文,因此如果只有少数人返回评论给你,也不用太在意。你可以如此反复几次——这是期刊论文所必需的。注意,除了自己的导师,一般很少将两次以上的草稿送给同一个人。
(8)当你写完一篇论文后,将论文的拷贝送给那些可能感兴趣的人。别以为人家自然而然地就会去阅读发表论文的期刊或者会议录。如果是内部的出版物(备忘录和技术报告)就更不容易读到了。
(9)你保持联系的人越是各式各样,效果就越好。尝试与不同研究组,AI实验室,不同学术领域的人交换论文。使自己成为没有联系的两个科研组交流的桥梁,这样,很快的,你的桌子上就会冒出一大摞相关的论文。
(10)如果某篇论文引用了自己感兴趣的某些东西,做好笔记。维护一份自己感兴趣参考文献的日志。到图书馆去看看能不能找到这些论文。如果要了解某个主题的发展轨迹,可以有意地去做一张引用的“参考文献”图。所谓的参考文献图,是指引用组成的网:论文A引用B和C,B引用C和D,C引用D,等等。注意那些被经常引用的论文,这通常是值得阅读的。参考文献图有奇妙的性质。一个是经常有研究同一主题的研究组相互不了解。你搜索该图,突然发现了进入另一部分的方式,这通常出现于不同学校或者不同方法存在的地方。尽可能了解多种方法是很有价值的,这总比非常深入的了解某一种方法更好。
(11)暂时搁置。跟别人交谈,告诉他们你在做什么,并询问人家在做什么。(如果你对与别的学生讨论自己的想法感到害羞,也要坚持交谈,即使自己没有什么想法,与他们讨论自己认为确实优秀的论文。这将很自然地引导到下一步做什么的讨论。)每天中午在活动楼七层有一个非正式的午餐讨论会。在我们实验室,人们都习惯于晚上工作,所以午餐的时候可以跟别人组成松散的小组进行讨论。
(12)如果你与外界的交流很多——做演示或者参加会议——去印张事务名片,主要要使自己的名字容易记住。
(13)从某个时间开始,你将会开始参加学术会议。如果你确实参加了,你会发现一个事实,几乎所有的会议论文都令人生厌或者愚蠢透顶。(这其中的理由很有意思,但与本文无关,不做讨论)。那还去参加会议干吗?主要是为了结识实验室之外的人。外面的人会传播有关你的工作的新闻,邀请你作报告,告知你某地的学术风气和研究者的特点,把你介绍给其他人,帮助你找到一份暑期工作,诸如此类。如何与别人结识呢?如果觉得某人的论文有价值,跑上去,说:“我非常欣赏您的论文”,并提问一个问题。
(14)获得到别的实验室进行暑期工作的机会。这样你会结识另外一群人,或许还会学到另外一种看待事物的方式。可以去问高年级同学如何获取这样的机会,他们或许已经在你想去的地方工作过了,能帮你联系。
4 学习其他领域
通常的情况,你只能做AI领域的事情,对AI领域之外的事情一无所知,好像有些人现在也仍然这么认为。但是,现在要求好的研究者对几个相关的领域都了解颇深。计算的可行性本身并没有对什么是智能提供足够的约束,其他的领域给出了其他形式的约束,例如心理学获得的经验数据。更重要的是,其他的研究领域给了你思考的新工具,看待智能的新方法。学习其他领域的另外一个原因是AI本身并没有评价研究价值的标准,全是借自于其他领域。数学将定理作为进展;工程会问某个对象是否工作可靠;心理学要求可重复的试验;哲学有严格的思辨;等等。所有这些标准有时都在AI中起作用,熟悉这些标准有助于你评价他人的工作,深入自己的工作以及保护自己的工作。
经过六年左右的研究方可获得MIT的PhD,你可以在一到两个非AI领域里打下坚实的基础,在更多的领域内具有阅读水平,并且必须对大部分内容具有一定程度的理解。
下面是如何学习自己所知甚少领域的一些方法:
(1)选修一门研究生课程,这很牢靠,但通常不是最有效的方法。
(2)阅读课本。这方法还算不错,不过课本的知识经常是过时的,一般还有很高比例的与内容无关的修辞。
(3)找出该领域最棒的期刊是什么,向该领域的高人请教。然后找出最近几年值得阅读的文章,并跟踪相关参考文献。这是最快的感受该领域的方法,但有时候你也许会有错误的理解。
(4)找出该领域最著名的学者,阅读他们所著的书籍。
(5)跟该领域的研究生泡在一起。
(6)参看外校研究该领域的系的课程表。拜访那里的研究院办公室,挑选有用的的文献。
下面是一些需要了解的与AI有关的科目:
(1)计算机科学是我们所使用的技术。你需要选修的初级研究生课程肯定不能让你对计算机科学有足够的了解,因此你必须通过阅读学习更多的知识。计算机科学所有的领域——理论体系结构,系统,语言等等——都是必须学习的。
(2)数学可能是接下来需要了解的最重要的学科。对于工作在视觉或者机器人学的人来说更关键。对于以系统为中心的工作,表面上看,并不相关,但数学会教你有用的思维方式。你需要能阅读定理,如果具有证明定理的能力将会给本领域的大多数人留下深刻的印象。很少有人能自学数学,光做个听众是不够的,还得做习题集。尽可能早地选修尽可能多的数学课,其他领域的课程以后选也很容易。
计算机科学是以离散数学为基础的:代数,图论,等等。如果你要从事推理方面的工作,逻辑是很重要的。逻辑在MIT用得不多,但是在斯坦福以及其他地方,这是认识思维的主流方法。所以你必须具备足够的逻辑知识,这样你才能保护自己的观点。在MIT数学系选修一两门课程就足够了。要是研究兴趣在感知和机器人,那么不仅需要离散数学,还需要连续数学。在分析,微分几何和拓扑学具有扎实的基础将会给你提供最常使用的技巧。统计和概率只是一般有用。
(3)认知心理学与AI共享几乎完全相同的观点,但是实践者确实具有不同的目标,他们主要是做实验而不是写程序。每一个人都需要知道认知心理学的某些知识。在MIT,Molly Potter开了一门很好的有关认知心理学的初级研究生课程。
(4)如果你想做有关学习的工作,那么发展心理学是很重要的。发展心理学从一般意义上讲也是很有用的,它能告诉你对于人类智能来说,哪些事情难哪些容易。它还给出了有关认知体系结构的认知模型。例如,有关儿童语言习得的工作就对语言处理理论施加了坚实的约束。在MIT,Susan Carey开了一门很好的有关发展心理学的初级研究生课程。
(5)心理学中更“软”的部分,例如心理分析和社会心理学,对AI的影响看似很小,但具有潜在的重大意义。它们会给你非常不同的理解人是什么的方式。象社会学和人类学这样的社会科学可以起相似的作用。具有多种观点是很有用的。上述学科你需要自学。不幸的是,很难区分出这些领域哪些是优秀的成果哪些是垃圾。到哈佛去学习:对于MIT的学生来说,很容易交叉注册哈佛的课程。
(6)神经科学告诉我们有关人体可计算硬件的知识。随着最近可计算神经科学和联结主义的兴起,对AI具有非常大的影响。MIT的脑和行为科学系提供了非常好的课程,视觉(Hildreth, Poggio, Richards, Ullman),移动控制(Hollerbach, Bizzi)和普通神经科学(9.015,由专家组讲授)。
(7)如果你想研究自然语言处理,语言学是很重要的。不仅如此,它还包含了很多有关人类认知的约束。在MIT,语言学主要由Chomsky学院负责。你可以去看看是不是符合自己的兴趣。George Lakoff最近出版的书《Women, Fire, and Dangerous Things》可作为另外一种研究程序的例子。
(8)工程,特别是电机工程,已经被很多AI研究机构作为一个研究领域。我们实验室在培养程序中加入了很多需要确实做一些东西的要求,例如分析电路。了解EE也有助于建造定制的芯片或者调试自己的Lisp机器上的电源。
(9)物理学对于那些对感知和机器人感兴趣的人具有强大的影响。
(10)哲学是所有AI领域看不见的框架。很多AI工作都有蕴含着哲学的影响。学习哲学也能帮助你运用或者读懂很多AI论文中用到的观点。哲学可沿着至少两个正交的轴分解。哲学通常是某种东西的哲学;有关思维和语言的哲学与AI更相关。然后存在着多种哲学学派,从比较大的范围来分,哲学可分为分析哲学和大陆哲学。分析哲学有关思维的观点与AI领域大多数研究者一致。大陆哲学则对我们习以为常的很多东西有非常不同的看待方式。它曾经被Dreyfus用于证明AI是不可能的。就在不久前,有几位研究者认为大陆哲学与AI是相容的,提供了另外一种解决问题的方法。MIT的哲学属于分析哲学,哲学学院深深地受到Chomsky在语言学方面工作的影响。
看起来要学习太多的东西,是不是?确实如此。要小心一个陷阱:认为对于所有的X,“只有我对X了解的更多,这个问题才会变得容易”。要知道,与之相关需要进一步了解的东西是永远没完的,但最终你还是要坐下来,解决问题的。
5 笔记
很多科学家都有做科研笔记的习惯,你也应该这样。可能你曾被告知从五年级开始,对于每一门科学课都应该记笔记,确实如此。不同的记笔记方式适用于不同的人,可以做在线笔记,记在笔记本或者便笺簿上。可能需要在实验室有一个,家里还有一个。在笔记本上记录下自己的想法。只有你自己才会去读它,因此可以记得比较随意。记录下自己的思索,当前工作中遇到的问题,可能的解决方案。对将来可能用到的参考文献作小结。
定期翻阅你自己的笔记本。有些人会做月度总结,方便将来的引用。
笔记中记录中的东西经常可以作为一篇论文的骨干。这会使生活变得轻松些。相反,你会发现写粗略的论文——标题,摘要,分标题,以及正文的片段——是一种记录自己当前工作的有效方式,即使你并不准备把它变成一篇真正的论文。(过一段时间你或许会改变想法)。
你或许会发现Vera Johnson-Steiner的书《Notebooks of the Mind》很有用,该书并不是描写如何做笔记的文献,它描述了随着思想片断的积累,创新思想是如何出现的。
6 写作
写作的理由有很多。
(1)在整个读研的过程中,你需要写一到两篇(这取决于你所在系的规定)毕业论文,以获得PhD或者MS。
(2)勤于写作不仅仅给你练习的机会。
(3)学术的规则就是要么发表,要么腐烂。在很多领域和学校,这通常开始于你成为一名教授时,但是我们实验室的很多研究生毕业之前就已经开始发表论文了。鼓励发表和分发论文是很好的政策。
(4)写下自己的想法是很好的调整思路的方式。你会经常地发现自以为很完美的想法一旦写下来就显得语无伦次。
(5)如果你工作的目的是不仅为自己还要为他人服务,就必须把它发表。这也是研究的基本责任。如果你写得精彩,会有更多的人来了解你的工作。
(6)AI但凭单打独斗是很难做的,你需要经常地从他人那里获得反馈。对你的论文作评论就是最重要的一种形式。任何事情,要做就要做到最好。
(7)阅读有关如何写作的书籍。Strunk和White的《Elements of Style》对基本的应该如何不应该如何做了介绍。Claire的《The MLA's Line By Line》(Houghton Mifflin)是有关在句子级别如何编辑的书籍。Jacques Barzun的《Simple and Direct: A Rhetoric for Writers》(Harper and Row, 1985)是有关如何作文的。
(8)写论文时,读读那些写作高超的书,并思考作者的句法运用。你会发现不知不觉地,你已经吸收了作者的风格。
(9)要成为写作高手,需要付出颇多,历经数年,期间还要忍受和认真对待他人的批评。除此之外,并无捷径可走。
(10)写作有时候是很痛苦的,看起来好像是从“实际的”工作中分心了。但如果你已经掌握了写作技巧,写起来会很快。而且如果你把写作当作一门艺术的话,你能从中得到很多乐趣。
(11)你肯定会遇到思路阻塞的情况,这有很多的可能原因,没有一定可以避免的方法。追求完美可能导致思路阻塞:无论开始写什么,总觉得不够好。要理解写作是一个调试的过程。先写一个草稿,然后返回修订。写草稿有助于理顺思路,如果写不出来正文,那就写个大纲。逐步对之细化,直到已经很容易写出子部分的内容。如果连草稿也写不出来,隐藏掉正在写作的所有窗口,然后随便输入自己脑袋里想到的东西,即使看起来好像是垃圾。当你已经写出了很多文本后,重新打开窗口,将刚才写的东西编辑进去。另外一个错误是以为可以将所有的内容依次写出。通常你应该将论文的核心内容写出来,最后才是介绍部分。引起作者思路阻塞的另一个原因是不切实际的以为写作是很容易的事情。写作是耗时耗力的,如果发现自己每天只能写一页,也不要放弃。
(12)完美主义可能会导致对本来已经足够好的论文还在不停地打磨。这是浪费时间。(这也是一种有意无意之间逃避做研究的表现)。将论文看作你与本领域其他人交谈时的一句话。在交谈中,并不是每一句话都是完美的。很少有人会期待自己的某次谈话就是全部的故事,是与对方的最后一次交流。
(13)写信是一种很好的练习。很多技术论文,如果其风格更类似于给朋友的信,那么会有很大的提高。坚持记日记也是练习写作的方法(也会使你试验更多的文体,不仅仅是技术论文)。这两种方法还有其它的实质作用。
(14)一个常见的陷阱是花很多时间去追求修辞而不是内容。要避免这样。LaTeX并非完美,但是它有很多你所需的修饰语。如果这还不够,还可从其他从事这一研究的人那里借用一些词语用法。很多站点(例如MIT)维护了一个写作修辞的库。
(15)清楚自己要表达什么。这是清楚的写作中最难最重要的因素。如果你写了拙劣的东西,且不知道如何修改,这很有可能是因为你不知道自己要说什么。一旦搞清楚了自己要说什么,说就行了。
(16)论文的写作要有利于读者查找到你所做的工作。无论是段落的组织还是通篇的组织,都要将最核心的部分放在前面。要精心写作摘要。确保摘要已经反映出你的好思路是什么。确保自己明白自己的创新点是什么,然后用几句话表达出来。太多的论文摘要只是一般性地介绍论文,说是有一个好思路,却不说是什么。
(17)不要用大话来贩卖你的工作。你的读者都是很优秀的人,正直且自尊。与之相反,也不要为自己的工作道歉或者进行消减。
(18)有时候你意识到某个子句、句子或者段落不够好,却不知道如何修改。这是因为你钻到死胡同里出不来了。你需要返回重写这一部分。现实中这种情况很少发生。
(19)确保自己的论文中有中心思想。如果你的程序在10毫秒内解决了问题X,告诉读者你是如何办到的。不要只是解释你的系统是如何构建的,是做什么的,还要解释其工作原理和价值所在。
(20)写作是给人看的,而不是机器。因此光观点正确是不行的,还要易懂。不要靠读者自己去推理,除非是最明显的推论。如果你在第七页的脚注上解释了某个小玩意的工作原理,接着在第二十三页没有进一步解释就引用了它,此时如果读者感到困惑一点都不值得奇怪。正式的论文要写清楚是很难的。不要模仿数学领域的文献,它们的标准是尽可能少的解释,使读者感到越困难越好。这并不适用于AI。
(21)写完一篇论文后,删掉第一段或者头几句话。你会发现那是与内容无关的一般性话语,更好的介绍语句在第一段最后或者第二段的开头。
如果你等做完所有的工作后才开始写作,会失去很多。一旦开始了某个科研项目,要养成这样的习惯:写作解释当前工作进展或者每几个月学习所得的非正式论文。从你的研究笔记中的记载开始。花两天的时间写下来——如果你花的时间更长,说明你是一个完美主义者。
将论文与你的朋友分享。写的是草稿——不是为了被引用的那种。将论文复制数十份,送给那些感兴趣的人(包括你的导师)。与写正式论文相比,这样做具有很多相同的好处(评论,理清思路,写作练习等等),而且从某种意义上讲,付出无需那么多。经常地,如果你做得不错,这些非正式论文以后可以作为正式论文的骨干内容,也就是从AI实验室的Working Paper成为一篇期刊文章。
一旦你成为Secret Paper Passing Network的成员,会有很多人给你寄论文拷贝要求评论。获得他人对自己的论文的评论是很有价值的。因此你评论的论文越多,你获得支持就越多,也会收到更多人对你论文的评论。不仅如此,学习评价别人的论文也有助你的选择。
为论文写有用的评论是一门艺术。
(1)要写出有用的评论,需要读两遍论文。第一遍了解其思想,第二遍开始作评论。
(2)如果某人在论文中屡次犯同一错误,不要每次都标记出来。而是要弄清楚模式是什么,他为什么这样做,对此还可以做什么,然后在第一页清晰地指出或者私下交流。
(3)论文的作者在合并你的评论时,将会遵循最小修改的原则。如果可以,就只修改一个词,不行再修改一个词组,再不行才修改整个句子。如果他的论文中某些拙劣之处使得他必须修改整个段落,整个小节甚至整篇论文的组织,要用大字体的字母指出来,这样他才不会忽视。
(4)不要在论文写毁灭性的批评如“垃圾”。这对于作者毫无帮助。花时间提出建设性的建议。要设身处地地为作者着想。
评论有很多种。有对表达的评论,有对内容的评论。对表达的评论也可以很不同,可以是校对打字稿,标点,拼写错误,字词丢失等。应该学一些标准的编辑符号。还可以是校正语法,修辞,以及混乱不清楚的段落。通常人们会持续地犯同一语法错误,因此需要花时间明确地指出。接下来是对组织结构的评论:不同程度(子句,句子,段落,小节乃至一章)的次序混乱,冗余,无关的内容,以及丢失论点。
很难描述对内容进行评论的特征。你可能建议作者扩展自己的想法,考虑某个问题,错误,潜在的问题,表达赞美等。“因为Y,你应该读X”是一种总是有用的评论。
当被要求对论文作评论时,你首先想弄清楚哪种评论更有用。对于早期的论文草稿,需要你主要对内容和论文的组织结构作评论;对于最终的草稿,需要你主要评论表达的细节。
注意,作为一种礼貌,在要求别人评论之前,应首先用拼写检查器对自己的论文进行检查。
你无须接受所有的意见,但是必须都认真对待。将论文的部分内容裁掉是挺令人痛心的,但往往也提高了论文的水平。你经常会发现某个意见确实指出了问题,但是解决方法你觉得不可接受,那么就去寻找第三条道路。
要多发表论文,这其实比想象中的容易。基本上,AI出版物评审者评审论文的标准是:(a)有新意;(b)在某些方面,符合标准。看看IJCAI的会议录,你会发现论文录取的标准相当低。这种情况由于评审过程本身固有的随机性而变得更糟糕了。
所以一个发表论文的诀窍是不停地试。
(1)确保论文可读性比较好。论文被拒绝的原因,除了没有意义之外,就是无法理解或者组织糟糕。
(2)论文在投往期刊之前,应该交流一段时间,并根据反馈的评论进行适当的修订。要抵制那种急匆匆地把结果投往期刊的做法。在AI领域,没有竞赛,而且不管怎么说,出版周期的延迟要大大超过对草稿进行评论的时间。
(3)读一读你想投稿的期刊或者会议的过刊,确保自己论文的风格和内容是适合的。
(4)很多出版物都有一页左右的“作者投稿须知”,仔细看看。
(5)主要的会议都会在被接收的论文中评出内容和表达俱佳的获奖论文,仔细研究研究。
(6)通常是向会议投交一篇篇幅比较短的有关部分工作内容的早期报告,然后再往期刊投交一份篇幅长的最终的正式论文。
(7)论文被拒绝了——千万不要沮丧灰心。
(8)期刊和会议的论文评审过程存在很大的不同。为了节省时间,会议论文的评审必须迅速,没有时间细究或者交流。如果你被拒绝了,你就失败了。但期刊论文则不同,你可以经常地与编辑争辩,通过编辑与评审人争辩。
(9)评审人一般都会对你有帮助。如果你收到了令人生厌的评审报告,应该向大会的程序主席或者编辑投诉。不能期望可以从会议论文评审人的报告那里得到多少反馈。但对于期刊论文,往往可以得到非常棒的建议。你不必完全按照评审报告的建议去做,但是,如果你不按照报告去做,那么就必须解释原因,并且要意识到这可能会导致进一步的负面评价。不管怎么样,无论是哪种的评审,作为评审者都要有礼貌。因为在余下的职业生涯中,你将会与被评审者在一个学术圈子里。
(10)MIT AI Lab Memos大体上是或者接近发表的水平。实际上,Technical Reports基本上都是这些Memos的修订版本。Working Papers则更不正式,这是很好的将自己的论文分发给同事们的方法。要出版这些内部文件,只需到Publications Office(在活动楼八层)领一份表格,并有两位教员签字即可。
就像其它的科研活动一样,论文写作所花的时间总是比期望的要高。论文的发表在耗费时间这个问题上则更严重。当你完成了一篇论文,投出去,等待发表。数月后,论文以及评论被返回来。你不得不对论文进行修改。然后又是几个月,才返回对你的修改的确认。如果你同时发表了该论文的不同形式,如有一篇短的投会议,一篇长的投期刊,这样的过程将反复数个回合。结果有可能是当你已经厌倦了,研究主题也已经令人生厌后数年,你仍然在修改那篇论文。这启示我们:不要去做那些需要热情投入但是很难发表论文的研究——苦不堪言。
7 讲演
与同行交流的另外一种方式就是讲演,上面提到的有关论文写作的问题,同样适用于讲演。站在听众面前从容讲演而不会使听众恹恹欲睡的能力,对于你成功地获得别人的承认、尊敬乃至最终的求职都是很关键的。
讲演的能力不是天生的,下面是一些学习和练习讲演的方法:
(1)Patrick Winston有一篇很好的有关如何作讲演的小论文。每年的一月,他都会就此作讲演,演示和描述它的演讲技巧。
(2)如果你觉得自己是一个糟糕的演讲者,或者想成为一名优秀的演讲者,选一门公共演讲课。初级的表演课也很有用。
(3)如果你的导师有定期的研究讨论会,自愿去作演讲。
(4)MIT AI实验室有一系列的半正式座谈会,叫做Revolving Seminar。如果你觉自己的某些观点值得写进AI Memo或者会议论文中,自告奋勇去作一场报告。
(5)深入了解实验室的不同机器人项目,当你外地的亲朋好友来的时候,你可以领着他们逛一圈,并就机器人做60分钟的报告。
(6)由于修改演讲远比修改论文容易,有些人会觉得这是很好的寻找如何表达思想的方式。(Nike Brady有一次曾说,他所有最好的论文都来自于演讲)。
(7)在一间空屋子里练习,最好就是你马上要做的报告。这有助于调整报告的技巧:每一张幻灯讲些什么;转换的延迟以及保持平滑;保持解释和幻灯的同步;估计报告的时间长度。你花在调整设备上的时间越少,留下来的与人交流的时间就越长。
(8)用镜子,录音机或者录像机练习是另外一种方法。实验室有这三种设备。这也有助于调整自己的发音和肢体语言。
(9)对于比较正式的报告——特别是你的答辩——应该在几个朋友面前练习一遍,请他们批评指正。
(10)观察别人是如何做报告的。有很多访问MIT的人会做报告。参加这样的报告会能够感受自己不熟悉的领域,并且如果报告令人提不起兴趣,你可以暗中分析报告者错在哪里。
(11)找一位朋友,将你最近的想法说给他听。这既可以提高的交际技巧,又能调试自己的思路。
8 程序设计
并不是所有的AI论文都包含代码,而且本领域的很多重量级人物从来没有写过一个重要的程序。但是为了深入掌握AI工作原理,你必须会程序设计。不仅仅是很多AI研究工作需要编写代码,而且学会程序设计能给你什么是可计算的什么是不可计算的直觉,这是AI对认知科学贡献的主要来源。
在MIT,基本上所有的AI程序设计都使用Common Lisp。如果还不知道,赶快学吧。当然,学习一门语言并不能等同于学习程序设计;AI程序设计包含的一些技术与那些在系统程序设计或者应用程序设计中用到的大不相同。开始学的时候,可以先看看Abelson和Sussman的《Structure and Interpretation of Computer Programs》,并做一些练习。这本书与AI程序设计本质上并不相干,但是包含了一些相同的技术。然后读Winston和Horn写的Lisp书第三版,书里有很多优雅的AI程序。最后,进行实际的程序设计,而不是阅读,才是最好的学习程序的方法。
学习Lisp程序设计有很多传统。有些人习惯一起写代码,这取决于个性。还有的人寻找机会直接向有经验的程序员学习,或者请他对你的代码进行评价。阅读别人的代码也是很有效的方法。如果可以向高年级同学要他们的源代码。他们可能会有些抱怨,说自己的编程风格差极了,程序实际上并不能工作云云。不管怎么样,最后你获得了源代码。然后你要仔细地通篇阅读,这很费时间。通常阅读并完全理解别人代码所花的时间与你自己编程完成的时间是一样多的,因此要计划好在你的头一个或者头两个学期用数周的时间去阅读别人的代码。你将从中学到很多以前不曾想到在课本中也没有的技巧。如果你读到了大段大段不可理解没有注释的程序,你就会明白应该如何写代码了。
在软件工程课里学习到的那些知识在AI程序设计中依然有用。要给代码加注释。使用正确的数据抽象。将图和你的代码隔离开,由于你使用的语言基本上是Common Lisp,因此可移植性很好。诸如此类。
经过头几年的学习后,应该写一些自己的标准AI模块,如:
(1)真值维护系统
(2)规划器
(3)规则系统
(4)不同风格的解释器
(5)具有流程分析的优化编译器
(6)具有继承特性的框架系统
(7)几种搜索方法
(8)基于解释的学习器
任何你感兴趣的东西都可以尝试用程序实现。你可以抓住问题的实质,在几天之内完成一个功能版本。修改已有的程序是另外一种有效的方法,前提是你已经写过这样的东西,并且确实了解其工作原理,优缺点以及效率等问题。
不象其他通常的程序员,AI程序员之间很少相互借阅代码(演示代码例外)。这部分由于AI程序很少有真正起作用的(很多著名的AI程序只在作者论文所提到的那三个例子上起作用,虽然最近这种情况已经有所改善)。另外一个原因是AI程序通常是匆忙凑成,并没有考虑一般化的问题。使用Foobar的“标准”规则解释器,开始时很有效,不久就会发现缺少一些你需要的功能,或者不够有效率。虽然可以对代码进行修改满足自己的需要,但记住理解别人的代码是很耗时的,有时候还不如自己写一个。有时候构建一个标准包的工作本身就可以成为一篇论文。
像论文一样,程序也有可能过于追求完美了。不停重写代码以求完美,最大化的抽象所有的东西,编写宏和库,与操作系统内核打交道,这都使得很多人偏离了自己的论文,偏离了自己的领域(从另外一方面,或许这正是你需要将来谋生的手段)。
9 导师
在MIT,有两种类型的导师,教学导师和论文导师。
教学导师的工作比较简单。每一位研究生都被分配了系里的一位老师作为教学导师。教学导师的作用是作为系方代表,告诉你对你的正式要求是什么,如果你的进度慢了敦促你,批准你的课程计划等。如果一切顺利的话,你每年只需要见教学导师两次,在注册日那天。从另一方面讲,如果你遇到了困难,教学导师替你向系里反映或者提供指导。
论文导师是监督你研究的人。选择论文导师是你读研期间最重要的选择,比选题都重要得多。从更广的意义上讲,AI是通过师傅带徒弟的方式学习的。有很多领域的技术方面或者研究过程方面的非正式知识,只能从导师那里学到,在任何教科书上都找不到。
很多AI教员都是行为古怪的人,毕业生也如此。导师与研究生的关系是非常个性化的,你的个人特点必须与导师的配合得很好,这样你们才能合作成功。
不同的导师具有不同的风格。下面是一些需要值得考虑的因素:
(1)你需要多大程度的指导?有些导师会给你一个定义良好的适合做论文的问题,对解决方法进行解释,并告诉你如何开展工作。如果你陷在某个地方了,他们会告诉你如何开展下去。其他的导师属于甩手型,他们可能对你的选题毫无帮助,但是一旦你选好题目,他们对于引导你的思路具有非常大的作用。你需要考虑清楚自己适合独立工作还是需要指导。
(2)你需要多大程度的联系?有的导师要求每周与你见面,听取你工作进展的汇报。他们会告诉你应该读的论文,并给你实际的练习和项目做。其他的导师每学期与你的谈话不会超过两次。
(3)你能承受的压力有多大?有些导师施加的压力是很大的。
(4)需要多少情感支持?
(5)听取导师意见的认真程度如何?大多数导师会相当正式的建议你的论文题目。有些导师是值得信赖的,他们给出的建议,如果按照执行,几乎肯定会做出一篇可接受程度的论文,如果不是令人兴奋的论文的话。其他的则一下子抛出很多思路,大部分是不切实际的,但是有一些,或许会导致重大突破。如果选了这样的一位导师,你首先得把自己当作一个过滤器。
(6)导师提供了什么类型的研究组?有些教授会创造环境,把所有的学生聚集在一起,即使他们做的不是同一个项目。很多教授每周或者每两周与自己的学生们会面。这对你有用么?你能与教授的学生和睦相处么?有些学生发现他们更能与其他教研组的学生建立良好的工作关系。
(7)你想参与大的项目么?有些教授将大系统分解,每个学生负责一部分。这给了你与一组人讨论问题的机会。
(8)你想被共同监督么?有些论文项目包含了多个AI领域,需要你与两个以上的教授建立密切的工作关系。虽然你正式的论文导师只有一位,但是有时候这并不反映实际情况。
(9)导师愿意指导其研究领域之外的论文题目么?你是否能与导师一起工作,比你做什么本身更重要。MIT的机器人系就曾指导过量子物理学和认知建模方面的论文;推理方面的教员指导过视觉方面的论文。但是有些教员只愿意指导自己研究兴趣领域内的论文。这对于那些欲获得终身职位的年轻教员来说尤其如此。
(10)导师会为了你跟体制作斗争吗?有些导师会为了你跟系里或者某些有敌意的实体作斗争。有时候体制对某些类型的学生不利(特别是对于女学生和怪癖的学生),因此这一点很重要。
(11)导师愿意并且能够在会议上推荐你的工作吗?这是导师工作的一部分,对你将来工作意义重大。
上述这些因素,不同学校的情况很不相同。与大部分学校相比,MIT提供了多得多的自由。
找论文导师是你研究生一年级最主要的任务。研一结束时,或者研二学年开始阶段,你必须有一个论文导师。下面是一些诀窍:
(1)查阅实验室的研究总结。其中有一页左右的篇幅描述了每个教师以及很多研究生目前在做什么。
(2)如果你对某些教师的研究工作感兴趣,查阅其最近的论文。
(3)在第一学期,与尽可能多的教师交谈。去感受他们喜欢做什么,他们的研究和指导风格是什么。
(4)与预期导师的研究生交谈。要保证与导师的多个学生交流,因为每位导师在与不同的学生交流时有不同的工作方式和交流效果。不能被一个学生的看法所左右。
(5)很多教师所在研究组的会议对新同学都是公开的。这是非常好的了解导师工作方式的途径。
作为一门学科,AI不同寻常的一点是很多有用的工作是由研究生完成的,而不是博士——他们忙着做管理去了。这有几个后果。一是某个教师的声望,是否会获得终身聘用,在很大程度上取决于学生的工作。这意味着教授有很强烈的动机吸引最好的学生为自己工作,并给与有效的指导和足够的支持。另外一个后果是,由于大部分学生的论文方向是由导师形成的,因此整个领域的方向和发展很大程度上取决于导师选择什么样的研究生。
当选定了导师,决定了自己对导师的要求后,要确保导师知道。不要由于交流不好,浪费时间于自己并不想做的项目上。
不要完全依赖你的导师,要建立自己的网络。找一些能定期评审你的工作的人是很重要的,因为研究时很容易走火入魔。网络中的人可以包括自己实验室或者外单位的研究生和老师。
在与其他学生、老师甚至自己的导师的关系中,很可能会碰到种族主义者、性别歧视、同性恋或者其他令人尴尬的事情。如果你不幸碰到了,去寻求帮助。MIT的ODSA出版了一本叫做“STOP Harrassment”的小册子,里面有很多建议。《Computer Science Women's Report》,可在LCS文档室找到,也与之相关。
实验室中有些同学只是名义上由导师指导,这对于那些独立性很强的人来说很好。但是如果你已经完成了某项导师指导的工作,除非你确保没有导师也行且自己有牢靠的支持网络,否则就不要这么干。
10 论文
做毕业论文将占据研究生生活的大部分时间,主要是去做研究,包括选题,这比实际的写作耗时更多。
硕士论文的目的是为做博士论文练兵。博士水平的研究如果没有准备好的话,是很难进行的。硕士论文最基本的要求是展示自己的掌握程度:你已经完全理解了本领域最新进展,并具备相应的操作水平。并不需要你对本领域的最新知识有所拓展,也不要求发表你的论文。然而我们实验室的论文总是比较大气的,因此很多硕士论文实际上都对本领域的发展作出了显著的贡献,大约有一半都出版了。这并不一定是好事情。很多人精力都集中于硕士的工作,所以MIT有这样的名声:硕士论文的质量往往比博士论文高。这有悖于硕士工作本来是为博士研究作准备的原有目的。另外一个因素是所做研究要对领域有所贡献,至少需要两年,这使得研究生学习时间之长令人难以忍受。现在或许你感受不到匆忙,但当你已经在实验室呆了七年后,你肯定迫不及待地想逃出去。硕士从入学到毕业平均时间是两年半,但是,计算机系强烈鼓励学生提前毕业。如果某个硕士生的题目过于庞大,可将之分解,一部分来做硕士论文,另一部分给博士生作博士论文。
想要了解硕士论文研究是什么样的,读几本最新的硕士论文。记住比较好的论文是那些出版的或者成为技术报告的,因为这标志着该论文被认为是扩展了领域的最新知识——换句话说,他们的论文远远超出了硕士论文的水平。还要读一些通过的但是没有出版的论文,所有通过的论文都可以在MIT图书馆中找到。博士论文必须对最新知识有所拓展,博士论文的研究必须具备可出版的质量。MIT的泱泱气质又表现出来了,很多博士论文在几年内都是某个子领域的权威工作。对于MIT的博士论文来说,开创一个新领域,或者提出并解决一个新问题,并不是什么了不起的事情。虽然,这并不是必需的。
一般来说,需要两到三年的时间来做博士论文。很多人花一到两年的时间跟硕士生活说再见,以及选题。这段时间可以去尝试一些别的事情,例如做助教或者在某个非AI领域打下坚实的基础或者组织个乐队。博士论文的实际写作时间大约是一年。
选题是论文工作中最重要最困难的部分:
(1)好的论文题目不仅能够表达个人观点,而且可与同行交流。
(2)选择题目必须是自己愿意倾注热情的。个人远景观点是你作为一个科学家的理由,是你最为关切的意象、原则、思路或者目标。有多种形式。或许你想造一台可与之交谈的计算机,或许你想把人类从计算机的愚蠢使用中拯救出来,或许你想展示万物都是统一的,或许你想在太空发现新生命。远景观点总是比较大的,你的论文并不能实现你的远景,但是可以朝着那个方向努力。
(3)做论文时,最困难的就是如何将问题消减至可解决的水平,同时规模又足以做一篇论文。“解决AI的宽度优先”是常见毛病的一个例子,题目太大太虚了。你会发现需要不断的缩小题目的范围。选题是一个渐进的过程,不是一个离散的事件,会持续到你宣布论文已经完成那一刻为止。实际上,解决问题通常比精确地描述问题要容易得多。如果你的目标是一个五十年的工程,那么合理的十年工程是什么,一年的呢?如果目标的结构庞大,那么最核心的部件是什么,如何最大程度的了解核心部件?
(4)一个重要的因素是你可以忍受多大程度的风险。在最终的成功和风险之间需要权衡。这也并不总是对的,AI中有很多研究者尚未涉及的想法。
(5)好的论文选题有一个中心部分,你确信肯定可以完成,并且你和你的导师都同意这已经满足毕业要求了。除此之外,论文中还有多种扩展,有失败的可能,但如果成功了,会增加论文的精彩程度。虽然不是每一个论文选题都符合这个模式,但值得一试。
(6)有些人觉得同时在多个项目中工作可以在选题的时候选择可以完成的那个。这确实降低了风险。另外一些人则愿意在做任何工作之前,选一个单独的题目。
(7)可能你只对某个领域感兴趣,这样你的选题范围就狭窄得多。有时候,你会发现系里的老师没有一个人能够指导你选择的领域。可能还会发现好像那个领域没什么很自然的选题,反而对别的领域有好想法。
(8)硕士选题比博士选题更难,因为硕士论文必须在你所知不多没有足够自信时就完成。
(9)博士选题需要考虑的一个因素是是否继续硕士阶段所研究的领域,可能拓展或者作为基础,或者干脆转到另外一个领域。待在同一个领域事情就简单了,可能只需要一到两年就毕业了,特别是如果在硕士阶段的工作中已经发现了适合做博士论文的题目。不足之处在于容易定型,改换领域则能增加知识的宽度。
(10)有的论文题目很新奇,有的则很普通。前者开创了新领域,探索了以前未曾研究过的现象,或者为很难描述的问题提供了有效的解决方法;后者则完美地解决了定义良好的问题。两种论文都是有价值的。选择哪一种论文,取决于个人风格。
(11)论文的“将来的工作”部分,是很好的论文题目来源。
(12)无论选什么样的题目,必须是前人未曾做过的。即使是同时有人做的工作,也不好。有很多东西可作,根本无需竞争。还有一种常见的情况,读了别人的论文后感觉很惊慌,好像它已经把你的问题解决了。这通常发生在确定论文题目过程中。实际上往往只是表面类似,因此将论文送给某个了解你的工作的高人看看,看他怎么说。
(13)MIT AI实验室的论文并非全是有关人工智能的;有些是有关硬件或者程序设计语言的,也行。
选好题后,即使有点虚,你必须能够回答下列问题:论文的论点是什么?你想说明什么?你必须有一句,一段,五分钟的答案。如果你不知道自己在干什么,别人也不会严肃对待你的选题,更糟糕的是,你会陷在选题——再选题的圈子里而不能自拔。开始作论文研究后,一定要能够用简单的语言解释每一部分的理论和实现是如何为目标服务的。
记住,一旦选好了题目,你必须与导师就论文完成的标准达成清晰的一致。如果你和他对论文具有不同的期望,最后你肯定死得很惨。必须定义好“完成测试”的标准,像一系列的能够证明你的理论和程序的例子。这是必须做的,即是你的导师并不这么要求。如果环境发生了根本的变化,测试也要随之改变。
首先尝试论文问题的简化版本。用实例检验。在形成理论抽象之前,要完整的探究具有代表性的例子。做论文的过程中,有很多浪费时间的方式。要避免下列活动(除非确实跟论文相关):语言表达的设计;用户接口或者图形接口上过分讲究;发明新的形式化方法;过分优化代码;创建工具;官僚作风。任何与你的论文不是很相关的工作要尽量减少。一种众所周知的现象“论文逃避”,就是你突然发现改正某个操作系统的BUG是非常吸引人也很重要的工作。此时你总是自觉不自觉的偏离了论文的工作。要记住自己应该做些什么(本文对于部分作者来说就属于论文逃避现象)。
11 研究方法论
[本部分内容比较少,尚不完善,请添加]
研究方法学定义了什么是科研活动,如何开展研究,如何衡量研究的进展,以及什么叫做成功。AI的研究方法学是个大杂烩。不同的方法论定义了不同的研究学派。方法是工具。使用即可,不要让他们来使用你。不要把自己陷于口号之中:“AI研究需要牢靠的基础”,“哲学家只会高谈阔论,人工智能则需要拼搏”,“在问为什么之前,先搞清楚计算的是什么”。实际上,要在人工智能领域取得成功,你必须擅长各种技术方法,还必须具备怀疑的态度。例如,你必须能够证明定理,同时你还必须思考该定理是否说明了什么。很多优秀的AI篇章都是巧妙地在几种方法论中取得平衡。例如,你必须选择一条在太多理论(可能与任何实际问题都无关)和繁琐的实现(把实际的解决方法表达得语无伦次)之间的最佳路线。你经常会面临区分“干净”和“肮脏”的研究决策。你应该花时间将问题在某种程度上形式化吗?还是保持问题的原始状态,此时虽然结构不良但更接近实际?采用前一种方法(如果可行的话)会得到清晰确定的结果,但这一过程往往是繁琐的,或者至少不会直接解决问题。后者则有陷入各种处理的漩涡之中的危险。任何工作,任何人,必须作出明智的平衡。
有些工作象科学。你观察人们是怎样学习算术的,大脑是如何工作的,袋鼠是如何跳的,然后搞清楚原理,形成可检验的理论。有些工作象工程:努力创建一个更好的问题解决器或者算法。有些工作象数学:跟形式化打交道,要理解属性,给出证明。有些工作是实例驱动的,目标是解释特定的现象。最好的工作是以上几种的结合。
方法具有社会性,看看别人是如何攻克类似难题的,向别人请教他们是如何处理某种特殊情况的。
12 情感因素
研究是艰苦的工作,很容易对之失去兴趣。一个令人尴尬的事实是在本实验室读博的学生只有很少比例最后获得学位。有些人离开是因为可以在产业界赚到更多的钱,或者由于个人的原因;最主要的原因则是由于论文。本节的目标是解释这种情况发生的原因,并给出一些有益的建议。
有的研究都包含风险。如果你的项目不可能失败,那是开发,不是研究。面对项目失败时是多么艰难啊,很容易将你负责的项目失败解释为你自己的失败。虽然,这实际上也证明了你有勇气向困难挑战。在人工智能领域很少有人总是一直成功,一年年地出论文。实际上,失败是经常的。你会发现他们经常是同时做几个项目,只有一些是成功的。最终成功的项目也许反复失败过多次。经历过很多由于方法错误的失败之后,才取得最终的成功。在你以后的工作生涯中,会经历很多失败。但是每一个失败的项目都代表了你的工作,很多思想,思考方式,甚至编写的代码,在若干年后你发现可用于另外一个完全不同的项目。这种效果只有在你积累了相当程度的失败之后才会显现出来。因此要有最初的失败以后将会起作用的信念。
研究所花费的实际时间往往比计划的要多得多。一个小技巧是给每个子任务分配三倍于预期的时间(有些人加了一句:“……,即使考虑了这条原则”)。
成功的关键在于使得研究成为你日常生活的一部分。很多突破和灵感都发生在你散步时。如果无时无刻地都潜意识的思考研究,就会发现思如泉涌。成功的AI研究者,坚持的作用一般大于天资。“尝试”也是很重要的,也就是区分浅薄的和重要的思路的能力。你会发现自己成功的比例是很随机的。有时候,一个星期就做完了以前需要三个月才能完成的工作。这是令人欣喜的,使得你更愿意在本领域工作下去。其他一些时候,你完全陷在那里,感觉什么也做不了。这种情况很难处理。你会觉得自己永远不会做出任何有价值的东西了,或者觉得自己不再具备研究者的素质了。这些感觉几乎肯定是错误的。如果你是MIT录取的学生,你就是绝对合格的。你需要的是暂停一下,对糟糕的结果保持高度的容忍。
通过定期设置中短期的目标,例如每周的或者每月的,你有很多工作要做。增加达到这些目标的可能性有两种方法,你可以把目标记在笔记本中,并告诉另外一个人。你可以与某个朋友商定交换每周的目标并看谁最终实现了自己的目标。或者告诉你的导师。
有时你会完全陷在那里,类似于写作过程的思路阻塞,这有很多可能的原因,却并无一定的解决方法。
(1)范围过于宽泛了,可尝试去解决流程中的子问题。
(2)有时候对你研究能力的怀疑会消磨掉你所有的热情而使得你一事无成。要牢记研究能力是学习而得的技能,而不是天生的。
(3)如果发现自己陷入严重的困境,一个多星期都毫无进展,尝试每天只工作一小时。几天后,你可能就会发现一切又回到了正轨。
(4)害怕失败会使得研究工作更加困难。如果发现自己无法完成工作,问问自己是否是由于在逃避用实验检验自己的思路。发现自己最近几个月的工作完全是白费的这种可能,会阻止你进一步开展工作。没有办法避免这种情况,只要认识到失败和浪费也是研究过程的一部分。
(5)看看Alan Lakien的书《How to Get Control of Your Time and Your Life》,其中包含很多能使你进入充满创造力的状态的无价方法。
很多人发现自己的个人生活和做研究的能力是相互影响的。对于有些人来说,当生活中一切都不如意时,工作是避难所。其他的人如果生活陷入混乱时就无法工作了。如果你觉得自己确实悲痛得难以自拔,去看看心理医生。一份非正式的调查表明,我们实验室大约有一半的学生在读研期间看过一次心理医生。
使得人工智能那么难的一个原因是没有被普遍接受的成功标准。在数学中,如果你证明了某个定理,你就确实做了某些事情;如果该定理别人都证不出来,那么你的工作是令人兴奋的。人工智能从相关的学科中借来了一些标准,还有自己的一些标准。不同的实践者,子领域和学校会强调不同的标准。MIT比其他的学校更强调实现的质量,但是实验室内部也存在很大的不同。这样的一个后果就是你不可能令所有的人都满意。另外一个后果就是你无法确定自己是否取得了进展,这会让你觉得很不安全。对你工作的评价从“我所见过最伟大的”到“空虚,多余,不明所以”不一而足,这都是很正常的,根据别人的反馈修订自己的工作。
有几种方法有助于克服研究过程中的不安全感。被承认的感觉:包括毕业论文的接受,发表论文等。更重要的是,与尽可能多的人交流你的思路,并听取反馈。首先,他们能贡献有用的思路;其次,肯定有一些人会喜欢你的工作,这会使得你感觉不错。由于评价进展的标准是如此不确定,如果不与其他的研究者充分的交流,很容易盲目。特别当你感觉不太好时,应该就你的工作进行交流。此时,获得反馈和支持是非常重要的。很容易看不到自己的贡献,总是想:“如果我能做,肯定是微不足道的。我的所有思想都太明显了”。实际上,当你回头看时,这些虽然对你是很明显的,对别人并不一定是明显的。将你的工作解释给很多门外汉听,你会发现现在对你来说是平淡无奇的东西原来那么难!写下来。
一项对诺贝尔获奖者实施的有关怀疑自己问题(在你研究的过程中,你一直觉得自己是在做震惊世界的工作吗?)的调查表明:获奖者们一致回答他们经常怀疑自己工作的价值和正确性,都经历过觉得自己的工作是无关的,太明显了或者是错误的时期。任何科学过程的常见和重要的部分就是经常严格的评价,很多时候不能确定工作的价值也是科学过程不可避免的一部分。
有些研究者发现与别人协作比单打独斗工作效果更好。虽然人工智能研究经常是相当个人主义的,但是也有一部分人一起工作,创建系统,联合发表论文。我们实验室至少已经有一个联合做毕业论文的先例。缺点是很难与协作者区分对论文的贡献。与实验室之外的人合作,例如暑期工作时,问题就会少一些。
很多来到MIT AI实验室的学生都是以前所在学校最厉害的人。来到这里之后,会发现很多更聪明的人。这对于很多一年级左右学生的自尊形成了打击。但周围都是聪明人也有一个好处:在你把自己不怎么样的(但自己又没有觉察到)想法发表之前就被其他人给打倒在地了。更现实的讲,现实世界中可没有这么多聪明人。因此到外面找一份顾问的工作有利于保持心理平衡。首先,有人会为你的才能付费,这说明你确实有些东西。其次,你发现他们确实太需要你的帮助了,工作良好带来了满足感。
反之,实验室的每一个学生都是从四百多个申请者挑选出来的,因此我们很多学生都很自大。很容易认为只有我才能解决这个问题。这并没什么错,而且有助于推进领域的发展。潜在的问题是你会发现所有的问题都比你想象的要复杂得多,研究花的时间比原先计划的多得多,完全依靠自己还做不了。这些都使得我们中的很多人陷入了严重的自信危机。你必须面对一个事实:你所做的只能对某个子领域的一小部分有所贡献,你的论文也不可能解决一个重大的问题。这需要激烈的自我重新评价,充满了痛苦,有时候需要一年左右的时间才能完成。但这一切都是值得的,不自视过高有助于以一种游戏的精神去作研究。
人们能够忍受研究的痛苦至少有两个情感原因。一个是驱动,对问题的热情。你做该研究是因为离开它就没法活了,很多伟大的工作都是这样做出来的。虽然这样也有油尽灯枯的可能。另外一个原因是好的研究是充满乐趣的。在大部分时间里,研究是令人痛苦的,但是如果问题恰好适合你,你可以玩一样的解决它,享受整个过程。二者并非不可兼容的,但需要有一个权衡。
要想了解研究是怎么样的,遭到怀疑的时候应该如何安慰自己,读一些当代人的自传会有些作用。Gregory Bateson's Advice to a Young Scientist, Freeman Dyson's Disturbing the Universe, Richard Feynmann's Surely You Are Joking, Mr. Feynmann!, George Hardy's A Mathematician's Apology, 和Jim Watson's The Double Helix.
当你完成了一个项目——例如论文——一两个月后,你可能会觉得这一切是那么不值。这种后冲效果是由于长时间被压抑在该问题上,而且觉得本可以做得更好。总是这样的,别太认真。等再过了一两年,回头看看,你会觉得:嘿,真棒!多棒的工作!
尾注
本文包含的思想,文本以及评论来自于Phil Agre, Jonathan Amsterdam, Jeff Anton, Alan Bawden, Danny Bobrow, Kaaren Bock, Jennifer Brooks, Rod Brooks, David Chapman, Jim Davis, Bruce Donald, Ken Forbus, Eric Grimson, Ken Haase, Dan Huttenlocher, Leslie Kaelbling, Mike Lowry, Patrick Sobalvarro, Jeff Shrager, Daniel Weise, and Ramin Zabih。我们要感谢那些对本文作出贡献的人(对我们的论文作出贡献的人,顺便一并致谢),特别是我们的导师。
上面所列举的一些思想来自于John Backus的《On Being a Researcher》和Alan Bundy,
Ben du Boulay, Jim Howe和Gordon Plotkin的《How to Get a PhD in AI》。
已投稿到: |
排行榜
|
---|