OSDI, SOSP与美国著名计算机系的调查

【序言】

按照USnews的分类,Computer Science被分为四个大类:AI, Programming Language, Systems, Theory.。毫无疑问,Systems是这四个大类中最要紧也是最大的一个。根据citeseer在2003年5月排出的所有计算机学科会议和期刊的影响因子排名[1],在前十位中的属于Systems的有7个,在前15个中占据了11个。Systems的内容十分广泛,包括OS, Architecture, Network等等。在citeseer排名中,最好的会议是OSDI,这是一个收录范围相当广的会议。提到OSDI,就得提到排名第11的另一个会议: SOSP。这两个是OS最好的会议,每两年开一次,轮流开,比如今年是OSDI,那么明年就是SOSP。由于这两个会议方向很广,因此影响很大。除此之外,在OS方向还有一些方向比较专一,但是水平仍然很高的会议,比如FAST就是File and storage system最好的会议,NSDI偏重Networked System Design and Implementation,2004年才第一次,USENIX Sponsor,号称要办成Network最好的System的会议。RTSS是Real system最好的会议。
在Architecture领域,最好的会议是ISCA,HPCA和MICRO。还有像ASPLOS则是OS, Architecture, Programming language三个领域交叉的最好会议,近年来貌似被Architecture霸占。
可以说Systems的会议非常多,一直是计算机的热门领域。本文仅仅针对OSDI和SOSP这两个最top的OS会议,尤其是OSDI来了解一下这个最顶级的会议都是哪些人物,哪些组在上面发表论文,这些牛人现在又在研究什么,我们中国人在这个会议上又有什么表现。
【会议历史】
OSDI 一个年轻的会议,它的全称是Operating Systems Design and Implementation。它是由USENIX主办的。诚如余老师上课所讲,USENIX是一个于1975年成立的Advanced Computing Systems Association。它所举办的都是一些非常好的会议,比如前面提到的NSDI,FAST等等。OSDI是USENIX于1994年创办的,基本上是两年一次,至今为止举办了7届(94,96,99,2000,2002,2004,2006)。每届会议举行3天,早期的OSDI每届收录20篇左右的文章,从2002年开始稳定在27篇,一般是每个小方向有3篇文章。
而SOSP是一个相对古老的会议,它是由ACM下属的SIGOPS (the ACM Special Interest Group on Operating Systems)于1967年创办的。这个会议也是两年一次,迄今为止已经举办了20届,每届收录的文章在20篇左右。
【统计数据】
我对OSDI所有收录的文章的作者,单位进行了人工统计。可当我统计完之后发现UIUC的一个马同学对OSDI和SOSP两者一起进行了统计[2]。所幸的是,他并没有单独统计,而且有些东西统计的不是很细致。下面主要以我自己统计的OSDI为基准,结合马同学的数据进行阐述。
首先我发现,很多文章都是由好几个单位合写而成的。于是我做了一个统计,计算每一届所有文章的单位数。比如某篇文章是由MIT和Washington合写的,那么这篇文章的单位数就是2。每一届的单位数的值如下:
由此可见,每一届的单位数基本都在上升,到了2006年更达到了44,平均每篇文章由1.62963个单位写成。这其中有学校和学校的合作,有企业和学校的合作,可见至少是在OS领域,合作是发表得高水平文章的基础。
下面分析一下哪些研究单位在OSDI上面发表的文章数最多:
MIT
14
Microsoft
13
Princeton
12
Washington
12
Stanford
11
Berkeley
10
CMU
10
Michigan
7
Arizona
6
Rice
6
Utah
6
Duke
5
Umass
5
OSDI,SOSP与美国著名计算机系的调查(一)2
以下是在OSDI和SOSP(97年之后)发表文章最多的单位[2]:
MIT
31
Microsoft
24
Stanford
23
Washington
20
Berkeley
17
CMU
15
Michigan
15
Princeton
14
Duke
10
Rice
9
HP
8
Utah
8
IBM
7
Wisconsin
7
Intel
6
对比USnews在Systems方向上的排名[3]:
1. University of California–Berkeley
2. Massachusetts Institute of Technology
3. Carnegie Mellon University (PA)
4. Stanford University (CA)
5. University of Illinois–Urbana-Champaign
6. University of Washington
7. University of Wisconsin–Madison
8. University of Texas–Austin
9. University of California–San Diego
10. Princeton University (NJ)
11. University of Michigan–Ann Arbor
12. Cornell University (NY)
13. Georgia Institute of Technology
University of California–Los Angeles
15. Rice University (TX)
16. Purdue University–West Lafayette (IN)
University of Maryland–College Park
可见,MIT不愧为理工科的老大。在USnews排行榜上的四牛校:MIT, Stanford,Berkelety,CMU名不虚传。此外在OS方向很强的微软老巢Washington, 在USnews上Systems方向比较强的Princeton,Michigan都有入围十强。比较意外的是Systems榜上第五的UIUC并没有很好的表现,这所硬件巨牛的学校在OS上比较令人失望。还有像新兴的UCSD,虽然没有入围但是它已经连续三年(04-06)在OSDI和SOSP上都有斩获,势头直逼传统牛校。值得一题的还有各大公司的研发机构,微软以两项第二的成绩证明了自己的研发能力堪比四大牛校,据说它在图形学的第一会议: SIGGRAPH上更是所向披靡。HP,IBM和Intel也不甘示弱,在OSDI和SOSP的总排行榜上分别名列11,13,15位。新生的 google也已3篇OSDI(06年的best paper),1篇SOSP在强势追赶。
以上是一些数据和总体印象,下面我将着重介绍一下我所调查的OSDI文章数前6的学校(MIT, Princeton, Stanford,Washington,Berkeley,CMU)的情况和一些知名的教授,以及中国人特别是清华师兄师姐们在这些学校中的表现。
OSDI,SOSP与美国著名计算机系的调查(一)3
【MIT】
作为工程的第一牛校,MIT在各个方向都是非常强的。在OSDI上发表了14篇文章。分别在94年发表4篇,99年1篇,00年3篇,02年1篇,04年3 篇和06年的2篇。在这14篇中,Professor M. Frans Kaashoek发表了4篇,Professor Robert Morris发表了3篇,他们都是MIT的PDOS组的,后文还会提到这个组培养出了很多伟大的人物。还有Professor Barbara Liskov教授和Professor Miguel Castro(后去了微软)也是三篇,他们是在MIT的PMG组。据马同学的统计[3],Frans Kaashoek教授在OSDI和SOSP中的发文数是第一名(15篇),而Barbara Liskov教授发文数第四(13篇),Miguel Castro排名第8,Robert Morris排名20。
可见,PDOS和PMG是MIT在OSDI上发文的两个大组,下面简要介绍一下这两个组。PDOS全称是Parallel & Distributed Operating Systems Group。它和PMG组一样,都是隶属于MIT Computer Science and Artificial Intelligence Laboratory。由于MIT是人智的发祥地,所以MIT把什么都归到人智的帐下……比如所有的System都是这个实验室管。PDOS组主要由 Frans Kaashoek和Robert Morris主持。他们组最近比较热门的是在做P2P方面的研究,他们2006年的文章大部分都是P2P计算,主要是IRIS和Chord两个P2P的项目。
另一个是Barbara Liskov教授的PMG(The Programming Methodology Group),他们组最近研究的东西也是给予哈希表的分布式计算,也是在IRIS项目上进行研究。
此外,像在OSDI上发表了两篇文章的Hari Balakrishnan教授,他所在的Networks and Mobile Systems组也有很好的文章。另外一些从MIT出去的比如Miguel Castro无论是在MIT还是在微软,都发表了高水平的论文,他02年在微软发表了两篇OSDI,05年写了一篇SOSP。总之,MIT的System 绝对是世界领先的,不过很遗憾,在这些牛人中几乎没有中国人的身影。
【Princeton Univ】
有人说 Princeton是一所梦一样的学校。这所座落在纽约边上小镇的学校以它的学术水平蜚声世界。在50-60年代,著名的高等研究中心吸引了一大批欧洲的科学家,爱因斯坦,外尔,陈省身都在那里留下了自己的足迹。在计算机系,这个只有17个Professor的小系,却在USnews上长期霸占前十的位置。Princeton在OSDI上一共发表了12篇文章,值得一题的是它是唯二的两个在每一届的OSDI上面都有文章发表的学校(另一个是 Washington)。值得一题的是,在普林斯顿的System方向,我们中国人做出了非凡的成绩。
在12篇文章中,主要是由两位教授完成的,每人完成6篇,可能方向不太一致,两位高产教授居然没有在OSDI中合作过。这两位是系主任Larry Peterson和中国教授Kai Li(李凯)。李凯教授在OSDI上发表过6篇文章,不仅如此,他还指导了许多中国学生在OSDI上崭露头角。其中来自清华计算机系的学生就至少有: Pei Cao,Yu xiang, Xiaohu Qie。他们分别在94,2000和2002年的OSDI上和李凯教授发表文章。不仅如此,Pei Cao师姐在1996年又以Wisconsin副教授的身份发表了一篇OSDI。在李凯教授的众多学生中,最著名的莫过于现在在UIUC当教授的 Yuanyuan Zhou。Yuanyuan Zhou是北大计算机本科毕业的,她跟李凯教授的第一篇论文就是发表在OSDI上面。她到UIUC后,发表了UIUC在OSDI上面的第一篇论文。现在 Prof. Zhou独自扛起了UIUC里OS的大梁,她已经在OSDI和SOSP上发表了4篇论文。
System方向的另一位教授 Larry Peterson比起李凯教授可能更加活跃。Larry Peterson在OSDI和SOSP上共发表了11篇文章,名列第6名。同样的,他指导了很多中国学生的研究工作。比如来自上海交大的Ruoming Pang,来自北大的Limin Wang,还有Ming Zhang, Chi Zhang,Zhe Wang都和Larry Peterson发表过OSDI。在普林斯顿总共发表的11篇OSDI中就有10篇是和中国人有关的。
两位教授近年来也在做一些比较有意思的事情。李凯教授前些年在做一个Scalable Display Wall 用很多台投影仪搭建一个超大尺寸的视频墙。今年李凯教授过来讲座,得知最近他在开一个公司,关于数据备份压缩的研究。
Larry Peterson一直在领导一个很大的项目PlanetLab。这个项目是一个超大的分布式平台,把很多实验室,工业界的计算资源整合起来,在全球已经有了722个结点。包括David Culler,Larry Peterson在内很多教授都参与了这个项目。最近的进展是12.13号发布了PlanetLab Services。
【U.Washington】
作为位于微软老巢的学校,Washington在System领域自然是不甘落后,甚至有和四大叫板的实力。一个有意思的现象是,我所介绍的6所学校中,除了4大牛校之外,剩下两所学校的系主任都是搞System的,而且都是发文狂人,这也从一个侧面说明了System在这两所学校中的地位吧。
和普林斯顿一样,Washington也是在每届OSDI中都有收获的学校。在Washington中,有两位教授在OSDI上都发表过4篇文章,他们是:系主任Henry M. Levy和Steven D. Gribble 。另两位教授Thomas Anderson,Brian N. Bershad在Washington发表了3篇文章,其中Brian N. Bershad还在CMU当教授期间发了一篇OSDI,这两位教授都是Washington毕业的,而且都是Henry M. Levy的学生。Henry M. Levy不仅培养出优秀的学生,自己的工作也十分的出色。在OSDI和SOSP发文排行榜上,Henry M. Levy以15篇文章和MIT的M. Frans Kaashoek并列第一位。在排行榜的前6位中,Henry M. Levy, Brian N. Bershad,Thomas Anderson师徒三人分别名列第1,3,6位,这是多么厉害的数字。另一位Steven D. Gribble教授不是来自Washington,他是来自OS牛校Berkeley。Steven D. Gribble在Berkeley导师是Eric Brewer,后面会提到Eric Brewer也是我们系师兄周枫的导师。Steven D. Gribble在做学生的时候于97年发了一篇SOSP,2000年又发了一篇OSDI。
上述四位教授主要都是在Systems, Networking, and Security Research组工作。他们组的项目很多,正在做的就有17项,包括分布式系统和网络、安全,操作系统等等。在分布式领域,他们和普林斯顿一样,都参加了PlantLab项目。其他的几个项目都是和网络相关:比如Internet Astronomy是要检测互联网的每一处行为,并构建下一代互联网协议;Wireless Network Design主要是讨论未来无线网的协议。在安全方面,Spyware and Worms项目主要是检测和防御蠕虫和间谍软件。Electronic Voting主要是加强电子投票器的安全问题。在操作系统方面,Denali和Nooks这两个操作系统使他们关注的热点。其中Nooks主要是解决操作系统中经常出现的驱动失败的问题。总而言之,网络和安全(包括修复错误)是Washington近期的研究的热点,他们最近的文章也都是这方面的内容。很遗憾,和MIT一样,在Washington没有看见中国人的身影。
OSDI,SOSP与美国著名计算机系的调查(一)4
【Stanford Univ.】
斯坦福大学位于信息世界的心脏地带--硅谷,它是所有学CS人心目中的dream school。Sun, Yahoo, Google等等公司都是由斯坦福的学生创办的。斯坦福在OSDI上发了11篇文章,其中有5篇是由Dawson Engler教授发表的,此外Dawson Engler还发表了5篇SOSP,以10篇的成绩名列第8位。
Dawson Engler毕业于大名鼎鼎的MIT的PDOS组,他是前面提到的MIT大牛人Frans Kaashoek的学生,可谓名师出高徒。他所研究的就是查找一些真实代码中的bug, 比如他做的Meta-Level Compilation项目,这个东西主要是用来检查,优化,修改操作系统代码中。它能够查处500多处出现在Linux, OpenBSD, Xok, 和Stanford FLASH machine中的错误。它主要是由一个compiler(xgcc)和一种编程语言Metal。另外他还开了一个公司:coverity用来推广静态检查产品。Dawson Engler最近研究的东西是自动生成一些输入数据,用来覆盖程序中所有的分支,对所有值的检查,用来发现代码中的问题。
在他的学生中,有一个很牛的清华计算机系的师兄Junfeng Yang。他和Dawson Engler合作,以第一作者的身份发表了两篇OSDI。他们组做的工作都是用软件去寻找代码中的bug,显得很有新意。
此外,还有一位华裔女性教授在OSDI上发表了2篇文章,在SOSP上发表了3篇文章,她就是Monica S. Lam(林倩玲)。她做的工作之一和Dawson Engler有点类似,是通过Static Analysis and Dynamic Instrumentation方法来提高程序的鲁棒性。此外,她还提出了一种新的体系结构,利用Virtual Appliances.技术来使计算机更容易管理。
【UC Berkeley】
Berkeley是OS的发祥地, BSD版的UNIX影响了整个OS界,伯克利的RISC技术后来成为了SUN公司SPARC微处理器的核心技术。可能是因为Berkeley大师太多了,所以没有像Henry M. Levy那样的领军人物。发文数最多的Eric A. Brewer,教授有3篇OSDI和两篇SOSP。但是,有像David Patterson,David Culler这样的泰斗级人物的存在,Berkeley依然是OS的领跑者。在Berkeley中,有两个方向常常在OSDI上发表文章,它们是 Computer Architecture & Engineering (ARC)和Operating Systems (OS)。
OS 组是由Eric A. Brewer领导的。同时Eric A. Brewer还领导着Intel Research Berkeley。Eric教授主要是做和网络相关的OS。他现在主要做两个项目:TIER和NEST。TIER是一个类似于100美金笔记本的项目,但是它不仅仅是造一台机器。从官方主页上来看,它包含了无线,存储,教育,医疗,语言和能源。这是一个非常大的项目,目前在很多非洲国家都有部署,有美国国家自然科学基金会的资助、来自Intel、HP和微软的协助以及联合国计划开发署、Grameen Bank和Markle Foundation的支持。另一个NEST是网络嵌入式系统,它是伯克利无线嵌入式系统的一部分,David Culler也参加了这个工作。值得一题的是Eric A. Brewer有一位得意门生是来自清华计算机系的周枫师兄,周师兄在06年的OSDI上发表了一篇论文,是关于用软件的方法来解决Linux中驱动崩溃的情况。解决驱动崩溃的东西前面提到的Washington也在做,不知道这是不是一个热门的方向。
David Culler的涉猎范围十分的广泛,和Eric A. Brewer一样,他们都毕业于MIT。Culler教授现在研究的项目有,前面提到的普林斯顿和华盛顿都在做的PlanetLab,和Eric教授一起参与的Wireless Embedded Sestems,另一个网络嵌入式系统TinyOS,高性能的网络工作站NOW,一种并行编程语言Split-C:,等等。
总之,伯克利的牛人太多了,像David Patterson这种泰斗,我都不知道怎么介绍了。另外有意思的一点就是伯克利的教授一般都是自己开公司,像Eric A. Brewer,David Culler都有自己的公司,在加州的这片热土上,有足够的机遇和人才来促进计算机的研究和发展。
【CMU】
作为四大牛校之一,CMU的CS是做为一个学院存在的,我记得在top10中就CMU是这样子的。正因为如此,CMU的方向非常全,Programming Language更是名列USnews的第一位。在System方向虽然不如其他三所牛校这么出色,但还是位于前列。看了一下CMU在OSDI和SOSP 上的表现会十分的奇怪。CMU在OSDI上共发了10篇文章,都是在2000年以前发的,2000年它一口气中了5篇OSDI,96年中了3篇,94和 99各中一篇。在SOSP上的表现也是如此,在SOSP上中了5篇,其中有三篇是在2005年中的,在这之前就要追溯到97年。也就是说,CMU在01年之后的5年里面,只在05年中了三篇SOSP,而OSDI一篇没中。
由于CMU方向太多,人员太分散,好多组都在OSDI上发表文章,只能找到一位教授在OSDI发了两篇文章,他是Gregory R. Ganger。Gregory R. Ganger教授同时也是CMU在OSDI和SOSP上发文最多的教授,发了5篇文章名列第31位。
Gregory R. Ganger所在是CMU计算机学院ECE系里的parallel data lab。Gregory R. Ganger主要是在做存储系统。他最近的做的Self-* Storage Systems就是一个集群的存储系统。Better Security via Smarter Devices是一个能够自动防御各种病毒,蠕虫的分布式的装置。Survivable distributed storage (PASIS)能够抵御successful breakins的存储系统。
值得一题的是Gregory R. Ganger读博士的时候是体系结构大牛Yale Patt的学生,博士后的时候更是去了MIT的PDOS组,是Frans Kaashoek的学生……这时候我对Frans Kaashoek的景仰之情犹如……
OSDI,SOSP与美国著名计算机系的调查(一)5
【总结】
迫于精力有限,另外几所很牛的学校像U. Michigan,Duke,Rice都来不及介绍了。诚然,OSDI和SOSP只是System方向的冰上一角,但是从这一滴水,我还是从中看到了OS方向的进展和人物。
从OSDI和SOSP上的表现来看MIT,Stanford,Washington,Berkeley,Princeton确实体现出了它们做为美国乃至世界一流名校的风采。就专业角度来说,虽然我只是扒了几个主页,看了看标题,但是还是有两点感触很深。
1.网络很重要。在OS领域取得成绩的都离不开网络,MIT的P2P离不开网络。而Washington的Henry M. Levy研究的项目几乎都是网络相关的,Princeton的Larry L. Peterson本身就是著名网络教材《Computer Networks: A Systems Approach》的作者。Berkeley的David Culler教授把网络纳入嵌入式系统。而众多牛校参与的PlanetLab本身就是一个超大规模的分布式系统,当然也离不开网络。
2.系统安全很重要。我发现好几个学校都在从事如何是操作系统或程序更加的安全,比如Washington的Nooks系统和Berkeley的周枫师兄不约而同的在研究如何解决系统驱动错误的问题。斯坦福的Dawson Engler教授和Junfeng Yang师兄研究是如何自动查找系统代码中的bug,如何检测程序中的问题。Monica S. Lam教授也在研究如何提高系统的鲁棒性。还有CMU的Gregory R. Ganger,如何防御蠕虫和病毒也是他目前正在研究的。系统的可靠性,安全性已经成为当今热门的领域。
以上就是我从这段时间调查OSDI和各个名校的网站上得到一些浅显的结论,可能有些地方是不对的或有漏洞的,不正之处还请各位老师指出!
【后序】
洋洋洒洒涂了一万字,每个字都是自己敲的,前后历经了几个星期,终于暂告一个段落。之所以想写这篇东西,一是觉得读了四年本科,连当今世界计算机的研究发展都不知道是件挺丢脸的事情。我也很好奇究竟是哪些人,哪些组在计算机界,特别是System方向呼风唤雨,也特别想看看中国人在这个领域有什么表现。二是今年正好自己申请学校,看了网上介绍美国计算机系的资料很少,只有南大和复旦的前辈们写过,而且不够详细,我想清华也该有这么一篇东西(虽然发现实在是不好写,只写了6所学校)。
正好选了高性能前沿技术这门课,有了这个机会来把我这个梦想给实现了,于是就满怀热情的开始写了。整理资料是一件挺烦琐的事情,不过这件事是我感兴趣的,所以还算挺顺利的就写下来了。
名字后面加了一个(一),寓意也是很明确,有时间我会再补上几所的(如果我以后确定是搞OS的话……)。其实想写的还有很多,调查中发现 Architecture就是一个和OS很不一样的领域,ISCA,HPCA,MICRO三个顶级的会议也使我有冲动去做一番调查,如果哪天我去搞 Architecture的话我一定也要写一篇类似的。
最后感谢薛巍老师,同意了我的这个设想,并引领了我进入了研究会议的大门。感谢郑纬民老师,陈文光老师,余洪亮老师精彩的授课,带着我开阔了视野,了结了HPC领域的各个方面。感谢不曾相识的UIUC的马同学,您的统计很漂亮,我猜想您做个这个统计估计也是和我有差不多的动机吧~
【参考资料】
[1] http://citeseer.ist.psu.edu/impact.html
[2] http://opera.cs.uiuc.edu/~xiaoma2/sohof/
[3] 盗版资料就不公布了
[4] http://google.com 所有教授,学校的网站都可以找到, 

你可能感兴趣的:(OSDI, SOSP与美国著名计算机系的调查)