OSDI, SOSP与美国著名计算机系的调查 (我也要开始读论文喽)

 

按照USnews的分类,Computer Science被分为四个大类:AI, Programming Language, Sy stems, Theory.。毫无疑问,Systems是这四个大类中最要紧也是最大的一个。根据cites eer在2003年5月排出的所有计算机学科会议和期刊的影响因子排名[1],在前十位中的属于 Systems的有7个,在前15个中占据了11个。

Systems的内容十分广泛,包括OS, Architecture, Network等等。在citeseer排名中,最 好的会议是OSDI,这是一个收录范围相当广的会议。提到OSDI,就得提到排名第11的另一 个会议: SOSP。这两个是OS最好的会议,每两年开一次,轮流开,比如今年是OSDI,那么 明年就是SOSP。由于这两个会议方向很广,因此影响很大。除此之外,在OS方向还有一些 方向比较专一,但是水平仍然很高的会议,比如FAST就是File and storage system最好的 会议,NSDI偏重Networked System Design and Implementation,2004年才第一次,USEN IX Sponsor,号称要办成Network最好的System的会议。RTSS是Real system最好的会议。

在Architecture领域,最好的会议是ISCA,HPCA和MICRO。还有像ASPLOS则是OS, Archite cture, Programming language三个领域交叉的最好会议,近年来貌似被Architecture霸占 。 可以说Systems的会议非常多,一直是计算机的热门领域。本文仅仅针对OSDI和SOSP这两个 最top的OS会议,尤其是OSDI来了解一下这个最顶级的会议都是哪些人物,哪些组在上面发 表论文,这些牛人现在又在研究什么,我们中国人在这个会议上又有什么表现。

 

【会议历史】 OSDI 一个年轻的会议,它的全称是Operating Systems Design and Implementation。它 是由USENIX主办的。USENIX是一个于1975年成立的Advanced Computing Systems Associa tion。它所举办的都是一些非常好的会议,比如前面提到的OSDI,FAST等等。OSDI是USEN IX于1994年创办的,基本上是两年一次,至今为止举办了7届(94,96,99,2000,2002, 2004,2006)。每届会议举行3天,早期的OSDI每届收录20篇左右的文章,从2002年开始稳 定在27篇,一般是每个小方向有3篇文章。

而SOSP是一个相对古老的会议,它是由ACM下属的SIGOPS (the ACM Special Interest G roup on Operating Systems)于1967年创办的。这个会议也是两年一次,迄今为止已经举 办了20届,每届收录的文章在20篇左右。

 

【统计数据】 我对OSDI所有收录的文章的作者,单位进行了人工统计。可当我统计完之后发现UIUC的一 个马同学对OSDI和SOSP两者一起进行了统计 [2]。所幸的是,他并没有单独统计,而且有 些东西统计的不是很细致。下面主要以我自己统计的OSDI为基准,结合马同学的数据进行 阐述。

首先我发现,很多文章都是由好几个单位合写而成的。于是我做了一个统计,计算每一届 所有文章的单位数。比如某篇文章是由MIT和Washington合写的,那么这篇文章的单位数就 是2。每一届的单位数的值如下:

由此可见,每一届的单位数基本都在上升,到了2006年更达到了44,平均每篇文章由1.62 963个单位写成。这其中有学校和学校的合作,有企业和学校的合作,可见至少是在OS领域 ,合作是发表得高水平文章的基础。

下面分析一下哪些研究单位在OSDI上面发表的文章数最多:

MIT 14

Microsoft 13

Princeton 12

Washington 12

Stanford 11

Berkeley 10

CMU 10

Michigan 7

Arizona 6

Rice 6

Utah 6

Duke 5

Umass 5

OSDI,SOSP与美国著名计算机系的调查(一)2 以下是在OSDI和SOSP(97年之后)发表文章最多的单位[2]: MIT 31

Microsoft 24

Stanford 23

Washington 20

Berkeley 17

CMU 15

Michigan 15

Princeton 14

Duke 10

Rice 9

HP 8

Utah 8

IBM 7

Wisconsin 7

Intel 6

对比USnews在Systems方向上的排名[3]: 1. University of California?CBerkeley 2. Massachusetts Institute of Technology 3. Carnegie Mellon University (PA) 4. Stanford University (CA) 5. University of Illinois?CUrbana-Champaign 6. University of Washington 7. University of Wisconsin?CMadison 8. University of Texas?CAustin 9. University of California?CSan Diego 10. Princeton University (NJ) 11. University of Michigan?CAnn Arbor 12. Cornell University (NY) 13. Georgia Institute of Technology University of California?CLos Angeles 15. Rice University (TX) 16. Purdue University?CWest Lafayette (IN) University of Maryland?CCollege Park

可见,MIT不愧为理工科的老大。在USnews排行榜上的四牛校:MIT, Stanford,Berkelet y,CMU名不虚传。

此外在OS方向很强的微软老巢Washington, 在USnews上Systems方向比较强的Princeton, Michigan都有入围十强。比较意外的是Systems榜上第五的UIUC并没有很好的表现,这所硬 件巨牛的学校在OS上比较令人失望。

还有像新兴的UCSD,虽然没有入围但是它已经连续三年(04-06)在OSDI和SOSP上都有斩获, 势头直逼传统牛校。值得一题的还有各大公司的研发机构,微软以两项第二的成绩证明了 自己的研发能力堪比四大牛校,据说它在图形学的第一会议: SIGGRAPH上更是所向披靡。 HP,IBM和Intel也不甘示弱,在OSDI和SOSP的总排行榜上分别名列11,13,15位。新生的 google也已3篇OSDI(06年的best paper),1篇SOSP在强势追赶。

以上是一些数据和总体印象,下面我将着重介绍一下我所调查的OSDI文章数前6的学校(M IT, Princeton, Stanford,Washington,Berkeley,CMU)的情况和一些知名的教授,以 及中国人特别是清华师兄师姐们在这些学校中的表现。

【MIT】 作为工程的第一牛校,MIT在各个方向都是非常强的。在OSDI上发表了14篇文章。分别在9 4年发表4篇,99年1篇,00年3篇,02年1 篇,04年3 篇和06年的2篇。在这14篇中,Profe ssor M. Frans Kaashoek发表了4篇,Professor Robert Morris发表了3篇,他们都是MIT 的PDOS组的,后文还会提到这个组培养出了很多伟大的人物。还有Professor Barbara Li skov教授和Professor Miguel Castro(后去了微软)也是三篇,他们是在MIT的PMG组。据 马同学的统计[3],Frans Kaashoek教授在OSDI和SOSP中的发文数是第一名(15篇),而B arbara Liskov教授发文数第四(13篇),Miguel Castro排名第8,Robert Morris排名20 。

可见,PDOS和PMG是MIT在OSDI上发文的两个大组,下面简要介绍一下这两个组。PDOS全称 是Parallel & Distributed Operating Systems Group。它和PMG组一样,都是隶属于MIT Computer Science and Artificial Intelligence Laboratory。由于MIT是人智的发祥地 ,所以MIT把什么都归到人智的帐下……比如所有的System都是这个实验室管。PDOS组主要 由 Frans Kaashoek和Robert Morris主持。他们组最近比较热门的是在做P2P方面的研究, 他们2006年的文章大部分都是P2P计算,主要是IRIS和Chord两个P2P的项目。 另一个是Barbara Liskov教授的PMG(The Programming Methodology Group),他们组最 近研究的东西也是给予哈希表的分布式计算,也是在IRIS项目上进行研究。

此外,像在OSDI上发表了两篇文章的Hari Balakrishnan教授,他所在的Networks and Mo bile Systems组也有很好的文章。另外一些从MIT出去的比如Miguel Castro无论是在MIT还 是在微软,都发表了高水平的论文,他02年在微软发表了两篇OSDI,05年写了一篇SOSP。 总之,MIT的Syst

 
 

em 绝对是世界领先的,不过很遗憾,在这些牛人中几乎没有中国人的身 影。

 

 

【Princeton Univ】 有人说 Princeton是一所梦一样的学校。这所座落在纽约边上小镇的学校以它的学术水平 蜚声世界。在50-60年代,著名的高等研究中心吸引了一大批欧洲的科学家,爱因斯坦,外 尔,陈省身都在那里留下了自己的足迹。在计算机系,这个只有17个Professor的小系,却 在USnews上长期霸占前十的位置。Princeton在OSDI上一共发表了12篇文章,值得一题的是 它是唯二的两个在每一届的OSDI上面都有文章发表的学校(另一个是 Washington)。值得 一题的是,在普林斯顿的System方向,我们中国人做出了非凡的成绩。

在12篇文章中,主要是由两位教授完成的,每人完成6篇,可能方向不太一致,两位高产教 授居然没有在OSDI中合作过。这两位是系主任 Larry Peterson和中国教授Kai Li(李凯)。 李凯教授在OSDI上发表过6篇文章,不仅如此,他还指导了许多中国学生在OSDI上崭露头角 。其中来自清华计算机系的学生就至少有: Pei Cao,Yu xiang, Xiaohu Qie。他们分别在 94,2000和2002年的OSDI上和李凯教授发表文章。不仅如此,Pei Cao师姐在1996年又以W isconsin副教授的身份发表了一篇OSDI。

在李凯教授的众多学生中,最著名的莫过于现在在UIUC当教授的 Yuanyuan Zhou。Yuanyu an Zhou是北大计算机本科毕业的,她跟李凯教授的第一篇论文就是发表在OSDI上面。她到 UIUC后,发表了UIUC在OSDI上面的第一篇论文。现在 Prof. Zhou独自扛起了UIUC里OS的大 梁,她已经在OSDI和SOSP上发表了4篇论文。

System方向的另一位教授 Larry Peterson比起李凯教授可能更加活跃。Larry Peterson在 OSDI和SOSP上共发表了11篇文章,名列第6名。同样的,他指导了很多中国学生的研究工作 。比如来自上海交大的Ruoming Pang,来自北大的Limin Wang,还有Ming Zhang, Chi Zh ang,Zhe Wang都和Larry Peterson发表过OSDI。在普林斯顿总共发表的11篇OSDI中就有1 0篇是和中国人有关的。

两位教授近年来也在做一些比较有意思的事情。李凯教授前些年在做一个Scalable Displ ay Wall 用很多台投影仪搭建一个超大尺寸的视频墙。今年李凯教授过来讲座,得知最近 他在开一个公司,关于数据备份压缩的研究。

Larry Peterson一直在领导一个很大的项目PlanetLab。这个项目是一个超大的分布式平台 ,把很多实验室,工业界的计算资源整合起来,在全球已经有了722个结点。包括David C uller,Larry Peterson在内很多教授都参与了这个项目。最近的进展是12.13号发布了Pl anetLab Services。

【U.Washington】

作为位于微软老巢的学校,Washington在System领域自然是不甘落后,甚至有和四大叫板 的实力。一个有意思的现象是,我所介绍的6 所学校中,除了4大牛校之外,剩下两所学校 的系主任都是搞System的,而且都是发文狂人,这也从一个侧面说明了System在这两所学 校中的地位吧。

和普林斯顿一样,Washington也是在每届OSDI中都有收获的学校。在Washington中,有两 位教授在OSDI上都发表过4篇文章,他们是:系主任Henry M. Levy和Steven D. Gribble 。另两位教授Thomas Anderson,Brian N. Bershad在Washington发表了3篇文章,其中Br ian N. Bershad还在CMU当教授期间发了一篇OSDI,这两位教授都是Washington毕业的,而 且都是Henry M. Levy的学生。Henry M. Levy不仅培养出优秀的学生,自己的工作也十分 的出色。在OSDI和SOSP发文排行榜上,Henry M. Levy以15篇文章和MIT的M. Frans Kaash oek并列第一位。在排行榜的前6位中,Henry M. Levy, Brian N. Bershad,Thomas And erson师徒三人分别名列第1,3,6位,这是多么厉害的数字。另一位Steven D. Gribble教 授不是来自Washington,他是来自OS牛校Berkeley。Steven D. Gribble在Berkeley导师是 Eric Brewer,后面会提到Eric Brewer也是我们系师兄周枫的导师。Steven D. Gribble在 做学生的时候于97年发了一篇SOSP,2000年又发了一篇OSDI。

上述四位教授主要都是在Systems, Networking, and Security Research组工作。他们组 的项目很多,正在做的就有17项,包括分布式系统和网络、安全,操作系统等等。在分布 式领域,他们和普林斯顿一样,都参加了PlantLab项目。其他的几个项目都是和网络相关 :比如Internet Astronomy是要检测互联网的每一处行为,并构建下一代互联网协议;Wi reless Network Design主要是讨论未来无线网的协议。在安全方面,Spyware and Worms 项目主要是检测和防御蠕虫和间谍软件。Electronic Voting主要是加强电子投票器的安全 问题。在操作系统方面,Denali和Nooks这两个操作系统使他们关注的热点。其中Nooks主 要是解决操作系统中经常出现的驱动失败的问题。总而言之,网络和安全(包括修复错误 )是Washington近期的研究的热点,他们最近的文章也都是这方面的内容。很遗憾,和MI T一样,在Washington没有看见中国人的身影。

【Stanford Univ.】

斯坦福大学位于信息世界的心脏地带--硅谷,它是所有学CS人心目中的dream school。Su n, Yahoo, Google等等公司都是由斯坦福的学生创办的。斯坦福在OSDI上发了11篇文章, 其中有5篇是由Dawson Engler教授发表的,此外Dawson Engler还发表了5篇SOSP,以10篇 的成绩名列第8位。

Dawson Engler毕业于大名鼎鼎的MIT的PDOS组,他是前面提到的MIT大牛人Frans Kaashoe k的学生,可谓名师出高徒。他所研究的就是查找一些真实代码中的bug, 比如他做的Met a-Level Compilation项目,这个东西主要是用来检查,优化,修改操作系统代码中。它能 够查处500多处出现在Linux, OpenBSD, Xok, 和Stanford FLASH machine中的错误。它主 要是由一个compiler(xgcc)和一种编程语言Metal。另外他还开了一个公司:coverity用来 推广静态检查产品。Dawson Engler最近研究的东西是自动生成一些输入数据,用来覆盖程 序中所有的分支,对所有值的检查,用来发现代码中的问题。

在他的学生中,有一个很牛的清华计算机系的师兄Junfeng Yang。他和Dawson Engler合作 ,以第一作者的身份发表了两篇OSDI。他们组做的工作都是用软件去寻找代码中的bug,显 得很有新意。

此外,还有一位华裔女性教授在OSDI上发表了2篇文章,在SOSP上发表了3篇文章,她就是 Monica S. Lam(林倩玲)。她做的工作之一和Dawson Engler有点类似,是通过Static A nalysis and Dynamic Instrumentation方法来提高程序的鲁棒性。此外,她还提出了一种 新的体系结构,利用Virtual Appliances.技术来使计算机更容易管理。

【UC Berkeley】

Berkeley是OS的发祥地, BSD版的UNIX影响了整个OS界,伯克利的RISC技术后来成为了SU N公司SPARC微处理器的核心技术。可能是因为Berkeley大师太多了,所以没有像Henry M. Levy那样的领军人物。发文数最多的Eric A. Brewer,教授有3篇OSDI和两篇SOSP。但是, 有像David Patterson,David Culler这样的泰斗级人物的存在,Berkeley依然是OS的领跑 者。在Berkeley中,有两个方向常常在OSDI上发表文章,它们是 Computer Architecture & Engineering (ARC)和Operating Systems (OS)。

OS 组是由Eric A. Brewer领导的。同时Eric A. Brewer还领导着Intel Research Berkel ey。Eric教授主要是做和网络相关的OS。他现在主要做两个项目:TIER和NEST。TIER是一 个类似于100美金笔记本的项目,但是它不仅仅是造一台机器。从官方主页上来看,它包含 了无线,存储,教育,医疗,语言和能源。这是一个非常大的项目,目前在很多非洲国家 都有部署,有美国国家自然科学基金会的资助、来自Intel、HP和微软的协助以及联合国计 划开发署、Grameen Bank和Markle Foundation的支持。另一个NEST是网络嵌入式系统,它 是伯克利无线嵌入式系统的一部分,David Culler也参加了这个工作。值得一题的是Eric A. Brewer有一位得意门生是来自清华计算机系的周枫师兄,周师兄在06年的OSDI上发表 了一篇论文,是关于用软件的方法来解决Linux中驱动崩溃的情况。解决驱动崩溃的东西前 面提到的Washington也在做,不知道这是不是一个热门的方向。

David Culler的涉猎范围十分的广泛,和Eric A. Brewer一样,他们都毕业于MIT。Culle r教授现在研究的项目有,前面提到的普林斯顿和华盛顿都在做的PlanetLab,和Eric教授 一起参与的Wireless Embedded Sestems,另一个网络嵌入式系统TinyOS,高性能的网络工 作站NOW,一种并行编程语言Split-C:,等等。

总之,伯克利的牛人太多了,像David Patterson这种泰斗,我都不知道怎么介绍了。另外 有意思的一点就是伯克利的教授一般都是自己开公司,像Eric A. Brewer,David Culler 都有自己的公司,在加州的这片热土上,有足够的机遇和人才来促进计算机的研究和发展 。

作为四大牛校之一,CMU的CS是做为一个学院存在的,我记得在top10中就CMU是这样子的。 正因为如此,CMU的方向非常全, Programming Language更是名列USnews的第一位。在Sy stem方向虽然不如其他三所牛校这么出色,但还是位于前列。看了一下CMU在OSDI和SOSP
上的表现会十分的奇怪。CMU在OSDI上共发了10篇文章,都是在2000年以前发的,2000年它 一口气中了5篇OSDI,96年中了3篇,94和 99各中一篇。在SOSP上的表现也是如此,在SOS P上中了5篇,其中有三篇是在2005年中的,在这之前就要追溯到97年。也就是说,CMU在0 1年之后的5年里面,只在05年中了三篇SOSP,而OSDI一篇没中。 由于CMU方向太多,人员太分散,好多组都在OSDI上发表文章,只能找到一位教授在OSDI发 了两篇文章,他是Gregory R. Ganger。Gregory R. Ganger教授同时也是CMU在OSDI和SOS P上发文最多的教授,发了5篇文章名列第31位。

Gregory R. Ganger所在是CMU计算机学院ECE系里的parallel data lab。Gregory R. Gan ger主要是在做存储系统。他最近的做的Self-* Storage Systems就是一个集群的存储系统 。Better Security via Smarter Devices是一个能够自动防御各种病毒,蠕虫的分布式的 装置。Survivable distributed storage (PASIS)能够抵御successful breakins的存储系 统。

值得一题的是Gregory R. Ganger读博士的时候是体系结构大牛Yale Patt的学生,博士后 的时候更是去了MIT的PDOS组,是Frans Kaashoek的学生……这时候我对Frans Kaashoek的 景仰之情犹如……

 

【总结】

迫于精力有限,另外几所很牛的学校像U. Michigan,Duke,Rice都来不及介绍了。诚然, OSDI和SOSP只是System方向的冰上一角,但是从这一滴水,我还是从中看到了OS方向的进 展和人物。

从OSDI和SOSP上的表现来看MIT,Stanford,Washington,Berkeley,Princeton确实体现 出了它们做为美国乃至世界一流名校的风采。就专业角度来说,虽然我只是扒了几个主页 ,看了看标题,但是还是有两点感触很深。

1.网络很重要。在OS领域取得成绩的都离不开网络,MIT的P2P离不开网络。而Washingto n的Henry M. Levy研究的项目几乎都是网络相关的,Princeton的Larry L. Peterson本身 就是著名网络教材《Computer Networks: A Systems Approach》的作者。Berkeley的Dav id Culler教授把网络纳入嵌入式系统。而众多牛校参与的PlanetLab本身就是一个超大规 模的分布式系统,当然也离不开网络。

2.系统安全很重要。我发现好几个学校都在从事如何是操作系统或程序更加的安全,比如 Washington的Nooks系统和Berkeley 的周枫师兄不约而同的在研究如何解决系统驱动错误 的问题。斯坦福的Dawson Engler教授和Junfeng Yang师兄研究是如何自动查找系统代码中 的bug,如何检测程序中的问题。Monica S. Lam教授也在研究如何提高系统的鲁棒性。还 有CMU的Gregory R. Ganger,如何防御蠕虫和病毒也是他目前正在研究的。系统的可靠性 ,安全性已经成为当今热门的领域。

以上就是我从这段时间调查OSDI和各个名校的网站上得到一些浅显的结论,可能有些地方 是不对的或有漏洞的,不正之处还请各位老师指出!

 

【后序】 洋洋洒洒涂了一万字,每个字都是自己敲的,前后历经了几个星期,终于暂告一个段落。 之所以想写这篇东西,一是觉得读了四年本科,连当今世界计算机的研究发展都不知道是 件挺丢脸的事情。我也很好奇究竟是哪些人,哪些组在计算机界,特别是System方向呼风 唤雨,也特别想看☆人在这个领域有什么表现。二是今年正好自己申请学校,看了网 上介绍美国计算机系的资料很少,只有南大和复旦的前辈们写过,而且不够详细,我想清 华也该有这么一篇东西(虽然发现实在是不好写,只写了6所学校)。

正好选了高性能前沿技术这门课,有了这个机会来把我这个梦想给实现了,于是就满怀热 情的开始写了。整理资料是一件挺烦琐的事情,不过这件事是我感兴趣的,所以还算挺顺 利的就写下来了。

名字后面加了一个(一),寓意也是很明确,有时间我会再补上几所的(如果我以后确定 是搞OS的话……)。其实想写的还有很多,调查中发现 Architecture就是一个和OS很不一 样的领域,ISCA,HPCA,MICRO三个顶级的会议也使我有冲动去做一番调查,如果哪天我去 搞 Architecture的话我一定也要写一篇类似的。

你可能感兴趣的:(计算机)