中国和美国 Database 牛校、牛人及相关会议评价 [转载]

其实,DB牛的也就那么二十来所学校。。。
  
  USA: Wisconsin, Stanford, Berkeley, Cornell, UIUC, Washington, CMU, UCSD, UMich, UPenn, Maryland, Columbia, Purdue, Duke, UCSB, Arizona, Florida
  CA: Toronto, Waterloo
  EU: ETHZ, Edinburgh, MPI Informatik
  Asia: NUS, HKUST
  
  今天无聊随便看,发现Berkeley DB Group 3个教授都是Wisconsin的Ph.D(虽然Papadimitriou也被列在DB里,不过鉴于他是做theory的超级大牛,兼做下db theory,就不算在db里了),真是无语啊。。。Cornell DB Group 2个主力教授也都是Wisc的Ph.D;UIUC不用说了,DM界数一数二的超级大牛Jiawei Han也是Wisc的Ph.D;CMU DB Group两位主力教授有一是Wisc 00年毕业的Ph.D;后面的就不数了。。。看来Wisc DB Group的Ph.D毕业后的Placement异常地好,不愧是世界第一。虽然Raghu Ramakrishnan离开Wisc加盟了Yahoo!,它家的DB Group阵容依然强大,有David DeWitt和Jeff Naughton两位超级大牛坐镇,还有Anhai Doan这位2003年ACM最佳博士论文奖得主这样的超级新星的加盟,相信Wisc DB仍然一路走好。。。(其实还是Ramakrishnan没离开时最牛,想想4个教授有3个ACM Fellow,还有个年轻的是ACM Doctoral Dissertation Award Winner,将来肯定也是ACM Fellow,@_@,而且Ramakrishnan现在还是SIGMOD的chair。。。)
  
  NUS和HKUST DB也够强悍,单看在SIGMOD/VLDB上的publication都和UIUC,Cornell有得一拼了,太牛了~
  
  大陆的数据库组,就是RUC,FDU,PKU这3家是不错的了。人大的数据库无疑是大陆第一,faculty里,王珊虽然很牛,不过也老了。。。孟小峰不错,也很年轻,实力派~ (后悔当年没报人大 @_@) 北大的杨冬青和唐世渭太老了。。。 复旦那边就是周傲英了,牛气十足:)个人补充一点,现在清华和哈工大也Very的牛,哈工大Jianzhong Li在Berkley转了一圈,统计一下发了好几篇VLDB。清华也在最近几年引入2名牛人Ling Feng和Jianyong Wang,TODS、TKDE和ICDE都有所斩获。 人大那边引入一个Cuiping Li,NUS过来的,一回来就带回一篇VLDB,今年人大Top又搞定好几篇。北大引进Bin Cui,SIMOD07搞定一篇,据说一作是个非计算机的本科生,牛呀。复旦这几年跟NUS合作不错,ICDE08搞定一篇Regular paper,好像也是一个本科生,牛呀。如果非要给这些学校在DB领域排个座次,我觉得目前应该这样排:人大、复旦、清华、北大、哈工大。
  
  (09/01添补:今天在DBLP上看到我目前见到的最Kong Bu(kao,校内连这也屏蔽)的publication,此年轻超级大牛的论文发表量如下(此大牛99年从Toronto Ph.D毕业,所以只计算其00年后的publication,并且此处仅仅统计部分top conference):
  2007: SIGMOD 1篇,VLDB 4篇,ICDE 6篇,WWW 1篇
  2006: SIGMOD 3篇,VLDB 3篇,ICDE 2篇,ICDM 1篇
  2005: SIGMOD 2篇,VLDB 4篇,ICDE 4篇,WWW 1篇
  2004: VLDB 3篇,ICDE 2篇
  2003: SIGMOD 1篇,VLDB 3篇,ICDE 5篇,KDD 1篇,WWW 1篇
  2002: SIGMOD 3篇,PODS 1篇,ICDE 3篇,KDD 1篇
  2001: STOC 1篇,SIGMOD 1篇,VLDB 1篇,PODS 1篇,ICDE 2篇
  2000: SIGMOD 1篇,VLDB 1篇,PODS 2篇
  仅统计SIGMOD/VLDB的话,8年间他共发表了12篇SIGMOD,19篇VLDB。。。以前有人专门做了个统计,分析得到全球28位数据库领域的超级牛人平均10年内在SIGMOD/VLDB上发表15篇左右,即平均每年1.5篇SIGMOD/VLDB。也就是说,哪位如果10年内在这两个会议上发表了15篇以上的paper,就可以排进“数据库世界前30超级大牛”了。而这位大大已经达到了平均每年3.875篇SIGMOD/VLDB的水平,OMG~ 非人类中的超级BT~~~)
  
  一流的:数据库三大顶级会议SIGMOD,VLDB,ICDE,数据挖掘KDD,实际相关的还有机器学习ICML,还有信息检索的SIGIR;数据库的理论会议PODS,但它是理论的会议所以和咱们就不大相关了
  二流的:EDBT,ICDT,CIKM,SDM,ICDM,PKDD,还有ECML欧洲的机器学习会议(这个应该是1.5档的,比一般的二流好),这些会也不好中,中了也会会觉得不一定爽,你可能觉得再以努力就上一流了,哈哈。还有一些会,俺就懒得列了!
  
  下面是很早以前AI版的一个帖子,写得还不错,看看吧,哈哈
  ————————————————————————————————————
  
  有些人的工作很原创,每年总有一些很新颖的东西。有的人文章很多,但主要都是follow别人的工作。Database领域有不少paper machine。有的地方,整个group就是一个大的paper machine。
  
  个人感觉数据库研究者倾向于把数据挖掘看作一个数据库的子领域,因而对数据挖掘的会议rating较低。然而对其他背景的人而言,数据挖掘是相对独立的一个新兴领域,因而对其会议rating比较高。
  
  SIGMOD:97分,数据库的最高会议,涉及范围广泛,稍偏应用(因为理论文章有PODS)。没说的,景仰如滔滔江水。这个会议不仅是double-blind review,而且有rebuttal procedure,可谓独树一帜,与众不同。
  
  VLDB:95分,非常好的数据库会议。与SIGMOD类似,涉及范围广泛,稍偏应用。
  
  从文章的质量来说,SIGMOD和VLDB难分伯仲,没有说谁比谁更高。他们的范围也几乎一样。不少牛人都认为,今年的rebuttal procedure其实并不怎么成功。投稿太多,很难做到每一篇都公平公正。很多rebuttal没人看。
  
  double-blind是把双刃剑。这几年来每年都有人冒充牛人的风格来投稿,有的还真进去了。反而VLDB的审稿质量一直很高。每年的VLDB都有很理论的paper。
  
  一般来说,我感觉大家还是认为SIGMOD要好那么一点点。根据我个人读过的文章,也有这样的感觉。不过这个并不重要了,有差别也是那么一点。
  
  PODS:95分。是“数据库理论的最好会议,也是一个很好的理论会议”。每年总是co-located with SIGMOD。感觉其中算法背景的人占主流(你可以数数PODS文章中有多少来自Motwanigroup),也有一部分AI背景的人(毕竟SIGART 也是主办者之一)。它的影响力远不及SIGMOD,然而其中文章的质量比较整齐,variance小于SIGMOD(以及其他任何数据库会议)。有一位牛人说:“PODS never had a really bad paper,”这是它值得骄傲的地方。
  
   KDD::full paper 95分,poster/short paper 90分。数据挖掘的最高会议。由于历史积累不足以及领域圈子较小,勿用讳言KDD目前比SIGMOD尚有所不如。我觉得我们可以这样类比:KDD:SIGMOD=CRYPTO:STOC。回顾密码学的历史,真正最牛的文章一般发在STOC/FOCS而非CRYPTO /EUROCRYPT,这和今天的数据挖掘何等类似!然而你看看今天的密码学文章,已经有顶级的密码学家(恕我不便写出名字)不再往STOC/FOCS投稿。我觉得同样的事情在不久的将来也会发生在数据挖掘中,让我们拭目以待。
  
  这几年来KDD的质量都很高。其full paper的质量高于SIGMOD/VLDB中数据挖掘方面的paper的质量。原因是SIGMOD/VLDB审稿人中数据挖掘的人很少,审稿标准不一定能掌握得很好。这几年好几篇SIGMOD/VLDB的数据挖掘paper都follow一些KDD的paper。而在KDD,要拿一篇full paper真难。去年复旦拿了一篇,实属难能可贵。今年他们又拿了一个SIGMOD demo,说明工作的确很扎实。
  
  听说在很多地方,如果能有一篇SIGMOD/VLDB/KDD,就能博士毕业,能有两篇就能找到不错的工作。“革命尚未成功,同志仍需努力!”
  
  ICDE:92分。很好的数据库会议,也是一个大杂烩。好处是覆盖面广、包容性强,坏处是文章水平参差不齐。
  
  EDBT:88分,不错的数据库会议,录取率很低然而历史积累不足,影响还明显不及ICDE。
  
  ICDT:88分,PODS的欧洲版,数据库理论第二会议。
  
  和SIGMOD/VLDB一样,ICDE和EDBT在质量和影响上都不相上下。
  其它的如CIKM,ICDM,SDM,SSDBM,PKDD等等都比以上的会议差一截。
  
  CIKM:85分。
  
  SDM:full paper 90分,poster/short paper 85分。SIAM的数据挖掘会议,与ICDM并列为数据挖掘领域的第二位,比KDD有明显差距。好像其中统计背景的人比较多,也有一部分机器学习背景的人,比较diversified。
  
  ICDM:full paper 90分,poster/short paper 85分。IEEE的数据挖掘会议,与SDM并列为数据挖掘领域的第二位,比KDD有明显差距。
  
  PKDD:83分(因为poster/short paper数量很少,所以不予区分)。好像是KDD的欧洲版,但与KDD差距很大。

你可能感兴趣的:(DB,database,sigmod,vldb,icde,fdu)