百家争鸣|国内外NLP领域学术界和工业界的牛人和团队

根据这几年的积累,整理了一份国内外学术界和工业界的牛人和大牛团队,供大家申请硕士、博士、博士后和找工作参考。

  • 国内学校(排名不分先后):

哈工大社会计算与信息检索实验室:刘挺老师坐镇,教师包括:秦兵、张宇、车万翔、赵妍妍、刘铭、张伟男、丁效等老师,实验室共7个组,另外王海峰老师也是实验室兼职博导。

哈工大智能技术与自然语言处理实验室:王晓龙老师坐镇,教师包括刘秉权、刘远超 、孙承杰等老师

哈工大机器智能与翻译研究室:赵铁军老师坐镇,教师包括杨沐昀、郑德权、徐冰老师等,另外周明老师是实验室兼职博导。

哈工大深圳智能计算研究中心:王晓龙老师坐镇,包括陈清才、汤步洲、徐睿峰、刘滨等老师,实力很强。

哈工大深圳人类语言技术组:徐睿峰老师坐镇,情感原因发现做的比较好。

哈工大另外做NLP的老师包括:关毅、王轩等。

清华大学自然语言处理与社会人文计算实验室:孙茂松老师坐镇,包括刘洋、刘知远等老师。论文发的非常多。

清华大学交互式人工智能(CoAI)课题组:朱小燕老师坐镇,包括黄民烈等老师。Dialogue System做的非常好,论文非常多。

清华大学智能技术与系统国家重点实验室信息检索课题组:马少平老师坐镇,包括张敏、刘奕群等老师。信息检索做的非常好,论文非常多,前段时间刚拿了CIKM唯一的最佳论文(因为一作是学生,跟最佳学生论文合二为一了)。

清华大学另外做NLP的老师还有李涓子、唐杰、朱军等老师,李老师知识图谱做得好,唐老师数据挖掘(尤其是学者画像)做得好,朱老师偏向机器学习和贝叶斯等做的很好。

北京大学计算语言学教育部重点实验室:教师包括:王厚峰、万小军、常宝宝、李素建、孙栩、严睿、穗志方、吴云芳等(包含其他实验室的老师)。万老师、李老师、常老师等发论文很多。

北京大学语言计算与互联网挖掘研究组:万小军老师、孙薇薇老师。万老师主要做自动摘要、文本生成、情感分析与计算等,论文非常多。

中科院NLP组主要集中在自动化所模式识别国家重点实验室下属的中文信息处理研究组,另外计算所有刘群老师组和软件所也有孙乐老师做。具体老师包括刘群、宗成庆、赵军、孙乐、王斌、徐君、张家俊、刘康、韩先培、何世柱等老师。论文非常多。

复旦大学自然语言处理组:黄萱菁、邱锡鹏等老师,发论文很多。

复旦大学知识工场:肖仰华老师知识图谱做的非常好,论文发的很多。

苏州大学自然语言处理组:做机器翻译、情感分析、信息抽取等,论文发的很多。教师包括张民、周国栋、姚建民、李正华、熊得意、李军辉、洪宇、陈文亮等老师。其中张老师、姚老师、李老师都是哈工大毕业的,张老师也是哈工大的兼职博导,论文很多。

东北大学自然语言处理实验室:机器翻译做的非常好,还成立了自己的公司,对外合作很多。姚天顺老师是创始人,朱靖波老师坐镇,教师包括肖桐、任飞亮、张春良等老师。

浙江大学:陈华钧、赵洲等老师,陈老师知识图谱做的很厉害。

中国人民大学:文继荣、赵鑫、徐君、窦志成等老师。文老师现在是院长,之前在MSRA,信息检索非常厉害。

上海交大:赵海老师,主要做机器翻译、句法分析等。

东南大学:漆桂林老师,知识图谱做的很厉害。

大连理工信息检索实验室:林鸿飞老师坐镇,包括杨志豪、王健、张绍武、孙媛媛、张冬瑜、杨亮等老师。主要做信息检索,隐喻、幽默等语料库做的非常好。

西湖大学:张岳老师,之前在新加坡,论文发的非常非常非常多,剑桥2016年统计的全世界发论文的数量好像排第二。

南京大学自然语言处理研究组:包括陈家俊、戴新宇、黄书剑等老师。

天津大学:张鹏老老师,信息检索做的很好。

北京理工大学:黄河燕老师、张华平老师。黄老师是北京理工大学计算机学院院长,主要研究机器翻译,担任好几个副理事长,享受国务院特殊津贴。中科院的自然语言处理工具包就是张老师做的,另外跟刘群老师合作发了不少论文,我之前工作时实习生开发的NER就是借鉴的他的层叠马尔可夫模型而二次开发和优化的。

武汉大学语言与信息研究中心:姬东鸿等老师。

厦门大学智能科学与技术系自然语言处理实验室:包括史晓东等老师,主要做机器翻译、知识图谱、信息抽取等。

山东大学:聂礼强老师,信息检索做的非常好,论文很多。之前在新加坡,新加坡发SIGIR太多了。。。

南开大学:杨征路老师,主要做信息检索。

北京邮电大学:王小捷老师。

北京语言大学:于东老师,主要做机器翻译、人机对话等。

华东师范大学:吴苑斌老师,记得应该是复旦大学黄萱菁老师的学生。

山西大学:李茹老师,山西大学计算机学院副院长。

郑州大学自然语言处理实验室:实验室网页最近打不开了。

黑龙江大学:付国宏、张梅山等老师。

  • 港澳台地区的高校(排名不分先后):

台湾大学自然语言处理实验室:主要研究方向包括知识图谱、机器翻译、问答、自动摘要、信息检索等,论文非常多。

香港科技大学人类语言技术中心:论文非常多,牛人也不少。

香港中文大学文本挖掘组:主要研究方向包括文本挖掘和信息检索。

澳门大学自然语言处理与中葡翻译实验室:主要做机器翻译,做的非常好,论文也非常多。

香港理工大学社会媒体挖掘组:主要研究方向包括社会影响力建模、社会媒体分析、观点摘要、观点追踪、跨语言情感分析等,这个实验室对外合作很多,比如北大李素建老师、MSRA的韦福如老师等。

  • 国内工业界(排名不分先后):

百度王海峰老师以及带领的自然语言处理部+百度研究院做NLP的一些组,内部NLPC平台集成了几十个NLP算子,一些算子每天调用量都能上亿次(不要问我为啥知道这么详细,因为15-16年我参与开发过2个算子,被加到开发者组了,经常有群邮件告知各算子的调用情况),几乎涵盖所有的NLP任务,部分技术在百度AI开放平台-全球领先的人工智能服务平台-百度AI开放平台开放API,少量技术在github开源代码;

MSRA周明老师带领的NLC组,组内论文发的非常多,尤其是几个高级研究员、主管研究员;

哈工大和科大讯飞联合实验室:实验室主任是刘挺老师,阅读理解做的非常好;

华为诺亚方舟的刘群老师以及带领的团队;

小米:王斌老师坐镇,王老师翻译的书相信大部分人都看过吧。

今日头条的李航老师;

阿里巴巴达摩院语言技术实验室,在全球6个地点(杭州,北京,西雅图,硅谷,纽约,新加坡)组建了100多人的国际化团队。包括司罗,黄非,骆卫华,陈博兴,刘晓钟等,内部搭建了平台,也做了一些技术评测取得不俗成绩。

阿里巴巴、腾讯NLP做的也不少,只是个人感觉都是很多团队在做,比较分散,没有集中到一起。如果有人总结比较好的话,欢迎告知。

其他很多创业公司也有大牛坐镇,只是太多、太分散了,不再赘述,感兴趣的可以私聊。

  • 国外学术界:

麻省理工学院:Regina Barzilay, Tommi S. Jaakkola。

卡内基梅隆大学:Jaime Carbonell, Justine Cassell, William Cohen(主要做信息抽取), Chris Dyer(主要做机器翻译), Scott Fahlman,(主要做只是表示和知识推理),Robert Frederking, Eduard Hovy, Alon Lavie, Lori Levin, Brian MacWhinney,(做的比较杂),Teruko Mitamura,(主要做QA),Tom Mitchell, Eric Nyberg,Kemal Oflazer, Carolyn Penstein Rosé,(主要做聊天),Roni Rosenfeld, Noah Smith, Eric Xing。

约翰·霍普金斯大学:Andreas Andreou,Raman Arora,Jason Eisner, Sanjeev Khudanpur, David Yarowsky, Hynek Hermansky,Mark Dredze, Tom Lippincott,Philipp Koehn,Najim Dehak,Ben van Durme。绝对的NLP领域顶级牛校,研究几乎涵盖所有NLP任务,而且做的都非常好,如果非要说主要研究内容的话:句法分析、机器翻译。

普林斯顿大学:Sanjeev Arora,Karthik Narasimhan。

斯坦福大学: Christopher Manning, Daniel Jurafsky, Percy Liang,这几个人不用赘述了吧,实验室做的很广泛,句法分析和词性标注的工具很有名。

哈弗大学:Stuart Shieber,Alexander Rush,主要做MT、自动摘要和文本生成。

剑桥大学:Edward J. Briscoe,Ann Copestake,Simone Teufel,Paula Buttery,Andreas Vlachos,摘要、文本生成、NLU、句法分析、IR做的都不错。

牛津大学:Stephen Pulman,Phil Blunsom(MT非常非常厉害)。

加州大学伯克利分校:Dan Klein(主要做IE和MT)。

伊利诺伊大学香槟分校:Margaret M. Fleck (CS),Roxana Girju (Linguistics),Mark Hasegawa-Johnson (ECE),Julia Hockenmaier (CS), Dan Roth (CS),ChengXiang Zhai (CS)。

宾夕法尼亚大学:Mitch Marcus,Dan Roth,Lyle Ungar,Ani Nenkova,Chris Callison-Burch,句法分析做的非常屌,LTAG、Penn Treebank不用过多解释了吧。

芝加哥大学:John Lafferty(CRF发明人,机器翻译做的也不错), John Goldsmith

哥伦比亚大学:Kathy McKeown, Julia Hirschberg,Owen Rambow。

康奈尔大学:Lillian Lee(主要做SA(情感分析)), Thorsten Joachims(深入学习SVM的话应该知道他), Claire Cardie, Yoav Artzi。

俄亥俄州立大学(OSU):Eric Fosler-Lussier(我是因为做对话知道的他), Michael White(主要做NLG), William Schuler(主要做句法分析和MT), Micha Elsner, Alan Ritter, Wei Xu(社交媒体)。

匹兹堡大学:Ashley Kevin, Brusilovsky Peter, Lewis Michael。

多伦多大学:Graeme Hirst, Gerald Penn,Frank Rudzic,Suzanne Stevenson,主要做句法分析、语义分析。

麦吉尔大学:Doina Precup,Jackie Chi Kit Cheung,Joelle Pineau, Prakash Panangaden

蒙特利尔大学:Yoshua Bengio,不过多解释。

佐治亚理工:Eric Gilbert(社会计算领域很有名)。

南加州大学:Jerry Hobbs,Ron Artstein,David DeVault,Kallirroi Georgila,Panayiotis (Panos) Georgiou, Andrew Gordon,Jerry Hobbs,Khalil Iskarous,Kevin Knight,Sungbok Lee, Anton Leuski,Jonathan May,Prem Natarajan,MT、IE、关系挖掘、对话做的都不错。

华盛顿大学:Tim Althoff,Jeffrey Bilmes,Yejin Choi,Pedro Domingos,Oren Etzioni, Hannaneh Hajishirzi,Noah Smith,Daniel S. Weld,Luke Zettlemoyer,主要做句法分析、MT、对话、IR等。

爱丁堡大学:Shay Cohen(句法分析),Sharon Goldwater,Kenneth Heafield(MT),Frank Keller(句法分析),Mirella Lapata(NLU、NLG),Adam Lopez,Walid Magdy(IR、DM、社会计算),Rico Sennrich(句法分析、MT),Mark Steedman(对话),Ivan Titov(句法分析、NLU),Bonnie Webber(QA)。

新加坡国立大学:NG Hwee Tou(主要做MT和句法纠错)。

马里兰大学:Philip Resnik, Naomi Feldman,Marine Carpuat,Hal Daumé, 主要做MT和IR。

东北大学:David A. Smith, Byron Wallace, Lu Wang。

加州大学伯克利分校:Dan Klein,主要做NLP和ML交叉研究。

加州大学圣巴巴拉分校:William Wang, 主要做IE(信息抽取)和ML。

加州大学圣克鲁兹分校:Marilyn Walker,主要做dialogue。

纽约市立学院(CUNY):Martin Chodorow,Liang huang,Andrew Rosenberg,William Sakas,Virginia Teller。

University of Massachusetts Amherst:Andrew McCallum(CRF、主题模型)、Bruce Croft、James Allan(IR做的非常屌)。

纽约大学:Sam Bowman, Kyunghyun Cho,NLU做的非常好。

北卡罗来纳大学教堂山分校(UNC):Mohit Bansal, Tamara Berg,主要做句法分析、多模态对话。

罗切斯特大学:Len Schubert, James Allen(篇章分析、对话做的很好),Dan Gildea(句法分析、MT)。

谢菲尔德大学:Rob Gaizauskas (Head of Group),Mark Hepple,Lucia Specia(MT很厉害),Mark Stevenson(主要做IR和IE),Yorick Wilks(ACL终身成就奖)。

还有很多学校、很多学术界大佬没整理了,后续再补充吧。另外美国工业界的NLP大牛也很多,比如google、facebook、microsoft、amazon、IBM等公司。

以上就是我这些年的总结,毕竟精力有限,难免挂一漏万。国内学术界、工业界了解较多,国外了解相对较少,很多只是扫过一些学者的论文或者看过他们的主页,如果大家有了解的欢迎交流。谢谢!

转载:https://mp.weixin.qq.com/s?__biz=MzI3ODgwODA2MA==&mid=2247485983&idx=1&sn=62de7cfc9b5e7ee63a37370c25c71676&chksm=eb501e8cdc27979a0c97ae3b37e1e9498f4845b694dbacb6b914213f40a9db166ace004922fd&mpshare=1&scene=23&srcid=11293P6kcQmquu45jwNFcVqY#rd

你可能感兴趣的:(NLP)