智源导读:12月10日,Nature Index 发布了其 AI 增刊(Nature Index AI supplement),该刊分别使用了Nature Index(自然指数)数据和规模更大的Dimensions数据库,对全球范围内的人工智能学术研究做了分析和排名。但根据两个数据库的排名,中国的名次变化有点大,前者在美、英、德之后,位居第四;而后者则远超其他国家,雄踞第一。
仔细分析这两种数据排名,我们发现:中国在 AI 方向确实已经处于前沿地位,但我们在将 AI 应用于传统基础学科上仍有欠缺。这种欠缺,除了提示我们应当更加注重基础研究外,或许也告诉我们的 AI 专家们:在传统学科中或许有更多可探索的新天地,而非仅仅局限在 AI 的核心任务上。
简单来说,根据自然指数数据显示,2015年至2019年期间,尽管中国在自然指数论文库中的数量迅速增加(2019年论文数量增长到了2015年的340%),但仍排在美、英、德之后,位居第四。这里可以看到美国的 Share (后文解释含义)要大于2~10名全部总和。
图 1:自然指数的国家排名
然而,根据规模更大的 Dimensions 数据库,AI领先的国家和地区显然不同。中国在2015-2019年间的出版物以 318534的数量雄踞第一,而印度则以91563的数量排名第三。
图2:基于Dimensions Data的国家排名
这种差别的原因在于,自然指数数据分析聚焦在指数所追踪的82本高质量自然科学期刊上发表的AI相关文章的数量,这些期刊主要覆盖化学、物理、生命科学、地球与环境科学等。因此依据自然指数数据的排名,更强调的是 AI 在化学、物理、生命科学、地球与环境科学等方面的应用。
而Dimension相对则更为广泛,包括人工智能相关的各种期刊和会议论文,可追踪到所有领域AI相关文章的发表情况。
两相对比,更突显了:尽管中国的 AI 研究在总体上居于世界第一(以出版物数量来说),但在化、物、生、地等传统学科中的应用却是短板。
01 Dimensions Data 中的中国 AI
使用Dimensions Data,Nature Index AI不仅分析了每个国家的排名,还给出更为详细的研究机构的 AI 100 排名。在这个榜单上,来自中国的研究机构主导了前十强机构。
前 10 名中有 7 家来自中国的高校/科研单位:清华大学(第一)、中国科学院大学(第二)、上海交通大学(第三)、北京航空航天大学(第四)、浙江大学(第五)、哈尔滨工业大学(第六)、电子科技大学(第八)。
而前100强机构中,中国占到 39 家。
名词 |
研究机构 |
国家/地区 |
出版物2015–2019 |
1 |
清华大学 |
中国 |
11,867 |
2 |
中国科学院大学 |
中国 |
8,835 |
3 |
上海交通大学 |
中国 |
8,796 |
4 |
北京航空航天大学 |
中国 |
8,605 |
5 |
浙江大学 |
中国 |
8,337 |
6 |
哈尔滨工业大学 |
中国 |
8,315 |
7 |
南洋理工大学 |
新加坡 |
6,985 |
8 |
电子科技大学 |
中国 |
6,954 |
9 |
斯坦福大学 |
美国 |
6,609 |
10 |
麻省理工学院 |
美国 |
6,314 |
11 |
东南大学 |
中国 |
6,180 |
12 |
东京大学 |
日本 |
6,058 |
13 |
华中科技大学 |
中国 |
6,048 |
14 |
伦敦大学学院 |
英国 |
5,988 |
15 |
武汉大学 |
中国 |
5,797 |
16 |
北京理工大学 |
中国 |
5,641 |
17 |
北京大学 |
中国 |
5,612 |
18 |
哈佛大学 |
美国 |
5,553 |
19 |
密西根大学 |
美国 |
5,464 |
20 |
西安交通大学 |
中国 |
5,364 |
21 |
国防科技大学 |
中国 |
5,361 |
22 |
西安电子科技大学 |
中国 |
5,277 |
23 |
新加坡国立大学 |
新加坡 |
5,269 |
24 |
西北工业大学 |
中国 |
5,261 |
25 |
多伦多大学 |
加拿大 |
5,205 |
26 |
卡内基·梅隆大学 |
美国 |
5,192 |
27 |
佐治亚理工学院 |
美国 |
5,123 |
28 |
北京邮电大学 |
中国 |
5,010 |
29 |
牛津大学 |
英国 |
4,951 |
30 |
伦敦帝国理工学院 |
英国 |
4,915 |
31 |
天津大学 |
中国 |
4,914 |
32 |
安娜大学安娜 |
印度 |
4,838 |
33 |
加州大学伯克利分校 |
美国 |
4,754 |
34 |
慕尼黑工业大学 |
德国 |
4,551 |
35 |
东北大学 |
中国 |
4,436 |
36 |
剑桥大学 |
英国 |
4,423 |
37 |
中国科学技术大学 |
中国 |
4,368 |
38 |
华盛顿大学 |
美国 |
4,359 |
39 |
伊利诺伊大学香槟分校 |
美国 |
4,282 |
40 |
华南理工大学 |
中国 |
4,239 |
41 |
加州大学洛杉矶分校 |
美国 |
4,179 |
42 |
苏黎世联邦理工学院 |
瑞士 |
4,152 |
43 |
大连理工大学 |
中国 |
4,143 |
44 |
同济大学 |
中国 |
4,112 |
45 |
加州大学圣地亚哥分校 |
美国 |
4,083 |
46 |
悉尼新南威尔士大学 |
澳大利亚 |
4,080 |
47 |
中山大学 |
中国 |
4,058 |
48 |
南加州大学 |
美国 |
4,050 |
49 |
约翰·霍普金斯大学 |
美国 |
4,014 |
50 |
悉尼大学 |
澳大利亚 |
3,860 |
另一方面,如果是按照增长速率进行排名的话,中国高校/单位近乎呈现一种霸榜的态势,在前 25 个发展最快的机构中,有 23 个来自中国,而仅有 2 个来自美国:
名次 |
研究机构 |
国家/地区 |
出版物2015 |
出版物2019 |
2015-19年变化 |
变动2015–19(%) |
1 |
中国科学院大学 |
中国 |
653 |
3,236 |
2,583 |
395.6% |
2 |
清华大学 |
中国 |
1,629 |
3,418 |
1,789 |
109.8% |
3 |
电子科技大学 |
中国 |
699 |
2,451 |
1,752 |
250.6% |
4 |
上海交通大学 |
中国 |
1,124 |
2,692 |
1,568 |
139.5% |
5 |
浙江大学 |
中国 |
1,166 |
2,644 |
1,478 |
126.8% |
6 |
东南大学 |
中国 |
711 |
2,099 |
1,388 |
195.2% |
7 |
西北工业大学 |
中国 |
500 |
1,804 |
1,304 |
260.8% |
8 |
哈尔滨工业大学 |
中国 |
1,158 |
2,340 |
1,182 |
102.1% |
9 |
北京航空航天大学 |
中国 |
1,172 |
2,339 |
1,167 |
99.6% |
10 |
北京邮电大学 |
中国 |
500 |
1,660 |
1,160 |
232.0% |
11 |
华中科技大学 |
中国 |
806 |
1,953 |
1,147 |
142.3% |
12 |
北京理工大学 |
中国 |
680 |
1,824 |
1,144 |
168.2% |
13 |
西安电子科技大学 |
中国 |
640 |
1,765 |
1,125 |
175.8% |
14 |
武汉大学 |
中国 |
709 |
1,821 |
1,112 |
156.8% |
15 |
中山大学 |
中国 |
414 |
1,513 |
1,099 |
265.5% |
16 |
天津大学 |
中国 |
568 |
1,621 |
1,053 |
185.4% |
17 |
哈佛大学 |
美国 |
710 |
1,709 |
999 |
140.7% |
18 |
北京大学 |
中国 |
785 |
1,711 |
926 |
118.0% |
19 |
国防科技大学 |
中国 |
655 |
1,578 |
923 |
140.9% |
20 |
中南大学 |
中国 |
314 |
1,219 |
905 |
288.2% |
20 |
斯坦福大学 |
美国 |
943 |
1,848 |
905 |
96.0% |
21 |
中国科学技术大学 |
中国 |
548 |
1,421 |
873 |
159.3% |
22 |
西安交通大学 |
中国 |
720 |
1,591 |
871 |
121.0% |
23 |
重庆大学 |
中国 |
369 |
1,239 |
870 |
235.8% |
24 |
深圳大学 |
中国 |
314 |
1,182 |
868 |
276.4% |
25 |
东北大学 |
中国 |
502 |
1,366 |
864 |
172.1% |
02 自然指数中的中国 AI
正如上文所说,自然指数的数据来源,是 82 本涵盖化学、物理、生命科学、地球与环境科学的高质量自然科学期刊,因此基于它所分析的 AI 现状,主要考虑 AI在这些领域中的应用情况。
首先需要强调一下它的排名计算方式。
1)count:对于一篇论文,如果作者中有一个以上来自中国,那么中国的count数就加 1(所以有两个也是加 1);不管文章有多少作者,都是如此。这也就意味着,同一篇文章可以给多个国家/地区或机构的count数做贡献。
2)share:假如每篇文章的share 数值为 1,那么每个作者将均分这个总额。例如一篇有10人合作者的论文,每个作者的share值将为 0.1,因此作者所隶属的单位或国家的share值便加 0.1。
从前面图 1 中可以看出,美国无论是在count,还是share上都远超中国;甚至 share值大于2-10名的国家之和。
自然指数还排名了前 100 强机构,前20名如下,中国仅有中国科学院入榜:
排名 |
机构 |
国家/地区 |
2015–2019 Share |
2015–2019 Count |
国际文章(%) |
1 |
哈佛大学 |
美国 |
331.08 |
937 |
57.0% |
2 |
斯坦福大学 |
美国 |
257.90 |
629 |
54.4% |
3 |
麻省理工学院(MIT) |
美国 |
209.04 |
620 |
59.4% |
4 |
马克斯·普朗克学会 |
德国 |
167.98 |
628 |
83.0% |
5 |
牛津大学 |
英国(UK) |
132.34 |
495 |
85.3% |
6 |
剑桥大学 |
英国(UK) |
130.68 |
485 |
84.9% |
7 |
中国科学院 |
中国 |
130.00 |
492 |
73.2% |
8 |
UCL |
英国(UK) |
129.70 |
415 |
77.1% |
9 |
纽约市的哥伦比亚大学(CU) |
美国 |
127.56 |
386 |
61.9% |
10 |
国立卫生研究院(NIH) |
美国 |
122.69 |
302 |
52.0% |
11 |
纽约大学(NYU) |
美国 |
117.40 |
353 |
67.4% |
12 |
华盛顿大学 |
美国 |
110.68 |
338 |
59.8% |
13 |
普林斯顿大学 |
美国 |
107.92 |
254 |
52.8% |
14 |
加州大学伯克利分校(UC Berkeley) |
美国 |
107.54 |
329 |
54.1% |
15 |
加州大学圣地亚哥分校(UC San Diego) |
美国 |
100.63 |
297 |
59.6% |
16 |
宾夕法尼亚大学 |
美国 |
98.54 |
296 |
59.8% |
17 |
约翰·霍普金斯大学(JHU) |
美国 |
85.80 |
285 |
52.3% |
18 |
耶鲁大学 |
美国 |
83.95 |
273 |
64.5% |
19 |
加州理工学院(Caltech) |
美国 |
83.59 |
205 |
57.1% |
20 |
多伦多大学 |
加拿大 |
83.27 |
290 |
84.5% |
考虑到2015年至2019年的增速,中国也仅有中国科学院和清华大学入榜:
排名 |
机构 |
国家/地区 |
2015–2019 share |
2015–2019 count |
2015-19 count变化 |
2015–19share变化(%) |
1 |
哈佛大学 |
美国 |
89.44 |
273 |
41.68 |
87.3% |
2 |
斯坦福大学 |
美国 |
76.03 |
187 |
39.94 |
110.6% |
3 |
麻省理工学院 |
美国 |
61.77 |
171 |
34.28 |
124.7% |
4 |
加州大学伯克利分校 |
美国 |
35.99 |
101 |
28.57 |
385.1% |
5 |
中国科学院 |
中国 |
40.69 |
173 |
26.69 |
190.7% |
6 |
加州大学圣地亚哥分校 |
美国 |
31.33 |
105 |
21.30 |
212.3% |
7 |
加州大学旧金山分校 |
美国 |
27.17 |
76 |
20.17 |
288.2% |
8 |
耶鲁大学 |
美国 |
28.32 |
78 |
19.41 |
218.1% |
9 |
加州大学洛杉矶分校 |
美国 |
24.19 |
90 |
18.18 |
302.8% |
10 |
马克斯·普朗克学会 |
德国 |
46.71 |
173 |
17.67 |
60.8% |
11 |
宾夕法尼亚大学 |
美国 |
30.33 |
85 |
16.72 |
122.9% |
12 |
剑桥大学 |
英国(UK) |
33.06 |
124 |
16.53 |
100.0% |
13 |
清华大学 |
中国 |
16.73 |
75 |
14.63 |
696.5% |
14 |
瑞士苏黎世联邦理工学院 |
瑞士 |
24.61 |
76 |
14.33 |
139.4% |
15 |
宾夕法尼亚州立大学 |
美国 |
16.63 |
40 |
13.72 |
471.1% |
16 |
伦敦帝国理工学院 |
英国(UK) |
18.13 |
82 |
13.67 |
306.1% |
17 |
UCL |
英国(UK) |
35.36 |
108 |
13.49 |
61.7% |
18 |
康奈尔大学 |
美国 |
20.90 |
85 |
13.23 |
172.3% |
19 |
亥姆霍兹德国研究中心协会 |
德国 |
23.37 |
113 |
12.54 |
115.8% |
20 |
杜克大学 |
美国 |
24.22 |
69 |
12.47 |
106.1% |
比较有意思的是,自然指数还进行了医疗机构的 AI 排名,前十名全部来自美国。这说明,医疗 AI 在美国很有市场。
排名 |
机构 |
国家/地区 |
2015–2019 Share |
2015–2019 Count |
国际文章(%) |
1 |
哥伦比亚大学欧文医学中心(CUIMC) |
美国 |
68.25 |
216 |
54.2% |
2 |
威斯康星大学医学 |
美国 |
49.31 |
154 |
48.1% |
3 |
杜克大学卫生系统 |
美国 |
38.32 |
115 |
46.1% |
4 |
加州大学圣地亚哥分校健康科学 |
美国 |
35.59 |
139 |
54.0% |
5 |
麻省总医院(MGH) |
美国 |
32.00 |
194 |
56.2% |
6 |
纽约大学朗格尼医学中心(NYULMC) |
美国 |
31.34 |
114 |
58.8% |
7 |
加州大学洛杉矶分校健康 |
美国 |
30.75 |
127 |
59.1% |
8 |
德克萨斯大学西南医学中心(UT Southwestern Medical Center) |
美国 |
27.97 |
62 |
48.4% |
9 |
UCSF健康 |
美国 |
27.18 |
110 |
40.0% |
10 |
斯隆·凯特琳纪念癌症中心(MSKCC) |
美国 |
26.02 |
78 |
60.3% |
03 总 结
Nature Index的排名并非是对中国 AI 的否定,而Dimensions Data的出版物数量也不能说明中国 AI 已经引领。
图 3:2015-2019年间,六个国家(中、美、印、德、英、法)在 Share 和出版物数量上的增长情况
正如许多AI报告指出,中国在论文数量上占据优势,但平均引用量却低于世界平均水平。例如《AI 指数报告》统计发现,2019 年来自中国的论文被引用量比世界平均水平低约 20%,而来自美国的论文被引用量比世界平均水平高约 40%。
“仅仅是大量的、没有持久影响的原始论文并不是真正有用的,跟上技术前沿更重要。”牛津大学人类未来研究所研究中国 AI 战略的 Jeffrey Ding 博士说。
这两种数据排名的对比告诉我们,中国在 AI 方向确实已经处于前沿地位,但我们在将 AI 应用于传统基础学科上仍有欠缺。这种欠缺,除了提示我们应当更加注重基础研究外,或许也告诉我们 的AI 专家们:在传统学科中或许可以探索更多的新天地,而非仅仅局限在 AI 的核心任务上。