[yzhpdh多读paper] The evolution of citation graphs in artificial intelligence research

Abstract

发问:AI研究与社会和社会趋势研究是否并驾齐驱? ->明显否

方法:

使用微软学术图去研究1950~当前(2019差不多)AI研究的书目计量演变以及与其相关的领域

证据表明,人工智能研究人员越来越倾向于在特定主题的会议上发表论文,而不是在学术期刊上发表论文,以及行业研究的日益增多,这对外部研究人员构成了挑战,因为社会科学家的参考文献中特别缺乏此类研究。

  • AI研究相关的paper ->会议
  • 其他领域研究相关的paper->期刊

AI发展历程

  • 早期AI ->受其他领域启发而发展
  • 当代AI->专注于工程应用,这可能是由于技术产业发挥中心作用导致的,且在AI领域最中心的研究组织更多集中于工业而非学术

文章的数据来源:

使用MAG(Microsoft Academic Graph),根据文章的引用查找到1950-2018期间发表的CS相关子领域

数据用途:

研究论文的生产和参考不同学术领域的行为,如计算机科学已经上升到第四大最多产的学术领域,人工智能是近几十年来计算机科学最突出的子领域。

工作内容:

使用1950年至2018年每十年发表的所有CS论文构建了一个引文网络。如果它们与人工智能(它本身是一个CS子领域)密切相关,那么认为一个CS子领域代表人工智能研究。在长时间分析过程后,AI研究包括计算机视觉、机器学习和模式识别。

有趣的发现:

自然语言处理被认为是一个特定的问题领域,它与20世纪80年代中期以前的人工智能研究密切相关,在这之后自然语言处理与基于文本的数据的信息检索和数据挖掘更加密切相关

局限性:在CS和AI相关领域的更具体的研究领域中可能是有限的。

研究获得的图表结果表明数据科学在相关的论文生产中逐渐式微,理论CS被实时和分布式计算所取代。然而,人工智能相关研究领域的论文稳步增长,从1950年的产出到今天,其产出在CS中占最大份额。

我们通过在每个学术领域发表的论文的参考关系来研究各种学术领域与人工智能研究之间的关系。外部领域参考人工智能研究的原因有很多。一些领域,如工程或医学,参考人工智能研究,因为他们使用人工智能方法用于优化或数据分析。其他领域,如哲学,参考人工智能研究,因为它们探索人工智能对社会的影响(例如,道德和/或伦理影响)。类似地,人工智能研究人员参考了其他领域,如数学或心理学,因为人工智能研究结合了这些领域的方法和模型。人工智能研究人员可能还会引用其他领域的原因是他们将它们作为应用领域来测试人工智能技术。

文章中提到了一个公式计算A到B的参考强度:强度(A,B)>1的参考强度表示,鉴于B领域发表的论文数量,从A领域到B领域的参考率高于随机参考行为的预期。参考份额和参考强度都反映了研究领域之间的总体参考行为,但这些计算可能会混淆更大学术领域内的子社区的其他动态。

在1980年之前,AI研究参考了较多心理学方面的内容,但是在1987年之后AI转向更强依赖于数学和CS,表明对计算研究产生上升性关注

CS领域在其一整个分析阶段正在缓慢提升对AI的引用,数学仅在1980年之后提升对AI的引用。

从整体来看,其他领域对AI的引用是减少的,表明AI领域近十几年的论文产出使得其他领域很紧跟其步伐

AI研究的巩固

发问:前沿研究机构如何塑造AI研究?

||

  \ /

对应解释:一方面,学术性大学的名望可以促进CS出版的科学效应,另一方面,尽管科学研究经常在大学进行,工业研究机构也出现了AI方面的进展

作者的调查方法:

  •         检查AI产出的分布
  •         通过研究机构引用AI文章的分布

一些发现:

从1980年以来,AI文章的产出、作者、对AI文章的引用减少了30%,而对于其他领域恰恰相反,它们都呈现一种多样性上升的情况。这种减少表明研究中心可能在形成,当preferential attachment(偏好连接)很好地模拟了机构之间的参照时,就会出现这种层次结构。根据证据表明偏好参考现在可能在AI研究机构中发生了

作者又通过计算PageRank来调查AI发表实践是如何使得偏好参考发生的,其中有更大PageRank的publications venues(出版地),其中IEEE除了在模式分析和机器智能方面外,成为AI研究发表最集中的地方

作者再发问:谁在AI社会享受特权?

作者计算了各机构发表的人工智能论文参考文献的引用PageRank

  • 1990年之前,最突出的研究机构都是学术性的,包括马萨诸塞州科技研究机构、斯坦福大学和卡内基梅隆理工学院,而只包括了一些基于行业的研究所,比如贝尔实验室和IBM等机构。然而,20世纪80年代末,尽管大学主导着所有学术领域的科学进步,但包括谷歌和微软在内的行业组织,在现代人工智能研究和PageRank中越来越重要,学术机构的分数正在下降。中国人的人工智能研究前沿的研究机构没有出现,因为它们的显著性是最近几年才出现的。我们分析的65年时间跨度。然而关注近年来,越来越多的中国研究机构以及其他非美国机构的重要性显而易见。
  • 尽管学术界仍然是AI文章的最大来源,从AI文章的作者可以看出工业界的出现,10年来,只有工业界作者的论文相对数量呈下降趋势,学术和工业界的合作变得更加丰富。
  • 作者提出IPS的概念,其>1代表[工业界AI文章更强烈的偏好/AI领域的随机参考]的比值。如材料科学、工程学、物理化学对工业界AI文章更偏爱,而社会学、经济学、哲学、政治科学则只有较低偏好

Discussion

  1. 人类对人工智能的长期需求正在视觉、语音和模式识别等领域迅速发展。然而,在我们部署人工智能系统时,除了能力和生产率的提高之外,它们的全面影响还包括其社会、伦理和社会影响。理解这些影响需要开发新人工智能技术的研究人员与研究社会和社会动态的研究人员之间持续对话。
  2. 因此,因此,在人工智能研究和其他领域的研究之间寻找差距是令人担忧的.
  3. 在总量上观察到的人工智能文章参考强度的下降表明,大多数研究人员无法跟上人工智能文章产出的爆炸式增长。这些发现可能有助于解释为什么最近的人工智能技术只是在最近才揭示了重要的(基本上是无意的)社会后果,比如面部识别软件中的种族偏见以及自动驾驶汽车所带来的道德困境以及18-20岁年龄段的收入不平等。如果当前的趋势持续下去,那么任何学术领域的研究人员都可能越来越难以跟上尖端人工智能技术
  4. 人工智能与其他科学之间的文献计量差距随着人工智能相关会议的到来以及工业在人工智能研究中的日益突出而不断扩大。一般来说,计算机科学会议能够体现出论文的重要性,并使主要参与者不成比例地影响整个研究领域。虽然从总体上来说CS变得更加多样化,但人工智能研究机构的科学影响却变得不那么多样化,微软和谷歌已经夺走了大学的中心角色,可能是通过在AI中优先引用出版物。

Conclusion

研究者们与政策制定者们可能忽视新型AI系统的社会、伦理和社会影响问题。

展望:

尽管这一差距令人担忧,从监管角度来看,这也为研究人员提供了一个机会。通常为决策者提供信息的学术领域在社会问题上有机会填补这一空白。

进一步的工作:

可能会明确量化当今人工智能技术的社会和社会效益和后果,并确定限制研究领域之间交流的机制。

你可能感兴趣的:(人工智能)