2022年斯坦福AI指数报告中文全解读(正文篇章虫洞)

2022年斯坦福AI指数报告中文全解读(正文篇章虫洞)_第1张图片

     斯坦福大学的人工智能机构 Stanford Institute for Human-Centered Artificial Intelligence (HAI)发布的这第五版《AI指数报告》(2022)英文版一共230页。为了方便阅读,我将他翻译成中文记录下来,本文仅摘取重要且有趣的部分,且有部分自己的阅读感受和见解,需要阅读原文的请至2022年斯坦福AI指数报告-深度学习文档类资源-CSDN下载。

    人工智能指数报告跟踪、整理、提炼和可视化与人工智能相关的数据。这份报告的使命是为政策制定者、研究人员、企业高管、媒体记者提供公正、经过严格审查的全球数据,使得公众对复杂的人工智能领域有更透彻、更细致入微的理解。它旨在成为世界上最可信、最权威的人工智能数据和见解来源。

以下是各篇章虫洞和概要:

2022年斯坦福AI指数报告中文全解读(全文亮点篇)_Mango_Holi的博客-CSDN博客

第一章. 人工智能的研究和发展

  • 尽管地缘政治紧张局势加剧,但自2010年至2021年的11年间,中美合作的跨国人工智能出版物最多,且自 2010 年以来增加了五倍。中美合作的出版物数量是该项排名第二的中英合作出版物数量的 2.7 倍。
  • 2021年,中国在人工智能期刊、会议和知识库的出版物贡献数量方面继续领先世界——所有三种出版物类型的总和比美国高 63.2%。同时,美国在人工智能会议和知识库的引用数量上在主要人工智能强国中占据主导地位。这可以理解为中国出版了很多研究结果,但并不能在研究领域形成主要影响力,毕竟这是靠能力而非靠数量取胜的环节。
  • 从 2010 年到 2021 年的11年间,教育机构和非营利组织之间的合作产生了最多的人工智能出版物数量,其次是私营公司和教育机构之间的合作、教育机构和政府机构之间的合作。
  • 2021年AI专利申请量是2015年的30多倍,复合型年增长率为76.9%。

第二章. 人工智能模型性能

  • 数据,数据,数据:基于实验室基准条件的模型技术结果则越来越依赖于使用更多的训练数据来获得更先进的结果。换言之,模型本身的设计好坏往往差别不大,而更多的训练数据能带来更好的实验效果。截至 2021 年,斯坦福大学AI指标报告中的 10 个基准测试中有 9 个最先进的 AI 系统经过了更多的训练。这种趋势隐隐指引着私营参与者倾向去寻找大量的数据集。
  • 对特定计算机视觉子任务的兴趣日益浓厚:2021 年,研究界在一些具体的计算机视觉子任务上有着更高的兴趣水平,例如医学图像分割和蒙面人脸识别(我的导师张百灵教授在2015年左右就在研究这几个领域的具体任务,我想现在研究界只是有更多来自工程学院和生物学院的教授关心这类识别为他们在特定领域研究带来的创新成果,仅此而已)。例如,2020年前只有 3 篇研究论文针对 Kvasir-SEG 医学成像测试了系统基准。2021 年,有 25 篇研究论文。这种增长表明人工智能研究是在转向更直接、更实际应用的研究。
  • AI 尚未掌握复杂的语言任务:AI 在基本阅读技术基准的性能上已经超过了人类的水平,SuperGLUE 和 SQuAD 等阅读理解基准表现提高了 1%–5%。虽然人工智能系统仍然无法在更复杂的语言任务上达到可媲美人类的表现,例如溯因自然语言推理(aNLI),但差异正在缩小。2019年,人类的表现仅领先 9个百分点(aNLI)。截至 2021 年,这一差距已缩小到  1%。
  • 转向更通用的强化学习:在过去十年中,人工智能系统已经能够掌握一定限制条件下的强化学习任务。这要求系统最大限度地提高某项特定技能的表现,例如国际象棋。顶级国际象棋软件引擎现在比 Magnus Carlsen 的最高 ELO 分数高出 24%。然而,在过去两年,人工智能系统在新环境、更通用的强化学习任务上也提高了129%(Procgen) 。这一趋势预示着人工智能系统未来的发展可以学习更广泛地思考能力。
  • 人工智能变得更实惠、性能更高:自 2018 年以来,训练图像分类系统的成本降低了 63.6%,而训练次数提高了 94.4%。其他 任务也出现训练成本降低、但训练时间加快的趋势:推荐系统,物体检测和语言处理,并有利于更广泛的人工智能商业应用。
  • 机械臂正在变得更便宜:一项人工智能指数调查显示,机械臂的中位数价格在过去六年中下降了 4 倍——从2016 年每只手臂 50,000 美元下降到 2021 年的 12,845 美元。关于机器人的研究变得更容易获得,且负担得起。

第三章. 人工智能伦理道德

  • 大型语言模型在技术基准上创造了新记录,但新数据显示更大的模型也更容易从训练数据中产生偏差(bias)。 2021年开发的2800亿参数模型与2018年最先进的 1.17 亿个参数的模型相比,其诱发偏差增加了 29%。随着时间的推移,这些系统的能力一定能够显着增强,同时也会带来模型产生训练偏差的严重后果。因此认为这类语言模型还有待研究。
  • 人工智能伦理的兴起变得无处不在:自 2014 年以来,关于人工智能公平性和透明度的研究呈爆炸式增长。在人工智能伦理相关的会议上,相关出版物增加了五倍有余。算法的公平和偏见已经从单纯的学术追求转变为成为具有广泛影响的社会主流研究课题。工业界研究人员近年来在以伦理为重点的会议上贡献的出版物同比增加了 71%。
  • 多模态模型学习多模态偏差:在训练多模态语言视觉模型方面取得了快速进展,这些模型在联合语言视觉任务上表现出新的能力水平。这些模型创下了有关图像分类和从文本描述创建图像等任务的新记录,但它们也反映出社会刻板印象和偏见——对CLIP的实验表明,黑人的图像被错误分类为非人类的比率是任何其他种族的两倍多。虽然研究者已经开发了许多衡量计算机视觉和自然语言处理系统偏见的指标,这依然强调了对洞察多模态模型偏差的指标需求。

第四章. 人工智能市场经济和教育

  • 2016 年至 2021 年的5年间,新西兰、香港、爱尔兰、卢森堡和瑞典是人工智能方向人才招聘增长最快的国家或地区。
  • 2021 年,加利福尼亚、德克萨斯、纽约和弗吉尼亚是美国人工智能职位发布数量最多的地区,加利福尼亚的职位发布数量是位居第二的德克萨斯的 2.35 倍以上。与职位发布的总数相比,华盛顿特区的 AI 职位占比最高。
  • 2021 年人工智能领域的私人投资总额约为 935 亿美元,是2020 年私人投资总额的两倍多。新获投资的 AI 公司数量持续下降,从2019 年的 1051 家公司、 2020 年的 762 家公司(同比下降27%)、到 2021 年的 746 家公司(同比下降2%)。2020 年一共有 4 项融资的价值超过5亿美元;2021年有15个(同比增加275%)。
  • “数据管理、处理和云”在 2021 年获得了AI方向最大规模的私人投资,是2020年投资额的2.6倍,其次是“医疗保健”和“金融科技”。
  • 2021 年,美国在人工智能领域的【私人投资总额】和【新资助的企业数量】均领先世界,分别比排名第二的中国高出三倍和两倍。
  • 据麦肯锡称,关于在工业中使用人工智能产生的相关伦理问题的讨论仍然有限。29% 和 41% 的受访者认为“公平与公正”和“可解释性”是AI应用的风险,仅 19% 和 27% 的人正在采取措施降低这些风险。
  • 2020 年,每 5 名获得博士学位的计算机科学系学生中就有 1 名是研究人工智能专业/机器学习专业,这使得人工智能相关专业成为了近十年来最受欢迎的专业。从 2010 年到 2020 年,大多数 AI 美国博士投入了工业,而很小一部分人则从事政府工作。

第五章. 人工智能政策和政府导向

  • 对 25 个国家人工智能立法记录的指数分析表明,包含“人工智能”的提议被通过而成为法律法条的情况,从 2016 年的 1 个增加到 了2021 年的 18 个。西班牙、英国和美国在 2021 年通过的与人工智能相关的法案数量最多,这些国家都通过了三项。
  • 美国的联邦立法记录显示2015 年到 2021 年拟议与人工智能相关法案的总数急剧增加,而通过的法案数量仍然很低,最终只有 2%的法案成为法律。
  • 2021 年,美国的州立法者在每 50 项包含 AI 条款的拟议法案中就会有 1 项通过,而此类提案的数量从 2012 年的 2 个增加到 了2021 年的 131 个。
  • 在美国,第 117 届(本届)国会会议有望创下自 2001 年以来最多与人工智能相关的提及。到 2021 年底会议进行到一半已有 295 次提及相关话题,与上一届(第 116 届)国会会议整体提到了 506次相比。

你可能感兴趣的:(人工智能)