受访者 | 张坤
记者 | 夕颜
出品 | CSDN(ID:CSDNnews)
自从 AI 搭乘 AlphaGo 出道以来,关于感知智能需要向认知智能进化的讨论被提上日程,因为虽然 AlphaGo 战胜了李世石,但是为什么 AI 会赢,其中的因果关系没人知道。认知智能的理想发展路线,是从认知心理学、脑科学及人类社会历史中学习,并结合领域知识图谱、因果推理、持续学习等技术,建立稳定获取和表达知识的有效机制,让知识能够被机器理解和运用,让 AI 能够回答为什么的问题,实现从感知智能到认知智能的关键突破。
这其中的关键方法,就有我们今天要讨论的主题——因果关系。
什么是因果关系?
18 世纪,苏格兰不可知论哲学家大卫·休谟提出“因果关系是人类的错觉”(即人们所谓的因果,实质上是对“相关关系”的归纳推理,而相关性无法保证因果性),用怀疑论毁掉了因果律,否认了理性分析的作用,引发哲学危机。从此,科学家就未停下过对因果关系的争论。
爱丁堡的大卫·休谟雕像
那么,什么是因果关系?因果关系有多重要?
从定义上来说,人们对因果关系最常见的误解,是会将其与相关关系混淆。《爱上统计学》一书举例说明了两者之间的区别:在美国中西部的一个小镇,地方警察局局长发现冰淇淋消费量越多,犯罪率就越高。这个例子中,冰淇淋消费量和犯罪率是正相关的,但并不意味着冰淇凌消费的增多导致了犯罪率的上升,更不可能通过减少冰淇凌的销售来降低犯罪率。
事实上,存在某个变量同时和冰淇淋消费量、犯罪率相关,这个变量就是室外温度。当室外气温变暖,如在夏天,就会有更多犯罪(白天更长,人们多开窗口等)。而因为天气变暖,人们更享受吃冰淇凌的乐趣。相对地,在又长又黑暗的寒冬,冰淇凌的消费就减少,同时犯罪也越少。
这里,冰淇淋消费量与犯罪率只是相关关系,虽然表面上存在着一定程度上的诡异关系,但是却非因果关系。
因果关系的抽象定义是这样的——如果保持系统中其他变量都不变,只改变其中的一个变量(比如通过人工降雨来下雨),然后发现有另一个变量也随之改变(比如我们发现地上由干变湿了),那么我们就说前面一个变量(是否下雨)是后一个变量(地上是否湿)的一个原因。一个典型的因果模型可以通过直观的图模型来描述,或者通过从因到果的数学函数来刻画。
此后数百年来,自然科学和社会科学中有很多科学家在尝试针对因果关系的检测方法,比如2002 年,加州大学伯克利分校教授亨利·布雷迪撰文整理了因果推断的各种经典理论,并根据不同假设,将其分为新休谟理论、反事实理论、操控实验理论、机制理论 4 大类,而从计算视角,近年来还兴起了基于统计独立性、分布变化性、因果过程复杂度和“压缩感知”的新方法。新的方法不断出现,但万变不离其宗,并且与哲学的紧密关系不减反增,其中包括卡内基梅隆大学哲学系(并在机器学习系兼职)副教授张坤在做的事。
一个用因果思维做机器学习的科研人
在张坤看来,哲学与机器学习看似两个毫不相关的领域,但其实有着很多交集,他本人就是一个跨越两个学科的科研人。在卡内基梅隆大学,张坤是哲学系教授,同时指导机器学习系博士生,并且是德国马克思普朗克智能系统研究所高级研究员。他的主要研究方向是机器学习和人工智能,特别专注于因果发现和因果机器学习的研究。在机器学习顶级会议和期刊上,他的团队每年展示十余篇论文, 他并担任 NeurIPS、ICML、UAI 等多个顶级会议的领域主席。
为什么说两个学科之间有交集?张坤的团队希望有更好的认识论和更恰当的方式来定义和解决实际问题。哲学思维方式能让他们更在意问题如何定义以及问题本身意义何在,而机器学习的背景和思维方式让他们脚踏实地从数据出发发现新的信息并进而更新其传统认识。张坤认为,哲学与机器学习两者之间类似于思和学的关系——学而不思则罔,思而不学则殆。
张坤在中国科学技术大学读完本科,在香港中文大学计算机系获得博士学位。在读博期间,他对如何从机器学习的角度看因果关系产生了很大兴趣,于是便从机器学习领域中逐渐缩小关注范围。最终将主要研究领域聚焦于因果发现和因果思维方式的机器学习,虽然当时在机器学习领域几乎还没什么人关注因果性。
在读博期间,张坤第一次接触到机器学习相关的研究课题,当时的目的是做更好的独立成分分析的方法。做那个课题的过程中,他深刻地感觉到,做研究要么着眼于重要的待解决问题而不受领域的限制,要么着眼于重要的还未被公认完善的方法而不被应用限制。如果两者都不是,可能需要想一想自己的研究到底要做什么样的贡献。
因果关系,就是一个重要的待解决的问题,也是具有重要意义的还未有完善方法的方向。在 CMU,张坤的主要研究方向就是在各种场景下如何找出真正的因果关系,以及如果解决一系列具有数据异质性的机器学习问题。他所在的小组在这两个方向并驾齐驱,这几年在研究上取得了一系列进展,比如他们可以从观测数据中自动找出背后有相互因果关系的隐变量。在他看来,这是一次不小的进步。
在在此之前,张坤有不少因果关系相关的研究成果出来,其中最为重要的成果包括他提出的自动因果关系发现方法以及用因果的思维方式解决迁移学习等问题。总体来说,前者将就是通过机器学习的方式,分析各种各样的观测数据,以找到背后的因果关系。张坤说到,在一些假设条件下,因果关系发现其实就是机器学习问题,问题是我们需要合适的或者很弱的假设,这是因果关系和数据之间的桥梁。上世纪 90 年代初,该方向的研究曾获得很大进展,因果发现问题得到部分的解决。而在过去十几年间,机器学习的思维方式的介入更是促进了因果关系突飞猛进的变化。而用因果的思维方式解决迁移学习问题,可以帮助我们判断系统的那些信息可被迁移,以及如何迁移。
张坤介绍到,近年来,因果发现有了不少新的理论和算法,大致是围绕如何利用异构数据以及如何自动构建隐藏的因果变量,而张坤团队最近的自动构建隐变量及其之间因果关系的方法,已经被应用到一系列心理学问题上。用他的话说,“得到了全新且有意义的结果,直接帮助他们重构、理解和干预心理上事实存在的各个维度。”张坤还提到,在这类问题上,华南工业大学的蔡瑞初老师团队也做出了令人兴奋的结果。
因果关系落地难点
具体来说,因果关系下大概分两个研究领域,其一是因果发现,它可以回答“为什么”的问题;其二是有了定性因果关系后,如何确定一个变量对另一个变量的因果影响,比如,它可以帮我们确定不同治疗方式对 COVID-19 的疗效。张坤认为,因果关系的研究领域现在还应该再增加一个,就是因果智能机器学习,它可以帮我们实现更鲁棒、更具适应性、更通用的机器学习系统。
关于因果关系的基础研究范围在不断拓扎和完善,大家关心的更多的还有其在实际场景中落地有哪些进展与难度。
张坤提到,因果关系在实际场景落地的最大困难,是需要掌握和使用要解决问题的特定性质,以及熟悉哪些问题一定需要用因果的思维方式才能解决,如此才能精确、高效的找到背后的因果关系并加以适当应用。“举例来说,现实中我们测量出来的变量往往有很大噪声,甚至并不是我们真正想找的变量,系统有观测噪声这样的信息都可以帮助我们大大降低搜索空间,从而提高搜索效率并改善最终结果,”张坤表示。
因果关系研究并不完善,亟待更多人才
实际上,张坤告诉 CSDN,因果关系相关的基础研究并不完善,因为这还是一个较新的领域,很多实际问题还未得到好的解决,甚至还没有被很好地刻画出来。他认为,用非参数的方式自动构建因果隐变量会是很未来重要的方向,无论是对于单纯的因果研究领域还是机器学习领域。
Judea Pearl
有着巨大挖掘和进步空间的因果关系领域,还需要更多人才的加入。对于那些对因果关系研究感兴趣的同学,张坤推荐了一些入门书籍和资料,包括 Judea Pearl 的 Causality: Models, Reasoning, and Inference,Peter Spirtes, Clark Glymour and Richard Scheines 的 Causation,Prediction,and Search,前者注重在概念和因果影响辨识问题(假设定性的因果影响已知),后者着眼于如何从数据发现因果关系。
此外,张坤提到 Clark Glymour 和他本人正在写一本关于因果发现的书,目前还未完工,希望完成之后能为大家提供比较及时、系统的因果发现以及如何使用因果关系的素材,大家可以关注一下。
另外一个问题大家可能也会关心——学习因果关系方向需要掌握扎实的数理知识基础吗?对学生入门学习,专家有哪些建议?
对此,张坤表示入门因果关系确实需要扎实的数理知识基础,他的建议就是别怕那些概念——毕竟因果关系不仅仅是对观测数据的现象描述,它需要一个新的描述体系。把那些概念吃透,变成自己思维方式的一部分。同时多考虑一些看起来宽泛的问题,比如人为什么在意因果关系以及人如何学习因果关系。在不同阶段,我们对这类问题的回答会有不同,更好的答案会直接催生更好的学习方法,而对更好的回答的追求也会给我们源源不断的动力。
【END】
更多精彩推荐
NB-IoT 连接数过亿,开发者如何抓住新机遇?
华为云跻身Gartner报告中国三强,预示云计算市场的未来变局?
☞数据库激荡40年,深入解析PostgreSQL、NewSQL演进历程
☞黑客用上机器学习你慌不慌?这 7 种窃取数据的新手段快来认识一下!
☞超详细!一文告诉你 SparkStreaming 如何整合 Kafka !附代码可实践
☞Libra的Move语言初探,10行代码实现你第一个智能合约
你点的每个“在看”,我都认真当成了喜欢