因果之箭指向何方？图灵奖得主珀尔的《为什么》-集智俱乐部的财新博客-财新网

导语

大数据的许诺，让科学界偷懒地用相关性代替为了因果关联。但最终我们还是要问因果相关的问题。由图灵奖得主、计算机科学家朱迪亚·珀尔和科学作家达纳·麦肯齐合著的《为什么》一书，为这个古老的问题提供一个新的答案。

相关不是因果

这一论断尽管重要，但也逐渐变成了一种陈词滥调。股市中，我们经常能看到所谓虚假关联的例子。比如，一个太平洋岛屿部落认为跳蚤对个人健康是有益的，因为他们观察到健康的人身上有跳蚤而生病的人身上则没有。这种关联是真实而有力的，但跳蚤显然不会导致健康，它们仅仅是显示了一个人处在健康的状态。发烧个体上的跳蚤只是抛弃原宿主去寻找更健康的宿主而已。一个人不应该为了躲避疾病而主动寻找跳蚤。

之所以会出现这样的问题，在于一个观察结果：因果关系的证据似乎完全取决于相关性。但是，看到相关性，我们不能知道是否会有因果关系。比如，我们发现吸烟导致肺癌的唯一原因是，我们在特殊情况下观察到了两者之间的相关性。因此，就产生了一个难题：如果因果关系不能归结为相关性，那么相关性又如何能作为因果关系的证据呢?

由计算机科学家朱迪亚·珀尔（Judea Pearl）和科学作家达纳·麦肯齐（Dana Mackenzie）合著的《为什么》一书，旨在为这个古老的问题提供一个新的答案。从启蒙运动以来，这个问题一直以某种形式被科学家和哲学家讨论着。2011年，珀尔因“通过发展概率和因果推理对人工智能的奠基性贡献”获得了计算机科学的最高荣誉图灵奖，这本书旨在解释因果推理对普通读者意味着什么，对他近20年前出版的关于同一主题的，但更技术性的书《因果关系》进行了内容上的更新。这本新书以第一人称的形式写成，融合了理论、历史和回忆录 , 详细介绍了珀尔发展出的因果推理的技术工具，以及他整个科研经历，包括一直与主流科学机构背道而驰，很久以前，主流学界就满足于对相关性的数据处理分析，而不是对因果关系的询证。这本书在科学和社会学方面，都充满了智慧和警示作用。

当然珀尔也有一个很大的问题要去解释和思考：我们如何思考，以及我们对于人工智能的狂热与炒作。他写道：「这种以数据为中心的历史在今天仍然困扰着我们。」11年前，《连线》杂志宣布「理论的终结」，因为他们预见到，「数据洪流使科学方法过时了」。而珀尔却极力反对这种说法，他说，「我们生活在一个假定大数据是我们所有问题的解决方案的时代，但我希望通过这本书来说服你，数据是非常愚蠢的。」数据可以帮助我们很好地预测将会发生什么，事实上，计算机可以驾驶汽车，在非常复杂的策略游戏中击败人类，不管是围棋还是危险边缘（美国电视智力竞赛，涵盖面广，参赛者根据答案和线索，回答出问题）。但即使今天最先进的机器学习技术也不能解释数据，告诉我们为什么数据能预测。对于珀尔来说，我们现在缺少一个「现实模型」，而这主要取决于「因」。他与数据狂热分子争辩说，现代的计算机跟我们的大脑完全不一样。

因果推理的基本问题

我们再来思考一下以下场景。假设在汽车的颜色和每年事故率之间存在一个稳健的、统计上显著的且长期的相关性，再具体一点，假设红色车每年都比其他颜色车事故率都高，你知道了这个研究，准备去买车，你是不是应该保证安全，从而完全不考虑红色的车呢？

经过一番思索，你对这个观察到的相关性进行了因果联系上的推测。一方面，你想，红色车事故率高，可能是因为人类视觉系统在测量红色物体距离和速度方面没有其他颜色的好。这情况下，红色车可能会有更多的事故，因为其他司机往往误判速度和距离而接近红色汽车，因此产生事故。

另一方面，你又想，这种相关性可能与颜色本身的危险性没有任何关系。这红色只是其他原因的副产品。选择红色汽车的司机可能比一般司机更喜欢冒险和寻求刺激，因此涉及到的事故比例更高。而这，跟司机的驾驶能力也没有关系。买红色车的人可能比其他人更喜欢开车，一年在路上花更多的时间。在这种情况下，即使司机平均比其他司机更小心谨慎，概率上也会有更多涉及红色汽车的事故发生。

以上的例子涉及到了一个因果推理的基本问题：对于一个问题的解释非常多，我们如何在这个因果询证的过程中，找到最接近真理的那一个？

在某些情况下，最好的办法是寻找更多的相关性，不同变量之间的相关性。比如，为了检验事故率的提高是否是由于在路上的时间较长所致，我们应该控制时间。如果相关性的真正原因在于司机喜欢驾驶的不同程度，而不是颜色本身，那么当我们研究汽车颜色与每英里驾驶事故或每小时驾驶事故之间的相关性时，相关性应该消失。这种思路表明，从相关关系中推断因果关系的诀窍就是梳理出足够大的数据集，用其来寻找其他的相关性，从而排除可疑的因果关系。根据这种操作主义的思维方式，所有的答案，不知何故，都在数据中。而人们只需要找到正确显露因果铁律的方式。

用因果图解释因果关系

珀尔早在20世纪70年代就开始了在人工智能方面的工作，在整个二十世纪，对于科学界的许多人来说，因果关系的概念本身被认为是可疑的，除非它能够被翻译成纯粹的统计语言。突出的问题是，这个翻译过程如何进行。但逐渐地，珀尔发现这个过程行不通。即使是在更大的数据集中，因果关系真的不能归结为相关性。在这一过程中投入更多的计算资源，比如他自己早年的工作——贝叶斯网络，（应用托马斯贝叶斯的基本原理，根据新的证据在相互连接的数据集更新对因果联系的概率), 这样做的结果是你永远也得不到一个解决方案。简单地说，如果不先加入因果假设，你就永远不会得到因果信息。

这本书讲述了珀尔是如何认识到这一点的。在这之后，他开发了简单但强大的技术，使用他所谓的“因果图”来回答关于因果关系的问题，或者确定什么时候这些问题根本不能从数据中得到答案。对于任何有兴趣的读者来说，这本书应该是可以理解的，只需要读者在一些公式上停下来消化它们的概念与含义（尽管准确的细节即使对那些有概率论背景的人也需要付出一些努力才能理解）。值得一提的是，珀尔在宣传这本书的时候用简单易懂的方式阐述了因果假设的使用，因果假设，与其说是在充满代数的统计数据中，不如说是在直观的图片中，这种图叫“有向图”，说明可能的因果结构，箭头从假设的原因指向结果。

这种有向因果图有两个基本的部分。如果两个箭头从同一节点起始，那么我们就有了一个「共同原因事件」，它可以使本身不存在因果关系的属性之间呈现统计学上的相关性（比如鲁莽驾驶者喜欢红色这个假设中的汽车颜色和事故率之间的关系）在这种情况下，A可能导致B和C，但B和C没有因果关系。另一方面，如果两个不同的箭头进入同一个节点，那么我们就有了一个“对撞机（collider）”，这需要新的方法来考量了。在这种情况下，A和B可能共同导致C，但A和B没有因果关系。这两种结构之间的区别对因果推理有着重要的影响。正如珀尔所展示的，给定某种因果模型的一般分析方法是识别连接节点的“后门”（共同原因）和“前门”（对撞机）路径，并视情况而采取谨慎的调整。

让我们来看一些简单的例子。我们知道，红色车和某年事故率有着正相关，但我们不知道的是，这辆车如果是红色，是否会让它更危险。因此，我们开始思考各种因果假设，并用有向图表示它们：用箭头连接起来的各个节点。

在一个假设中，红色是事故率高的原因，所以我们画了一个箭头从节点“红色汽车”到节点“事故”。

在另一个假设中，某些性格特质是购买红色汽车和驾驶时长更长的原因，而驾驶更久是每年发生事故数目的原因。在这个因果图里，箭头从「性格特质」节点指向「红色汽车」节点和「更多驾驶」节点，（因此，个性特质是一个共同原因叉），还有一个箭头从「更多驾驶」指向「事故数目」。人格特质只会间接导致事故。

在这张图中，从「红色汽车」到「事故数目」仍然有一条连通的路径，这可以解释这种相关性，但这是一条后门路径：它通过一个共同的原因（个性特质）。我们可以通过控制「个性特质」（也可能是一个未知的人格特征）或“「更多驾驶」（可以测量）来检验这个假设。如果当这两者中的任何一个被控制时，相关性仍然存在，那么我们知道这种因果假设是错误的。

但是，我们如何决定首先测试哪些因果模型呢? 对珀尔来说，这些模型是由理论家根据背景信息、基于常识的推测，甚至是盲目的猜测提供的，而不是从数据中得出的。因果图的存在允许我们通过引用数据来测试假设，既可以单独测试假设，也可以相互测试假设；它不告诉我们要测试哪些假设。（珀尔坚称：“我们只有在假设了因果模型之后才收集数据，在我们陈述了我们希望回答的科学问题之后。这与传统的统计方法形成对比的是，传统统计方法甚至没有因果模型。“）有时数据可能会反驳一个理论。有时我们发现，我们手头的数据不能在一对相互竞争的因果假设之间做出决定，但我们可以获取新数据后再分析。有时我们则会发现根本没有数据可以用来区分这些假设。

虽然这种用假设的因果结构从统计数据中梳理出因果结论的方法非常简单，正如珀尔和麦肯齐（Mackenzie）给读者提供的例子那样，但是珀尔探索并提出这些方法的途径是困难和迂回的。这主要是因为，当他们开始普及这个方法时，整个统计学领域已经开始不再谈论因果关系，所以珀尔的方法需要与该领域的「常识」背道而驰。珀尔从上世纪80年代末和90年代初开始脱离主流，在本书中，他颇为自豪地讲述了自己在知识和体制方面的与主流的抗争。

这似乎是一个古老而熟悉的故事。对世界的描述，无论是科学的还是常识的，都假定了各种事物不能被立即观察到（比如法律和社会结构）。但是，评估这种理论所依据的数据必须是可观察的：这就是使它们成为数据的原因。因此，在我们相信什么（理论）和我们相信它的理由（数据）之间出现了差距。哲学家称之为「证据理论的不确定性」，这意味着数据不能完全证明理论是正确的。敏感的人会发现这种认知上的差距是不可容忍的，因此很多科学领域会一次次的试图去减少这个差距，并以某种方式将科学框定为可观察的数据结构。

这种“回归数据”的方法已经被尝试过很多次了，心理学上的行为主义和物理学上的实证主义都失败了。在统计学上，据珀尔所说，它所采取的形式是放弃了所有关于因果关系的讨论，因为正如启蒙运动哲学家大卫·休谟在17世纪所指出的那样，事件之间的因果关系本身不是立即可见的。正如休谟所说，我们可以观察到的是事物之间的连接，比如一个事情一致地跟随另一事件出现，但这连接不是因果关系。实证主义者的逻辑是不说因果关系，如珀尔所说，「你会发现，在统计教科书的索引中寻找一个关于”原因“的条目是徒劳的。」学生不能说x是y的原因，而只能说x和y是「相关的」。

但我们通常关心的是有效的干预，而有哪些办法则取决于因果结构。如果红色车事故率高的原因是红色车确实很难被有效准确地看到，那么买一辆不同颜色的车确实会更安全。如果这种相关性仅仅是由于一个共同的原因，比如买家的心理特质，那么你也可以选择你喜欢的颜色。避开那辆红色的车并不会神奇地让你成为一个更好的司机。不得不说的是，试图通过讨论相关性来压制对因果关系的讨论，这使得统计分析领域陷入了混乱。

随机对照试验还不够

客观地说，主流学界其实也不算是压制因果关系的讨论，而只是被降级到更专业的领域中去（比如实验而不是观察研究)，实验科学远远不止统计分析，而实验科学本身也专注于结论而不是原因。

事实上，有一种普遍的认识是，观察到的相关性可以被接受为因果关系的证据：采用随机对照试验（RCT）。假设我们把一大群购车者随机分成两组，实验组和对照组。然后，我们强迫实验组驾驶红色汽车，并禁止对照组这样做。由于这些组是随机形成的，因此极有可能（如果这些组足够大），它们在统计上的各个方面都是相似的。例如，每个群体中鲁莽驾驶员的比例大致相同。如果实验组的事故数量超过对照组的数量，达到了统计上的显著水平，我们就有了“金标准”的证据，即颜色本身就会导致事故。

当然，也不一定是真正的金标准，更严谨的金标准是双盲实验。在这个实验中，受试者和实验者都不知道谁在哪一组。而在汽车颜色的情境里，我们实际上要使得司机失明才能做双盲实验，然而这么做当然会大大提高事故率。所以我们别再纠结这个问题了。

随机对照试验的关键在于，通过随机方式将成员分配到这两个组，而不是让他们自行选择，我们控制其他可能的解释。当然，其实分配随机的方式也不完全是彻底随机，它们实际上由投掷骰子或随机数发生器决定。只是，这些决定方式的影响不会达到任何显著水平。

珀尔通过「Do 操作符」来识别这种情况，「Do X」表示一种干预，而不仅仅是观察x的结果。如果我睁开眼睛看着从我身边经过的车流，我就能记录下谁开着一辆红色的车，谁不开红色的车。但是，「开红色汽车」就要求一个驾驶一辆红色汽车或者驾驶不是红色的车子。这恰恰就是观察研究和随机对照实验的区别，观察研究不会进行干预。（对于熟悉统计方法的人来说，这本书中有足够多的关于微积分的技术细节和计算细节，但也可以从更纯粹的图形层次来阅读和解读。）

珀尔并不质疑随机对照实验的证据价值。但RCT 成本高、难度大，有时也不道德。吸烟导致人类癌症的最佳证据来自一项实验，该实验将一大群婴儿随机分为两组，迫使一组每天吸烟两包，另一组则阻止吸烟。但这样的实验在道德上显然是不允许的。

珀尔的主要贡献之一是对「Do calculus」的发展。他和他的学生与同事展示的是，如果一个人从某种情况的因果结构的精确图形模型开始，箭头显示某些变量可能是其他变量的原因，那么在某些情况下，一个人可以用观察替代干预。也就是说，适当的被动观测数据可以提供与RCT相同的证据，当然，前提是初始因果模型是准确的。RCT的优点是它提供了因果关系的证据，而不需要任何初始的因果假设。「Do calculus」演算的优点是，它可以提供同样强大的因果推测能力，而不需要干预。

攀上因果关系的阶梯

这本书的最后部分进入了哲学领域。珀尔描述了从仅仅观察相关性到检验因果性的转变，即从因果关系阶梯的第一级上升到第二级。

其中的区别是仅仅注意数据中的相关性和得出因果结构的结论之间的区别。但是，现在的情况变得相当复杂，因为珀尔还坚持认为，还有一个更高的因果关系阶梯：第三阶段，这涉及到反事实的推理。

如果世界在某种程度上不是原来的样子，反事实推理就会断言会发生什么。举个例子，考虑一下这个说法，「如果奥斯瓦尔德没有射杀肯尼迪，其他人也会射杀肯尼迪。」这个说法理所当然地认为奥斯瓦尔德确实射杀了肯尼迪，并声称如果他不这样做的话，事情会如何发展。我们可能没有理由认为这种反事实是真的，但很容易想象它会出现的情况。例如，如果有第二个刺客藏在草丘里，他的工作是在奥斯瓦尔德失败的情况下充当后援。

在某种意义上，反事实是关于虚构的世界或未实现的可能性，因为他们的前因与事实相反：他们是关于什么可能发生，但没发生。因此，从表面上看，它们似乎超出了正常科学研究的范围。毕竟，不可能有上帝视角来揭示可能但没有发生的事情。事实上，人们很容易认为反事实完全超出了科学的范围。正如物理学家阿瑟·佩雷斯曾经说过的那样，未完成的实验是没有结果的。那么反事实在珀尔的书里面是什么样的角色？

事实是，珀尔似乎认为反事实具有哲学意义：在他的讲述中，对反事实的考虑比对因果要求的考虑具有更高的认知层次。他认为，许多非人类动物可以进行因果思维，但也许只有人类和一些非常先进的动物可以接受反事实。提升到第三级，就像吃了知识之树的果实一样，将人类与动物王国的其他部分区别开来。他用书的最后几章来描述反事实推理，以及我们必须相信它们的理由。

但在将因果推理和反事实推理的区分开是一个错误。反事实是如此紧密地与因果关系联系在一起，以至于不可能用因果关系而不用反事实推理来思考。这一事实常常被哲学家们忽视，所以看到珀尔落入同样的陷阱也就不足为奇了。

试想一下，你拿着一盏珍贵而易碎的蒂芙尼（Tiffany）灯，地板是坚硬的石头地板。一只苍蝇在你的头附近嗡嗡叫，打扰你，而你希望嗡嗡声停止，该怎么办？你可以放开灯来拍苍蝇，但是作为一个因果推理者，你可以预见到这样做的结果：你可能会杀死苍蝇，但灯会掉到地板上并摔碎。这个结果并不好，所以你还是不能松手。但是，在接受了掉灯和它粉碎之间的因果联系之后，假设你实际上没有掉灯，那么你就会不由自主地想反事实中的“如果我当时放开灯，它现在已经粉碎。” 所以你会发现，因果思维和反事实思维其实是联系在一起的。

由于未能领会因果推理和反事实推理之间的联系，这本书后面的章节比前面的更加晦涩。珀尔讨论因果联系是有坚实基础的，但将反事实推理加到更上的一层就有些疯狂了。这和他在书的最后讨论自由意志一样，都缺乏对哲学文献的熟知。

《为什么》一书的这些方面提出了个有趣的问题，即哲学在珀尔职业生涯中有什么作用，以及在更广泛的科学中有什么作用。作为一个哲学家读这本书，我发现有很多值得欣慰的地方。珀尔阅读并欣赏关于因果关系和反事实的哲学讨论。这本书引用了大卫·休谟（David Hume），大卫·刘易斯（David Lewis），汉斯·赖欣巴哈（Hans Reichenbach ）和其他哲学家的话。与科学家通常对哲学表现出的蔑视相比，珀尔的态度简直就是一盏明灯。

这本书同样是一本警示寓言。统计学严谨的训练，让珀尔发现统计学避免谈论英国关系，从而使他逆流而上，恢复了西沃尔·赖特（Sewall Wright）在20世纪20年代关于「线性路径分析」的工作，又推动了这些想法。相比之下，我从1980年到1986年是匹兹堡大学历史和科学哲学的研究生，我可以证明，当时珀尔所争论的概念是我们赖以生存的东西。当然，科学哲学专业的学生读过他提到过所有哲学家的书，甚至更多。但除此之外，肯·沙夫纳（Ken Schaffner）在医学研究的背景下教授路径分析和西沃尔·赖特。更重要的是，克拉克·格莱摩（Clark Glymour）和他的学生彼得·斯皮尔特斯（Peter Spirtes）和理乍得·谢恩斯（ Richard Scheines）一起努力，研制出了用于测试因果关系模型的统计软件Tetrad。他们的研究成果出现在2001年出版的《因果关系、预测和搜索》（Causality: Models, Reasoning, and Inference, Cambridge University Press, 2000）一书中。

如果珀尔早点知道这项工作，他本可以节省他自己多年的时间。他在书中承认，他从彼得·斯皮尔特斯那里学到，强迫进行干预就像抹去了因果关系的箭头，（是无效的），但考虑到我自己的背景，我不禁想知道，如果珀尔接受了我作为哲学家的训练，他能走多远。物理学家理乍得·费曼（Richard Feynman）曾说过广为流传的一句话：「科学哲学对科学家的作用就像鸟类学对鸟类的作用一样。」我总是感到惊讶的是，没人指出，如果鸟类可以说话，可以向鸟类学家征求意见的话，那鸟类学确实对于鸟类有很多的作用。

隐藏的因果，天生的好奇心

《为什么》一书对因果分析的现状提供了精彩的概述。它有力地论证了提出有充分支持的因果假设既是必要的，也是困难的。困难的是，不管数据集有多大，因果结论不会仅仅从观察到的统计规律中得出。相反，我们必须利用我们所有的线索和想象力来创建合理的因果假设，然后分析这些假设，看看其是否合理以及如何通过数据来检验它们。仅仅靠堆砌更多的数字并不是获得因果洞察力的捷径。

但为什么要关注这个世界或时间的本源与原因呢？其中一个原因是纯粹的科学好奇心：我们想了解世界，而了解的一部分需要找出它隐藏的因果结构。但同样重要的是，我们不仅是世界的被动观察者：我们也有主观能动性。我们想知道如何有效地干预世界，以防止灾难和促进福祉。光有良好的意图是不够的，我们还需要深入了解自然的馈赠和其力量是如何由因果关系连接起来的。因此，如果我们要理解如何获得成功，最终必须要去理解这个世界的运转的因果。

原文地址：

翻译：Frank Xu

审校：郭瑞东

编辑：张爽

话题：