莱辛巴赫的共同因果原则(二)

有关此示例的进一步讨论,请参阅 Hitchcock (1998)。

示例 4. 炸鱼。

英国人和日本人都吃油炸过的裹面糊海鲜:英国人吃炸鱼薯条,日本人吃天妇罗。裹面糊油炸海鲜的技术似乎起源于 13 世纪伊比利亚半岛的摩尔人,当时这道菜被称为 mu’affar。它传到了西班牙和葡萄牙的犹太人和基督徒居民中。16 世纪,逃离迫害的塞法迪犹太人将食谱带到了英国,葡萄牙商人将其带到了日本。

虽然将 mu’affar 称为炸鱼薯条和天妇罗的共同原因可能是合理的,但这并不是共同原因原则的一个实例。这个例子中没有涉及任何概率,而且英国人和日本人都吃油炸海鲜,这在概率上没有明确的相关性。也许可以建立一个全球粮食分配的概率模型来提供这样的概率,但如果没有这样的模型,我们就没有 RCCP 的实例。

5.(假定的)反例

许多作者提出了共同原因原则的反例。反例涉及两个事件 A 和 B,其中

A 和 B 是概率相关的,

两个事件都不是另一个事件的原因,并且

A 和 B 之间的相关性不能用共同原因来解释,要么是因为它们没有共同原因,要么是因为它们共同的原因没有将它们彼此隔离开来。

有一种情况经常被认为违反了共同因果原则,即量子力学中的纠缠态,例如爱因斯坦-波多尔斯基-罗森 (EPR) 思想实验中发现的纠缠态。我们将在下面的第 10 节中详细讨论这种情况。本节将考虑其他几个例子。正如我们将看到的,这些例子通常会提出关于共同因果原则的适当范围和解释的问题,而不是直接驳斥该原则。

示例 5. Cartwright 的工厂。

Cartwright (1999: 108–109) 让我们想象一家工厂生产用于污水处理的化学品 C。工厂采用真正不确定的过程,因此当过程启动时,I,生产化学品的概率为 0.8。然而,每当生产化学品时,工厂也会释放污染物 P 作为副产品。因此.

8=p(C∩P|I)>p(C|I)p(P|I)=.64

C 和 P 都不会导致对方。

Glymour (1999) 反对说,这样的工厂是无处可寻的。这引发了关于共同因果原则地位的问题。如果该原则旨在成为因果关系和概率之间关系的概念性真理,那么我们可以通过表明可以清楚地构想违反该原则的因果结构来破坏该原则。另一方面,如果该原则旨在成为现实世界中因果关系和概率之间关系的经验概括,那么 Glymour 要求的不仅仅是一个假设的例子,这是正确的。

示例 6。随机飞镖。

假设使用不确定的过程将飞镖射向飞镖板,该过程可以击中板的任何部分。 (如果读者对不确定的飞镖不熟悉,可以想象光子穿过狭缝后击中闪烁屏。)假设 A 和 B 是飞镖盘的两个区域,A 完全包含在 B 内,而 B 不填满整个飞镖盘(见图 5(a))。让 A 成为飞镖落在区域 A 时对应的事件,B 也是如此。然后我们将得到:

p(A∩B)=p(A)>p(A)p(B)。

这是因为 A∩B=A 且 p(B)<1。虽然投掷飞镖(或发射飞镖的任何过程)是 A 和 B 的共同原因,但这不会屏蔽它们。如果该过程确实是不确定的,那么就没有原因可以屏蔽它们。

两个大圆圈,即飞镖盘,一个是 (a),另一个是 (b)。飞镖靶 (a) 中有两个同心圆,内侧标记为“A”,外侧标记为“B”。飞镖靶 (b) 中有两个大部分重叠的圆,左侧标记为“A”,右侧标记为“B”。

图 5:大圆代表飞镖靶。圆 A 和圆 B 是飞镖靶的区域。在 (a) 中,区域 A 完全包含在区域 B 中。在 (b) 中,区域几乎(但不完全)完全重叠。

众所周知,David Lewis 曾试图从反事实的角度分析因果关系(Lewis 1973)。他认识到,为了使他的理论取得成功,他需要将分析限制在不同事件之间的反事实关系上(参见 Lewis 1986)。例如,我们在本段开头附近输入了单词“Lewis”。如果我们没有输入字母 L-e-w,那么我们就不会输入单词“Lewis”。但是输入字母 L-e-w 并不会导致我们输入“Lewis”。输入 L-e-w 是输入“Lewis”行为的一部分。输入 L-e-w 和输入“Lewis”的事件彼此之间没有区别,因此无法建立因果关系。刘易斯对独特性的解释有些复杂,但它明确排除了逻辑蕴涵和时空包含的关系。

看来,共同因果原则要求对不同事件进行类似的限制。在我们的飞镖盘示例中,区域 A 在空间上包含在区域 B 内;因此,事件 A 和 B 不会是刘易斯意义上的不同事件。这意味着这些事件之间可能存在完全由其时空关系引起的相关性,并且没有任何明显的因果基础。

现在假设区域 A 和 B 几乎完全重叠,但都不包含在另一个内(参见图 5(b))。同样,相应的事件 A 和 B 将会相互关联,而先前的共同原因可能不会将它们屏蔽掉。(Arntzenius(1999 [2010:第 2.4 节])有一个本质上具有这种结构的例子。)似乎这种情况也是事件 A 和 B 不够不同的情况。但现在很难制定一个足够普遍的不同概念,而不会排除太多。为了看清问题,想象一下,我们有一个维恩图来表示不确定演化的系统的可能状态,而不是字面上的飞镖靶。空间区域 A 和 B 现在表示可能状态的集合,对应于事件 A 和 B 发生的状态。面积对应于概率。因此,A 发生的状态集几乎完全与 B 发生的状态集重叠,以状态概率分布来衡量。这是认为 A 和 B 不不同的理由吗?最好不要这样,因为这只是事件 A 和 B 概率相关的一般情况的表示。因此,阐明工作中不同性的精确概念仍然是一个挑战。

示例 7。守恒定律。

Salmon (1984) 和 Schurz (2017) 认为,由概率动力学和守恒定律共同控制的系统将导致违反 RCCP。假设一块重 2 公斤的砖块掉落在坚硬的尖顶表面上。砖块破裂并碎成两块,A 和 B。假设这个过程真的是偶然的。也许砖块撞击表面的精确点,或者砖块中裂缝形成的精确过程,不是由系统的早期状态决定的。让 A 成为与重量为特定量(例如 1.2 公斤)的 A 块相对应的事件,让 B 成为与重量互补量(例如 0.8 公斤)的 B 块相对应的事件。由于总质量必须为 2 千克,因此当且仅当 B 发生时,A 才会发生。由于该过程是偶然的,p(A)=p(B)=r<1。但是,

p(A∩B)=r>r2=p(A)p(B),

因此 A 和 B 是相关的。除非确定 A 和 B 会发生,否则任何早期事件都无法屏蔽这种相关性。由于该过程确实是偶然的,因此不存在这样的事件。因此违反了 RCCP。

是否存在具有这种形式的 RCCP 的实际违反取决于是否存在受概率动力学和守恒定律支配的实际过程。我们没有发现经典物理学描述的此类过程。我们确实已经在量子力学中遇到了这种组合,至少在某些解释(所谓的崩溃解释)中是这样。然而,这些情况因量子纠缠的作用而变得更加复杂。我们将在下面的第 9 和 10 节中更详细地讨论共同因果原理在量子力学中的地位。

示例 8。时间序列。

Sober (2001) 指出,威尼斯的海平面和伦敦的面包价格在过去几个世纪中都在上升。让 V 代表威尼斯海平面高于某个指定水平,让 L 代表伦敦面包价格高于给定标记。如果我们对一段时间内的威尼斯海平面和伦敦面包价格进行抽样,我们会发现 V 和 L 是相关的:在 V 达到的年份,L 往往也会达到(因为这些年份往往是较近的年份)。但是,我们没有理由认为这些现象有共同的原因。它们似乎是因果独立的。

要理解此示例中发生了什么,我们需要更仔细地研究样本统计数据与潜在概率分布之间的关系。我们经常用经典的瓮模型来思考这个问题。一个瓮里有一定比例的黑球和白球。我们从瓮中抽球,并使用抽出黑球的频率来估计瓮中黑球的比例。以这种方式使用统计频率来估计概率通常需要假设样本在概率上是独立的:抽取一个黑球不会影响下一个抽取的球是黑球的概率。索伯的例子涉及统计学家所说的时间序列。当我们在几年内对威尼斯海平面进行采样时,我们并不是从稳定的概率分布中抽取概率独立的样本。如果某一年的海平面很高,我们可以预测第二年的海平面也会同样高(它们往往不会从一年到下一年发生巨大变化)。因此,我们不能将获得的相对频率解释为潜在概率分布的估计值。因此,即使我们的样本中 V 和 L 之间存在相关性,也不可能将其解释为概率相关性,即 p(V∩L)>p(V)p(L)。统计样本中并非所有相关性都表明概率相关性。 (有关 Sober 示例的进一步讨论,另请参阅 Hoover 2003 和 Steel 2003。)

然而,这种对共同原因原则的辩护引发了担忧。许多我们想要应用共同原因原则的案例也可能表现得像时间序列。例如,考虑 Reichenbach 的巡回剧团示例(上面的示例 2)。如果男主角在某一天生病了,那么他第二天生病的可能性就更大,这是合理的预期——有些疾病会持续超过一天。如果他一次接触到某种病原体,他可能会在未来获得对该病原体的免疫力。如果我们排除所有此类示例,那么我们就有可能排除许多本应支持该原则的标准示例。

6. 分叉不对称

Reichenbach 的《时间方向》(1956 年)主要关注时间不对称现象。大部分工作都致力于热力学第二定律的状态,该定律指出,在封闭系统中,熵可以增加但永远不会减少。但 Reichenbach 也试图使用共同原因原理来定义宏观统计不对称。假设事件 A 和 B 是相关的,即 p(A∩B)>p(A)p(B)。如果存在满足上述条件 (2)-(5) 的事件 C,Reichenbach 将三重奏 ACB 称为合取分叉。如果 C 发生在 A 和 B 之前,并且没有满足 (2)-(5) 的事件发生在 A 和 B 之后,则 ACB 被称为向未来开放的合取分叉(见图 6(a))。

图表:下面的扩展描述链接

图 6:(a) 通向未来的合取叉。(b) 通向过去的合取叉。(c) 闭合叉。[图 6 的扩展描述在补充中。]

类似地,如果有满足 (2)-(5) 的后续事件,但没有更早的事件,我们就会有一个通向过去的合取叉(图 6(b))。如果早期事件 C 和后期事件 D 都满足 (2)-(5),则 ACBD 形成一个闭合叉(图 6(c))。Reichenbach 声称,在我们的世界中,有很多通向未来的叉,但很少或没有通向过去的叉。此外,他提出,从原因到结果的方向可以基于这种统计不对称。

Reichenbach 将他的叉不对称视为热力学第二定律的宏观统计类比。假设我们有一个由大量粒子组成的系统,例如气体。每个粒子可以处于许多可能的状态 s1,…,sn 之一。设 pi 为处于状态 si 的粒子的比例。则系统熵的一个表达式为 S=−∑ipilog(pi)。当粒子均匀分布在 n 个状态中时(或在系统约束条件下尽可能均匀分布),该总和将达到最大值。热力学第二定律指出,封闭系统的熵可以增加但永远不会减少;因此它将向最大熵状态发展。Reichenbach 声称,如果我们发现一个处于低熵状态的封闭系统,我们可以推断它是最近在与其余环境隔离之前以该状态准备的。

现在假设我们有两个事件 A 和 B,以及四个状态 AB、A

¯

B

¯

A

B、

¯

A

¯

B

的概率分布 p。我们可以将熵公式应用于此概率分布;保持 A 和 B 的概率不变,当 A 和 B 概率独立时,熵将最高。因此,当我们发现 A 和 B 之间存在相关性时,这就像发现一个处于低熵状态的系统,我们应该寻找 A 和 B 过去的某个事件来解释这种相关性。这只是一个形式上的类比,但莱辛巴赫试图表明,产生热力学第二定律的基本原理也会产生共同因果原理。有关更多讨论,请参阅关于时间热力学不对称的条目。

莱辛巴赫的分叉不对称受到了众多批评。 Horwich (1987) 认为,我们推断过去的互动的意愿通常与熵无关。我们可能从一堆废墟推断出一座城市遭到轰炸。一堆废墟的熵比完整的建筑物高;但正是前者,而不是后者,让我们推断出与城市发生了某种互动。

图表:下面的扩展描述链接

图 7:S 是整个状态空间。显示了 S 的三个副本,分别对应于时间 0、t 和 t′>t。如果系统在时间 0 处于状态 s,则它在时间 t 处于状态 Ut(s),在时间 t′ 处于状态 Ut′(s)。与事件 C 相对应的状态集将演变为 Ut(C) 和 Ut′(C)。 [图 7 的扩展描述在补充材料中。]

Arntzenius (1990) 指出,叉状不对称在 Reichenbach 所研究的经典统计力学背景下存在很大问题。设 S 为包含物理系统所有可能状态的状态空间(见图 7)。系统 s 在特定时间 t 的状态将涉及参数的指定,例如系统中所有粒子的位置和动量。系统以确定性方式演化,因此对于每个时间 t,如果系统在时间 0 处于状态 s,则它在时间 t 处于状态 Ut(s),其中每个 Ut 都是从 S 到自身的一对一函数。诸如 C 之类的事件对应于 S 的一个子集:C 发生的状态集。然后我们可以将 Ut(C) 定义为形式为 Ut(s) 的状态集,其中 s∈C。

然后,可以将时间 0 时 S 上的概率函数 p 扩展为通过 S 的轨迹上的概率分布,从而得出后续时间事件的概率。

假设 C 发生在时间 0,A 和 B 发生在后续时间 t。此外,假设 ACB 形成一个合取分叉。然后,我们可以将 C 中的一组微观状态向前演化到时间 t′>t。然后 D=Ut′(C) 将在 A 和 B 之后发生,但与 A 和 B 的概率关系与 C 相同(参见图 8)。因此,ACBD 将形成一个封闭的分叉。由于此配方非常通用,因此似乎每个 C 早于 A 和 B 的合取分叉 ACB 都必须属于封闭的分叉 ABCD。

图表:下面的扩展描述链接

图 8:时间 t′ 的事件 D 是将 C 从时间 0 向前演化到 t′ 的结果。它与时间 t 的事件 A 和 B 的概率关系与时间 0 的 C 的概率关系相同。[图 8 的扩展描述见附录。]

对这种担忧的自然反应是提出,较早的状态集 C 将足够连贯以形成自然事件,而较晚的状态集 D 将是一个异质集合,除了它们都演化为 C 中的状态之外,没有任何共同之处。这种异质状态集合不符合事件的条件——例如,请参阅 Lewis (1986) 对什么才算真正的事件的讨论。因此,有一个较早的事件屏蔽了 A 和 B,但没有较晚的事件这样做。然而,统计力学的框架没有给我们任何原则性的理由来认为在所有这些情况下,较早的屏蔽事件将足够连贯以成为一个适当的事件,而较晚的屏蔽者则不会。此外,Arntzenius (1990) 为使这一提议精确的一种方式提供了一个反例。

我们还将在第 7 节中看到,现代因果建模理论不使用合取分叉来确定因果关系的方向,而是使用本质上与合取分叉完全相反的概率模式。

7. 因果马尔可夫条件

Reichenbach 的共同因果原则与因果建模中常用的因果马尔可夫条件密切相关。因果马尔可夫条件的一个版本最初由 Kiiveri、Speed 和 Carlin (1984) 提出。Pearl (2009) 和 Spirtes、Glymour 和 Scheines (2000) 开发了以因果马尔可夫条件为特色的因果建模详细程序。

我们在此仅描述一种因果模型,即因果贝叶斯网络。因果贝叶斯网络使用有向无环图 (DAG) 来表示一组变量之间的因果关系,并将其与该组变量的概率分布配对。更准确地说,因果贝叶斯网络是一个三元组 (V,G,p),其中 V 是一组变量,G 是 V 上的有向无环图,p 是 V 生成的事件域上的概率分布。V 中的变量对应于某些人群中个体的属性。例如,在美国成年人口中,我们可能有代表个人教育水平、工作经验和当前收入的变量。变量可以是二进制的,表示某些属性的存在或不存在,但也可以是多值或连续的。

G 是 V 中一组有序变量对。如果 (X,Y)∈G,我们用图形表示从 X 到 Y 画一个箭头,并且我们称 X 是 Y 的父级。如果有从 X1 到 X2、X2 到 X3、… 和 Xn-1 到 Xn 的箭头,那么就有一条从 X1 到 Xn 的有向路径。在这种情况下,我们称 Xn 是 X1 的后代。如果没有任何变量到自身的有向路径,则 G 是非循环的。图 9 显示了变量集 {U,V,W,X,Y,Z} 上的 DAG。在这个 DAG 中,有一条从 U 到 Z 的有向路径,并且 Z 是 U 的后代。PA(X) 是 X 的所有父级的集合,ND(X) 是 V 中除 X 及其后代之外的所有变量的集合。在图 9 中,PA(W)={U,V} 和 ND(W)={U,V,X}。

DAG 表示来自相关人群的个体的变量集之间的定性因果结构。具体来说,从 X 到 Y 的箭头表示 X 对 Y 具有因果影响,而该影响不受集合中任何其他变量的影响。在这种情况下,我们说 X 是 Y 的直接原因。

(本章完)

相关推荐