莱辛巴赫的共同因果原则(一)
1. 简介
2. 莱辛巴赫的共同因果原则
3. 历史背景
4. 例证
5. (假定的)反例
6. 分叉不对称
7. 因果马尔可夫条件
8. 与评估 RCCP 状态相关的共同因果技术结果
9. 量子场论和共同因果原则
10. EPR 相关性和 RCCP
11. 进一步阅读
参考书目
学术工具
其他互联网资源
相关条目
1. 简介
共同因果原则 (RCCP) 由汉斯·莱辛巴赫 (Hans Reichenbach) 在 1956 年死后出版的《时间的方向》中提出。该原则假定因果结构与事件之间的概率相关性之间存在联系。在第 2 节中介绍该原则后,我们将在第 3 节中提供一些历史背景。以下两节介绍了 RCCP 的一些例证和所谓的反例。第 6 节讨论了 Reichenbach 的分叉不对称性,这是他与 RCCP 相关的宏观统计模式中的(假定的)时间不对称。第 7 节介绍了因果马尔可夫条件,它在因果建模方法中起着核心作用。因果马尔可夫条件通常被视为 RCCP 的现代继承者,我们将研究它与 RCCP 的关系。第 8 节将在适合检查 RCCP 在量子力学中的地位的正式环境中开发 RCCP。第 9 节和第 10 节将考虑 RCCP 是否与量子物理兼容。
2. Reichenbach 的共同因果原则
让 A 和 B 成为事件。一场风暴、一个人生病、一个足球运动员进球以及产生特定结果的科学测量都是事件的例子。假设我们可以有意义地为这些事件的发生分配概率。赖兴巴赫本人发展了一种复杂的概率频率解释(赖兴巴赫 1949),但我们仅假设某种客观概率可以有意义地应用。假设事件 A 和 B 在概率上呈正相关:
p(A∩B)>p(A)p(B)。
也就是说,A 和 B 同时发生的概率大于各个概率的乘积。赖兴巴赫的共同因果原则认为,当 A 和 B 之间存在这种概率相关性时,这是因为存在以下因果关系之一:A 是 B 的原因;B 是 A 的原因;或者 A 和 B 都是由第三个因素 C 引起的。在最后一种情况下,共同原因 C 发生在 A 和 B 之前,并且必须满足以下四个独立条件:
p(A∩B|C) =p(A|C)p(B|C)
p(A∩B|
¯
C
) =p(A|
¯
C
)p(B|
¯
C
)
p(A|C) >p(A|
¯
C
)
p(B|C) >p(B|
¯
C
)
其中
p(X|Y)≐
p(X∩Y)
p(Y)
表示在条件 Y 下 X 的条件概率,
¯
C
表示事件 C 的缺失(C 发生的命题的否定),并且假设 C 和
¯
C
的概率均为零。行 (2) 表示,在给定 C 的情况下,A 和 B 是条件独立的。用 Reichenbach 的术语来说,C 将 A 与 B 隔离开来。行 (3) 表示
¯
C
也将 A 与 B 隔离开来。行 (4) 和 (5) 表示,在 C 条件下,A 和 B 发生的概率大于在没有 C 的情况下。这些不等式是 C 是 A 和 B 的原因的自然结果。总之,条件 (2) 至 (5) 在数学上蕴含 (1)。因此,可以理解共同原因解释了 (1) 中的相关性。行 (1) 至 (3) 中描述的概率关系展示了辛普森悖论的一个版本。有关此概率现象的更多信息,请参阅辛普森悖论条目。
以图表形式表示这种共同原因结构通常会很有帮助,如图 1 所示。箭头表示因果关系,垂直维度表示时间(较晚的时间出现在较高位置)。
左边是单词“时间”,箭头向上;右边是字母 C,箭头从字母 C 向上向左指向字母 A,另一个箭头从 C 向上向右指向字母 B
图 1:一个共同的原因结构。C 发生的时间早于 A 和 B,C 是 A 和 B 的原因。
RCCP 表示概率相关性最终源于因果关系。也就是说,如果 p(A∩B)>p(A)p(B),那要么是因为其中一个事件导致了另一个事件,要么不等式可以从其他不等式 p(A|C)>p(A|
¯
C
) 和 p(B|C)>p(B|
¯
C
) 中得出,其中 C 是 A 和 B 的原因。该原则很重要,因为它假定因果结构和概率相关性之间存在联系,从而允许从经验可观察到的相关性推断因果关系。
如上所述,RCCP 假设共同原因只有两种可能的状态:C 和
¯
C
。也就是说,C 是一个存在或不存在的二元事件。RCCP 的自然扩展是允许共同原因是具有许多可能值 z1,…,zn 的随机变量 Z。在这种情况下,我们预计 Z=zi 会在 i=1,…,n 时将 A 与 B 隔离开来。但是,这并不意味着我们可以将 Z 的值分成两个集合 S 和 S′,使得 Z∈S(对应于 C)和 Z∈S′(对应于
¯
C
)各自屏蔽 A 和 B。更一般地,我们不会期望 Z 的粗化会产生屏蔽 A 和 B 的事件。
这种概括的一个推论是,如果 A 和 B 有两个不同的二元共同原因 C 和 D,我们会期望 CD、C
¯
D
、
¯
C
D、
¯
CD
中的每一个屏蔽 A 和 B,但不会期望 C 和 D 屏蔽 A 和 B。例如,即使我们以共同原因 C 为条件,我们也会期望 A 和 B 是相关的,因为还有另一个共同原因 D。
我们可以进一步概括,允许相关效应是随机变量而不是二元事件。RCCP 的完全通用版本如下:
假设 X 和 Y 是相关的随机变量;即,存在 xi 和 yj 值,使得
p(X=xi∩Y=yj)≠p(X=xi)p(Y=yj)。
然后存在一组变量 Z1,…,Zm,使得每个变量都是 X 和 Y 的原因,并且
p(X=xi∩Y=yj| Z1=zk1,…,Zm=zkm)=
p(X=xi|Z1=zk1,…,Zm=zkm)
×p(Y=yj|Z1=zk1,…,Zm=zkm)
对于所有 i,j,k1,…,km
通过这种 RCCP 的推广,为条件 4 和 5 制定类似物变得更加棘手,这些类似物以概率形式捕捉到每个变量 Zk 都是 X 和 Y 的原因这一想法。此外,这组条件并不严格意味着 X 和 Y 在概率上相关。我们将在第 7 节中回顾这些问题。
3. 历史背景
《时间的方向》(Reichenbach 1956)在 Reichenbach 于 1953 年去世时尚未完成。手稿由他的妻子 Maria Reichenbach 编辑,并于 1956 年在他死后出版。这本书关注的是时间不对称现象——我们将其与过去和未来的区别联系起来的现象。它包括关于时间在古典物理学、热力学、统计力学和量子力学中的作用的主要章节。它还包括一个关于宏观统计学中时间不对称的部分。Reichenbach 计划在最后一节中加入关于时间的主观体验。
这本书做出了许多重要而独创的贡献。它包含对统计力学哲学基础的详细研究,特别是研究了热力学第二定律的地位,该定律指出封闭系统的熵可以增加,但永远不会减少。赖兴巴赫探索了统计力学与信息论这一新领域之间的联系——香农和韦弗关于该主题的经典著作 (1949) 几年前才出版。除了热力学第二定律描述的熵增加不对称性之外,这本书还研究了其他时间不对称现象。其中之一就是记录的不对称性:我们有过去事件的详细记录,包括人类记忆和人造文件,如记录和历史书籍,也包括自然现象,如化石、树木年轮和地质层。这些记录为我们提供了有关过去的丰富信息来源。我们没有关于未来的类似信息来源,尽管我们可以可靠地预测某些事件,如日食。
第三个重要的时间不对称是因果不对称。在时间上,原因总是先于结果。赖兴巴赫试图用宏观统计或概率来分析因果方向。他利用筛选的概念来定义因果关系,并定义因果方向。正是在后一种背景下,RCCP 被引入。RCCP 与因果方向之间的联系将在下文第 6 节中讨论。赖兴巴赫还提出了因果关系的概率理论,并探讨了这些新思想与他很早就提出的区分因果方向的标记方法之间的联系 (Reichenbach 1958)。
RCCP 与赖兴巴赫思想中的许多线索相联系。赖兴巴赫发展并捍卫了概率的频率解释(赖兴巴赫 1949),以及彻底的概率认识论(赖兴巴赫 1938)。他还在早期作品中探讨了概率与因果关系之间的联系(赖兴巴赫 1925 [1978]、1930 [1978])。《时间的方向》在发展概率形而上学方面更进一步。赖兴巴赫还在赖兴巴赫(1925 [1978])和赖兴巴赫(1958)中探讨了因果关系与时间方向之间的联系。后者在相对论的背景下发展了时间的因果理论。
4. 插图
示例 1. 气压计和风暴(杰弗里 1969)。
字母 A 上有一个箭头从它向上向左指向字母 B,另一个箭头从 A 向上向右指向字母 S
图 2:气压计和风暴。A= 气压下降;B= 气压计水银水平下降;S= 风暴。
气压计水银水平下降通常伴随着风暴。分别称这些事件为 B 和 S。由于风暴通常不那么频繁,因此这些事件在概率上是相关的:p(B∩S)>p(B)p(S)。一个气压计的行为不会影响天气,因此 B 不是 S 的原因;相反,B 和 S 有一个共同的原因:气压 A 下降(见图 2)。A 增加了 B 和 S 的概率:
p(B|A)>p(B|
¯
A
) 和 p(S|A)>p(S|
¯
A
)。
此外,A 会将 B 与 S 隔离开来:
p(B∩S|A)=p(B|A)p(S|A)
和
p(B∩S|
¯
A
)=p(B|
¯
A
)p(S|
¯
A
)。
例如,如果气压下降,但气压计中的水银柱由于气压计故障而没有下降,则暴风雨发生的概率与气压计正常运行时相同。
示例 2。剧团(Reichenbach 1956)。
一个小剧团在全国各地演出。偶尔,男主角病得很重——称此事件为 M——必须由替补演员代替他。同样的事情有时也会发生在女主角 L 身上。虽然这两种情况很少见,但它们往往同时发生:p(L∩M)>p(L)p(M)。原因是演员们通常在同一家餐厅一起吃饭,偶尔会分享被污染的食物——T。见图 3。
字母 T 上有一个箭头从它向上向左指向字母 L,另一个箭头从 T 向上向右指向字母 M
图 3:剧团。T=演员光顾的餐厅里的食物被污染;L=女主角生病;M=男主角生病。
假设概率如下:
p(T) =.1
p(L|T)=p(M|T) =.8
p(L|
¯
T
)=p(M|
¯
T
) =.1
然后我们可以计算:
p(L∩M|T)=p(L|T)p(M|T) =.64
p(L∩M|
¯
T
)=p(L|
¯
T
)p(M|
¯
T
) =.01
这些计算利用了 T 和
¯
T
将 L 与 M 隔离开来的事实。我们还可以计算:
p(L)=p(L|T)p(T)+p(L|
¯
T
)p(
¯
T
) =.17=p(M)
p(L∩M)=p(L∩M|T)p(T)+p(L∩M|
¯
T
)p(
¯
T
) =.073
因此
.073=p(L∩M)>p(L)p(M)=.172=.0289。
L 和 M 是概率相关的。
假设在某个晚上,男主角和女主角都病得很重。我们能推断出他们吃了被污染的食物吗?根据上面的概率,我们可以计算出
p(T|L∩M)=
.064
.073
≅.877。
虽然他们吃了被污染的食物是可能的,但这绝不是肯定的。此示例表明,共同因果原则本身并不允许进行标记级因果推断。也就是说,它并没有告诉我们,当两个结果 A 和 B 在特定场合发生时,它们的共同原因 C 也会在这种场合发生。相反,共同因果原则允许从概率相关性推断出类型级共同原因的存在。
示例 3。语言血统。
以字母“F”开头的英语常用词在西班牙语中通常有以字母“P”开头的对应词:“foot”/“pie”、“fish”/“pez”、“father”/“padre”等。可以通过查看两种语言的规范单词表来量化这一点,并查看英语中以“F”开头的单词和西班牙语中以“P”开头的单词的频率。通过将此列表中的相对频率视为概率,人们会发现英语单词首字母“F”和西班牙语单词首字母“P”之间确实存在概率相关性。
这种相关性的解释是,英语和西班牙语都起源于一种共同的语言,即原始印欧语。原始印欧语中的一些(但不是全部)单词以辅音开头,我们可以将其标记为 [P/F],在罗曼语(包括西班牙语)中演变为“P”,在日耳曼语(包括英语)中演变为“F”。(请注意,这里关注的是语音发音,而不是拼写;例如,许多以“V”开头的德语单词都算在内。)在从原始印欧语到英语和西班牙语的独立谱系中,一些单词保留了原始印欧语词根,但其他单词则被替换了。这些词根保留的次数足够多,以至于仍然可以检测到相关性。此外,这两个谱系在从原始印欧语分离后或多或少独立地发展。请注意,共同的原因不是整个原始印欧语,结果也不是英语和西班牙语。为这些语言分配概率是没有意义的(更不用说为英语和西班牙语分配联合概率了)。相反,共同的原因是原始印欧语中的首辅音 [P/F];结果则是英语中的首字母“F”和西班牙语中的首字母“P”。为这些声音分配概率是有意义的,因为我们可以计算这些语言中以这些声音开头的单词的频率。参见图 4。
短语“PIE[P/F]”的箭头从其上方和左侧指向短语“英语 F”,另一个箭头从上方和右侧指向短语“西班牙语 P”
图 4:英语中首字母为“F”的单词和西班牙语中首字母为“P”的单词从原始印欧语中首字母为 [P/F] 的单词的下降趋势。
请注意,两种语言之间共同下降趋势的证据是两种声音之间的相关性,而不是它们之间的任何语音相似性。例如,拉丁语“du”和亚美尼亚语“erk”之间存在公认的关联,如“duo”/“erku”(“二”)。尽管这些发音不同,但这种关联是共同血统的证据(两者都是印欧语系语言)。