概率因果(一)
“概率原因”表示一组理论,旨在使用概率理论的工具来表征原因与效果之间的关系。 这些理论背后的中心观点是导致改变其效果的概率。 本文涉及概率导致的开发,包括因果建模的最新发展。
此条目调查在概率方面表征原因的主要方法。 第1节提供了一些概率造成方法的动机,并解决了一些初步问题。 第2节调查旨在在升高概率升高方面表征因果的理论。 第3节调查因果建模的发展。 第4节涵盖了实际因果关系的概率账户。
1.动机和预备
1.1规律性理论的问题
1.2概率
1.3对概率的解释
1.4一般因果关系和实际因果关系
1.5因果关系
1.6进一步阅读
2.提高概率的因果关系
2.1提高概率和条件概率
2.2筛选
2.3常见原因原则
2.4辛普森的悖论和背景上下文
2.5其他因果关系
2.6情境无与伦比
2.7结论和进一步阅读
3.因果建模
3.1图形因果模型
3.2识别问题
3.3马尔可夫条件
3.4最小性和忠诚的条件
3.5因果结构的可识别性
3.6干预措施
3.7结论和进一步阅读
4.实际因果关系
4.1第一次尝试
4.2问题案例
4.3刘易斯的反事理论
4.4。 Fenton-Glynn的因果建模账户
4.5结论和进一步阅读
参考书目
学术工具
其他互联网资源
相关条目
1.动机和预备
在本节中,我们将为试图理解概率而言,提供一些动机,并解决了几个初步问题。
1.1规律性理论的问题
根据David Hume的说法,原因总是随后的影响:
我们可以将原因定义为一个对象,后跟另一个,以及与第一个类似的对象之后是类似于第二的对象。 (1748:第VII节)
在不变的继承模式方面试图分析因果关系被称为因果关系的“规律性理论”。 至少在最简单的形式中面临着规则性理论的许多众所周知的问题,这些问题可以用于激励概率的因果方法。 此外,这些困难的概述将有助于了解任何适当的因果理论必须解决的问题。
(i)不完美的规则。 第一个困难是大多数原因都不是总是随后的效果。 例如,吸烟是肺癌的原因,尽管一些吸烟者不会发展肺癌。 可能出现不完全规则的原因可能出现。 首先,由于引发产生的情况的异质性,它们可能会出现。 例如,一些吸烟者可能对肺癌有遗传易感性,而其他吸烟者则没有; 一些非吸烟者可能会暴露于其他致癌物(如石棉),而其他人则不是。 其次,由于物理确定性失败,也可能出现不完美的规则。 如果未确定事件发生,则没有其他事件可以是该事件的足够条件的(或是一部分)。 量子力学的成功 - 以及较小程度,采用概率的其他理论 - 已经震动了我们对确定性的信仰。 因此,许多哲学家们希望制定不预先假定确定主义的因果理论。
导致概率理论背后的核心观点是导致改变它们的效果的可能性; 在没有原因的情况下仍可能发生效果或在其存在下未发生。 因此,吸烟是肺癌的原因,而不是因为所有吸烟者都发展肺癌,而且因为吸烟者更有可能发展肺癌而不是非吸烟者。 这完全是一致的,有些吸烟者避免肺癌,以及一些屈服于它的非吸烟者。
(ii)无关紧要。 无论如何,某些结果的状况可能仍然可能与该结果无关紧要。 被巫师包裹的盐总是溶解在水中(Kyburg 1965)时溶解,但是Hexing不会导致盐溶解。 Hexing没有对解散产生差异。 概率的因果理论通过要求原因对其效果的概率产生差异来捕获这种概念。
(iii)不对称。 如果原因B,那么通常,B也不会引起A.吸烟导致肺癌,但肺癌不会导致一个吸烟。 执行因果不对称的一种方法是规定,导致在其效果之前。 但如果原因理论可以提供对因果方向性的一些解释,那将是很好的,而不是仅仅规定它。 一些概率因果理论的支持者试图利用概率理论的资源来表达对原因不对称的实质性叙述。
(iv)杂散的规律。 假设一个原因定期后跟两个效果。 以下是杰弗里(1969)的一个例子:假设只要某个区域中的气压下降到一定水平以下,就会发生两件事。 首先,特定气压计中汞柱的高度低于一定水平。 不久之后,发生风暴。 这种情况在图1中示意性地示出。然后,在每当汞柱滴的柱子时,它也可能有风暴。 如果是这样,一个简单的规则性理论似乎统治了水星柱的滴导致暴风雨。 然而,事实上,与这两个事件相关的规律性是虚假的。 处理这种杂散相关性的能力可能是概率原因理论的最大吸引力。
具有三个文本节点的图表。 底座是“压实气压”,带有指向“汞柱列”和“风暴”和“风暴”的箭头。
图1
1.2概率
在此分段中,我们将审查数学概率理论的一些基础知识,并引入一些符号。 读者已经熟悉概率的数学可能希望跳过本节。
概率是一个函数p,它在零和一个之间分配值,包容性。 通常,函数的参数被拍摄,或以正式的语言命题。 这些论点的正式术语是“活动”。 我们将在这里使用适合命题的符号,以“〜”表示否定,'&'表示结合,'∨'表示分离。 有时,当结合长时间时,这将通过逗号而不是amperss缩写。 概率函数的域具有字段或布尔代数的结构。 这意味着该域在互补和获取有限元或交叉口(套件),或在否定,结合和分离(主命令)下关闭。 因此,如果a和b是p的域中的事件,所以~a,a&b和a∨b。
概率的一些标准属性如下:
如果A是矛盾,那么P(a)= 0。
如果A是Tautology,那么P(a)= 1。
如果p(a&b)= 0,则p(a∨b)= p(a)+ p(b)
p(~a)= 1-p(一)。
除概率理论外,该条目还将使用集合理论和逻辑的基本符号。 设置将以粗体显示。
∅是空集(没有成员或元素的集合)
x∈x表示X是SET X的成员或元素。
x⊆y意味着X是Y的子集; 即,X的每个成员也是Y的成员。注意,∅和y都是Y的子集。
x∈Y是从X中删除y的成员的集合。
∀和∃分别是普遍和存在量的量词。
一些进一步的定义:
给定B的条件概率写入p(a |b),标准定义如下:
p(a|b)=
p(一个与b)
p(b)
。
如果p(b)= 0,则条件概率定义中的比率未定义。 然而,有多种技术开发,可以让我们在P(b)为0时定义p(a |b)。我们将忽略此问题。
概率p的随机变量是函数x,其在实数中取值,使得对于任何数字x,x = x是p的域中的事件。例如,我们可能具有在{1,2,3,4,5,6}中取值的随机变量t1,表示{1,2,3,4,5,6}中的值,表示第一次折腾死亡。 事件T1 = 3将表示具有结果3的第一个折腾。我们将以T1 =1∨t1=2∨t1= 3写入t1∈{1,2,3}。
如果A和B处于P的域,则A和B刚刚概率独立于(A&B)= P(a)×p(b).a和b概率地依赖或相关。
A和B在C且仅IF且仅当P(A&B | C)= P(A | C)×P(B |c)上是概率的概率上的条件。
随机变量x和y是概率的,如果x∈h的所有事件概率无关,则且仅在y∈j的所有事件上都是概率的,其中h和j分别是x和y范围的子集。
作为一种方便的速记,一个仅包含变量或变量集但没有值的概率陈述将被理解为在变量的所有可能值的通用量化。 因此,如果x = {x1,...,xm}和y = {y1,...,yn},我们可以写
p(x|y)= p(x)
作为速记
∀x1...∀xm∀y1...∀yn[p(的x1 =的x1,...,xm = xm|y1 = y1,...,yn = yn)
= p(的x1 =的x1,...,xm = xm)]
(每个变量的量化域将是相关随机变量的范围)。
1.3对概率的解释
因果关系通常被认为是世界的客观特征。 如果要在概率理论方面捕获,那么概率分配应该代表世界的一些客观特征。 有许多尝试客观地解释概率,最突出的频率解释和倾向解释。 由于这两种方式之一,因此大多数概率原因理论的支持者已经理解了概率。 值得注意的例外是支持(1970),概率是科学理论模型的特征; 和斯基尔(1980),谁理解相关概率是某种理性剂的主观概率。
1.4一般因果关系和实际因果关系
常见的是,一方面,一方面,一方面的级别或类型的因果关系,另一方面是奇异的,令牌水平或实际因果关系。 此条目采用术语一般因果关系和实际因果关系。 因果索赔通常具有结构的C导致E'。 C和E是因果索赔的Relata; 我们将在下一节更详细地讨论因果关系。 一般因果关系和实际因果关系通常通过它们的Relata来区分。 一般因果索赔,这种“吸烟导致肺癌”通常不参考特定的个体,地方或时间,而是仅针对事件类型或性质。 奇异的因果索赔,例如“2000年代的吉尔的沉重吸烟导致她发育肺癌”,通常会参考特定的个体,地方和时间。 然而,这是一个不完美的指南; 例如,下面讨论的一些普通因果的理论取得其因果关系以时间索引。
相关的区别是一般因果关系涉及全方位的可能性,而实际因果关系则关注事件在特定情况下的事件如何实际发挥作用。 在实际因果的索赔中,“原因”函数作为成功动词的最低限度。 索赔“吉尔在2000年代的沉重吸烟导致她开发肺癌”意味着吉尔在2000年代的巨大吸烟,她开发了肺癌。
下面第2和第3节中讨论的理论主要关注一般因果关系,而第4节讨论了实际因果的理论。
1.5因果关系
已经提出了许多不同的候选人来说是因果关系的Relata。 虽然有些作者(例如,Mellor 2004)辩称,但实际因果关系的Relata通常被认为是活动(不要与纯粹技术意义上的事件混淆)争辩说他们是事实。 一般因果关系的Relata通常被认为是属性或事件类型。 出于明确的目的,事件将指的是实际因果关系的Relata,因素是指一般因果关系的Relata。 这些术语并非旨在暗示对因果关系性质的任何特定观点的承诺。
以概率的因果方法,因果Relata由概率空间中的事件或随机变量表示。 由于形式主义要求我们利用否定,结合和分离,因此Relata必须是实体(或由实体准确表示)可以有意义地应用这些操作的实体。
在某些理论中,事件发生或属性的时间实例化起着重要作用。 在这种情况下,包括指示相关时间的下标是有用的。 因此,Relata可能由CT和ET'表示。 如果Relata是特定的事件,则此下标只是提醒; 它没有进一步的信息。 例如,如果有问题的事件是里约奥林匹克游戏的开幕式,下标'8/5/2016'是无需消除其他事件的歧义。 但是,在属性或事件类型的情况下,此类下标确实添加了更多信息。 时间索引不需要参考日期或绝对时间。 它可以参考发展特定系统的发展阶段。 例如,儿童铅涂料的暴露可能导致学习障碍。 这里的时间指数表明它是儿童的暴露,即人生的早期阶段,导致有问题的效果。 时间指数也可以指示相对时间。 暴露于麻疹病毒导致大约两周后的皮疹的外观。 我们可以通过分配T = 0的时间索引来表示此时间延迟,并重新衰减T = 14的索引(为14天)。
它是标准,假设原因和效果必须彼此不同。 这意味着他们不得彼此符合逻辑关系或部分关系。 刘易斯1986A载有关于明显概念的详细讨论。 我们通常会留下这种限制默契。
1.6进一步阅读
Psillos 2009概述了因果关系的规律性理论。 Lewis 1973包含了一个简短但明确而有力地概述了规律性理论的问题。 科学解释的条目包含对其中一些问题的讨论。
Hájek和Hitchcock 2016B是对哲学应用的概率理论的简要介绍。 Billingsley 1995和Feller 1968是两个标准的概率理论文本。 概率解释的条目包括简要介绍概率理论的形式主义,并讨论了概率的各种解释。 Galavotti 2005年和吉利亚2000是概率理论的良好调查。 Hájek和Hitchcock 2016a包括涵盖概率主要解释的论文。
EELLS 1991的引入提供了一般和实际因果关系之间的区别良好概述。
Bennett 1988是对因果关系中的事实和事件的讨论。 EHRING 2009是关于关于因果Relata的视图的调查。 另请参阅因果关系,事件,事实和属性的形而上学的条目。
2.提高概率的因果关系
本节中的理论均展示了导致引起其效果概率的基本思想。 这些理论是20世纪下半叶的导致理论之一。 如今,它们主要由第3节中讨论的因果建模方法所涂。
2.1提高概率和条件概率
导致引起其效果概率的中心思想可以使用条件概率正式表达。 C提高了E的概率:
(pr1)
p(e|c)> p(e)。
言语,e发生的概率,鉴于C发生,高于E发生的无条件概率。 或者,我们可能会说C刚刚提高E的概率:
(pr2)
p(e|c)> p(e|~c);
鉴于C发生的概率,否高于E发生的概率,鉴于C不会发生。 这两种配方在不等式PR1将在PR2持有情况下持有的意义上是等同的。 一些作者(例如,Reichenbach 1956,Supptes 1970,Cartwright 1979)制定了使用PR1,其他(例如,Skyrms 1980,Eells 1998,1991)等不平等的因果关系的概率理论使用PR2等不平等。 这种差异大多是无关紧要的,但对于一致性,我们将坚持(PR2)。 因此,在概率的因果理论下的第一个刺激是:
(pr)
C是e刚刚在p(e |c)> p(e ~c)的原因。
PR与最简单的原因理论的最简单版本有一些优势(在上面的第1.1节中讨论)。 PR与不完全规律兼容:C即使C的实例不在于E.此外,则C可以提高E的概率。此外,PR处理相关性的问题:如果C是E的原因,则C对E的可能性产生差异。但是,在它的阶段,PR并没有解决不对称问题,或虚假相关的问题。 PR没有解决不对称问题,因为概率升降结果是对称的:P(E |c)> P(E |〜C),如果且仅当P(C | I)> P(C〜E)时。 因此,PR本身不能确定C是否是E的原因,反之亦然。 PR也有杂散相关性的麻烦。 如果C和E都是由一些第三因素引起的,那么它也可以是P(E |c)> P(E |〜C),即使C不引起E.这是上面图1所示的情况。 在这里,C是晴雨表中汞水平的下降,E是风暴的发生。 然后我们期望P(e |c)> p(e ~c)。 在这种情况下,大气压被称为混杂因子。
2.2筛选
Hans Reichenbach的时间方向于1956年出版。在IT中,Reichenbach涉及时间上不对称现象的起源,特别是热力学第二律规定的熵增加的熵增加。 在这项工作中,他提出了第一个完全发达的概率的因果理论,尽管一些想法可以从1925年追溯到早期的纸张(Reichenbach 1925)。
Reichenbach引入了筛选术语来描述特定类型的概率关系。 如果P(E | A&C)= P(E |c),则据说C从E筛选筛选。当P(A&C)> 0时,这种平等相当于P(a&e`c)= p(a |c)×p(e`c); 即,A和E在C上是概率自残的条件。
Reichenbach认识到有两种因果结构,其中C将通常筛选OFF。当导致C时,第一发生,这反过来导致e,并且没有其他路线或过程。
字母'a',箭头向右指向字母'c',又向右侧指向字母'e'箭头
图2
在这种情况下,Reichenbach表示,C是A和E之间的因果性。我们可以说C是A和E之间的中间原因,或者C是e的近似原因和E的远端原因。例如,未受保护的性别(a)导致艾滋病(a)导致艾滋病(a)导致艾滋病(e)仅通过引起艾滋病毒感染(c)。 然后我们期望在那些已经感染艾滋病毒的人中,那些通过无保护的性别感染的人不会更有可能与那些以其他方式感染的人合同援助。
当C是C是A和E的常见原因时,产生筛选的第二种情况,例如在图1中所示的气压计示例中。大气压(c)的下降导致气压计(a)和风暴(a)中的水平下降。 (这种符号与前面使用的那些符号略有不同。)大气压将筛选从天气读取的晴雨表读取:鉴于大气压已经下降,气压计的读数对风暴是否会产生差异。
Reichenbach使用了筛选装置来解决杂散相关的问题。 在我们的例子中,虽然汞柱(a)的栏目总体上升(E)的概率总体上升,但是当我们进一步调节大气压时,它不会提高风暴的可能性。 也就是说,如果a和e是虚拟相关的,则通过常见的原因从e筛选a。 更具体地,假设CT和et“分别是在时间t和t'发生的事件。 然后