概率因果(二)
(帝国)
CT是IT'的原因,如果是,只有:
我。
t <t'ii。
p(et'|ct)> p(et'|~ct); 和
三。
没有进一步的事件bt“,在时间t的时间t”发生于或同时与t,该从CT屏幕关闭。
注意与CT发生的发生或同时的T“的限制。 这是因为CT和ET'之间的因果中间体通常会屏幕屏幕从等。 在这种情况下,我们仍然想说CT是ET'的原因,尽管远端或间接原因。
尽管他对No筛选条件的动机不同,但Supples(1970)独立提供了相当于因果关系的定义与REICHENBACH的无屏蔽条件不同。 支持在许多方向上扩展框架。 虽然Reichenbach对主要有关统计力学基础内出现的问题的概率因果感兴趣,但对于在科学理论的概率模型框架内定义导致感兴趣。 例如,Suppes在学习心理模型的背景下进行了扩展的因果关系。
2.3常见原因原则
Reichenbach(1956)制定了他称之为“常见原因原则”(CCP)的原则。 假设事件A和B是正相关的,即,
p(一个与b)> p(一)×p(b)。
但假设既不是一个也不是b是另一个的原因。 然后Reichenbach维护,它将存在一个共同的原因,a和b,满足以下条件:
0<p(c)<1
p(一个与b|c)= p(a|c)×p(b|c)
p(一个与b|~c)= p(a|~c)×p(b|~c)
p(a|c)> p(a|~c)
p(b|c)> p(b|~c)。
当事件A,B和C满足这些条件时,据说它们形成一个结膜叉。 5和6从C遵循是A的原因和B的原因。条件2和3规定了来自B的C和~c筛选。
条件2到6数学仍然需要1.Reichenbach说,常见原因阐述了A和B之间的相关性。该想法是不是一个事件导致另一种事件的结果的概率相关性最终导出来自的概率相关性因果关系。
Reichenbach对因果关系的定义,在上面的2.2节中讨论,上诉时间顺序:它要求原因早于其效果。 但Reichenbach还认为可以用普遍的统计不对称鉴定对效果的原因的方向。 假设事件A和B是相关的,并且C满足上述条件2-6,因此ABC形成了一个结膜叉。 如果C比A和B更早地发生,并且没有比A和B更晚发生的事件,然后据说ACB形成了对未来开放的联合叉子。 类似地,如果有稍后的事件满足2到6,但没有早先的事件,我们对过去开放了一个联合叉子。 如果较早的事件C和稍后的事件D都满足2到6,则ACBD形成闭叉。 Reichenbach的提议是,从原因到效力的方向是开放叉占主导地位的方向。 在我们的世界里,有一个很多叉子向未来开放,少数或没有过去。 但是,我们将在下面的3.6节中看到,结合叉不是识别因果方向的最佳结构。
2.4辛普森的悖论和背景上下文
在Reichenbach-Suppers的原因定义中,不等式P(et'10ct)> p(et'μg)是必要的,但不足以因因果关系。 这是不够的,因为它可能会在CT和ET'共享常见原因的情况下举行。 不幸的是,常见的原因也可能产生这种不平等是不需要因果关系的情况。 例如,假设吸烟与在这个国家的生活高度相关:住在该国的人也更有可能吸烟。 吸烟是一种肺癌的原因,但假设城市污染是肺癌的均匀原因。 然后,可能是吸烟者,除了非吸烟者的情况下,吸烟者均不太可能患有肺癌。 让C代表吸烟,B住宿,以及e肺癌,p(E`c)<p(E ~c)。 但是,如果我们在该国或城市居住的人有条件化,则这种不平等是逆转:P(E | C&B)> P(E |〜C&B)和P(E | C&ryb)> P(E |〜C&~b)。 概率不平等的这种逆转是“辛普森悖论”的实例。 南森森帕拉德帕拉德因因果关系的概率理论创造的问题是指出的,南希特克人(1979)和Brian Skyrms(1980)在大约同一时间指出。
Cartwright和Skyrms试图通过替换Reich的条件(ii)和(iii)来纠正问题,因为原因必须在各种背景上下文中提高其效果的概率。 咖啡件提出以下定义:
(购物车)
C如果且仅当P(e |c&b)> p(e ejc&b)时,则才能为每个背景上下文B(E |〜C&B)。
Skyrms提出了稍微弱的条件:原因必须在至少一个背景上下文中提高其效果的概率,并且在没有下面的情况下降低。 背景上下文是因素的结合。 当这种因素的结合有条件时,这些因素被认为是“固定”。 要指定后台上下文将是什么,那么,我们必须指定要固定的因素。 在前面的例子中,我们看到,当我们持有国家固定固定的国家固定的情况下,揭开了对肺癌吸烟的真正因果关系,无论是正面的(调节B)还是负面(调节~b)。 这表明,在评估C对于E的因果关系时,我们需要积极或消极地保持e固定的其他原因。 然而,这个建议并不完全正确。 让C和E分别吸烟和肺癌。 假设D是一个因果中介,说肺中焦油的存在。 如果C专门通过D引起E,则D将筛选出从E中筛选:鉴于肺中焦油的存在(不存在),肺癌的概率不受吸烟的焦油的影响。 因此,我们不想修复自己的任何原因,这本身就是由C引起的。让我们呼吁这一套是e的原因的所有因素,但是不是由C的造成的,这一组独立原因为E. C和E的背景上下文然后是最大结合其相结合是e的独立事业,或否定E的独立原因。
请注意,需要持有固定呼吁对因果关系的因素的规范,因此该理论不再提供对因果关系的还原分析。 尽管如此,理论对可能的因果关系来说,这一理论对可能的概率关系与至少一些因果关系系统不兼容。 另请注意,我们引用了下标。 Cartwright声称,没有必要向事件的时间顺序吸引以区分原因从她理论中的影响。 这是因为它通常不再是真的,即如果C在每个相关背景上下文中提高了e的概率B,则E提升将提高每个背景上下文B'中的C的概率。 原因在于,背景上下文的构造确保与评估C对E的因果关系相关的背景上下文不同于与评估E对C的因果相关性有关的背景。然而,戴维斯(1988年)和Eells(1991)都争辩卡特赖特的账户仍将有时规则统治,影响其原因。
2.5其他因果关系
纸盒定义了一种因素,作为增加其在每个背景上下文中其效果概率的因素。 但很容易看出,C和E. Eells(1991)之间存在其他可能的概率关系提出以下分类:
(eells)
•
CT是ET'如果且仅当T <T'和P)> P(et'sige_ct&b)为每个背景上下文b的正面原因(或仅引起的)。
•
CT是ET'的负原因(或CT防止等,如果只有在每个背景上下文中,则才能且仅当T <T'和P)(ET'1MYCT&B)而才能才能禁止ET')。
•
如果且仅当每个背景上下文中的P(et'μgt_ct&b),则CT是因果中性的(或因ET而因ET)而导致的ET')。
•
CT是ET'如果且仅当T<T“和CT不是ET'而不是差别中性的ET'而不是差别中性的情况的混合原因(或相互作用的原因)。
如果它是ET'的正,负片或混合原因,则CT对ET'的因子相关; 即,如果且仅当T<T“和CT没有因果性中立时,那么。
应该显而易见的是,当构建C和E一个的背景上下文时,应该保持不仅固定的e的(正)的e而独立于c,而且是e的负面和混合原因; 换句话说,一个应该固定对e因果关系的所有因素,除了C是因果关系的那些。 这表明因果关系,而不是积极的因果关系,是最基本的形而上学概念。
Eells的分类系统带来了一个重要的区别。 有一件事要问C是否以某种方式因果关系; 另一种要求,以这种方式C是因果关系的。说,C导致e可能含糊不清:这可能意味着C与e会导致相关; 或者它可能意味着C是E.概率理论的积极原因可以用来回答这两种问题。
EELLS声称,一般因果索赔必须对人口进行保证。 一个非常异质的人口将包括许多不同的背景条件,而均匀的人口将包含少数。 异质种群总是可以分为均匀的亚群。 它通常会发生这种情况是相对于群体P的混合原因,而在P的各种亚群中,e的正面原因,负原因或因果性因子。
2.6情境无与伦比
根据推车和EELLS,一个原因必须提高其在每个背景上下文中的效果的概率。 这被称为语境一致性的要求。 Dupré(1984)将以下强调要求提高到上下文一致性要求。 假设存在具有以下效果的非常罕见的基因:那些具有基因的人在吸烟时具有其收缩肺癌的机会。 在这种情况下,将有一个背景上下文,其中吸烟降低了肺癌的可能性:因此,根据上下文的要求,吸烟不会是肺癌的原因。 尽管如此,这种基因的发现似乎不太可能导致我们放弃吸烟导致肺癌的索赔。
Dupré表示,如果它在“公平的示例”中提出了e的概率,我们应该认为c是e的原因,这是一个作为整体人口的人口的样本。 在数学上,这增加了要求
(杜普雷)
C如果且才能才能才能
σbp(e|c&b)×p(b)>σbp(e|~c&b)×p(b)
其中b在相关背景上的范围内。 这与要求C必须在后台上下文的加权平均值中提高E的概率,其中每个背景上下文被P(b)的乘积和绝对值的加权
p(e|c&b)差分方程(e|~c&b)。
Dupré的账户肯定会更接近捕捉我们的普通使用因果语言。 实际上,Dupré的不平等是在随机试验中寻找的。 如果一个随机确定人口的哪些成员接受治疗(c)并且不(~c),则两组的背景条件B的分布应该是相同的,并且应该反映这些条件的频率。 因此,在不平等Dupré持有情况下,我们希望在治疗组中将E频率更高。
另一方面,EELLS的人口相对配方使我们能够做出更精确的因果索赔:在整个人口中,吸烟是肺癌的混合原因; 在缺乏保护基因的个体亚群中,吸烟是肺癌的积极原因; 在由具有基因的个体组成的亚种群中,吸烟是肺癌的负面原因。
无论如何,这种辩论似乎并不是关于因果关系的形而上学。 正如我们在上一节所看到的那样,因果关系真的是基本的形而上学概念。 Dupré和Eells之间的争议真的是关于如何最好地使用“原因”这个词来挑选一个特定的因果相关性的争论。 Dupré的拟议使用量将算作(积极)导致许多将在Eells拟议使用情况下混合的事情。 但似乎没有任何潜在的分歧,关于这些因素是因果关系的因素。 (为了防御类似的位置,请参见第三款和Korb 2004.)
2.7结论和进一步阅读
本节中描述的程序对导致和概率之间的关系进行了很多影响。 特别是,它帮助我们更好地了解因果结构可能导致筛选的概率关系的方式。 然而,尽管该计划的数学框架和与统计和实验方法的接触点,但该程序并未产生任何新的计算工具,或者建议任何用于检测因果关系的新方法。 因此,该程序主要通过下一节中描述的因果建模工具来供应。
本节调查的主要作品是Reichenbach 1956,Swex 1970,Cartwright 1979,Skyrms 1980和Eells 1991. Williamson 2009和Hitchcock 2016是两种进一步的调查,涵盖了一些主题本节讨论。 Hans Reichenbach和Reichenbach的共同原因原则的条目包括讨论Reichenbach的计划和他普通原因原则的地位。 SALMON(1984)含有对联合叉的广泛讨论。 辛普森的悖论的条目载有关于第2.4节中提出的一些问题的进一步讨论。
3.因果建模
前一节的讨论传送了从概率相关性推断出介质关系的问题的一些复杂性。 最近,已经开发了许多技术来代表因果关系系统,以及推断出概率的因果关系。 “因果建模”的名称通常用于描述致力于研究因果推理方法的新跨学科。 该领域包括统计数据,人工智能,哲学,经济学,流行病学和其他学科的贡献。 在这个领域中,吸引了最伟大的哲学兴趣的研究计划是计算机科学家Judea珍珠和他的合作者,以及哲学家彼得·斯普尔特,克拉克·甘肃和理查德·丘陵(SGS)及其合作者及其合作伙伴合作者。 这些作者最重要的作品是珍珠(2009年)(首次发表于2000年)和Spirtes等。 (2000)(第一次发表于1993年)。
3.1图形因果模型
每个因果模型都涉及一组变量V. V中的变量可以包括例如教育级别,收入和占领个人。 变量可以是二进制的,其值表示一些事件的发生或非发生,或某些属性的实例化或非实例化。 但随着收入的示例表明,变量可以具有多个值甚至是连续的。
概率的因果模型还包括概率测量P. P. p被定义在X = x的主题上定义,其中x是V的变量,x是x的范围内的值。P的X.P的范围内也通过粘合,剖析和这种命题的否定。 因此,只要发生在阳性概率的情况下,就可以在这种命题的情况下,在这种命题上的条件概率将是明确定义的。 P通常被理解为代表某种客观概率。
V中变量之间的因果关系由图表表示。 我们将考虑两种图形。 首先是指向的非循环图(DAG)。 变量集v上的定向图G是V的一组有序的变量。我们通过在⟨x中绘制从x到y的箭头绘制箭头来表示此目的地,在g中。图3显示了变量集v = {s,t,w,x上的定向图。,y,z}。
有6个字母的图。 S具有指向T的箭头,该箭头又具有指向X和Y的箭头又具有指向Z的箭头,该箭头具有指向W的箭头,该箭头指向W的箭头,该箭头指向箭头指向Z的箭头。
图3
定向图中的路径是具有共同端点的箭头的非重复序列。 例如,有一个来自x到z的路径,我们可以写入x←t→y→z。 定向路径是通过在尖端到尾部会议的所有箭头对齐的路径; 例如,有一个定向路径S→T→Y→z。 定向图是无循环的,因此一个DAG,如果没有从变量到自身的定向路径。 图3中的图形是DAG。
图中的关系通常使用谱系语言描述。 变量X是y的父级,以防有一个从x到y的箭头。pa(y)将表示y的所有父母的集合。在图3中,pa(y)= {t,w}。 x是y的祖先(和y是x的后代),以防x到y的定向路径。然而,从族记类比略微偏离并定义“后代”,使每个变量略微偏离,因此每个变量也是一个方便的其自身的后代。 de(x)表示x的所有后代的集合。在图3中,在图3中(t)= {t,x,y,z}。
从y到z中的箭头表示y是z的直接原因。这意味着y的值对z的值进行了一些因果差异,并且y通过V.iftensne的任何其他变量中未调解的一些过程来影响z。直接性是相对于变量集的一些过程。 我们将调用DAG中表示的直接因果关系系统,如图3变量集V的因果结构。
我们认为的第二种图形是无循环定向的混合图(ADMG)。 AWMG,将包含双头箭头,以及单头箭头。 双头箭头表示潜在的共同原因。 变量x和y的潜在常见原因是不包含在变量集V中的常见原因。例如,假设x和y共享常见的原因l(图4(a))。 变量集V = {x,y}的ADMG将如图4(b)所示。
三个字母图。 l向x和y有箭头尖头。两个字母的图。 x和y有一个双头箭头连接它们。
(a)(b)
图4
当他们最接近普通原因时,我们只需要以这种方式代表缺失的共同原因。 也就是说,V的图表应该在x和y之间包含双头箭头,当存在从v中省略的变量l,使得如果添加到v,则将是x和y的直接原因。双头箭头不会产生“族记”的关系:在图4(b)中,x不是y的父母,祖先或后代。
在ADMG中,我们扩展了一个路径的定义来包括双头箭头。 因此,x↔y是图4(b)所示的ADMG中的路径。 定向路径保留相同的含义,并定向路径不能包含双头箭头。 ADMG不能包含从变量到自身的定向路径。
我们将采用DAG和ADMGS两者代表直接因果关系和潜在共同原因的存在和缺乏。 例如,图3中的DAG表示T是Y的直接原因,即T不是Z的直接原因,并且没有任何变量的潜在的共同原因。
3.2识别问题
我们对具有一般结构的各种问题感兴趣。 将有关于正在调查的系统的一些因果特征的查询。 查询可能涉及: