统计哲学(四)

贝叶斯统计分析

考虑H1 / 2和H3 / 4的假设,在前述内,分别用作零和替代,H和H'。 我们基于数据而不是在它们中选择它们,我们分配了对它们的先前分配,使得NULL是可能的两倍,作为替代方案:P(H1 / 2)= 2/3和P(H3 / 4)= 1/3。 用SN / 5正确表示猜测5杯中的特定顺序,我们具有P(SN / 5 |h1 / 2)= 1/25,而P(SN / 5 | H3 / 4)= 3N / 45。 如前所述,因此五种猜测的可能性比变为

p(sn / 5|h3 / 4)

p(sn / 5|h1 / 2)

=

3n

25

因此,5个正确猜测后的后部比是

p(h3的/ 4|sn / 5)

p(上半年/ 2|sn / 5)

=

35

25

1

2

≈4。

这种后部由概率理论的公理来源于单独的概率理论,特别是贝叶斯定理。 它告诉我们,每个假设如何将样本数据纳入我们的信仰之后。

请注意,在上述博览会中,后验概率被写为p(hθsn/ 5)。 贝叶斯推理的一些阐述更愿意将修订的意见表达为新的概率函数p'(⋅),然后将其等同于旧的p(⋅|s菊)。 对于贝叶斯推论的基本正式运作,TIS的区别是不幸的。 但我们将在4.3.3节中返回。

4.1.2连续模型

在许多应用程序中,该模型不是有限的假设,而是由真实值的参数标记的连续体。 这导致对假设和可能性分布的定义的一些细微变化。 必须以所谓的概率密度函数,P(HΘ)Dθ写下来。 需要由限制过程定义的可能性:概率p(hθ)无限较小,使得我们不能以正常方式定义p(s`hθ)。 但除了贝叶斯机械的工作方式完全相同:

p(hθ|s)dθ=

p(s|hθ)

p(s)

p(hθ)dθ。

最后,需要通过集成替换求和:

p(s)=∫θ∈θp(hθ)p(s|hθ)dθ。

此表达式通常称为模型的边际可能性:它表达了数据如何符合整个模型的程度。

后验概率密度提供了一种基础,即一个人可以从样本S汲取,并且其类似于估计准确性的估计和措施。 对于一个,我们可以导出对参数θ的期望,我们假设θ连续变化:

ˉ

θ

=∫θθp(hθ|s)dθ。

如果模型由凸起集参数化,则它通常是它,那么将有一个假设h

ˉ

θ

在模型中。 这个假设可以作为贝叶斯估计。 类似于置信区间,我们还可以从后验概率分布中定义所谓的凭证间隔或可信度间隔:围绕期望值的大小2D的间隔

ˉ

θ

写[

ˉ

θ

使用-d,

ˉ

θ

+ D],这样

ˉ

θ

+ d

ˉ

θ

使用-d

p(hθ|s)dθ= 1-ε。

θ的该值范围是使得相应Hθ的后验概率增加了总后概率的最多1°。

基于后密度,还有许多其他方法可以定义贝叶斯估计和θ的闭合间隔。 贝叶斯分析优惠的具体估计可以通过科学家的需求来确定。 由于贝叶斯形式主义中可能性的核心作用,任何贝叶斯估计都会类似于最大似然估计人。 然而,输出还将取决于假设的现有概率,并且通常讲述当样本大小趋于无穷大时,它只倾向于最大似然估计。 有关此所谓的“洗涤”的更多信息,请参见第4.2.2节。

4.2贝叶斯方法问题

贝叶斯方法的大多数争议涉及假设的概率分配。 一系列重要问题围绕着这些概率作为信仰的解释,以及愿意采取行动等。 另一组问题涉及确定先前概率分配以及可能管理它的标准。

4.2.1对假设概率的解释

这里的整体问题是我们应该如何理解分配给统计假设的概率。 当然,解释将是认识的:概率表达了对假设的信仰的力量。 尝试物理解释几乎没有意义,因为假设不能被视为可重复事件,或者作为可能具有发生趋势的事件。

这叶将概率分配的若干解释为相信的力量。 随着信仰程度的概率的一个非常有影响力的解释涉及愿意对某些赔率进行赌注(参见Ramsey 1926,De Finetti 1937/1964,Earman 1992,Jeffrey 1992,Hownon 2000)。 根据这种解释,例如,将3/4的概率分配给一个命题,意味着我们准备为投注合约的投注合约准备为最多0.75美元支付,如果命题为真,如果命题是真的,那么如果命题是错误的,那就毫无价值。 声称,信仰程度在概率分配中正确表达,然后由所谓的荷兰书论支持:如果代理人不遵守概率理论的公理,则为一个似乎对代理人似乎公平的投注导致某种货币损失,因此被称为荷兰人,可能是由于荷兰人的军人声誉。 这种解释与他们的行为后果直接联系在行为后果:相信某事物与愿意从事特定活动,例如,在赌注中。

对假设的概率分配的解释有几个问题。 对于一个人来说,似乎对统计假设的真相赌注几乎没有意义,因为这种假设不能伪造或验证。 因此,他们上的投注合同永远不会兑现。 更一般地,尚不清楚统计假设的信念通过以这种方式连接到行为来适当地框架。 已经争论(例如,ARMENDT 1993),这种框架概率任务的方式介绍了对信仰的务实考虑,与成功导航到驾驶世界,进入一个自身涉及信仰作为真实代表的环境世界。

有些不同的问题是贝叶斯形式主义,特别是它在统计假设上使用概率分配,表明贝叶斯统计学家的一部分令人瞩目的闭合性。 调用上述示例,模型M = {H1 / 2,H3 / 4}。 贝叶斯形式主义要求我们在这两个假设上分配概率分布,并进一步造型的概率是p(m)= 1。 这是一个非常强烈的假设,即使是理性的理性的代理人,她也确实配备了一个真实的函数,表达了她对假设的看法。 此外,假设的概率分配似乎需要贝叶斯统计学家确定模型中包含真正的假设。 这是一个过度强大的主张贝叶斯统计名人在分析开始时必须提交。 它与广泛共享的方法见解(例如,Popper 1934/1956)严重坐到,根据哪种科学理论必须在任何时候开放修订(CF. Mayo 1996)。 在这方面,贝叶斯统计数据不法对科学探究性的性质,似乎似乎。

刚刚概述的问题在贝叶斯人期望得到良好校准的问题中获得了数学上更复杂的形式。 在道德(1982年)中制定的这个问题涉及贝叶斯预报员,例如,贝叶斯预报员,例如,那个确定第二天降水概率的天气预报员。 然后它被认为是这样一个天气预报员认为,从长远来看,他将汇聚在概率1的正确概率上。然而,假设风格默认会意识到他的气象模型可能是错误的,因此似乎是概括的对于正确的预测下方。因此,风格曼导致了不连贯的信念。 似乎贝叶斯统计分析甚至在理想的代理人的情况下均不实现不切实际的要求。

4.2.2确定先前

目前,假设我们可以将假设的概率解释为认知不确定性的表达。 那我们如何确定先前的概率? 也许我们已经对模型中的假设有直观的判断,因此我们可以根据此基础销售前的概率。 否则我们可能有其他标准选择我们的之前。 但是,几个严重的问题附上了用于确定之前的程序。

首先考虑运行贝叶斯分析的科学家的想法提供了先前的概率。 这个想法的一个明显的问题是,科学家的意见可能不会足够精确,以确定完整的先前分配。 假设科学家可以在模型上将她的意见转变为单个实际函数,特别是模型本身由一个连续的假设组成。 但是,更紧迫的问题是不同的科学家将提供不同的现有分布,并且这些不同的前瞻性会导致不同的统计结果。 换句话说,贝叶斯统计推断将不可避免的主观组成部分介绍到科学方法中。

统计结果取决于科学家的初始意见是一回事。 但它可能如此发生,科学家对假设没有任何意见。 她应该如何为假设分配现有概率? 之前的将不得不表达有关假设的无知。 表达这种无知的主要思想通常是漠不关心的原则:无知意味着我们在任何一对假设之间漠不关心。 对于有限数量的假设,但漠不关心意味着每个假设得到相同的概率。 对于一个假设的连续,漠不关心意味着概率密度函数必须是均匀的。

然而,有不同的方式施加漠不关心的原理,因此可以算作无知的表达的假设中不同的概率分布。 Bertrand的悖论很好地说明了这个洞察力。

Bertrand的悖论

考虑围绕等边三角形绘制的圆圈,现在想象一下长度超过圆直径的针织针被抛到圆圈上。 围绕圆圈内的针的部分的概率是多于等边三角形的一侧? 为了确定答案,我们需要参数化针可以抛出针头的方式,确定所包含的部分的参数值的子集确实比三角形侧更长,并且在参数上的概率分布中表达了针对针的精确抛光的无知,使得可以导出所述事件的概率。 问题是我们可以提供任何数量的方法来参加针在圆圈中的针落在圆圈中。 如果我们使用针在交叉点处用圆圈的切线使用的角度,那么如果角度在60°和120°之间,则针的附带部分才会更长。 如果我们假设我们的无知通过这些角度的均匀分布表示,该角度范围为0∘至180英寸,则事件的概率将是1/3。 然而,我们还可以参数化针线的方式不同,即通过针到圆形中心的最短距离。 在距离上的均匀概率将导致概率为1/2。

Jaynes(1973年和2003年)提供了对这个谜语的非常有着深切的讨论,也争辩说,可以通过依赖于某些转变下的问题的反侵犯问题来解决。 但是现在的一般信息是漠不关心的原则不会导致独特的前瞻选择。 重点不是关于参数的无知是难以在这些值的概率分布中表达的。 在某些情况下,我们甚至不知道用于表达我们无知的参数。

部分地点可以通过对科学理论采取不同的态度来解决贝叶斯分析的主体性问题,并通过放弃绝对客观性的理想来解决。 实际上,有些人会争辩说,统计方法恰当地适应科学家之间的意见差异。 然而,如果先前的分布表达了无知而不是意见,这种反应会错过标志:似乎难以捍卫源于拼写无知的不同方式的意见的差异的合理性。 现在,基于所谓的收敛结果(例如,Blackwell和Dubins 1962和Gaifman和Gaifman和Snir 1982),现在还有一个更积极的答案。 事实证明,先前选择的影响随数据的累积而减小,并且在限制中,后部分布将收敛到由采样数据决定的最佳假设的集合,可能的单例,并且因此完全独立于先前分布。 然而,在短期和中,运行主观先前选择的影响仍然存在。

总结,贝叶斯统计数据对主观投入敏感仍然存在问题。 经典统计程序的无可责任的优点是它们不需要任何此类输入,尽管可以说是经典程序对样本空间(Lindley 2000)的选择仍然敏感。 反对这一点,贝叶斯统计员指出能够将初步意见纳入统计分析的优势。

4.3回应批评

贝叶斯统计的哲学为上述问题提供了广泛的回应。 一些贝叶斯人咬紧牙关,捍卫贝叶斯方法的基本主观性质。 其他人通过提供客观激励手段来确定先前概率或通过强调贝叶斯形式本身的客观性质来弥补或弥补主体性。

4.3.1严格但经验上知情的主观主义

对贝叶斯统计数据的一个非常有影响力的观点,进入分析的主观性(例如,Goldstein 2006,Kadane 2011)。 所谓的个性学家或严格的主题主义者认为,统计方法不提供任何客观指导方针,指出任何形式的知识的主观主观来源。 因此,解释和选择的问题,至少部分地分配:贝叶斯统计学家可以在意志之前选择她,他们是她的信仰的表达。 然而,值得强调对贝叶斯统计数据的主观性观点并不意味着从经验事实中获得的所有限制都可以被忽视。 如果您还有进一步的知识,如果您对模型上的限制或之前的限制,则必须容纳这些约束。 例如,在下一个统计推理中,今天的后验概率可以用作明天的先前。 关键是,这种约束涉及信仰的合理性,而不是统计推理本身的一致性。

主观性观点在以务实的时尚解释概率分配的人中最突出,并激励了上述荷兰书论者对概率分配的信念的表现。 这种方法的核心是野蛮和德芬蒂的工作。 野蛮人(1962年)提议将统计数据统计到决策理论,了解实际合理性的数学理论。 他认为,自我概率分配根本并不意味着什么,并且它们只能在代理面临行动之间选择的上下文中解释,即,一组投注之间的选择。 在类似的静脉中,De Finetti(例如,1974年)主张统计数据,只有概率信仰的实证后果,表达愿意赌注,但他没有完全依赖统计推理决策理论。 值得注意的是,似乎对贝叶斯统计的主观主义观点是基于相同的行为主义和经验主义,激励奈曼和皮尔逊开发古典统计数据。

请注意,所有这一切都使第4.2.1节重新出现的解释问题的一个方面:如何在行为方面发布对假设的明显,因此可以在信仰方面解释,这里理解为愿意采取行动意愿? 对此问题的一个响应是通过概率分配转向代表信仰程度的不同动机。 遵循Finetti的工作,若干作者拟议的概率表达的概率表达不仅仅是基于行为目标,而是对持有信仰的认识目标,即准确代表世界,例如罗森克坦(1981年),Joyce(2001),Leitgeb和Pettigrew(2010年),Easwaran(2013)。 这种想法的强大概括是在斯·维修,塞内德菲尔德和卡达恩(2009年)中实现的,这在利用获得统计目标的得分规则的更长传统中建立了更长的传统。 另一种方法是,信仰的任何正式陈述必须尊重某些逻辑限制,例如,COX在基于部分信仰本身的性质的基础上,为概率分配表达了表达。

然而,原始主观主义对问题的问题是难以解释的问题来自De Finetti所谓的表示定理,这表明每个先前的分发都可以与自己的一组预测相关,因此有自己的行为后果。 换句话说,De Finetti展示了Priors如何确实与能够携带投注解释的信念。

4.3.2游览:表示定理

De Finetti的表示定理将预测规则与给定示例数据的职能相关,以防止这些数据的贝叶斯统计分析,以防止统计模型的背景。 有关有用的介绍,请参阅Festa(1996)并支持(2001)。 de Finetti考虑一个生成一系列时间索引观测的进程,然后他使用可以分析这些样本的统计模型研究将这些有限段作为输入的预测规则作为输入,并返回概率。 De Finetti的关键结果是特定统计模型,即,观察到独立和相同分布的所有分布集可以等同于可交换预测规则,即其预测不依赖于哪个顺序的规则观察结果进来了。

让我们在一些更正式的细节中考虑表示定理。 为简单起见,说该过程生成时间索引二进制观察,即0和1。 预测规则采用这种长度t的比特串,表示为st,作为输入,返回概率,因为字符串中的下一个位为1,表示为q

1

t + 1

。 因此,我们将预测规则写为部分概率分配p(q

1

t + 1

|st)。 可交换的预测规则是提供与字符串St中的位的顺序提供相同预测的规则。如果我们编写字符串ST总共N个观察的事件,则为SN / T的总共,那么可更换的预测规则被写为P(Q

1

t + 1

|sn / t)。 至关重要的是,预测的价值不受0和1在String St中出现的顺序的影响。

De Finetti通过特定类型的统计模型将这种特定的可更换预测规则与贝叶斯推断相关联。 De Finetti认为的模型包括所谓的Bernoulli假设HΘ,即,假设

p(q

1

t + 1

|hθ∩st)=θ。

这种可能性不依赖于之前已经消失的String ST。 假设是最佳考虑确定用于二进制过程的固定偏压θ,其中θ∈θ= [0,1]。 表示故事者认为,在Bernoulli假设和可交换预测规则上有一个达到的前者映射。 也就是说,每个先前的分发P(Hθ)都可以与一个完全一个可交换的预测规则P相关联(Q

1

t + 1

|n / t),并相反。 在De Finetti的原始表示定理旁边,证明了几种其他和更一般的表示定理,例如,对于Markov方法的部分可交换序列和假设(DiaConis和Freedman 1980,Skyrms 1991),用于聚类预测和分区过程(Kingman 1975和1978),甚至用于图表和它们的发电过程(Aldous 1981)。

表示定理等同于将统计假设的先前分发到预测规则,因此可以给出主观和行为解释的概率分配。 这消除了上面表达的担忧,即假设的先前分配不能被主观解释,因为它不能与信仰视为愿意的愿意:前锋与特定预测相互联系。 然而,对于De Finetti,表示定理提供了完全消除统计假设的原因,因此为了去除概率的概念,而不是主观意见(CF.HIntikka 1970):假设可以采取概率索赔来指的是无形的Chancy过程是多余的形而上的行李。

并非所有主观主义者都同样解除使用统计假设。 Jeffrey(1992)拟议所谓的混合贝叶斯主义,其中通过假设的主观解释的分布与假设定义样本空间的分布的物理解释相结合。 Romeijn(2003年,2005年,2006年)认为,假设的前瞻性是确定比直接指定预测系统的性质的归纳预测的有效和更直观的方式。 使用假设的这种优势似乎与科学的实践一致,其中假设是经常使用的,并且通常通过机械知识对数据产生过程进行激励。 事实上,统计假设可以严格地淘汰,不会消除他们在预测方面的效用。

4.3.3贝叶斯统计为逻辑

尽管其看似不可避免的主观性质,但有一种意义的意义,其中贝叶斯统计可能会对客观性施加索赔。 可以表明,贝叶斯形式主义符合合理性,一致性和校准的某些客观标准。 因此,贝叶斯统计数据因此回答了象限级客观性的要求:虽然它涉及保留主观方面的意见,但它涉及这些意见的方式,特别是对他们的数据影响的方式是客观正确的,否则是争论。 通过动态荷兰书论,在务实的背景下,支持支持贝叶斯方式的贝叶斯方式,即由条件化的争论方式,由此概要被解释为愿意下注(参见Maher 1993,Van Fraassen 1989)。 类似的论据已经提出了先进的理由,即我们的信念必须准确地代表世界德芬蒂(1974年),例如Greaves和Wallace(2006)和LeitgeB和Pettigrew(2010)的世界。

必须在支持贝叶斯方式的争议方案中进行重要区分:贝叶斯定理的区别,作为一个数学给出的和贝叶斯的规则,作为一段时间的一致性。 定理只是概率分配之间的数学关系,

p(h|s)= p(h)

p(s|h)

p(s)

并且因此不受辩论的影响。

(本章完)

相关推荐