统计哲学(三)
除了由六个成功组成的样本外,所有样本包括一系列以故障结尾的成功,仅在系列的长度中不同。 然而,长度六个样本的概率与勤奋的研究人员相同。 如前所述,六个成功的样本再次包括在拒绝区域中。 类似地,五个成功的序列随后是一个故障的概率也在零假设下的概率为1/64,根据替代方案的概率为35/46。 差异在于降低抑制区域中的似然比以包括该样品的抑制导致仅包含该样品。 如果我们在拒绝区域中包含它,则错误抑制的概率变为1/32,因此不超过5%。 因此,在这些数据的基础上,悠闲的研究人员可以拒绝这位女士只是猜测的空假设。
考虑为什么不耐烦的研究人员拒绝零假设是有益的。 由于他的采样计划,其他样本具有五个成功,即将勤勉研究人员从包含在抑制区域的止痛区域中被观察到的样品保持超过误差概率的疼痛。 这例示了,经典统计程序的结果不仅取决于实际数据的可能性,这对两个研究人员来说都是相同的。 他们还取决于我们没有获得的数据的可能性。
在上面的示例中,可以被认为是令人困惑的是,用于可选停止的协议取决于正在记录的数据。 但如果不存在这种依赖,可选停止的争议也出现。 例如,想象一位第三次研究员,直到勤奋的研究人员完成,或者在那之前,如果她开始感到抨击。 此外,我们可能会假设与女士提供的每个新杯,感觉匹配的可能性是
1
2
。 如果她完成六杯系列,这种掠夺研究员也能拒绝零假设。 它肯定似乎与这种拒绝依赖于研究人员的生理学和心态的统计程序的客观性差异:如果她没有保持休息的可能性,她就不会拒绝零假设,即使她做过实际上没有那个休息。 作为杰弗里着名的争吵,这确实是一个“非凡的程序”。
然而,这种情况并不像似乎一样清除。 对于一个,哈克什研究员可以说是在串联中测试两个假设,一个关于茶品尝女士和另一个关于她自己的掠夺的能力的一个假设。 合并的假设在一起的实际样本具有不同的可能性,而不是勤奋研究员考虑的简单假设。 上述可能性原则决定了这种差异不会影响实际样本的证据影响,但有些人保留了它应该的直觉。 此外,在某些情况下,这种直觉由那些维护可能性原则的人共享,即当停止规则取决于以问题上的假设已经表达的方式被记录(CF.Robbins 1952,Hownson和urbach 2006,p。365)。 就我们的例子而言,如果女士只是猜测,那么研究人员可能更有可能从纯粹的无聊中掠夺,而不是如果女士表现远低于或高于机会水平。 在这种情况下,停止本身的行为揭示了关于问题的假设,这应该反映在假设的可能性中。 这将使数据对假设依赖于所有的假设的证据影响。
3.3对批评的回应
对上述批评有许多反应。 其中一些响应有效地重新诠释了古典统计程序,只针对数据的证据影响。 其他响应发展了古典统计理论以适应问题。 它们的共同核心是他们建立或至少澄清了两个概念领域之间的联系:统计程序是指物理概率,而其结果涉及证据和支持,甚至拒绝或接受假设。
3.3.1证据强度
古典统计论通常呈现为向我们提供有关行动的建议。 错误概率不告诉我们基于统计程序的基础上采取什么事故态度,而是如果我们生活在一起,他们表示误差的长期频率。 特别是奈曼主张这种古典程序的解释。 反对这一点,费舍尔(1935A,1955年),Pearson和其他古典统计人员认为更多的认知解释,并且最近的作者纷纷纷纷纷纷纷纷纷纷纷纷纷纷纷纷纷纷纷纷纷纷纷纷审视。
上述关于古典统计讨论的核心是可能性的概念,这反映了数据在问题上的假设。 在黑客(1965年)的作品中,爱德华兹(1972年),更近罗伊尔(1997年),可能是统计程序的基石,并赋予认识诠释。 他们据说他们表达了数据提出的证据的力量,或者数据给出假设的比较支持程度。 黑客在所谓的可能性定律(1965,p.59)中制定这个想法:如果样品S在H0的条件下比H1更可能,则S支持H0的支持H1。
似然主义的位置基于对概率的特定观点组合。 一方面,它只采用样本空间的概率,并避免将概率放在统计假设上。 由此避免使用不能给予物理解释的概率。 另一方面,它确实将样本空间的概率解释为支持关系的组件,从而与心目不调而不是物理领域。 值得注意的是,可能性主义方法在正式的认识论中具有很长的历史,特别是在确认理论(见Fitelson 2007)中,其中概率理论用于拼出数据和假设之间的确认关系。 确认措施总是将假设作为输入组件的可能性。 它们提供了似乎律法所描述的支持关系的定量表达。
梅奥(1996)和Mayo和Spanos(2011)介绍了另一种古典统计的认知方法。 在过去的十年中,他们已经做了很多,以推动科学哲学古典统计议程,这已被贝叶斯统计所占主导地位。 反击奈曼的原始行为倾向,错误统计方法推进了经典测试和估算程序的认知读数。 Mayo和Spanos认为经典程序最好被理解为推论:他们许可归纳的推论。 但他们很容易承认推论是不可取的,即,他们可以引领美国误入歧途。 经典过程始终与特定误差概率相关联,例如,假拒绝或接受的概率,或估计在一定范围内的估计的概率。 在Mayo和Spanos的理论中,这些误差概率获得了认识的作用,因为它们被采用以指示由程序许可的推断的可靠性。
梅奥和其他人的错误统计方法包括一般科学哲学以及关于哲学统计的特定观点。 通过讨论严重测试的概念,我们简要介绍了后者(参见Mayo和Spanos 2006)。 索赔是,我们基于严重测试假设来获得实验效果的知识,这可以具有重要性和力量的特征。 在梅奥的定义中,假设在两个条件下传递了严重的测试:数据必须与假设一致,并且数据必须非常低,以至于数据同意替代假设。 在“同意”和“低概率”和“低概率”中忽略潜在的争议,我们可以认识到这些要求中奈梅曼和皮尔逊的标准。 如果显着性低,则测试是严重的,因为数据必须与假设一致,并且权力很高,因为这些数据不得同意,或者在替代方面具有较低的概率。
3.3.2理论发展
除了对古典统计程序的重新解释之外,众多统计人员和哲学家还进一步发展了古典统计的理论,以便善于其结果的认识作用。 我们特别关注两个发展,智力,基准和证据概率。
证据概率理论源于凯斯堡(1961年),他们开发了一个逻辑系统,以始终如一地处理古典统计分析的结果。 因此,证据概率在尝试中,建立了古典统计的认知使用。 Haenni等人(2010)和Kyburg和Teng(2001)介绍了对证据概率的有敏感介绍。 该系统基于版本默认推理:统计假设随着置信水平附加,并且逻辑系统组织了这种置信水平如何在推理中传播,因此建议使用哪个假设用于预测和决策。 特别注意的忠于推论中的置信水平的传播,这涉及与不同的自信标记的相同假设的多个实例,其中这些信心由各种数据集产生,每个数据集各有与特定群体相关联。 证据概率有助于选择最佳置信水平,从而在选择所考虑的情况下选择适当的人口。 换句话说,证据概率有助于解决在前述内容中提叠的参考课程问题。
基准概率呈现了另一种方式,其中古典统计可以赋予认识状态。 Fisher(1930,1933,1935C,1956/1973)开发了基准概率的概念,作为在假设上导出概率分配的方式,而不假设在开始时统计假设的先验概率。 基准论点是有争议的,并且普遍认为其适用性仅限于特定的统计问题。 Dempster(1964),黑客(1965年),Edwards(1972),Seidenfeld(1996)和Zabell(1996)提供了富有洞察力的讨论。 Seidenfeld(1979)介绍了特别详细的研究,并进一步讨论了在多个参数的情况下对参数的限制适用性。 麻告和石头(1982)争辩说,为了运行基准论点,必须假设可以在平滑可逆的功能模型中捕获统计问题。 Dempster(1966)提供了这种概念的概念,因为θ的分布不是唯一的,而且仅限于上限和下限(CF.Haenni等,2011)。 粗略地,获得对θ上的概率分布的这种约束而不是在开始时的任何分布上的任何分布。
3.3.3游览:基准论证
要解释我们首先建立一个简单的例子的基准论点。 例如,我们估计在变量X上的单位方差的正态分布的平均θ。我们收集由测量X1,X2,... Xn组成的样本S. θ的最大似然估计器是XI的平均值,即,
θ
(s)=σixi/ n。 在假设的真值θ下,我们对估算器具有正常分布
θ
(s),以真正的价值为中心,具有方差1 /
√
n
。 值得注意的是,该分布具有与θ的所有值相同的形状。 正因为如此,我们可以使用估算者的分布
θ
(s)作为对真值θ的分布的待机。 因此,我们基于样本S导出概率分布P(θ),似乎不假设现有概率。
有几种方法可以澄清这种所谓的基准论点。 一种方式采用所谓的功能模型,即通过特定功能来规范统计模型。 对于上述模型,功能是
f(θ,ε)=θ+ε=
θ
(s)。
它将可能的参数值θ与基于样本的数量相关联,在这种情况下观察的估计器
θ
。 这两个通过随机分量ε相关,其分布是已知的,并且对于所考虑的所有样品也是如此。 在我们的情况下,ε是通常以方差1 / /
√
n
。 重要的是,对于θ的每个值,ε的分布是相同的。 函数F的解释现在可以是显而易见的。 相对于选择值的值,然后获得真值θψ的角色,ε上的分布决定了估计函数的分布
θ
(s)。
现在可以简洁地表达基准论点的想法。 它是将随机组件上的分布投影回可能的参数值。 关键观察是功能关系F(θ,ε)是平滑可逆的,即功能
f-1(
θ
(s),ε)=
θ
(s)-ε=θ
每种组合点
θ
(s)和ε到唯一的参数值θ。 因此,我们可以颠覆前一段的索赔:相对于固定价值
θ
,ε上的分布完全确定了θ的分布。 因此,借助于倒的功能模型,我们可以将正常分布转换为θ周围的值θ
θ
(s)。 这在参数θ上产生了所谓的基准概率分布。 获得分布,因为,在估计器的值,参数和随机术语上的条件变得完全相关。 然后将后者的分布自动适用于前者(CF.Haenni等,52-55和119-122)。
另一种解释相同的想法的方法调用枢轴量的概念。 由于如何设置上述统计模型,我们可以构建枢轴量
θ
(s)-θ。 我们知道该数量的分布,即正常和上述方差。 此外,该分布与样品无关,并将样品固定到S,因此固定值
θ
,唯一地确定参数值θ上的分布。 因此,基准参数允许我们基于观察到的样本来构建参数值上的概率分布。 每当我们可以构建如此或等效,每当我们可以将统计模型视为功能模型时,可以运行该论点。
这是一个警告在这里。 正如上述许多参考文献所示,基准论证是高度争议的。 数学结果是在那里,但对结果的正确解释仍然是为了讨论。 为了适当地理解精确的推理举措及其挥手概念的基础,考虑在解释置信区间使用基准概率将是有益的。 对此的正确理解需要首先阅读第3.1.2节。
回想一下,置信区间正被认为是指出估计的质量,通常被认识到。 95%的置信区间通常被误解为包含95%概率的真实值的参数值的范围,所谓的信件间隔:
p(θ∈[
θ
-δ,
θ
+δ])= 0.95。
这种解释与古典统计数据有所差异,但是将变得明显,它可以通过基准论证的应用来激励。 假设我们通过以下内容替换积分确定置信区间的尺寸δ:
∫
θ
(s)+δ
θ
(s)-δ
pθ(r
θ
(s))dθ= 0.95。
用文字,我们修复估算器
θ
(s)然后在pθ中整合在参数θ上(r
θ
(s)),而不是假设θ∞然后在rτ中集成参数τ。 果然可以计算这种积分。 但是什么可以确保我们可以将积分视为概率? 请注意,它运行在概率分布的连续范围内,并且在它站立时,没有理由认为术语pθ(r
θ
(s))在θ中加入适当的分布。
这里的假设是在功能模型的可逆性方面解释了,确保术语确实增加,并且表现良好的分布将表面。 我们可以以样本统计方式选择统计模型
θ
(s)和参数θ以正确的方式相关:相对于参数θ,我们在统计数据上发布
θ
,但是,通过相同的标记,我们有相对于这种统计数据的参数分布。 结果,概率函数pθ(r
θ
(s)+ε)在ε上,其中θ是固定的,可以转移到基准概率函数pθ+ε(r
θ
(s))在ε上,在哪里
θ
(s)是固定的。 功能pθ(r
θ
)参数θ是一个适当的概率函数,可以从该概率函数构造。
即便如此,尚不清楚为什么我们应该将这种分布作为我们信仰的适当表达,因此我们可能支持与它的信心间隔的认知解释。 所以辩论继续。 在最终的基准概率中可能最好理解为古典和贝叶斯统计看法之间的半路房屋。 古典统计量大的概率解释出来,因此,古典统计方法中出现的概率都被解释为事件的频率。 显然,通过基准论证产生的假设的概率分布不能以这种方式解释,因此对该分布的认知解释似乎是唯一的选择。 若干作者(例如,Dempster 1964)已经注意到,基准概率确实在贝叶斯视角下最有意义。 这是我们现在转身的看法。
4.贝叶斯统计
贝叶斯统计方法通常以推理的形式呈现。 推断从统计假设的所谓的先前概率分布运行,这表达了在收集数据之前假设的信仰程度,以在数据结合后表达信仰的后验概率分布。 通过概率理论的公理,从先前分布和所获得的数据的可能性来遵循后续分布,即获得数据的假设的可能性。 因此,贝叶斯方法采用数据来调制我们对指定统计假设集的态度,并且在这方面,它们与经典统计程序相同。 两种类型的统计数据都对归纳问题响应。 但是,虽然古典程序选择或消除来自这组假设的元素,但贝叶斯方法从集合上表达了数据的影响。 通过概率理论的形式主义,该后部通过前提和似然性完全决定。
贝叶斯统计数据的定义特征是它考虑了统计假设以及数据的概率分布。 它全心全意地拥抱了对概率的认可解释:假设的概率被解释为信仰程度,即作为认识性不确定性的表达。 贝叶斯统计的哲学涉及确定对这些输入组件的适当解释,以及概率本身的数学形式主义,最终旨在证明产出证明。 请注意,贝叶斯统计方法的一般模式是累计意义上的电感主义:在数据的影响下,我们向越来越多的关于假设的概率意见。 然而,在下文中,似乎贝叶斯方法也可能被理解为自然界中的扣除师。
4.1推理的基本模式
贝叶斯推论始终从统计模型开始,即,一组统计假设。 虽然推理的一般模式是相同的,但我们将模型与有限数量和分别的假设的连续体分别进行处理,并分别使用假设检测和估计进行平行。 博览会主要基于2002年新闻,豪信和厄尔巴赫2006,Gelman等,2013和Earman 1992。
4.1.1有限型号
贝叶斯方法中的核心是一种概率理论的定理,称为贝叶斯定理。 相对于假设的现有概率分布,以及每个假设的样本空间上的概率分布,它告诉我们假设的足够后概率是什么。 更确切地说,让S成为样本,并且s如前所述是样本空间,并设定m = {hθ:θ∈θ}是统计假设的空间,θ具有参数值的空间。 该功能P是整个空间M×S上的概率分布,这意味着每个元素Hθ与其自身的示例空间S相关联,以及它在该空间上的其自身概率分布。 对于后者,它完全由假设的可能性决定,我们在假设,P(S`Hθ)上写下样本条件的概率。 这与在古典统计的上下文中写入的表达pHθ的不同之处,因为与古典统计学家相比,贝叶斯人接受HΘ作为概率分布的参数。
首先在有限一组假设的背景下首先引入贝叶斯统计,之后提供了无限案例的概括。 假设hθ∈m上的先前概率p(hθ)。 进一步假设可能性p(s`hθ),即分配给假设Hθ的数据S条件的概率。 然后贝叶斯的定理决定了这一点
p(hθ|s)=
p(s|hθ)
p(s)
p(hθ)。
贝叶斯统计量输出后验概率分配,P(HΘBS)。 此表达式获得了在样本S已被记录的容纳后的HΘ的意见的解释,即,这是一个修订意见。 来自贝叶斯推理的进一步结果全部可以从统计假设上的后部分布中得出。 例如,我们可以使用后验来确定参数的最可能值,即,挑选p(hθss)最大的假设hθ。
在贝叶斯统计推理的这种表征中,数据P(s)的概率未预设,因为它可以通过总概率的定律从先前和可能性计算,
p(s)=
σ
θ∈θ
p(hθ)p(s|hθ)。
贝叶斯统计推断的结果并不总是被报告为后验概率。 往往仅在比较两个假设的后海后的比率。 我们拥有的贝叶斯定理
p(hθ|s)
p(hθ'|s)
=
p(hθ)p(s|hθ)
p(hθ')p(s|hθ')
,
如果我们假设相等的Priors p(hθ)= p(hθ'),我们可以使用假设的可能性与所谓的贝叶斯因子的比率进行比较假设。
这是茶叶品尝女士举例的贝叶斯过程。