即使那样,尚不清楚为什么我们应该以这种分布作为我们信仰的适当表达,以便我们可以支持对置信区间的认知解释。因此,辩论仍在继续。最终,最好将基准的概率理解为古典和贝叶斯对统计的观点之间的中途房屋。经典统计数据是从概率的常见主义解释中得出的,因此,经典统计方法中出现的概率都被解释为事件的频率。显然,不能以这种方式解释由基准论点产生的假设的概率分布,因此对该分布的认知解释似乎是唯一的选择。几位作者(例如Dempster 1964)指出,从贝叶斯的角度来看,基金的概率确实是最有意义的。从这个角度来看,我们现在转向。
4. 贝叶斯统计
贝叶斯统计方法通常以推理的形式提出。该推论是从统计假设上所谓的先前概率分布进行的,该假设表达了在收集数据之前对假设的信念程度,即对假设的后验概率分布,该假设表达了在数据纳入数据后的信念。后验分布通过概率理论的公理,从先前的分布和可能获得的数据的假设的可能性,即假设分配给数据的概率。因此,贝叶斯方法采用数据来调节我们对指定的统计假设集的态度,在这方面,它们的实现与经典统计程序相同。
两种类型的统计数据都回答了归纳问题。但是,经典程序从假设集中选择或消除元素,而贝叶斯方法则以后验概率分配的形式表达数据对该组的影响。这个后验完全由先验和假设的可能性通过概率论的形式决定。
贝叶斯统计的定义特征是它考虑统计假设和数据的概率分布。它全心全意地拥抱概率的认知解释:假设的概率被解释为信念程度,即认知不确定性的表达。贝叶斯统计的哲学涉及确定这些输入分量以及概率本身的数学形式主义的适当解释,最终目的是证明输出的合理性。请注意,贝叶斯统计方法的一般模式是累积意义上的归纳主义:在数据的影响下,我们转向关于假设的越来越多的明智的概率观点。然而,在下文中,贝叶斯方法本质上也可以被理解为演绎主义方法。
4.1 推理的基本模式
贝叶斯推理总是从统计模型开始,即一组统计假设。虽然推理的一般模式是相同的,但我们分别处理具有有限数量和连续假设的模型,并分别与假设检验和估计进行比较。该阐述主要基于 Press 2002、Howson 和 Urbach 2006、Gelman 等人 2013 以及 Earman 1992。
4.1.1 有限模型
贝叶斯方法的核心是概率论中的一个定理,称为贝叶斯定理。相对于假设的先验概率分布以及每个假设的样本空间的概率分布,它告诉我们假设的充分后验概率是多少。更准确地说,让
s
是样本并且
S
是像以前一样的样本空间,并让
中号
=
{
小时
θ
:
θ
ε
θ
}
是统计假设的空间,其中
θ
参数值的空间。功能
磷
是整个空间的概率分布
中号
×
S
,意味着每个元素
小时
θ
与自己的样本空间相关联
S
,以及它自己在该空间上的概率分布。对于后者,它完全由假设的可能性决定,我们写下以假设为条件的样本概率,
磷
(
s
∣
小时
θ
)
。这与表达不同
磷
小时
θ
(
s
)
,在经典统计学的背景下编写,因为与经典统计学家相比,贝叶斯主义者接受
小时
θ
作为概率分布的参数。
贝叶斯统计首先在有限假设集的背景下引入,然后提供对无限情况的推广。假设先验概率
磷
(
小时
θ
)
超过假设
小时
θ
ε
中号
。进一步假设可能性
磷
(
s
∣
小时
θ
)
,即分配给数据的概率
s
以假设为条件
小时
θ
。那么贝叶斯定理决定了
磷
(
小时
θ
∣
s
)
=
磷
(
s
∣
小时
θ
)
磷
(
s
)
磷
(
小时
θ
)
。
贝叶斯统计输出后验概率分配,
磷
(
小时
θ
∣
s
)
。 这个表达得到了有关意见的解释
小时
θ
样品后
s
已记录采纳,即为修订意见。贝叶斯推断的进一步结果都可以从统计假设的后验分布中得出。例如,我们可以使用后验来确定参数的最可能值,即选择假设
小时
θ
为了
磷
(
小时
θ
∣
s
)
是最大的。
在贝叶斯统计推断的特征中,数据的概率
磷
(
s
)
不是预先假设的,因为它可以根据总概率定律从先验和可能性计算,
磷
(
s
)
=
Σ
θ
ε
θ
磷
(
小时
θ
)
磷
(
s
∣
小时
θ
)
。
贝叶斯统计推断的结果并不总是报告为后验概率。通常,人们的兴趣只是比较两个假设的后验概率之比。根据贝叶斯定理我们有
磷
(
小时
θ
∣
s
)
磷
(
小时
θ
′
∣
s
)
=
磷
(
小时
θ
)
磷
(
s
∣
小时
θ
)
磷
(
小时
θ
′
)
磷
(
s
∣
小时
θ
′
)
,
如果我们假设先验相等
磷
(
小时
θ
)
=
磷
(
小时
θ
′
)
,我们可以使用假设的似然比,即所谓的贝叶斯因子,来比较假设。
这是一个以品茶女士为例的贝叶斯程序。
贝叶斯统计分析
考虑假设
小时
1
/
2
和
小时
3
/
4
,在前面被用作无效和替代,
小时
和
小时
′
我们不是根据数据在它们之间进行选择,而是对它们分配先验分布,以便零值的概率是替代值的两倍:
磷
(
小时
1
/
2
)
=
2
/
3
和
磷
(
小时
3
/
4
)
=
1
/
3
。 表示特定的猜测顺序
n
5 个杯子正确搭配
s
n
/
5
,我们有那个
磷
(
s
n
/
5
∣
小时
1
/
2
)
=
1
/
2
5
依靠
磷
(
s
n
/
5
∣
小时
3
/
4
)
=
3
n
/
4
5
。 和之前一样,五个猜测的似然比就变成了
磷
(
s
n
/
5
∣
小时
3
/
4
)
磷
(
s
n
/
5
∣
小时
1
/
2
)
=
3
n
2
5
。
5次正确猜测后的后验比是
磷
(
小时
3
/
4
∣
s
n
/
5
)
磷
(
小时
1
/
2
∣
s
n
/
5
)
=
3
5
2
5
1
2
≈
4
。
该后验仅由概率论公理,特别是贝叶斯定理导出。它告诉我们将样本数据纳入我们的信念后,每个假设的可信度如何。
请注意,在上面的阐述中,后验概率写为
磷
(
小时
θ
∣
s
n
/
5
)
一些贝叶斯推理的阐述更喜欢将修正意见表达为新的概率函数
磷
′
(
⋅
)
,然后等于旧的
磷
(
⋅
∣
s
)
对于贝叶斯推理的基本形式工作来说,这种区别是无关紧要的。但我们将在 4.3.3 节中再次讨论它。
4.1.2 连续模型
在许多应用中,模型不是一组有限的假设,而是由实值参数标记的连续体。这导致假设和可能性的分布定义发生一些微妙的变化。先验和后验必须写成所谓的概率密度函数,
磷
(
小时
θ
)
d
θ
。 似然性需要通过一个极限过程来定义:概率
磷
(
小时
θ
)
无限小以至于我们无法定义
磷
(
s
∣
小时
θ
)
以正常方式。但除此之外,贝叶斯机制的工作原理完全相同:
磷
(
小时
θ
∣
s
)
d
θ
=
磷
(
s
∣
小时
θ
)
磷
(
s
)
磷
(
小时
θ
)
d
θ
。
最后,求和需要用积分代替:
磷
(
s
)
=
∫
θ
ε
θ
磷
(
小时
θ
)
磷
(
s
∣
小时
θ
)
d
θ
。
该表达式通常称为模型的边际似然:它表示数据在整个模型中的概率有多大。
后验概率密度为人们可以从样本中得出的结论提供了基础
s
,并且类似于估计和估计准确性的测量。首先,我们可以得出参数的期望
θ
,我们假设
θ
连续变化:
 ̄
θ
=
∫
θ
θ
磷
(
小时
θ
∣
s
)
d
θ
。
如果模型由凸集参数化(通常是这样),那么就会有一个假设
小时
 ̄
θ
在模型中。这个假设可以作为贝叶斯估计。与置信区间类似,我们还可以根据后验概率分布定义所谓的可信区间或可信区间:大小的区间
2
d
围绕期望值
 ̄
θ
,写成
[
 ̄
θ
-
d
,
 ̄
θ
+
d
]
,使得
∫
 ̄
θ
+
d
 ̄
θ
-
d
磷
(
小时
θ
∣
s
)
d
θ
=
1
-
ε
。
该值范围为
θ
使得对应的后验概率
小时
θ
总计为
1
-
ε
总后验概率。
还有许多其他方法可以定义贝叶斯估计和可信区间
θ
基于后验密度。贝叶斯分析提供的具体估计类型可以根据科学家的需求来确定。由于可能性在贝叶斯形式主义中的核心作用,任何贝叶斯估计在某种程度上都类似于最大似然估计。然而,输出也将取决于假设的先验概率,一般来说,当样本量趋于无穷大时,它只会趋向于最大似然估计。有关这种所谓的先验“清洗”的更多信息,请参见第 4.2.2 节。
4.2 贝叶斯方法的问题
关于贝叶斯方法的大多数争议都涉及假设的概率分配。一组重要的问题围绕着将这些概率解释为信念、与行动意愿等相关的解释。另一组问题涉及先验概率分配的确定以及可能控制它的标准。
4.2.1 假设概率的解释
这里的总体问题是我们应该如何理解分配给统计假设的概率。自然地,解释将是认知性的:概率表达了对假设的信念的强度。尝试物理解释没有什么意义,因为该假设不能被视为可重复的事件,或可能有某种发生趋势的事件。
这就留下了对概率分配作为信念强度的几种解释。一种对概率作为信念程度的非常有影响力的解释将概率与对某些赔率下注的意愿联系起来(参见 Ramsey 1926、De Finetti 1937/1964、Earman 1992、Jeffrey 1992、Howson 2000)。根据这种解释,分配一个概率
3
/
4
例如,对于一个命题,意味着我们准备为一份投注合同支付最多 0.75 美元,如果该命题为真,则支付 1 美元,如果该命题为假,则该合同将变得毫无价值。所谓的荷兰书论证支持了概率分配中正确表达信念程度的主张:如果代理人不遵守概率论公理,恶意博彩公司可以提出一组看似公平的赌注但这会导致一定的金钱损失,因此被称为荷兰人,大概是由于荷兰人的商业声誉。这种解释将信念与其行为后果直接联系起来:相信某事与愿意参与特定活动(例如打赌)相同。
这种对假设的概率分配的解释存在几个问题。一方面,押注于统计假设的真实性似乎没有什么意义,因为此类假设无法被证伪或验证。因此,他们的投注合同永远不会兑现。更一般地说,目前尚不清楚关于统计假设的信念是否通过以这种方式将其与行为联系起来而得到正确的构建。有人认为(例如 Armendt 1993),这种构建概率分配的方式引入了对信念的务实考虑,与成功驾驭世界有关,进入一个更关心信念本身作为世界的真实表征的环境。
一个有些不同的问题是,贝叶斯形式主义,特别是它对统计假设的概率分配的使用,表明贝叶斯统计学家的思想非常封闭。回想一下前面的例子,模型
中号
=
{
小时
1
/
2
,
小时
3
/
4
}
贝叶斯形式主义要求我们为这两个假设分配一个概率分布,并且进一步模型的概率为
磷
(
中号
)
=
1
即使对于一个理想理性的代理人来说,这是一个相当强的假设,即她确实配备了一个实值函数来表达她对假设的看法。此外,假设的概率分配似乎意味着贝叶斯统计学家确信模型中包含真实的假设。这是贝叶斯统计学家在分析开始时必须承认的过分强烈的主张。它与广泛共享的方法论见解(例如,Popper 1934/1956)格格不入,根据该见解,科学理论必须随时接受修订(参见 Mayo 1996)。在这方面,贝叶斯统计并没有公正地对待科学探究的本质,至少看起来是这样。
刚刚概述的问题在贝叶斯主义者期望得到良好校准的问题中获得了数学上更复杂的形式。 Dawid (1982) 提出的这个问题涉及贝叶斯预报员,例如确定第二天降水的每日概率的天气预报员。然后表明,这样的气象员相信自己,从长远来看,他将以概率 1 收敛到正确的概率。然而,假设气象员意识到他的气象模型可能有问题,因此设置他正确预测的概率低于 1。因此,天气预报员的信念变得不连贯。贝叶斯统计分析似乎提出了不切实际的要求,即使对理想的智能体也是如此。
数学联邦政治世界观提示您:看后求收藏(笔尖小说网http://www.bjxsw.cc),接着再看更方便。