统计哲学(一)
1.统计和归纳
2.基础和解释
2.1物理概率和古典统计
2.2认知概率与统计理论
2.2.1的认知概率类型
2.2.2统计理论
3.古典统计
3.1古典统计的基础知识
3.1.1假设检测
3.1.2估计
3.2古典统计问题
3.2.1与信仰的界面
3.2.2证据的性质
3.2.3游览:可选停止
3.3对批评的回应
3.3.1证据强度
3.3.2理论发展
3.3.3游览:基准论证
4.贝叶斯统计
4.1推理的基本模式
4.1.1有限型号
4.1.2连续模型
4.2贝叶斯方法问题
4.2.1对假设概率的解释
4.2.2确定先前
4.3回应批评
4.3.1严格但经验上知情的主观主义
4.3.2游览:表示定理
4.3.3贝叶斯统计为逻辑
4.3.4游览:归纳逻辑和统计数据
4.3.5目标前锋
4.3.6绕过前锋
5.统计模型
5.1模型比较
5.1.1 Akaike的信息标准
5.1.2贝叶斯的模型评估
5.2没有模型的统计信息
5.2.1数据减少技术
5.2.2正式学习理论
6.相关主题
参考书目
学术工具
其他互联网资源
相关条目
1.统计和归纳
统计数据是一种数学和概念学科,专注于数据与假设之间的关系。 数据是在科学研究中的观察或事件的记录,例如,从人口中的一系列个体测量。 实际获得的数据是各种称为样本,样本数据或简单数据的数据,以及从研究中的所有可能的样本都被称为示例空间。 反过来,假设是关于科学研究的目标系统的一般陈述,例如,表达了对人口中所有人的一般事实。 统计假设是一般陈述,其可以通过样本空间的概率分布表示,即,它决定了每个可能的样本的概率。
统计方法提供了根据样品评估统计假设的数学和概念手段。 为此目的,方法采用概率理论,并顺便普遍。 评估可以确定一个假设是如何令人信的,无论我们是否可以依赖我们的决定,支持是如何对假设给出的,等等。 良好的统计介绍比比皆是(例如,Barnett 1999,情绪和Graybill 1974,按2002)。
设定舞台的一个例子,从Fisher(1935)中取出,会有所帮助。
茶品尝女士。
考虑一位要求她可以味道的女士确定牛奶和茶倒入杯中的顺序。 现在想象一下,我们为她准备了五杯茶,折腾了一枚公平的硬币来确定每杯牛奶和茶的顺序。 我们要求她发表命令,我们发现她在所有情况下都是正确的! 现在,如果她盲目地猜测订单,那么由于我们准备杯子的随机方式,她将正确地回答50%的时间。 这是我们的统计假设,称为零假设。 它给出了1/2到正确猜测的概率,因此将概率为1/2到不正确的概率。 样本空间由女士可能给出的所有答案组成,即,所有的正确和错误的猜测,但我们的实际数据位于此空间中相当特殊的角落。 在我们的统计假设的假设中,记录事件的概率仅为3%,或更准确地为1/25。 在此基础上,我们可能决定拒绝女士正在猜测的假设。
根据所谓的空假设试验,如果实际获得的数据包含在样本空间的特定区域中,则保证这种决定,其总概率不超过一些指定限度,标准设置为5%。 现在考虑刚刚概述的统计测试所取得的成果。 我们开始了对女士的实际茶品尝能力的假设,即她没有任何东西。 在这一假设的假设上,我们获得的样本数据结果表明是令人惊讶的或更精确,非常不可能的。 因此,我们决定这位女士没有欺骗品尝能力的假设可以被拒绝。 样本指出我们的负面,但是关于女士可以,或不能做什么的一般性结论。
因此,统计分析的基本模式从归纳推断熟悉:我们输入到目前为止所获得的数据,统计程序输出超越数据的判决或评估,即单独的数据不需要的声明。 如果数据确实被认为是唯一的输入,并且如果统计程序被理解为推理,则统计信息涉及放大推断:粗略地说,我们超出了我们所投入的更多。并且由于统计数据的放大推断涉及未来或总体的国家,他们是归纳的。 然而,对具有放大和归纳推理的统计数据的关联是有争议的,因为统计数据被认为是非推崇的,但其他一些(见第3节)和其他人的非放大(参见第4节)。
尽管存在此类分歧,但要介绍统计数据作为对归纳问题的回应(参见豪森2000以及归纳问题的情况)。 这个问题,首先由休谟在他的人性论文中讨论(预订I,第3部分,第6节),但是已经被古代怀疑论者如塞斯萨帝王性(见古代怀疑论),是对推论没有适当的理由从给定经验到对未来的期望。 转移到统计数据中,它读到了将数据视为投入的程序没有适当的理由,并返回判决,评估或与未来的其他一些建议,或者是一般的事务状态。 可以说,通过为统计提供的程序的基础提供基础,或者通过重新解释统计数据来逃避统计数据来应对这一挑战,这是关于应对这一挑战的哲学。
值得注意的是,统计的哲学家最终涉及精致,甚至是欧洲归纳的理由。 事实上,许多哲学家和科学家都接受了统计数据的稳定性,发现更重要的是,统计方法被理解和正确应用。 如此经常这种情况,基本哲学问题是催化剂:归纳指导我们对统计方法适用性的调查,正确性和条件的调查。 统计的哲学,理解为执行这些调查的普通标题,因此并不涉及短暂的问题,但对科学哲学造成了至关重要和具体的贡献,以及科学本身。
2.基础和解释
虽然有统计程序和推论的组织方式有很大的变化,但它们都同意使用现代措施理论概率理论(Kolmogorov)或近乎jation,因为表达假设并将其与数据相关联的手段。 本身,概率函数仅仅是一种特定的数学函数,用于表达集的测量(CF.Billingsley 1995)。
假设具有元素S的集合,并考虑W的初始集合,例如,Singleton集{S}。 现在考虑采取补充的操作
ˉ
r
给定集合R:补充
ˉ
r
完全包含在R中未包含的所有这些。接下来考虑GOINr∪q给定集R和Q:当它是R,Q或两者的成员时,元素S是r∪q的成员。 由补码和加入的操作生成的集合被称为代数,表示在统计中,我们将S作为样本的集合解释,我们可以将集R与特定事件或观察组织相关联。 特定示例S包括当s∈r时与R的事件的记录。 我们将像R这样的套装的代数作为对样品进行索赔的语言。
概率函数被定义为代数:函数的添加剂标准化测量
p:s→[0,1]
如果r∩q=ψ和p(w)= 1,则P(r∪q)= P(r)+ p(q)。 条件概率p(q`r)定义为
p(q|r)=
p(q∩r)
p(r)
,
每当p(r)>0时。 它确定集合R内的集合Q的相对大小。它通常被读取为鉴于事件R发生的事件Q的概率。 回想一下,集合R包括包括与R相关的事件的记录。通过查看P(q |r),我们在该Set R中的概率函数上放大,即,我们考虑发生相关事件的情况。
现在概率函数是什么意思? 概率的数学概念不提供答案。 功能p可以被解释为
物理,即频率或事态发生的频率或倾向,通常被称为机会,否则是
认知,即对事态状况发生的信仰程度,愿意对其假设,支持或确认等等。
这种区别不应该与客观和主观概率之间的混淆。 可以获得物理和认识概率,可以获得目标和主观特征,从而认为两者都可以被视为依赖或独立于知识主体和她的概念设备。 有关概率解释的更多详细信息,请读者邀请咨询Galavotti(2005),吉利斯(2000),Mellor(2005),Von Plato(1994),由Eagle(2010),Hajek和Hitchcock(即将举行),或者确实是对概率解释的进入。 在这种情况下,关键点是解释都可以连接到统计程序的基础程序。 虽然匹配不是精确的,但上述两种主要类型可以分别与统计,古典和贝叶斯统计的两个主要类型相关联。
2.1物理概率和古典统计
在科学中,概念,概率表达了物理状态,通常称为机会或随机过程,是最突出的。 它们是一系列事件中的相对频率,或者,它们是实现这些事件的系统中的趋势或拟合。 更确切地说,所连接到事件类型的属性的概率可以理解为该类型在该类型的一系列事件中的频率或趋势。 例如,硬币着陆头的概率在一系列类似的硬币掷骰子时,硬币落地一半的时间。 或者,如果迄今为止在硬币折腾的设置中存在可能结果的趋势,则概率是一半的。 Mathematician Venn(1888)和Quetelet和Maxwell等科学家(CF.Von Plato 1994)是这种观察概率的早期支持者。 哲学理论的职业理论是Peirce(1910年)创造的,并由Popper(1959),Mellor(1971),Bigelow(1977)和Giere(1976年)开发; 请参阅近期概述的手场(2012)。 作为频率首先由Von Mises(1981)设计的概率的严格理论,也由Reichenbach(1938)辩护,并在van Lambalgen(1987)中精心阐述。
物理概率的概念连接到统计方法的主要理论之一,这已被称为古典统计。 它是在20世纪上半叶大致发展的,主要由数学家和菲舍斯(1925,1935,1956),瓦尔德(1939年,1950年),奈曼和皮尔逊(1928,1933,1967年),并通过最近几十年的非常多种古典统计人来改装。 这种统计理论的关键特征自然地对准,观察概率作为物理机会,因此属于可观察和可重复的事件。 物理概率不能有意义地归因于统计假设,因为假设没有与它们来的趋势或频率,因为它们是分类的或虚假的,一次和全部。 归因于假设的概率似乎需要概率被认识到。
古典统计论往往称为频率,由于古典程序中的事件频率和常见的概率解释von mises开发的常见解释的突出。 在这种解释中,机会是频率,或在一类类似事件或物品中的比例。 它们是与其他物质相似的最佳思想,如质量和能量。 它应该强调在机会之前概念性地概念性地进行频率。 在倾向理论中,各个事件或物品的概率被视为自然界的趋势,使得频率或一类类似事件或物品中的比例作为大数字定律表现出来。 相比之下,在频繁的理论中,比例放下,确实定义了机会的目标。 这导致频率概率的核心问题,所谓的参考课程问题:尚不清楚与个别事件或项目关联的类(参见Reichenbach 1949,Hajek 2007)。 人们可能争辩说,该类需要尽可能狭窄,但在单例事件的极端情况下,当然的机会差异为零或一个。 由于古典统计数据在其程序中雇用了附加到单一案件的非琐碎概率,因此可以说是需要对参考课题问题的响应来实现对统计数据的完全频率。
为了说明物理概率,我们简要考虑在茶叶品尝女士的例子中的物理概率。
物理概率
我们表示,这位女士只是猜测的零假设。 说我们遵循上面示例中所示的规则:我们拒绝这个零假设,即,否认女士仅仅是猜测,只要采样的数据S包括在可能的样本的特定集合中,所以s∈r,并且R有一个求和根据空假设的概率为5%。 现在想象一下,我们应该判断一整套茶叶,散落在全国各地的茶室。 然后,通过运行实验并采用刚刚引用的规则,我们知道我们将归咎于特殊的茶品酒人才,以5%的那些女士们为真的假设是真实的,即,实际上只是猜测。 换句话说,该百分比属于特定事件集的物理概率,该规则与我们判断中的特定错误连接。
现在说,我们找到了一位女士,为我们拒绝了零假设,即,一位经过测试的女士。 她是否有茶品尝能力? 不幸的是,这不是可以通过手头的测试回答的问题。 一个很好的答案可能会涉及确实具有特殊茶叶在得分超过某个门槛的女士们的比例,即,在所有五个杯子上正确回答的人。 但是,除了通过测试的所有女士中,后一种比例,即零假设的女士们都是假的,与那些像这样的女士们在那些女士们那里的女士的比例不同。 它也将取决于在审查中拥有人口能力的女士的比例。 相比之下,测试仅涉及一组女士内部的比例为真,我们只能考虑特定事件的概率,假设事件以给定的方式分发。
2.2认知概率与统计理论
有一种替代方法,可以观看统计方法中出现的概率:它们可以被视为认知态度的表达。 我们再次面临几种相互关联的选择。 非常粗略地说,认知概率可以是Doxastic,决策或逻辑的。
2.2.1的认知概率类型
可以采取概率来表示非凡的态度,以至于他们指定了关于理想化的理性剂的数据和假设的意见。 然后概率表达了相信的强度或程度,例如关于下一次猜测茶叶女士的正确性。 它们也可以作为决策理论,即代理人更精细地代表的一部分,这决定了她对数据和假设的决策和行动的倾向。 在决策 - 理论代表中涉及与优惠且其他人一起具有夸张的态度。 在这种情况下,概率可以例如表示愿意打赌女士是正确的。 最后,概率可以作为逻辑。 更确切地说,可以将概率模型作为逻辑,即确定用于不确定推理的规范理想的正式表示。 根据后一个选项,数据和假设的概率值具有与演绎逻辑中真理值的作用相当的作用:它们用于确保有效推断的概念,而不携带数值指出任何心理突出的建议。
关于概率的认识意见在20世纪和20世纪上半叶的发展中发展,首先是De Morgan(1847年)和Boole(1854),后来的凯恩斯(1921),Ramsey(1926)和De Finetti(1937年),并通过决策理论家,哲学家和归纳逻辑学,如Carnap(1950),野蛮人(1962),Levi(1980)和Jeffrey(1992)。 这些在统计数据中的重要支持者是Jeffreys(1961),Edwards(1972),Lindley(1965),Good(1983),Jaynes(2003)以及最后一个贝叶斯哲学家和统计人员几十年(例如,Goldstein 2006,Kadane 2011,Berger 2006,Dawid 2004)。 所有这些都有一个观点,即在认知域的领域而不是物理,即不是世界模型的一部分的地方的概率,而且是模拟代表系统的手段。
上述分裂肯定没有完成,边缘处于模糊。 对于一个,在决策理论的帮助下,概率的十大概念主要以行为主义方式拼写出来。 许多人已经采用所谓的荷兰书论,以确保信仰程度,并表明它确实被数学概率理论捕获(CF.Jeffrey 1992)。 根据这样的论据,如果事件表现出来的投注合约的价格,押注合同的价格则给出了事件的发生程度。 然而,有这种行为主义者的替代方案占用概率为具有Doxastic态度,使用准确性或靠近真理。 其中大多数是De Finetti(1974)提出的参数的版本或扩展。 其他人已经开发了一种基于自然探索的公理方法,用于信仰程度(例如,COX 1961)。
此外,并且如上所述,在概率的十播概念内,我们可以进一步降低到主观和客观的口味态度。 客观的贬值概率的定义特征是它受到对某些客观事实或事态的需求的限制,或者通过进一步的合理标准校准。 相比之下,一个主观的Doxastic态度并不是以这种方式限制:从规范性的角度来看,只要它们符合概率公理即可,代理可以自由地相信。
2.2.2统计理论
对于目前的担忧,重要的一点是,这些认识概率微积分的每个认知解释都有自己的一组统计数据。 总的来说,认知概率最自然与贝叶斯统计数据相关,第二个主要理论的统计方法(2002年,Berger 2006,Gelman等,2013)。 贝叶斯统计数据的关键特征直接从认知解释中流动:根据这种解释,可以将概率分配给统计假设并将这种概率相关,理解为表达我们相信假设有多强烈的表达,对此事件。 贝叶斯统计数据使我们能够表达我们的认识到统计假设的态度,是IT逻辑,决策或Doxastic,在数据的影响下的变化。
为了说明贝叶斯统计数据概率的认知概念,我们短暂回到茶花典礼的例子。
认知概率
如在我们表示零假设之前,这位女士随机猜测h,使得分布pH给出了这位女士制造的任何猜测的概率。 替代性是那个女士表现得比公平的硬币更好。 更确切地说,我们可能规定分布pH'给出3/4的概率为正确的猜测。 首先,我们可能会发现它相当不可能让茶叶的女士具有特殊的茶花品种能力。 为了表达这一点,我们给出了她们的假设,这些能力只有她不具有能力的可能性的一半:p(h')= 1/3和p(h)= 2/3。 现在,将数学细节留到第4.1节,在收到她猜到所有五个杯子的数据后,我们对女士特殊能力的新信念不仅仅是逆转。 我们现在认为这是大概的四倍可能具有比她仅仅是一个随机猜测的特殊能力:P(H')= 243 /307≈4/ 5和P(H)≈1/ 5。
收回家庭消息是贝叶斯方法使我们能够在概率转让方面表达统计假设的认识态度,并以规范的方式对这种认知态度产生数据。
应该强调的是,贝叶斯统计不是概率的认识概念的唯一用户。 实际上,经常考虑对分配给统计假设的概率似乎是荒谬的。 但是,可以完全可以阅读事件的概率,或者样本空间中的元素,作为认识,完全独立于所使用的统计方法。 如下节进一步解释,古典统计的几种哲学发展雇用了认识概率,最符合的基准概率(Fisher 1955和1956;另见Seidenfeld 1992和Zabell 1992),可能主义(黑客1965年,Edwards 1972年,Royall 1997)和证据概率(Kyburg 1961),或者以其他方式将古典统计数据的程序连接到推理和支持。 在所有这些开发中,概率和功能在样本空间上被读取,即,作为证据强度,支持程度或类似的表达。