正式认识论(二)

当理论符合完美的证据时,怎么样? 如果我们认为适合H预测E,P(E`H),那么之前的分析很好地概括。 假设H强烈预测,但不能绝对确定:P(E`H)= 1-ε,用于一些少数ε。 我们再次应用贝叶斯定理:

p(h|e)= p(h)

1-ε

p(e)

这再次将P(h)乘以大于1的比率,所以P(e)不接近1.所以p(h`e)将大于p(h)。 当然,较大的ε得到,确认变得越弱,并使H然后预测E.

新颖的预测。 另一种真实的是,新颖的预测数量更多。 当一个理论预测我们不会以其他方式期望的东西时,如果预测被承载,特别强烈地确认。 例如,泊松派生的理论认为光是波浪,因为它预测了亮点应该出现在某些阴影的中心。 没有人曾经观察过这种明亮的斑点,使其成为一种新的预测。 当验证这些明亮斑点的存在时,它是波浪理论的福音。

再一次,我们的形式化对真实的辩护。 假设H在H预测E之前,因此P(E`H)= 1或几乎如此。 新的预测是P(e)低的预测,或者至少不是非常高的。 这是一个不期望的预测。 我们以前的分析暴露在这种情况下,我们将P(h)乘以贝叶斯定理中的大比率。 因此,P(H |e)显着大于P(H),使C(H,E)大。 因此,新颖的预测结果特别验证。

先验合理性。 最后的真实性:必须对理论的先验合理来称越理论的新证据。 也许这个理论本质上是难以置信的,被复制或重言地发布。 或者理论变得难以置信,因为它遭到了早期的证据。 或者理论已经很合理,优雅,与以前的证据完全合适。 无论如何,必须根据这些事先考虑来评估新的证据。

再一次,贝叶斯定理对这种真理进行了辩护。 通过将p(h)乘以因子p(e`h)/ p(e)来计算p(h`e)。 我们可以考虑因子p(e`h)/ p(e),因为捕获了证据计算h的程度(或反对它,如果p(e`h)/ p(e)小于1),我们将乘以以前的H,p(h),为了获得H新的,所有的事情,被认为是合理性的。 如果H已经难以置信,P(h)将低,并且这种乘法的结果将小于H已经粘合的结果,并且p(h)因此很高。

让我们暂停总结。 贝叶斯的定理不仅仅是一个有用的计算工具。 它还对确认的三种真实性进行了辩护,在一个方程中统一它们。 每个特鲁斯对应于贝叶斯定理中的一个术语:

p(e`h)对应于理论合理。 假设符合证据的越好,这笔数量越大。 由于该术语出现在贝叶斯定理中的分子中,因此更好的拟合意味着P(H蜂)的更大值。

p(e)对应于预测的新奇,或者缺乏它。 预测的新颖性越多,我们预期的越少是真的,因此较小的p(e)是。 由于该术语出现在贝叶斯定理的分母中,因此更多的新颖性意味着P(H蜂)的较大值。

p(h)对应于先前的合理性。 在发现E之前更合理的H是在E的情况下,这笔数量越大,因此更大的p(H蜂)是。

但是乌鸦悖论怎么样?

1.3定量确认和乌鸦悖论

回想一下乌鸦悖论:所有乌鸦都是黑色的假设是相当于所有非黑人都是非乌鸦的假设。 然而,后者似乎是每次发现非黑人,非乌鸦...红色衬衫,蓝色内裤等。然而,检查邻居晾衣绳的内容似乎并不是研究鸟类学假说的好方法。 (也不是治疗邻居的好方法。)

经典的定量解决方案源自Hosiasson-Lindenbaum (1940)。该方案认为,蓝色内裤的发现确实证实了“所有乌鸦都是黑色的”假设,但证实的程度之小以至于我们很容易忽略它。蓝色内裤怎么可能与“所有乌鸦都是黑色的”假设相关呢?通俗地说,这个想法是,一件最终被证明是蓝色内裤的物体,最终也可能是一只白色的乌鸦。当事实并非如此时,我们的假设就通过了某种弱检验。我们正式的确认理论是否能证实这种非正式的思路?答案是:“是的,但是……”。

“但是……”将对尼科德标准的命运至关重要(剧透:前景不容乐观)。但让我们先从“是”开始吧。

我们用一个定理来证明“是”:如果我们做出某些假设,发现一个物体不是黑色的乌鸦,¬R∧¬B,会略微提升“所有乌鸦都是黑色”这一假设的概率 H。定理如下(证明见技术附录):

定理(乌鸦定理)。如果 (i) p(¬R∣¬B) 非常高,且 (ii) p(¬B∣H)=p(¬B),那么 p(H∣¬R∧¬B) 略大于 p(H)。

第一个假设,即 p(¬R∣¬B) 非常高,似乎非常合理。考虑到世界上所有非乌鸦种类,给定物体不是乌鸦的概率相当高,尤其是当它不是黑色的时候。第二个假设是 p(¬B∣H)=p(¬B)。换句话说,假设所有乌鸦都是黑色的,并不会改变给定物体非黑色的概率。这个假设更具争议性(Vranas 2004)。如果所有乌鸦都是黑色的,那么一些原本可能是黑色的东西就不是黑色的,也就是乌鸦本身。在这种情况下,p(¬B∣H)<p(¬B) 不是应该这样吗?另一方面,也许所有乌鸦都是黑色的并不会减少宇宙中黑色物体的数量。也许这仅仅意味着其他种类的物体是黑色的概率略高一些。幸运的是,我们可以用不那么可疑的假设来替代 (ii)(Fitelson 2006;Fitelson and Hawthorne 2010;Rinard 2014)。但我们不能完全不做任何假设,这就引出了关于证实和概率的两个关键点。

第一点是 Nicod 标准失效。乌鸦定理中像 (i) 和 (ii) 这样的假设并不总是成立。事实上,在某些情况下,发现一只黑乌鸦反而会降低所有乌鸦都是黑色的概率。这怎么可能呢?诀窍在于想象这样一种情况:发现一只乌鸦本身对所有乌鸦都是黑色的假设来说是个坏消息。如果所有乌鸦都是黑色的唯一原因是它们的数量非常少,就会发生这种情况。那么偶然发现一只乌鸦就表明乌鸦数量很多,在这种情况下它们并非全是黑色的。Good (1967) 提供了以下具体的例子。假设只有两种可能性:

所有乌鸦都是黑色的,尽管乌鸦只有 100 只,而其他种类的乌鸦却有 100 万只。

1000 只乌鸦中有一只不是黑色的乌鸦,此外还有 100 万只其他种类的乌鸦。

在这种情况下,偶然遇到一只乌鸦对 ¬H 有利,因为 ¬H 使乌鸦的奇异性减少了十倍。乌鸦是黑色的这一点与 H 稍微吻合一些,但不足以抵消第一个效应:在 ¬H 上,黑色乌鸦并不罕见。这是与我们之前的“是”相辅相成的“但是……”。

。第二点具有深远的寓意:关于确证的断言的命运往往取决于我们对 p 的值所做的假设。尼科德标准在类似古德悖论的情况下失效,其中 p 赋予 p(R∧B∣H) 的值低于赋予 p(R∧B∣¬H) 的值。但在另一种情况相反的情况下,尼科德标准确实适用。同样,像标准标准那样对乌鸦悖论的诊断仅适用于对 p 的某些假设,例如乌鸦定理的假设 (i) 和 (ii)。仅凭概率公理通常不足以告诉我们何时适用Nicod标准,或者何时确认值是大是小,是正的还是负的。

1.4 先验问题

。最后一点是一个非常普遍、非常重要的现象。与一阶逻辑的公理一样,概率公理也相当弱(Howson and Urbach 1993;Christensen 2004)。除非H是重言式或矛盾式,否则公理只能告诉我们它的概率介于0和1之间。如果我们可以将H表示为两个逻辑上不相容的子假设H1和H2的析取,并且我们知道这些子假设的概率,那么第三个公理可以让我们计算p(H)=p(H1)+p(H2)。但这只是把问题倒退了一步,因为公理本身只告诉我们 p(H1) 和 p(H2) 本身必须介于 0 和 1 之间。

概率公理的这一弱点导致了著名的先验问题,即初始概率的来源问题。它们总是基于先前收集的证据吗?如果是这样,科学探究是如何开始的?如果它们不是基于先前的证据而是基于先验的,那么什么原则支配着这种先验推理?形式认识论者在这个问题上存在分歧。所谓的客观主义者认为概率公理是不完整的,需要用额外的公设来补充,以确定探究应该从哪些概率开始。(无差异原则 (PoI) 是这里的主要候选原则。参见关于概率解释的词条。)所谓的主观主义者则认为,不存在一个单一的、正确的概率函数 p 可以用来开始探究。不同的探究者可能从不同的 p 值开始,但这并不代表他们中的任何一个都比其他人更科学或更不理性。

在后面的章节中,先验问题将会多次出现,以说明其重要性和普遍性。

1.5 总结

我们已经看到,使用概率论将确证形式化可以得到一个在几个重要方面取得成功的解释:它证明了关于确证的几个不言而喻的事实,将这些不言而喻的事实统一在一个方程中,并且解决了一个经典悖论(更不用说我们没有讨论的其他悖论(Crupi and Tentori 2010))。

我们还看到,它提出了一个问题,即先验问题,形式认识论者在如何解决这个问题上存在分歧。还有其他一些问题我们没有探讨,最显著的是逻辑全知和旧证据问题(参见贝叶斯认识论条目的小节)。

这些问题以及其他问题引发了对其他科学推理方法以及一般推理方法的探索和发展。一些方法坚持概率框架,但在其中发展出不同的方法论(Fisher 1925;Neyman 和 Pearson 1928a,b;Royall 1997;Mayo 1996;Mayo 和 Spanos 2011;参见“统计哲学”条目)。另一些方法则背离了标准概率论,例如 Dempster-Shafer 理论(Shafer 1976;参见“信念的形式化表征”条目),它是概率论的一种变体,旨在解决先验问题并做出其他改进。排序理论(Spohn 1988, 2012;同样参见“信念的形式化表征”条目)也与概率论有相似之处,但它从条件句的可能世界语义学中汲取了许多灵感(参见“指示性条件句”条目)。引导理论(Glymour 1980;Douven 和 Meijs 2006)完全抛弃了概率框架,而是从我们最初基于演绎的方法中汲取灵感。还有一些方法发展了非单调逻辑(参见条目),这些逻辑不仅可以进行演绎推理,还可以进行可废止的归纳推理(Pollock 1995、2008;Horty 2012)。形式学习理论提供了一个框架,用于研究各种方法的长期后果。

。在接下来的两节中,我们将以这里介绍的概率方法为基础,因为它是目前最流行、最具影响力的形式认识论方法。但重要的是要记住,存在着丰富多样的替代方法,而且这种方法存在一些问题,我们很快就会遇到其中一些问题的后果。

2.第二案例研究:诱导问题

我们很多推理似乎涉及将观察到的模式投影到未观察到的实例上。 例如,假设我不知道我持有的硬币是否有偏见或公平。 如果我把它翻转9次,它每次都落在尾巴时,我会期待第10次折腾也有尾巴。 这类推理是什么证明的? 休谟争辩说,没有什么可以证明它。 在现代形式中,休谟的挑战基本上是这样的:这种推理的理由必须吸引归纳争论或演绎。 吸引归纳争论将是不可接受的通知。 虽然演绎论证必须表明未观察到的实例将类似于观察到的实例,这不是必要的真理,因此不通过任何有效参数来证明。 因此,没有参数可以证明将观察到的模式归功于未见的情况。 (Russell和Restall(2010)提供正式的发展。Haack(1976)讨论了在此感应和扣除之间的假定不对称。)

概率可以在这里救援吗? 如果不是致法那个未观察到的实例会类似于观察到的,我们只是推断出他们可能类似于观察到的实例? 如果我们可以从概率公理推断出下一个折腾可能会出现尾部,因为它到目前为止,它落在9次中的尾部有9次,这似乎可以解决休谟的问题。

不幸的是,不可能这样的扣除:概率公理根本不符合我们想要的结论。 那怎么样? 考虑所有不同的头部(h)和尾部(h)和尾部(t)我们可能会在10次掷骰子中获得:

hhhhhhhhhh

hhhhhhhhht

hhhhhhhhth

hhhhhhhhtt

hhhhhhhtht

ttttttttth

tttttttttt

有1024个可能的序列,因此每个可能序列的概率似乎是1/1024。 当然,其中只有两个连续9个尾巴,即最后两个尾部。 因此,一旦我们将事物缩小到9个尾部中的9个开始的序列,第10次折腾的尾部的概率为1/2,与头部相同。 更正式,应用定义条件概率给我们:

p(t10|t1 ... 9)=

p(t10∧t1... 9)

p(t1的... 9)

=

1/1024

2/1024

=

1

2

所以看起来概率的原理需要前9个抛出告诉我们关于第10次的折腾。

然而,事实上,概率的原理甚至不需要那个 - 它们实际上并没有说任何关于p(t10bt1 ... 9)。 在前一段中,我们假设每个可能的折叠序列同样可能,每个序列都是相同的p(...)= 1/1024。 但概率公理不需要这种“统一”分配。 当我们在遇到前锋(1.4)的问题时,概率公理只能告诉我们Tautologies具有概率1(和矛盾概率0)。 偶然的命题可以具有0至1的任何概率,这包括折叠序列将是Hhhhhhhtht的命题,或任何其他HS和Ts的序列。

如果我们使用Carnap(1950)主张的不同方案分配了现有概率,我们可以利用这种自由,并获得更明智的感应友好友好的结果。 假设而不是分配每个可能的序列相同的概率,我们分配每个可能的ts的ts相同的概率。 我们可以从0到10ts的任何地方,所以每个可能的TS都有概率1/11。 现在,只有一种方式来获得0 TS:

hhhhhhhhhh

所以p(h1 ... 10)= 1/11。 但有10种方式获得1 T:

hhhhhhhhht

hhhhhhhhth

hhhhhhhthh

thhhhhhhhh

因此,这种可能性1/11的概率分为10种方式,为每种贫化性产生概率1/110,例如p(hhhhhhhthh)= 1/110。 然后有45种方式获得2 TS:

hhhhhhhhtt

hhhhhhhtht

hhhhhhthht

tthhhhhhhh

因此,这里,1/11的概率分开45种方式,产生每种苯的1/495的概率,例如,p(hthhhhthh)= 1/495。 等等。

然后是p(t10bt1 ... 9)是什么?

p(t10|t1 ... 9)=

p(t10∧t1... 9)

p(t1的... 9)

=

p(t1的... 10)

p(t1的...10∨[t1的...9∧h10])

=

p(t1的... 10)

p(t1的... 10)+ p(t1的...9∧h10)

=

1/11

1/11 + 1/110

=

10

11

因此,当我们根据Carnap的两级方案分配现有概率时,我们会得到更合理的结果。 然而,该方案不是由概率的原理授权的。

这是教导我们的一件事是概率公理对休谟的问题保持沉默。 归纳推理与公理兼容,因为Carnap的构建方式的构建方式使得10th T T TS的初始字符串非常可能。 但是公理也与关于诱导的怀疑相容。 在构建先前概率的第一种方法中,无论字符串多长时间都有多长时间,一串TS永远不会让下一个折腾更有可能成为一个t串! 事实上,还有进一步的方法来构建产生“反诱导”的现有概率,在我们观察到的TS越多,下一个折腾的可能性越小就是为T.

我们也学到了其他事情,更具建设性的事情:休谟的问题是前锋问题的紧密表达。 如果我们能够证明Carnap的分配方式的概率,我们会很好地解决休谟的问题。 (为什么只在我们的路上?更多的那一刻,但非常简单地说:因为我们仍然必须使用条件概率作为我们的新的无条件概率指南。)我们可以证明Carnap的两级方案吗? 这将我们带来了正式认识论中的经典辩论。

2.1漠不关心的原则

如果你不得不在没有关于任何马匹的情况下赌骑马者,你会打赌哪一个? 这对你来说可能无关紧要:每匹马都可能像其他人一样赢得胜利,所以你会在可用的赌注之间漠不关心。 如果比赛中有3匹马,则每个人都有1/3的获胜机会; 如果有5个,每个都有1/5机会; 这种推理是常见的,并且通常归因于漠不关心的原则:[5]

漠不关心的原则(POI)

给予N互斥和共同详尽的可能性,其中任何一个都是通过可用证据对他人的青睐,每个概率为1 / n。

Poi起初看起来很合理,甚至可能有概念真理的味道。 如果证据不支持它,如何可能更可能更可能是可能的? 然而,POI面临着经典和顽皮的挑战。

考虑一下在比赛中列出的第一匹马,雅典娜。 有两种可能性,她将赢,她会失败。 我们的证据(或缺乏它)既不既不是可能的,所以POI表示她赢得的概率是1/2。 但是假设比赛中有三匹马:雅典娜,比阿特丽斯和塞西尔。 由于我们的证据涉及任何其他人,因此POI要求我们将概率分配1/3,这与我们之前的结论相矛盾,雅典娜的获胜可能性是1/2。

麻烦的来源是可以将可能性细分为进一步的子质量。 Athena失败的可能性可以细分为两个子组织,一个Beatrice赢得的一个,另一个塞西尔赢得了另一个。 由于我们缺乏任何相关证据,所以可用的证据似乎似乎有利于更精细的贫困能力造型的可能性,从而导致矛盾的概率任务。 我们需要的是,似乎是一种选择单一,特权划分可能性空间的方式,以便我们可以一致地应用POI。

认为我们应该使用更细粒度的可能性,在雅典娜,比阿特丽斯和塞西尔的案件中使用更精细的可能性。 但我们实际上可以进一步划分事情。 例如,雅典娜可能会赢得全长,半长度赢得一定的长度等。因此,她赢得的可能性实际上是无限的。 我们可以扩展POI以自然的方式处理这种无限分裂的可能性,如果雅典娜赢得,她将赢得1至2长度之间的概率是她将在1/2和1之间赢得的概率的两倍。 但我们试图解决的同样的问题仍然存在于臭名昭着的Bertrand Paradox(Bertrand 2007 [1888])的形式。

(本章完)

相关推荐