信念的形式化表征(一)
认识论者对支配信念体系结构和动态的规范感兴趣:个人信念必须如何连贯才能被视为理性;这些信念必须如何反映在决策中;以及它们应该如何适应新证据。形式认识论者通过构建信念体系的数学模型或“形式化表征”来探究这些问题,这些模型在某种意义上是认识论上的典范。广义上讲,这些模型捕捉到了一些关于理想理性主体如何管理其认知生活的重要信息。本条目概述了为此目的提出的形式化表征。
。
。信念有两种形式:一种是定性的(完整的),例如索菲亚相信维也纳是奥地利的首都;另一种是定量的(部分的),例如索菲亚相信维也纳是奥地利首都的信念在某种意义上比她相信维也纳比布达佩斯人口更多的信念更强烈。完全信念和部分信念之间的关系在形式认识论中引起了广泛关注,并产生了几种微妙、优雅但不幸的是不相容的解决方案。这些替代方案之间的争论是本条目的特别关注点,将在第 4 部分中介绍。
。
。1. 准备工作
。1.1 为什么要形式主义?
。1.2 信念的对象及其结构
。2. 完全信念的表示
。2.1 非单调逻辑
。2.2 AGM 信念修正
。2.3 认识论逻辑
。3. 部分信念的表示
。 3.1 主观概率理论
。3.2 不精确概率理论
。3.2 邓普斯特-谢弗理论
。3.3 可能性和似真性理论
。3.4 排序理论
。4. 完全信念和部分信念
。4.1 消除主义
。4.2 桥梁理论
。4.2.1 极值概率
。4.2.2 洛克阈值
。4.2.3 稳定性理论
。4.2.4 跟踪理论
。4.2.5 认知决策理论
。参考书目
。学术工具
。其他网络资源
。相关文章
。1. 前言
。1.1 为什么要形式主义?
。为什么要构建信念的形式化表征?在很大程度上,形式主义在认识论中的严谨性和回报与其他学科中一样。它要求我们精确地表述基本原理,反过来,它允许我们通过演绎证明或计算机模拟来证明它们的逻辑后果和联系。通常,这些后果和联系是意料之外的——有时甚至出乎意料地如此,以至于很难想象如果没有形式主义的帮助,它们是如何被发现的。如果一个看似吸引人的原理却得出了不吸引人的结论,那么很容易想象,如果没有如此清晰地证明,人们可能会试图回避或忽略它。或许最常见的悲剧是发现几个看似吸引人的原理相互矛盾,因此必须做出一些令人不快的牺牲。在经历了几次这样的经历之后,认识论者开始觉得形式化的表述可以避免模棱两可和自欺欺人,并促进进步和理解。
。
。当然,形式化的表述并非没有缺点。一旦采用形式化框架,某些问题和项目就会变得突出,而其他问题和项目则会退居次要地位。一些先前有趣的问题可能无法用新的形式主义来表达;业内人士可能会倾向于贬低这些问题,认为它们毫无意义或乏味。在最糟糕的情况下,这会使形式化工作变得肤浅,或回避重要问题。这些都是狭隘主义的陷阱。为了避免这些陷阱,回顾形式主义最初的动机有时会有所帮助。为此,框架的历史有时很有启发性。它也有助于在形式主义之外和之间转换:这种视角的转变可以对抗认识论中的狭隘主义,就像沉浸在新的语言或文化中往往会更广泛地对抗它一样。
。
。除了认识论之外,许多学科也适用上述情况。事实上,数学方法可以促进认识论特定问题的进展,就像它促进物理学或经济学特定问题的进展一样。过度信奉某种形式主义在物理学和经济学中存在陷阱,就像在认识论中一样。然而,如果我们就此止步,就无法充分理解数学方法在认识论中被赋予的独特抱负。
莱布尼茨梦想着一种普遍性特征——一种精确的理念演算,它可以通过计算来仲裁科学争议,并成为那些“在实验海洋中航行的人”的“指路明灯”(Leibniz 1679/1989)。上个世纪,“科学统一论”运动希望一种新的逻辑能够成为一种通用语言,用来统筹所有科学,并将它们的全部力量应用于当今的问题。但是,正如哥白尼体系和托勒密体系之间的冲突所表明的那样,精确地、数学地阐述两种理论并不足以裁定它们之间的争议。为此,人们投入了大量精力来开发一种微积分,用于计算证据的精确方位,从而在各种理论之间进行仲裁。这种微积分不仅被认为是哲学的福音,更是作为一种管理和协调科学联邦共和国的普通法则。本文涵盖的许多形式主义都可以追溯到一个雄心勃勃的项目,其雄心壮志可能令我们当代的想象力感到震惊。
。帕斯卡(约1658/2004)将新的概率微积分应用于极其个人化的信仰问题。事实上,许多认识论者并不特别关注科学探究者的规范,而是关注支配个人整个信仰体系的规范:他们的信仰必须如何协调才能合理;这些信仰必须如何反映在决策中;以及它们应该如何适应新证据。主观概率论及其伴随的理性决策理论是该项目最全面的当代表达;无论好坏,它都是当今实践理性的主导理论。我们将在第 3.1 节中介绍它。
。
。我们在这里援引我们杰出的前辈,主要是为了说明他们雄心壮志的远大目标,并希望他们的改良主义精神能够为本文所涵盖的材料注入活力。在数学细节中,人们很容易忘记形式认识论表达了这样一种希望,即理性可以有效地转向自身。如果这个项目失败了,我们就有可能阻碍或人为地限制人类理性的范围和力量。但如果它成功了呢?
。
。1.2 信念的对象
。接下来我们将看到几种关于信念结构的提议模型。这些提议中的大多数都将信念的对象视为命题或形式化语言中的句子。本节回顾了在形式语言中处理命题和句子所需的基本概念。如果读者觉得本节中的技术细节难以理解,可以暂时搁置,并在阅读过程中随时参考。习惯于使用这些对象的读者可以跳过本节。
。
。普遍的观点是,信念的对象是命题,而命题是可能世界的集合。但这些应该是什么呢?这是一个相当难的问题(参见关于可能世界的条目)。一种形象的观点认为,可能世界是对另一种现实的完整描述。挑选一个可能世界就是以一种小心避免矛盾的方式,明确指出某些可能现实中存在的每一个事实,而这些现实不一定是我们自己的。按照这种观点,所有可能世界的集合 W 就像一个巨大的图书馆,包含所有可能现实的完整历史。现实世界会挑选出与我们自身现实相对应的卷册。
将可能世界视为完全形而上学的可能性是不必要的,或许也毫无帮助。在这种极其精细的粒度层面上,每种可能性都指定了无数晦涩无趣的细节。但语境通常决定了哪些世界特征我们可以视为理所当然;哪些特征我们不确定但不愿如此;哪些特征我们并不感兴趣。例如,索菲亚可能对维也纳下一任市长的身份感兴趣,但她们是左撇子还是右撇子并不重要。就我们的目的而言,可能世界是对所有且仅对与语境相关的世界特征的完整规范。因此,集合 W 是所有与语境相关的认知可能性的集合。将可能性集合缩小到单个 w∈W,将完全解决正在讨论的一些有趣问题。命题 P⊆W 是一组可能世界,即它是对世界现状的部分规范。确定 P 为真,就是确定现实世界位于世界集合 {w:w∈P} 之中,因为 P 在可能世界 w 中为真,当且仅当 w∈P。
命题具有集合论结构。P 的相对补集 ¬P=W∖P 是所有 P 为假的世界的集合。如果 P、Q 是任意命题,则它们的交集 P∩Q 是所有 P 和 Q 同时为真的世界的集合。析取 P∪Q 是 P、Q 中至少有一个为真的世界的集合。实质条件 P→Q 是世界集合 ¬P∪Q,其中 P 为假,Q 为真。如果 P⊆Q,我们说 P 蕴涵 Q,并且 P 在逻辑上强于 Q。如果 P⊆Q 且 Q⊆P,我们写为 P≡Q,并称 P 和 Q 在逻辑上等价。重言式命题 W 在所有世界中为真,而矛盾命题空集 ∅ 在任何世界中都不为真。命题集 A 是一致的当且仅当存在一个世界,其中 A 的所有元素都为真,即如果 ∩A≠∅。否则,我们称 A 不一致。命题集 A 是互斥的当且仅当任何一个元素为真都意味着所有其他元素为假。A 的逻辑后果集,记为 Cn(A),为集合 {B⊆W:∩A 蕴涵 B}。注意,如果 A 不一致,则 Cn(A) 是 P(W),即 W 上所有命题的集合。
命题集 F 是一个域(有时是代数域),当且仅当 F 包含 W 并且它在交、并和补下封闭。也就是说,如果 A、B 都是 F 的元素,那么 W、A∪B、A∩B 和 ¬A 也是 F 的元素。命题集合 F 是一个 σ-域(有时也是 σ-代数),当且仅当它是一个在可数交集下封闭的域,也就是说,如果 S⊆F 是可数命题集合,那么它所有元素 ∩S 的交集也是 F 的元素。该定义意味着 σ-域也在可数并集下封闭。不难证明 σ-域的交集也是 σ-域。这意味着每个命题集合 F 都会通过与所有包含 F 的 σ-域集合相交来生成 σ(F),即包含 F 的最小 σ-域。
。
。命题虽然通常在语言中用句子表达,但它们本身并不是句子。这种区别通常表现为命题是语义对象,而句子是句法对象。语义对象(如命题)是有意义的,因为它们代表了有意义的可能性,而语法部分必须经过“解释”才能变得有意义。用一句口号来说:句子具有潜在意义,而命题本身就有意义。
。
。就我们的目的而言,语言 L 是指它包含的所有语法句子的集合。句子将用小写希腊字母 α、β、… 表示。假设语言 L 包含一组原子句子 α、β、…,这些句子并非由任何其他句子构成,也包含所有由原子句子与命题逻辑中的真值函项连接词组合而生成的句子。换句话说:如果 α,β 是 L 中的句子,则 ¬α、α∨β、α∧β、α→β 和 α↔β 也是 L 中的句子。它们分别可以读作“非 α”、“α 或 β”、“α 和 β”、“如果 α,则 β”和“α当且仅当 β”。符号 ⊥(发音为“falsum”)表示任意矛盾(例如 α∧¬α),符号 ⊤(发音为“top”)表示任意重言式。
。
。L 中的一些句子“逻辑上”可以推断出其他句子。例如,根据真值函项连接词的预期解释,α 从句子 α∧β 得出,也从句子集 {β,β→α} 得出。为了抓住演绎结果的本质,我们引入了一个结果关系 ⊢,只要 β 是 α 的演绎结果,它就在任意两个句子 α⊢β 之间成立。假设结果运算符满足以下属性,这些属性抽象了演绎逻辑的特征:
。
。α⊢α;
。α⊢γ,意味着 α∧β⊢γ;
。α⊢β 和 α∧β⊢γ 意味着 α⊢γ。
。
。反身性仅仅表达了任何句子 α 都是其自身的演绎结果这一简单性。单调性表达了这样一个事实,即在演绎论证中添加更多前提可以让你得出与使用更少前提时相同的所有结论。Cut 粗略地说,演绎结论与其前提处于同等的认识论基础之上:推导过程变长不会失去信心。综上所述,这些原则意味着“后果的后果就是后果”,即 α⊢β 和 β⊢γ 蕴涵 α⊢γ。
。我们将所有 β 的集合写为 Cn(α),使得 α⊢β。如果 Δ 是有限句子集,我们将 Cn(∧α∈Δα) 写为 Cn(Δ),Cn(∧α∈Δα) 是 Δ 中所有句子合取的所有演绎后果的集合。如果 Δ 是无限句子集,则定义 Cn(Δ) 会稍微复杂一些,因为 Δ 中所有句子的无限合取不是形式语言的句子。为了避免无限合取,令 α1,α2,… 为 Δ 中句子的枚举,令 βi=⋀j≤iαj,为枚举中前 i 个句子的合取。最后,令 Cn(Δ)=∪
∞
i=1
。 Cn(βi)。有时用后果算子 Cn(⋅) 来表述原理会很方便。例如,我们假设演绎后果关系满足以下附加性质。
β∈Cn(Δ∪{α}) 意味着 (α→β)∈Cn(Δ)。
演绎定理表达了这样一个事实:你可以通过假设 α 然后推导出 β 来证明条件句 α→β。不出所料,可以证明此性质适用于我们遇到的大多数演绎逻辑,包括命题逻辑和一阶逻辑。
每种形式语言 L 都会以规范的方式生成一组可能世界。L 的模型会为 L 中的每个句子分配真值,方法是首先为每个原子句子分配真值,然后根据连接词的预期含义为所有其他句子分配真值。我们将 L 的所有模型集合写为 ModL。因此,每种语言 L 都会在 L 的所有模型集合上诱导一个有限域 A。A 是 ModL 上命题的集合,这些命题由 L 中的句子表达。反过来,A 又诱导一个包含 A 的唯一最小 σ 域 σ(A)。
。
。一旦我们有了可能性集合 W 和上下文中的形式语言 L,就有了一种标准的系统方法将它们连接起来。估值函数 V 将 L 中的每个原子句子 α 映射到命题 V(α)⊆W,即在原子的该解释下 α 为真的世界集合。例如,如果 W=ModL,则原子将精确映射到它们为真的模型。估值函数还会以尊重逻辑连接词预期含义的方式解释非原子句子,即 V(⊤)=W、V(¬α)=W∖V(α) 和 V(α∧β)=V(α)∩V(β)。以这种方式,L 中的每个句子都映射到一组可能世界。
。
。如果对于所有估值 V,V(α)⊆V(β),则我们记为 α⊨β。那么,α⊨β 表达了这样一个事实:无论 L 的非逻辑词汇如何解释,β 在 α 中所有句子都为真的所有世界中都为真。我们说 α 有效当且仅当 {⊤}⊨α,即如果对于所有估值函数 W⊆V(α)。那么,α 有效当且仅当 α 在所有可能世界中都为真,无论非逻辑词汇如何解释。例如,句子 α∨¬α 是有效的。
我们假设我们的演绎结果关系具有以下性质。
如果 α⊢β,则 α⊨β。
健全性表明,如果句子 β 是 α 的可推导结果,那么无论 L 的非逻辑词汇如何解释,β 在 α 为真的所有世界中都为真。也就是说,从真的前提出发,我们的结果关系总是得出真的结论。健全性还意味着每个定理都是有效的。健全性是任何演绎结果关系的基本要求,并说明了演绎证明和语义蕴涵之间的预期联系。
从某种意义上说,句子能够表达命题无法表达的区别。例如,两个句子 p 和 ¬¬p 显然不同。但如果 p 和 q 可证明等价,即 ⊢p↔q,则 {p}⊢q 和 {q}⊢p。根据合理性,{p}⊨q 和 {q}⊨p。因此,对于任何估值函数,V(p)=V(q)。所以 p 和 q 必须表达相同的命题。当然,不知道等价关系的主体可能会相信 p 而不相信 q。更糟糕的是,每个使得 ⊢p 的句子 p 都必须表达重言式命题 W。当然,普通主体并不总是能识别命题逻辑的定理。因此,一些人认为,句子而不是命题才是合适的信念对象。然而,我们将要研究的大多数模型都要求理性主体对逻辑上等价的句子采取相同的信念态度。这是一个非常严格的要求,相当于假设每个理性主体在逻辑上都是全知的,也就是说,她认为所有逻辑蕴涵都是完全透明的。只要情况确实如此,将信念对象视为句子或命题之间就没有显著差异。然而,关于如何放宽逻辑全知要求的想法,请参阅 Hacking (1967)、Garber (1983) 和 Pettigrew (即将出版)。还有一些人并不满足于句子或命题。Perry (1979)、Lewis (1979) 和 Stalnaker (1981) 认为,为了捕捉本质上指示性的信念——本质上涉及诸如“我”、“这里”或“现在”等指示词的信念——信念对象必须是中心命题。我们在此不讨论这个有益的建议,但有关中心命题的更多信息,请参阅 Ninan (2019) 或 Liao (2012)。