逻辑和概率(一)
逻辑和概率理论是正式推理研究中的两个主要工具,并且在不同于哲学,人工智能,认知科学和数学等地区果树果实地应用。 本条目讨论了结合逻辑和概率理论的主要建议,并试图提供这种快速发展领域的各种方法的分类。
结合逻辑和概率理论
2.命题概率逻辑
2.1概率语义
2.2 adams概率逻辑
2.3进一步的概括
3.基本概率运营商
3.1不确定性的定性表示
3.2概率术语和产品
4.模态概率逻辑
4.1基本有限模式概率模型
4.2索引和解释
4.3概率空间
4.4结合定量和定性不确定性
4.5对定量和定性相互作用的约束
4.6动态
5.一阶概率逻辑
5.1一阶概率逻辑的示例
5.1.1量化超过一个变量
5.1.2条件概率
5.1.3概率按术语
5.2可能的世界一阶概率逻辑
5.3 Metalogic
参考书目
学术工具
其他互联网资源
相关条目
结合逻辑和概率理论
结合逻辑和概率的想法可能看起来很奇怪(Hájek2001)。 毕竟,逻辑涉及绝对某些真理和推论,而概率理论涉及不确定性。 此外,逻辑提供了一种有关推理的定性(结构)的视角(参数的演绎有效性基于参数的正式结构),而概率是大自然的定量(数值)。 然而,如下一部分所示,存在自然的感官,其中概率理论预先假定并扩展了古典逻辑。 此外,历史上讲,几个杰出的理论家,如de Morgan(1847),Boole(1854),Ramsey(1926),De Finetti(1937),Carnap(1950),Jeffrey(1992)和豪森(2003年,2007年,2009年)强调了逻辑和概率之间的紧密联系,甚至考虑了作为逻辑本身的一部分的概率的工作。
通过整合定性逻辑和数值概率理论的互补视角,概率逻辑能够提供高度表现力的推论。 因此,它应该不令人意外地应用于研究推理机制的所有领域,例如哲学,人工智能,认知科学和数学。 这种跨学科流行的缺点是不同的研究人员等术语,不同的,不等同的方式。 因此,在继续进行各种方法的实际讨论之前,我们将首先描绘该条目的主题。
最重要的区别是在概率逻辑和归纳逻辑之间。 经典上,据说一个论点是(减免)有效的话,如果A的房屋才是真的,那么它的结论是假的。 换句话说,演绎有效性达到真实保存:在有效的论点中,房屋的真实性保证了结论的真实性。 然而,在一些论点中,房屋的真实性并不能完全保证结论的真实性,但它仍然很有可能呈现。 一个典型的例子是附近的论点'我看到的第一个天鹅是白色的',......,'我看到的1000天天鹅是白色的',结论'所有天鹅都是白色的'。 这种参数在感应逻辑中研究,这是广泛使用概率概念,因此一些作者认为与概率逻辑相关。 关于感应逻辑与概率逻辑之间的确切关系存在一些讨论,总结了Kyburg(1994)的引入。 这里也通过的主导地位(由Adams和Levine(1975)等)的主导地位是,概率逻辑完全属于演绎逻辑,因此不应涉及归纳推理。 尽管如此,大多数关于电感逻辑的工作落在“概率保存”方法中,因此与第2节中讨论的系统密切相关。更多关于电感逻辑,读者可以咨询Jaynes(2003),Fitelson(2006),Romeijn(2011年),以及这种百科全书的归纳与归纳逻辑问题的条目。
我们还将通过对概率的确切性质来阐明哲学辩论。 这里讨论的正式系统与所有常见概率解释兼容,但显然,在具体的应用中,概率的某些解释比其他概率更自然地融合。 例如,第4节中讨论的模态概率逻辑是概率的中性,但是当它们用于描述转换系统的行为时,它们通常以客观方式解释它们的概率,而建模多代理方案是通过对概率的主观解释(作为信誉的代理人),伴随着最自然的。 本主题在吉利斯(2000),Eagle(2010)中详细介绍,以及对此百科全书概率的解释。
最近的文献的趋势一直在将逻辑和概率理论集成到一个统一的框架中的整合或结合,而是在两所学科之间建立桥梁。 这通常涉及试图以概率理论的定量术语或其他方式捕获逻辑的定性概念。 我们将无法在这个蓬勃发展的地区进行各种方法,但感兴趣的读者可以咨询Leitgeb(2013,2014),林和凯利(2012年,2012b),杜文和罗特(2018)和哈里森 - 教育师,Holliday和Icard(2016,2018)。 该地区的“当代经典”是Leitgeb(2017年),而Van Benthem(2017)提供了有用的调查和一些有趣的程序备注。
最后,尽管概率逻辑的成功主要是由于其各种应用程序,但我们不会有任何细节处理这些应用程序。 例如,我们不会评估使用概率作为信仰哲学(贝叶斯认识学)或人工智能(知识代表)的正式代表,以及它对替代表示的优点和缺点,例如广义概率论(适用于量子理论),P-ADIC概率和模糊逻辑。 有关这些主题的更多信息,读者可以咨询Gerla(1994),Vennekens等。 (2009),HARTMANN和HARTMANN(2010),HARTMANN和SPRENGER(2010),ilić-stepić等。 (2012年),以及关于信仰,贝叶斯认识论,难以理解的推理,量子逻辑和概率理论的正式表示的条目,以及这种百科全书的模糊逻辑。
在这些澄清到位,我们现在准备好看看该条目中将讨论的内容。 获得最常见的概率逻辑系统的最常见策略是以经典(命题/模态/等)开始逻辑系统,并通过向其添加概率特征来“概述”它。 有各种方式可以实现这种概率。 一个人可以研究古典语言的概率语义(没有任何明确的概率运算符),在这种情况下,后果关系本身都会获得概率的味道:演绎有效性成为“概率保存”,而不是“真实保存”。 将在第2节中讨论此方向。或者,可以将各种概率运算符添加到逻辑的语法中。 在第3节中,我们将讨论概率概率的概率运算符的初始示例。 模态概率运营商的全部表达竞争力将在第4节中探讨。最后,将在第5节中讨论带有一阶概率运营商的语言。
2.命题概率逻辑
在本节中,我们将介绍一系列概率逻辑系列,用于研究“概率保存”的问题(或双重,“不确定传播”)。 这些系统不会与任何概率运算符扩展语言,而是处理具有可计算的原子命题的“古典”命题语言L,以及通常的真实功能(布尔)连接。
主要思想是,有效论点的场所可能是不确定的,在这种情况下(演绎)有效性对(联合国)确定的条件没有条件。 例如,与房屋的争论'如果明天下雨,我会弄湿'明天会下雨',结论'我会弄湿'有效,但如果它的第二个前提是不确定的,其结论通常也是不确定的。 命题概率逻辑代表这种不确定因素作为概率,研究它们如何从房屋流出结论; 换句话说,他们没有学习真理保存,而是概率保存。 以下三个小节讨论了处理此问题越来越多的普通版本的系统。
2.1概率语义
我们首先回顾命题语言L的概率函数的概念。(在数学中,通常为给定的设定ω的子集的Σ-代数定义概率函数,并且需要满足可数性添加力; CF.第4.3节然而,在逻辑上下文中,通常更自然地定义逻辑对象语言的概率函数(Williamson 2002)。因为这种语言是合法的,其所有公式都有有限的长度 - 它还足以需要有限的增量。)a概率函数(对于l)是满足以下约束的函数p:l→r:
非消极。 P(φ)≥0对于所有φ∈l。
tautologies。 如果⊨φ,则p(φ)= 1。
有限的添加性。 如果⊨¬(φ∧ψ),则p(φ∨ψ)= p(φ)+ p(ψ)。
在第二和第三约束中,⊨符号表示经典命题逻辑中的(语义)有效性。 因此,概率函数的定义需要来自经典逻辑的概念,并且在这种尖叫概率理论中可以说是预先假定古典逻辑(ADAMS 1998,22)。 可以很容易地表明,如果P满足这些约束,则对于所有公式φ11的P(φ)∈[0,1],以及用于逻辑等效的所有公式φ,ψ∈l的p(φ)= p(n)即,这是⊨φ↔ψ)。
我们现在转向概率的语义,如Leblanc(1983年)所定义。 具有前提γ和结论的论证φ-hevenceforth表示为(γ,φ) - 据说是概率有效的,写入γ⊨pφ,如果且仅当:
对于所有概率函数P:L→R:
如果P(γ)= 1对于所有γ∈γ,则也是p(φ)= 1。
因此,概率语义替换了经典命题逻辑的估值v:l→{0,1}与概率函数p:l→r,在实际单元间隔中取值[0,1]。 因此,真实的真相值可以被视为单位间隔[0,1]的端点[0,1],同样地,估值v:l→{0,1}可以被视为退化概率函数p:l→[0,1]。 从这个意义上讲,经典逻辑是概率逻辑的特殊情况,或者等效地,概率逻辑是古典逻辑的扩展。
可以表明,经典命题逻辑(强烈)声音,并且相对于概率语义,完成:
γ⊨pφ,如果且仅在γ⊢φ。
一些作者将概率解释为广义真理值(Reichenbach 1949,Leblanc 1983)。 根据这种观点,概率逻辑只是一种特殊的许多值逻辑,并且概率有效性归结为“真实保存”:真理(即概率1)从房屋带到结论。 其他逻辑学家,如Tarski(1936)和Adams(1998,15)所指出的是,概率不能被视为广泛的真理值,因为概率函数不是'扩展'; 例如,P(φν)不能表示为p(φ)和p(ψ)的函数。 更多关于本主题的讨论,可以在海拉林(1984年)找到。
另一种可能性是将句子的概率解释为其(联合国)确定性的衡量标准。 例如,句子“琼斯此刻在西班牙时,可以有任何程度的确定性,从0(最大不确定性)到1(最大确定性)。 (请注意,0实际上是一种确定性,viz。关于虚假的确定性;但是,在此条目中,我们遵循亚当斯的术语(1998,31)并将0解释为最大的不确定性。)根据本解释,以下定理遵循概率语义的强大健全和完整性:
定理1.考虑阻止有效的参数(γ,φ)。 如果γ中的所有房屋具有概率1,则结论φ也具有概率1。
本定理可以被视为第一,非常部分地阐明概率保存(或不确定传播)的问题。 它说,如果没有任何不确定性的情况,那么就没有任何关于结论的不确定性。 在接下来的两个小节中,我们将考虑更有趣的情况,当房屋的非零性不确定性时,并询问它如何结束。
最后,应该注意的是,虽然这个小节仅讨论了经典命题逻辑的概率语义,但还有各种其他逻辑的概率语义,例如直观的命题逻辑(Van Fraassen 1981b,Morgan和Leblanc 1983),模态逻辑(Morgan 1982A,1982B,1983,Cross 1993),古典一阶逻辑(Leblanc 1979,1984,Van Fraassen 1981B),相关逻辑(范弗拉索1983年)和非单调逻辑(Pearl 1991)。 所有这些系统都共享一个关键功能:逻辑的语义是概率本质上的,但概率不是在对象语言中明确表示的概率; 因此,它们对这里讨论的命题概率逻辑比在后面的部分中呈现的系统中更接近。
大多数这些系统不是基于机会概率P(φ),而是在条件概率p(φ,ψ)上。 条件概率p(φ,ψ)作为原始(而不是被定义为p(φ∧ψ)/ p(ψ),通常完成)以避免P(ψ)= 0时出现问题。 Goosens(1979)根据条件概率的这种原始概念,概述了概率理论的各种公理化。
2.2 adams概率逻辑
在上一小节中,我们讨论了概率保存的第一个原则,这表示,如果所有房屋都有概率1,那么结论也有概率1.当然,当房屋小于绝对肯定时出现更有趣的情况。 考虑与房屋p∨q和P→Q的有效参数,结论Q(符号'→'表示真实条件材料条件)。 人们可以轻松展示
p(q)= p(p∨q)+ p(p→q)-1。
换句话说,如果我们知道参数的场所的概率,那么我们可以计算其结论的确切概率,从而提供对该特定参数的概率保存问题的完整答案(例如,如果p(p∨q)= 6/7和p(p→q)= 5/7,然后p(q)= 4/7)。 但是,考虑到房屋的概率,不可能计算结论的确切可能性; 相反,我们可以希望的最佳概率是(紧密)的上/或下限。 我们现在将讨论亚当斯(1998)方法来计算这些界限。
亚当斯的结果可以在不确定性而不是确定性(概率)方面更容易地说明。 给定概率函数p:l→[0,1],相应的不确定性函数被定义为
高达:l→[0,1]:φ↦up(φ):= 1-p(φ)。
如果从上下文中清楚概率函数p,我们经常只需写入U而不是向上。 在本小节的剩余部分(也在下一个)中,我们假设所有争论只有许多房屋(这不是一个显着的限制,因为古典命题逻辑的紧凑性财产)。 Adams的第一个主要结果是由Supples(1966)建立的,现在可以说明如下:
定理2.考虑有效的参数(γ,φ)和概率函数P.然后结论φ的不确定性不能超过γ∈γ的不确定性的总和。 正式:
u(φ)≤
σ
γ∈γ
u(γ)。
首先,请注意,本定理将定理1作为特殊情况:如果P(γ)= 1对于所有γ∈γ,则为U(γ)= 0对于所有γ∈γ,所以U(φ)≤σu(γ)= 0,因此p(φ)= 1。 此外,注意到结论的不确定性的上限取决于|γ|,即在房屋的数量上。 如果有效的论据具有少数房屋,每个场所只有一个小的不确定性(即高度确定性),那么其结论也将具有相当小的不确定性(即合理高度确定性)。 相反,如果有效的论据具有小的不确定性的场所,那么它的结论只能高度不确定,如果论证有大量的场所(这一逆向原则的着名插图是kyburg(1965)彩票悖论,这是在讨论的进入这个百科全书的认知悖论)。 要更具体地提出此事,请注意,如果有效的参数有三个房屋,每个都有不确定性1/11,那么添加一个也有不确定性1/11的前提不会影响参数的有效性,但它将提高结论的上限的不确定性从3/11到4/11 - 因此,结论比最初的情况更不确定。 最后,定理2提供的上限是最佳的,从此(在正确的条件下)结论的不确定性可以与其上限ΣU(γ)重合:
定理3.考虑有效的参数(γ,φ),并且假设前提集γ是一致的,并且每个前提γ∈γ是相关的(即γ-{γ}⊭φ)。 然后存在概率函数p:l→[0,1]这样
高达(φ)=
σ
γ∈γ
高达(γ)。
由定理2提供的上界也可用于定义有效性的概率概念。 据说参数(γ,φ)是亚当且概率有效的,写入γ⊨aφ,如果且仅当
对于所有概率函数P:L→R:上升(φ)≤σγ∈γup(γ)。
亚当斯 - 概率有效性在概率而不是不确定性方面具有替代,同等的表征。 该表征说(γ,φ)是adams-probibilisticy有效的,如果结论的概率可以任意接近1,如果房屋的概率足够高。 正式:γία\如果且仅当
对于所有ε>0,存在Δ>0,使得对于所有概率函数P:
如果P(γ)>1-δ为所有γ∈γ,则P(φ)> 1-ε。
可以表明,经典命题逻辑(强烈)声音,并对亚当斯的概率语义完整地完成:
γ⊨aφ,如果且仅在γ⊢φ。
亚当斯(1998,154)还定义了另一个逻辑,他的概率语义是声音和完整的。 但是,该系统涉及非真实功能的结缔组织(概率条件),因此落在本节的范围之外。 (有关条件的概率解释,读者可以咨询条件的条目和此百科全书的条件的逻辑。)
考虑以下示例。 具有前提P,Q,R,S和结论p∧(q∨r)的参数A有效。 假设p(p)= 10/11,p(q)= p(r)= 9/11和p(s)= 7/11。 然后定理2说
u(p∧(q∨r))≤
1
11
+
2
11
+
2
11
+
4
11
=
9
11
。
这个上限的结论的不确定性相当令人失望,它暴露了定理的主要弱点2.上限为什么这么高的原因之一,这是为了计算它,我们考虑了它的前提,这具有相当高的不确定性(4/11)。 然而,这个前提是无关紧要的,因此结论已经从其他三个场所遵循。 因此,我们可以将p∧(q∨r)视为有效参数A的结论,而且还为(同样有效)A'的结论,该参数a',其具有P,Q,r。 在后一种情况下,定理2产生1/11 + 2/11 + 2/11 = 5/11的上限,其已经低得多。
因此,定理2的弱点是考虑到无关或不确定的房屋的不确定性。 为了获得本定理的改进版本,需要更细粒度的“基本性”的概念。 在上面的例子中的参数A中,前提是S绝对无关紧要。 同样,前提P是绝对相关的,在没有这种前提的情况下,结论P�(q∨r)不再可衍生。 最后,前提下子集{q,r}'介于之间':一起q和r是相关的(如果两个场所都被遗漏,则结论不再衍生),但它们中的每一个可以省略(同时保持结论衍生)。
本质上的概念正式化如下:
基本前提集。 鉴于有效的参数(γ,φ),设定γ'ίγ是必需的IFFγ-γ'∞φ。
基本要素。 给定有效参数(γ,φ)和前提γ∈γ,γ的本质程度,写入e(γ),是1 / |sγ|,其中|Sγ| 是包含γ的最小基本前提集的基数。 如果γ不属于任何最小的必要前提,则γ的本质程度为0。