逻辑和概率(二)
通过这些定义,可以建立一个精致版的定理版本:
定理4.考虑有效的参数(γ,φ)。 然后,结论φ的不确定性不能超过地质γ∈γ的不确定性的加权之和,其基本程度为重量。 正式:
u(φ)≤
σ
γ∈γ
e(γ)u(γ)。
定理4的证据比定理2的证据更困难2:定理2只需要基本概率理论,而使用来自线性编程的方法(Adams和Levine 1975; Goldman和Tucker 1956)证明了定理4。 定理4将定理2作为一个特殊情况:如果所有房屋都是相关的(即具有基本度1的程度,那么定理4产生与定理的相同的上限2.此外,定理4不考虑无关的房屋(即,有基本度的场所0)来计算这个上限; 因此,如果对论证的有效性无关,那么其不确定性将不会结束。 最后,注意因为所有γ∈γ的e(γ)∈[0,1],它保持该
σ
γ∈γ
e(γ)u(γ)≤
σ
γ∈γ
u(γ),
即,定理4通常比定理2更紧密的上限2.为了说明这一点,再次考虑与房屋P,Q,R,S和结论p∧(q∨r)的参数。 召回p(p)= 10/11,p(q)= p(r)= 9/11和p(s)= 7/11。 可以计算房屋的本质程度:e(p)= 1,e(q)= e(r)= 1/2和e(s)= 0。 因此,定理4产生
u(p∧(q∨r))≤
(1×
1
11
)+(
1
2
×
2
11
)+(
1
2
×
2
11
)+(0×
4
11
)=
3
11
,
这是p∧(q∨r)不确定度的更紧长的上限,而不是通过定理2(viz。9/11和5/11)的任何界限。
2.3进一步的概括
鉴于有效参数的房屋的不确定性(和基本程度),亚当斯定理允许我们计算结论不确定性的上限。 当然,这些结果也可以以概率而非不确定性表达; 然后,它们产生了较低的结论概率。 例如,当在概率而不是不确定性方面表达时,定理4看起来如下:
p(φ)≥1-
σ
γ∈γ
e(γ)(1-p(γ))。
亚当斯的结果至少有两种方式限制:
它们仅为结论的可能性提供较低的界限(鉴于场所的概率)。 在某种意义上,这是最重要的界限:它代表了“最坏情况”中的结论在实际应用中可能是有用的信息。 然而,在某些应用中,它也可能是具有结论概率的上限。 例如,如果一个人知道这种概率具有0.4的上限,则可以决定避免某些动作(如果这个上限为(已知为)0.9)。
他们认为房屋的确切概率是已知的。 然而,在实际应用中,可能只有关于前提γ的概率的部分信息:其确切值是不知道的,但是已知具有下限A和上限B(Walley 1991)。 在这种应用中,在房屋的概率的上限和下限的结论的概率下计算(最佳)降低和上限是有用的。
海宾(1965年,1984年,1986,1996)和Nilsson(1986)使用线性规划的方法来表明可以克服这两个限制。 他们最重要的结果是:
定理5.考虑一个参数(γ,φ),具有|γ| = n。 存在函数Lγ,φ:R2N→R和Uγ,φ:R2N→R,使得对于任何概率函数p,以下保持:如果ai≤p(γi)≤bi为1≤i≤n,则:
Lγ,φ(a1,...,a,b1,...,bn)≤p(φ)≤uγ,φ(a1,...,a,b1,...,bn)。
项目1中的界限是最佳的,因此在存在概率功能PL和PU使得AI≤PL(γi),PU(γi)≤bi为1≤i≤n,并且
lγ,φ(a1,...,一个,b1的,...,bn)= pl(φ)
和
pu(φ)=uγ,φ(a1,...,一个,b1的,...,bn)。
功能Lγ,φ和uγ,φ是有效的,从γ∪{φ}中的句子的布尔结构有效地确定。
该结果也可用于定义又一概率的有效性概念,我们将调用Hailepin-概率有效性或简单的H型有效性。 该概念不适于公式来定义,而是相对于由[0,1]的公式和子间隔组成的对。 如果xi是与前提相关的间隔γi∈γ和y是与结论φ相关的间隔,那么据说参数(γ,φ)被称为H-VALIVE,写入γ⊨hφ,如果且仅当所有概率函数P:
如果p(γi)∈xi为1≤i≤n,则p(φ)∈y
在Haenni等人。 (2011)这是写作的
γ
的x1
1
,...,γ
xn
n
|≈φy
并称为标准的概率语义。
尼尔森的工作概率逻辑(1986,1993)有引发了大量的研究概率推理在人工智能(汉森和jaumard 2000;第2章的哈恩尼等铝。2011)。 然而,应该注意的是,尽管定理5表示功能Lγ,φ和uγ,φ有效地从γ∪{φ}中的句子中可有效地确定,但是这个问题的计算复杂度非常高(Georgakopoulos等人。1988年,Kavvadias和Papadimitriou 1990),因此在实际应用中迅速发现这些功能在计算上变得不可行。 基于概率论证系统和概率网络的当代方法更好地处理这些计算挑战。 此外,概率论证系统与Dempster-Shafer理论密切相关(Dempster 1968; Shafer 1976; Haenni和Lehmann 2003)。 然而,对这些方法的扩展讨论超出了本条目的(当前版本)的范围; 参见(Haenni等,2011)最近的调查。
3.基本概率运营商
在本节中,我们将研究以相当基本的概率运算符扩展命题语言l的概率逻辑。 它们与第2节中的逻辑不同,因为这里的逻辑涉及对象语言中的概率运算符。 第3.1节讨论了定性概率运营商; 第3.2节讨论了定量概率运算符。
3.1不确定性的定性表示
有几种应用程序,其中概率的定性理论可能是有用的,甚至是必要的。 在某些情况下,没有可用于概率的估计没有频率,或者实际上不可能获得这些频率。 此外,人们往往愿意比较两个陈述的概率('φ比ψ')的概率,而不是能够单独为每个陈述分配显式概率(Szolovits和Pauker 1978,Halpern和Halpern和拉比1987)。 在这种情况下,定性概率逻辑将是有用的。
最早的定性概率逻辑之一是Hamblin(1959)。 语言与一元运算符◻扩展,◻,它将被读为“可能”。 因此,诸如ψφ的公式将被读为“可能φ”。 这种“可能”的这种概念可以正义为足够高(数值)概率(即P(φ)≥T,对于一些阈值1/2<t≤1),或者在合理性方面,这是非韵律的概率的概括。 Burgess(1969)进一步开发了这些系统,专注于“高值概率的解释”。 Hamblin和Burgess都将额外的运营商介绍到他们的系统中(表达,例如,形而上学的必要性和/或知识),并研究“可能的运营商和这些其他模态运算符之间的互动。 但是,“可能的操作员已经自己显示了一些有趣的功能(独立于任何其他运算符)。 如果它被解释为“足够高的概率”,则它无法满足原理(◻φ∧◻ψ)→◻(φ∧ψ)。 这意味着它不是正常的模态运算符,并且不能给予克莱波克(关系)语义。 Herzig和Longin(2003)和ArlóCosta(2005)为这类“可能的运营商”提供了邻里语义的较弱系统,而Yalcin(2010)则从更直思言上的视角讨论其行为。
通过Segerberg(1971)和Gärdenfors(1975a,1975b)拍摄的另一条路线,由De Finetti(1937),Kraft,Pratt和Seidenberg(1959)和Scott(1964年)。 他们介绍了二进制运算符≥; 式φ≥ψ读为“φ至少可能为ψ”(正式:p(φ)≥p(ψ))。 关键的想法是,人们可以完全公开≥不必使用单个公式的“底层”概率的行为。 应该注意的是,对于比较概率(二进制运算符),人们还可以表达一些绝对概率性质(机构运算符)。 例如,φ≥⊤表示φ具有概率1,φ≥-φ表示φ具有至少1/2的概率。 最近,Delgrande和Renne(2015)和Delgrande,Renne和Sack(2019)进一步扩展了定性方法,通过≥≥为公式的有限序列(可能不同的长度)。 公式(φ1,...,φn)≥(ψ1,...,ψm)被非正式地被读为“φi的概率之和至少与ψj的概率的总和一样高”。 得到的逻辑可以完全粗略化,并且可以捕获任何合理的数量,使其成为一种作为一些定量概率逻辑的表现力。 但是,它仍然不同于定量概率逻辑,因为语言没有数字。 在以下部分中,我们将注意力指向定量概率逻辑。
3.2概率术语和产品
命题概率逻辑是命题逻辑的扩展,其表达概率术语P(φ)之间的数值关系。 一个简单的命题概率逻辑增加了表单p(φ)≥q的命题逻辑公式,其中φ是命题式,q是一个数字; 这种公式断言φ的概率至少是Q. 使用组成概率函数p的模型正式化,其元素各自给出命题逻辑的原子命题。 因此,如果该元素的真实性分配使命题公式正确,则命题公式在Ω的元素处是真实的。 如果λ为true的ω的元素集的概率P,则在模型中,则在模型中为真是如此,则公式P(φ)≥Q是真的。 请参阅申报馆章节第3章。 (2016)概述了这种命题概率逻辑。
一些命题概率逻辑包括对象语言中的其他类型的公式,例如涉及概率术语和概率的概率和产品的其他类型的公式。 涉及总和的上诉可以通过概率函数的添加条件(参见第2.1节)来阐明,其可以表达为P(φ∨ψ)= P(φ)+ P(ψ),每当¬(φά)是正文的,或等效作为p(φν)+ p(φάς)= p(φ)。 明确涉及概率和概率总和的概率逻辑倾向于更广泛地包括概率术语的线性组合,例如在Fagin等人中。 (1990)。 这里,命题逻辑与形式A1P(φ1)+⋯+ anp(φn)≥b的公式延伸,其中n是与公式的正整数,A1,...,a和b是所有合理的数字。 以下是可以表达的一些示例。
p(φ)≤q致-p(φ)≥-q,
p(φ)<q¬(p(φ)≥q),
P(φ)= q通过p(φ)≥qəp(φ)≤q。
P(φ)≥p(ψ)p(φ)-p(ψ)≥0。
具有和没有线性组合的表现力:虽然线性组合提供了表达概率术语之间众多关系的便捷方式,但是没有概率术语的总和的语言仍然非常强大。 考虑限于FORM P(φ)≥Q的公式的语言对于某些命题公式φ和理性Q。 我们可以定义
p(φ)≤q通过p(¬φ)≥1-q,
考虑到,考虑到命题补体的概率等于1减少主张的可能性。 可以在没有线性组合的情况下定义公式P(φ)<Q和P(φ)= Q。 使用这种受限制的概率语言,我们可以以不太直接的方式推理添加性。 公式
[p(φ∧ψ)=a∧p(φ∧¬ψ)= b]→p(φ)=一个+ b
指出,如果φ∧ψ的概率是A的概率,并且φ∧¬ψ的概率是b,则公式的分离的概率(其等同于φ)是+ b。 然而,虽然使用线性组合的使用允许我们通过使用式p(φν)+ p(φά)= p(φ),但是在没有上方的线性组合的公式的情况下,φν和φάς的概率是附加的。所以,如果我们选择正确的数字a和b。 在Demey和Sack中给出了LINAINAL概率逻辑表达性的正式比较,但在DEMEY和SACK中给出了DEMEY和SACK(2015)。 虽然只有当他们同意所有公式(Lemma 4.1的Demey和Sack(2015))时,任何两个模型都达成了所有公式,但如果没有(2015年)的所有公式,则可以定义任何具有线性组合的单个公式可定义的任何类别的模型。通过单一的公式(Lemma 4.2的Demey和Sack(2015))。 特别地,由式P(P)-P(Q)≥0定义的模型不能由任何单个公式定义,而没有线性组合的功率。
属于给定子集的概率:egnjanović和rašković(1999)通过新类型的操作员扩展了概率逻辑语言:QF。 直观地,公式QFφ意味着对于一些给定的集合,φ的概率属于f,对于一些给定集合[0,1]。 该QF操作员不能根据形式P(φ)≥a的公式定义。 奥加莫诺维奇和拉什科维rašković(1999)提供这种类型的逻辑系统的声音和完整的公理化。 将QF运算符连接到更标准的P运算符的关键桥梁原理是所有Aa∈f的公理P(φ)= a→qfφ,以及指定从p(φ)= a→ψ的无限规则对于所有A1F,可以推断QFφ→ψ。
多项式重量公式:具有多项式重量公式的逻辑(涉及概率术语的加权和术语的产品),可以允许形式P(φ)p(ψ)-p(φν)= 0的公式,即概率φ和ψ的等于φ和ψ概率的乘积。 该公式捕获它意味着φ和ψ致统计学独立。 在Fagin等人中进行了这种逻辑。 (1990),但主要包括一阶逻辑功能,然后在Perović等人中再次进入更简单的上下文(没有量词)。 (2008)。
紧凑性和完整性:紧凑性是逻辑的属性,其中如果每个有限子集是满足的,则一组公式是满足的。 命题概率逻辑缺少紧凑性属性,因为每个有限子集{p(p)>0}∪{p(p)≤a| a> 0}是满足的,但整套不是。
没有紧凑,逻辑可能是弱完成的(每个有效的公式都可以在公理系统中可提供),但没有强烈完成(对于公式的每个设定γ,γ的每一个逻辑后果都可以从公理系统中的γ提供。 在Fagin等人。 (1990),给出了涉及线性组合的证据系统,并且逻辑被证明是声音和弱完成。 在Ognjanović和Rašković(1999)中,没有线性组合的命题概率逻辑给出了一种声音和强大的证明系统。 在Heifetz和Mongin(2001)中,一个用于逻辑变化的证据系统,没有使用类型系统的线性组合,以允许概率公式的迭代(我们将在第4节中看到如何使用可能的世界实现这种迭代)和逻辑被证明是声音和弱完成的。 他们还观察到这种逻辑的无限性系统可以强烈完成。 ognjanović等。 (2008)呈现出一些具有无限衍生规则的定性概率逻辑(需要一个可计数无限的房屋),并证明了强大的完整性。 Goldblatt(2010)为相关的陆基逻辑提出了一个强大的证明系统。 perović等。 (2008)给出一种校验系统和具有多项式重量公式的命题概率逻辑的强大完整性的证据。 最后,获得强大完整性的另一种策略涉及将概率函数的范围限制为固定的有限数量; 例如,ognjanović等。 (2008)讨论一个定性的概率逻辑,其中概率函数的范围不是完整的真实单元间隔[0,1],而是“离散化”版本{0,
1
n
,
2
n
,...,
n-1
n
,1}(对于一些固定的数字n∈n)。 请参阅ognjanović等人的第7章。 (2016)概述完整性结果。
4.模态概率逻辑
许多概率逻辑被单一但任意概率空间解释。 模态概率逻辑利用许多概率空间,每个概率空间与可能的世界或状态相关联。 这可以被视为模态逻辑的关系语义的微小调整:而不是将每个可能的世界联系到一个可访问的世界,如模态逻辑,模态概率逻辑关联到每个可能的世界的概率分布,概率空间或一组概率分布。 模态概率逻辑的语言允许嵌入概率中的概率,即,它可以是关于(可能是不同)概率为1/2的概率的原因。 这种涉及多个概率的模态设置通常已经给出了一个(1)随机解释,关于下一个状态的不同概率,系统可能转变为(Larsen和Skou 1991),以及(2)关于不同概率的主观解释不同的药剂可能具有关于情况或彼此的概率(Fagin和Halpern 1988)的情况。 这两种解释都可以使用完全相同的正式框架。
基本的模态概率逻辑增加了表单p(φ)≥q的命题逻辑公式,其中q通常是raty数,并且φ是语言的任何公式,可能是概率公式。 读取这种公式的是φ的概率至少是Q. 该公式的这一综合读数不反映模态概率逻辑与具有相同公式的其他概率逻辑之间的任何差异; 在差异谎言中,能够在概率术语和语义中的参数中嵌入概率。 以下小节概述了模型概率逻辑的模拟方式的变化。 在一种情况下,语言稍微改变(第4.2节),在其他情况下,逻辑扩展到地址定性和定量不确定性之间的相互作用(第4.4节和第4.5节)或动态(第4.6节)。
4.1基本有限模式概率模型
正式地,基本的有限模式概率模型是元组m =(w,p,v),其中w是一个有限的可能的世界或状态,p是将分布PW与每个世界w∈w相关联的函数,并且v是'估值函数'将原子命令从集合φ分配给每个世界。 分布从个体世界延伸到世界各地:PW(s)=σs∈spw。 基本模式概率模型的前两个组件与Kripke帧有效地相同,其关系由数字装饰(概率值)。 这种结构具有不同的名称,例如具有数学中标记边缘的定向图形,或计算机科学中的概率转换系统。 估值函数,如在Kripke模型中,允许我们为世界分配属性。
公式的语义是对(M,W)给出的,其中M是模型,W是模型的元素。 公式P(φ)≥Q在一对(m,w)处为真,写入(m,w)= p(φ)≥q,if且仅当pw({w'ib(m,w')⊨φ})≥q。