博弈分析逻辑(七)

概率及其逻辑是数学和哲学中的一个重要课题,正如“概率的解释”和“逻辑与概率”条目中所讨论的那样。本节仅概述概率与博弈逻辑分析之间的一些关键联系。以下介绍假设所有状态空间都是有限的,忽略了从有限状态空间到无限状态空间转变过程中的一些重要技术和概念问题。

5.1 概率与信念

概率方法被广泛用于表示博弈内外主体的信念,贝叶斯认识论就是明证。通常,概率信念模型由两部分组成:主体信念所涵盖的可能状态空间,以及表示主体判断不同命题或状态的概率的定量概率函数。另一方面,在定性逻辑模型中,主体信念的表征细节程度各不相同。最粗略的方法仅区分主体认为可能的状态和排除的状态。这是标准认知信念逻辑的视角,例如第 3.6 节中讨论的多主体 S5 和 KD45。Boutilier (1994) 和 Baltag 和 Smets (2008) 的似真性模型采用了更细粒度的视角,其中认知选项的范围由似真性排序进一步构建,该排序编码了主体选择哪些选项的可能性较小或较大。另见第 3.6.4 节和第 4.2 节。概率论和似真论的视角都可以表达某种选择比另一种更有可能发生。然而,这两个框架之间也存在概念上的差异。概率模型可以聚合,这使得它们的逻辑能够表达,例如,许多低概率事件加起来是否能够超过最高概率的世界。例如,聚合概率在预期效用的计算中起着关键作用。然而,在似真性语义学中却无法表达这种可能性。另一个显著的区别是,似真性模型导致了一种在合取下闭合的信念概念。这种合取闭合通常不适用于概率性的信念描述。然而,参见Leitgeb (2017) 的文章,了解两种建模类型之间复杂的桥梁。

5.2 从逻辑到概率,再回到概率

从普遍的观点来看,逻辑和概率框架强调信念的不同方面。逻辑强调所相信命题之间的一致性,例如在逻辑蕴涵或合取下的闭合性。另一方面,概率推理强调分级信息和对不确定事件(例如彩票)的态度。即便如此,仍有各种方法试图通过在框架之间搭建桥梁来统一这两种推理类型。

从定性概率到定量概率 早期在这方面的尝试可以追溯到 Finetti (1970 [1974]),他致力于对概率论进行纯粹的定性公理化。向逻辑推理迈进一步的是各种定性概率理论 (Kyburg 1994),这些理论通常基于这样的假设:经典的定量概率概念对于现实生活中的主体来说过于苛刻。在这一研究领域中,主体只需基于部分、比较的概率评估进行推理,而无需为所有事件指定完全指定的概率。定性概率的逻辑框架包括 Segerberg (1971)、Fagin、Halpern 和 Megiddo (1990) 以及 Delgrande 和 Renne (2015)。尽管细节上有所不同,但该领域中的所有逻辑都有一个共同点,即它们允许φ⪯ψ形式的表达式,这表明ψ至少在φ处被判断为同样可能的发生。最近的框架对这种语言进行了各种额外的改进。同样,Heifetz 和 Mongin (2001) 将概率信念的公理分析扩展至高阶推理,其研究的概率类型空间类似于第 3.7 节中介绍的概率类型空间。

然而,定性概率的概念有时被认为是有缺陷的:一套完整的概率逻辑原理,保证逻辑语言中每个完整的描述都对应一个唯一的概率测度,结果却需要复杂的演算,涉及一条不透明的无限规则 (Kraft, Pratt, & Seidenberg 1959; Scott 1964)。Harrison-Trainor、Holliday 和 Icard (2016) 以及 Ding、Holliday 和 Icard (2021) 提出了一个新的视角,通过将上述唯一对应要求放宽到仅要求与某一族的所有概率测度兼容,可以公理化一个低复杂度的定性概率逻辑。

然而,这里描述的任何框架都不是专门针对博弈论的。事实上,定性概率逻辑,无论是旧的还是新的,是否能用于博弈论解概念的定性分析,还有待观察。从定量到定性概率 前述研究旨在从定性概念中恢复定量概率,而一个相反的项目则表明,在定量概率环境中,普遍存在的定性模式可能自然而然地出现。基于有时被称为洛克论题的理论,阈值方法通过规定如果 φ 的概率高于某个适当的数值阈值 t,则某个 φ 将被更简单地相信,从而将概率与逻辑联系起来。对于大多数阈值 t 的选择,这样的翻译与标准逻辑要求并不相符,因为信念通常不会在合取下闭合。然而,在最近的研究中,Leitgeb (2017) 以及 Lin 和 Kelly (2012) 已经确定了可以做得更好的条件。基于 Skyrms (1977) 的思想,Leitgeb 在阈值上确定了强大的、依赖于上下文的“鲁棒性条件”,这些条件保证定义的信念算子最终能够满足 KD45 公理。另一方面,Lin 和 Kelly 的研究采用非均匀阈值来在逻辑信念和概率信念之间进行转换,从而能够推导出双方不同形式的信念动态之间的一致性。有关这些方法的数学基础和局限性以及它们生成的条件逻辑的最新研究,请参阅 Mierzewski (2020)。

5.3 更新和跟踪概率

从游戏玩法的动态视角来看,每一次行动都构成了代理必须考虑的一条新信息。此外,玩家也可能通过沟通或收到的任何其他信号(无论可靠与否)经过深思熟虑后改变他们对游戏的信念(参见第 4 节)。所有这些动态事件都引发了一个问题:新信息如何融入智能体的信念,以及概率更新何时会有相应的逻辑修正,反之亦然。

如果新信息是硬性信息,被所有智能体视为不可逆转的真实,那么逻辑公开声明的概率对应物就是贝叶斯条件反射。这两个概念在语义层面上相互关联,这意味着它们的输出结果相同。公开声明后计算信念意味着在包含所有接收信息为真的状态的子模型中重新计算。这与贝叶斯更新中重新计算概率的机制完全相同。此外,对于更新的推理,两种方法都需要条件概念:分别是条件信念和条件概率。条件信念的定量概念与条件信念B(φ|ψ)的逻辑概念相关,但需要注意的是,后者也允许在任一论证中使用认知算子或信念算子。更精细的条件信念逻辑概念出现在前面提到的第4.1.2节的似真性语义学中(Baltag & Smets 2008)。

鉴于定性和定量视角并存,探究其中一种视角能否追踪另一种视角是有意义的。从静态意义上讲,追踪探讨的是不同的信念概念是否可以通过省略或转换一些相关的语义细节来相互转化。动态解释则对此进行了扩展,探讨第4节中硬性或软性更新是否能够与交换图中的这些翻译兼容:翻译后在新视角下进行信息更新,其结果应与先在旧视角下进行匹配更新,然后再进行翻译的结果相同 (van Benthem 2016)。在游戏中,追踪的概念可能不仅指信息更新,还指第二节中讨论的各个层面上所描述的游戏玩法中的解决方案概念或动作。

追踪图的存在取决于所考虑的更新的具体类型。目前,可信度模型的更新策略种类繁多 (van Benthem & Smets 2015),并非所有策略都有明显的概率对应策略。同样,对于众所周知的概率更新类型,例如 Jeffrey 更新,其中所选命题的概率可以随意重置,其可信度对应策略也不易找到,尽管 van Benthem、Gerbrandy 和 Kooi (2009) 尝试修改动态认知逻辑,以允许 Jeffrey 更新和其他广义概率策略。

5.4 博弈论的专门化

博弈论的几乎所有方面都提供了逻辑和概率视角之间的联系。显然,对于刚刚讨论过的知识、信念及其动态的不同表征而言,情况确实如此。其他联系发生在博弈形式层面,参见第2节,其中概率丰富了策略空间。由此产生的混合走法要求玩家将其偏好扩展到混合结果,参见第3节。最后,在博弈论推理层面,参见第4节,概率信念在诸如优势推理或基于预期效用的推理等解决技术中发挥着作用。

可用行动和混合策略 纯策略的概率混合在博弈论中非常突出,因为它们能够确保任何纯策略都无法保证的结果和收益。

例如,匹配硬币。

考虑一个著名的匹配硬币游戏,其矩阵形式如下:

鲍勃

x y

安妮 a 1,-1 −1, 1

b −1,1 1,-1

对于安妮来说,无论鲍勃做什么,恰好一半时间采取a的混合策略都能保证预期结果为0。任何纯策略都无法做到这一点。

从逻辑的角度来看,混合策略可以被概念化为早期博弈逻辑中的新原始动作(参见第2节)。然而,这种处理方式会立即使可用动作集变得无限。一种经过谨慎改进的逻辑语言,将逻辑方法扩展到定性概率,可以允许诸如代理至少以q的概率采取动作a之类的表达式(Delgrande和Renne,2015)。

一个更具挑战性的普遍性问题是如何将经典概率方法及其不动点结果和随之而来的均衡存在定理与本文多处提到的逻辑不动点方法联系起来。后者采用逐步的序数迭代,而不是像经典博弈论中相关的布劳威尔或角谷不动点定理那样采用渐进的近似程序。一个相关的问题是,在定性框架内重现概率存在定理需要多少逻辑。

添加玩家偏好 一旦添加偏好,混合策略就会引发额外的复杂性。如果策略组合中包含一些玩家,并且他们采取混合策略,则不会产生唯一的结果,而是一个加权结果组合。因此,允许混合策略需要将偏好关系提升到结果或策略组合的概率混合。纳入此类混合结果可能隐含地偏离标准的、纯粹定性的结果视角(Ramsey 1931;Savage 1954)。

示例:扩展偏好比较。

以下两个博弈在双方玩家对结果的定性(即序数)偏好方面是等价的。然而,它们对混合结果的偏好有所不同,左侧博弈中

0.5(b,x)+0.5(b,y)⪰A(a,x)

成立,而右侧博弈中成立。

x y

a 1,0 2,1

b 0,1 4,0

x y

a 1,0 2,1

b −10,1 4,0

这种做法会带来一些逻辑挑战。例如,考虑一个关于概率结果混合的偏好关系,其中 mt(a,b) 表示以概率 t 获得 a,否则为 b。这一设定符合冯·诺依曼和摩根斯特恩于1944年提出的著名“连续性公理”,该公理以隐含的无限析取为特征:

a⪯b⪯c⇒∃t∈(0,1): mt(a,c)⪯b⪯m1−t(a,c)

这似乎远远超出了标准概率逻辑的表达能力。

解决方案概念和游戏玩法 概率化也会影响游戏玩法及其推理动态,例如,它会改变前面提到的弱优势和强优势的演算(第3.4节)。考虑以下游戏,参见de Bruin (2005):

B

x y

A a 0, 5 5, 0

b 5, 0 0, 5

c 1, 1 1, 1

就纯策略而言,A的所有策略均不处于劣势。然而,就预期结果而言,c 由 a 和 b 的均等混合支配。因此,先前分析的求解程序(例如迭代移除弱支配策略或强支配策略)可能会产生不同且不兼容的结果,具体取决于是否考虑混合策略。对于这种情况,似乎不存在先前那种令人满意的逻辑分析。

5.5 逻辑方法的进一步挑战

逻辑与概率推理相互作用的进一步挑战比比皆是。总而言之,这里有一个似乎难以用纯粹的定性逻辑术语来捕捉的维度。博弈论和决策论推理的一个典型特征是信念和偏好以各种方式纠缠在一起(Liu 2011)。例如,预期效用这一关键概念将代表信念的概率与代表偏好的效用纠缠在一起。面对对手当前和未来行动的概率不确定性,博弈者通常被建议最大化预期效用(von Neumann & Morgenstern 1944;Savage 1954)。因此,即使人们已经分别找到了概率信念和基数效用的定性对应物,纠缠也带来了额外的困难,即难以将这两种定性分析融合在一起,使其与定量分析通过对两者进行某种算术组合而轻松实现的结果相匹配。

6. 游戏化

本条目的主题是博弈论的逻辑方法,将逻辑学中的经典概念和方法应用于游戏。该项目有时被称为“游戏的逻辑”。此外,还有一个相反的方向,即“逻辑即游戏”,即运用博弈论概念来阐明逻辑的基本概念。本节将简要讨论这一方向,作为本条目主线的自然对照。有关更全面的概述,请参阅“逻辑与游戏”和“游戏、抽象与完备性”条目。

6.1 逻辑游戏

许多逻辑概念都已用博弈论术语进行了分析。

评估游戏 有一些著名的双人游戏,用于在给定的逻辑模型中评估一阶公式φ。这些游戏在验证者和证伪者之间进行,他们既可以测试原子断言,也可以指定给定域中变量的值 (Hintikka 1973)。游戏的进程由公式 φ 的句法结构决定。析取和存在量词需要验证者选择,证伪者选择连词和全称量词,否定则触发两位玩家之间的角色转换。结果是获胜策略与普通语义真值概念之间的匹配:

公式 φ 在模型 M 中,在赋值 s 下为真,当且仅当验证者在相关游戏 game(M,s,φ) 中拥有获胜策略。

相应地,如果公式 φ 在模型中为假,则证伪者拥有获胜策略。评估游戏被证明是一种极其灵活的工具。通过适当调整规则和获胜惯例,可以为大多数逻辑系统找到合适的评估游戏。然而,做到这一点并非易事,正如与诸如模态μ演算(Venema 2008)之类不动点逻辑相对应的复杂无限“奇偶博弈”所证实的那样。就目前而言,需要注意的是,这种分析风格将逻辑运算、合取、析取、模态算子与博弈中的自然走法联系起来。同样,“真”的概念与扩展形式博弈中的策略这一博弈论基本概念相联系(参见第二节):一个复杂的、结构化的对象,在这里可以理解为公式真假的原因或解释。

这两种视角之间的联系如此紧密,以至于有效的逻辑原理能够表达博弈论事实。例如,经过一番分析,排中律意味着验证者或证伪者总有一个获胜策略,参见第2.4节。换句话说,经典逻辑的逻辑评估博弈是在博弈论意义上确定的。事实上,这一性质扩展到大多数非经典逻辑博弈。

进一步的逻辑博弈 逻辑博弈存在许多其他用途。Ehrenfeucht-Fraïssé博弈用于模型比较(Ehrenfeucht 1961;Ebbinghaus & Flum 1995),Lorenzen博弈进行证明分析(Kamlah 1973 [1984]),而tableau博弈执行模型构建(Hodges 1985)。在每种情况下,博弈中的策略都与重要的逻辑概念相匹配。例如,在Lorenzen对话博弈中,主张支持者的获胜策略对应于从对手授予的前提对该主张的证明,而对手的获胜策略则是反模型的构建。因此,证明和模型,这两个逻辑上截然不同的概念,在一个博弈中共存。

存在一种替代的博弈论方法来解释这些关联结果。假设所研究的博弈是固定的,并与某种代表博弈一般状态主要特征的“棋盘”相关联(想想国际象棋,尽管也可能出现更抽象的棋盘)。那么,上述等价关系表明,制胜策略,即一个典型的、以完整扩展博弈树定义的博弈论概念,等价于一个更简单的“不变量”,它可以完全根据与树的节点相关联的某个棋盘来定义。识别此类有用的不变量是分析具体博弈的一项众所周知的艺术。就本文的主题而言,不变量可以存在于与给定博弈类别相关的不同表示层次上。游戏语义学 逻辑游戏可以被视为一种简单的教学工具,用于分析那些已被广泛理解的逻辑概念。或者,换句话说,它提供了一种基于博弈论直觉的具体逻辑教学方法。然而,逻辑游戏的意义远不止于此。首先,通过在现有逻辑游戏中追求制胜惯例、招式或调度的自然变化,可以提出新的逻辑。此外,将逻辑运算视为游戏构造器,可以提出一种全新的、更精炼的逻辑常数观。例如,合取运算现在可以自然地分为顺序运算和并行运算。类似的并行运算示例也存在于计算逻辑中。此外,将量词与对象选取(例如在评估游戏中)关联起来,可以将量词转化为特殊类型的原子游戏,并通过游戏组合的抽象运算连接到以下公式。这种抽象组合运算与选择和切换等命题运算相结合的通用逻辑已被证明是可判定的,这为一阶逻辑提供了一种新的可判定核心逻辑,而此前人们从未怀疑过它的存在(van Benthem 2014)。因此,博弈论可以为现有的逻辑系统提供全新的视角。

逻辑的独立博弈论视角的主要来源之一是计算逻辑的博弈语义(Abramsky 1997)。在这种情况下,逻辑博弈的地位可能会发生变化。对某些人来说,这些博弈不仅仅是一种教学或探索手段,而是被认为是逻辑常数的真正含义。在这种情况下,无限博弈通常是范式,代表着持续进行的过程,而不是有限的终止博弈。这体现在无限奇偶博弈对模态μ演算的重要性上,Venema (2008)以及前面提到的游戏的协同代数视角。Baltag、van Benthem 和 Westerståhl(即将出版)讨论了协同代数游戏语义学的由外而内的视角,将其作为一种可行的语言意义通用范式,代表了组合性标准讨论的重大转变。

(本章完)

相关推荐