博弈分析逻辑(一)
鉴于逻辑的历史根源在于对话和论证,游戏与逻辑自然契合。论证是一种类似游戏的活动,涉及轮流、在正确的时间说正确的话,并且在竞争环境中,胜负具有明显的回报。为了探究这种联系,专门的逻辑游戏早在中世纪就已被用作逻辑训练的工具 (Hamblin 1970)。现代领域以正式的对话游戏作为逻辑的基础,将论证中的制胜策略与令人信服的证明联系起来 (Kamlah 1973 [1984]),从而进一步拓展了这种图景。如今,逻辑与博弈论之间的联系涵盖了众多不同的领域,不仅涉及与博弈论的交叉,还涉及语言学、计算机科学以及其他领域。
本百科全书的各个条目涵盖了逻辑与博弈领域中广泛且不断发展的主题,特别是博弈在逻辑中的应用、博弈论的认识论基础、社会过程的形式化方法、分析主体权力的逻辑,以及用于编程语言和过程语言的博弈语义。这些条目的侧重点各不相同,可能侧重于逻辑、博弈论或计算机科学基础。本条目主要关注用于分析博弈的逻辑,并在相关之处引用了本百科全书中的其他观点。
1. 概述
1.1 博弈逻辑
1.2 逻辑与博弈论
1.3 计算与代理
1.4 逻辑中的博弈
1.5 概率
1.6 放大
2. 博弈结构与博弈逻辑
2.1 表征层次
2.2 博弈间的不变性关系
2.3 匹配不变性关系的语言
2.4 扩展博弈的模态逻辑
2.5 幂的模态邻域逻辑
2.6 战略博弈的模态逻辑
2.7 作为逻辑对象的策略
2.8 同时行动与不完全信息
2.9 博弈代数与计算的动态逻辑
2.10 专题
3. 博弈者性质
3.1 偏好与均衡
3.2 博弈的偏好逻辑
3.3 扩展形式博弈中的逆向归纳法
3.4 劣势策略的迭代移除
3.5 目标
3.6 知识、信念与信息局限性
3.6.1 行动的不确定性
3.6.2 不完全信息逻辑
3.6.3 选项与偏好的不确定性
3.6.4 不完全信息与信念
3.7 高阶不确定性与类型空间
3.8 推理、有限主体和玩家类型
3.9 玩家的薄模型和厚模型
3.10 专题
4. 博弈分析
4.1 博弈解决方案和博弈前审议
4.1.1 通过公开声明进行逆向归纳
4.1.2 通过信念修正进行逆向归纳
4.1.3 严格支配策略的迭代移除
4.2 博弈过程中的信息流、知识和信念
4.2.1 认知更新和不完美信息
4.2.2 信念修正和正向归纳
4.2.3 博弈后合理化
4.2.4 从长期时间视角进行博弈
4.3 结论:博弈理论
4.4 进一步研究方向
5. 博弈中逻辑与概率的接口
5.1 概率与信念
5.2 从逻辑到概率,再从逻辑到概率
5.3 更新和跟踪概率
5.4 博弈专业化
5.5 进一步研究逻辑方法的挑战
6. 游戏化
6.1 逻辑游戏
6.2 其他逻辑相关游戏
6.3 专题
7.讨论及进一步指导
参考文献
学术工具
其他网络资源
相关条目
1. 概述
本条目对用于分析博弈的逻辑进行了全面的概述,并根据一些统一的主题和视角进行了整理。此外,本百科全书其他部分涵盖了逻辑与博弈交界处的其他分支,并偶尔将其与这些分支联系起来。本概述部分简要概述了稍后将更详细讨论的主题。
1.1 博弈逻辑
特定博弈代表着重要的、反复出现的社会互动模式。在“博弈逻辑”的视角中,逻辑的概念和结果被用于分析各种博弈的结构。事实上,许多关于博弈的经典推理都涉及到逻辑中常见的概念。
博弈解推理示例。
考虑以下两个玩家 A 和 E 的博弈树,其中标记了回合,并在收益中首先写出 A 的值。或者,这些值可以被解释为对玩家在结果之间的定性(或序数)偏好的编码。
这是一个博弈树图,展示了图后段落中描述的内容。扩展描述(链接见图题)将对这棵树进行详细描述。
图 1. ⓘ
玩家可能会这样推理。轮到 E 时,她面临一个标准的决策问题,有两个可选行动,选择左边比选择右边的结果更好。所以她会选择左边。A 知道这一点,他预期选择右边会导致结果 0,而选择左边会导致结果 1,所以他选择左边。结果,两位玩家的处境都比他们选择右边/右边时更糟。简而言之,在这种情况下,推理会导致非帕累托最优的结果。这个例子提出了一个问题:为什么玩家应该这样做?以及,例如,更合作的行为是否也合理。答案显然取决于玩家的信息和推理风格。这里,探究这个例子的结构就变得有趣了。仔细观察,上述场景涉及许多概念:行动及其结果,玩家对游戏结构的了解,他们对游戏结果的偏好,以及他们对游戏将如何进行的看法。背景中甚至还存在反事实条件,例如A事后解释他的选择时说:“如果我玩右,E就会玩左”。此外,这些概念以微妙的方式交织在一起。例如,A选择左,并非因为在标准意义上左优于右(即对他来说总是更有利),而是因为根据他的信念,左优于右。反过来,这些信念是如何形成的,又取决于游戏的许多其他特征,包括玩家的性质。
简而言之,即使是像本文讨论的这样非常简单的博弈,也将哲学逻辑的诸多议题集中到一个非常具体的场景中。本文将重点探讨此处提到的方面,其中第3节专门探讨玩家的偏好和信念,第4节则探讨博弈过程中的推理风格和态度动态。
分析由几个大致的区别构成。直观地讲,博弈包含几个以不同方式运用逻辑的阶段:博弈前的审议,因为许多博弈论解决方案概念实际上就是审议程序,它创建了关于博弈如何进行的初步预期。博弈过程中的观察和信念修正,包括对偏离先前预期的情况做出反应。最后,进行赛后分析,例如,确定从失败中可以学到什么,或者对自己的表现进行解读。此外,所有这些都可以从两种视角来思考:假设以第一人称参与者或第三人称观察者的角度看待游戏和玩法。
1.2 逻辑与博弈论
在上述许多主题中,逻辑与博弈论相交融。其中一个交叉领域是认知博弈论,其中,博弈玩法和解决方案概念根据关于玩家及其认知状态的各种假设(例如共同知识或对理性的共同信念)进行分析和论证。认知博弈论可以被视为逻辑与博弈论的共同产物,这种后代构成了跨学科联系成功的可靠标志。
还有其他可行的逻辑视角。具体而言,人们可以像数理逻辑学家看待任何数学分支一样看待博弈论。按照著名的埃尔朗根纲领的风格,我们可以讨论该领域研究的结构,并寻找结构不变性关系和相应的逻辑语言。博弈论结构丰富,因为它包含几种不同的自然不变性概念。扩展博弈的树形结构提供了玩家逐步行动时发生情况的详细视图,而战略形式博弈的矩阵结构则提供了以结果为中心的高级视图。此外,下文将讨论的其他结构则侧重于玩家对各种结果的控制。所有这些不同层次的博弈结构都有各自的逻辑系统,这将在第2节中详细介绍。此外,这些不同的逻辑并非仅仅提供孤立的快照:它们可以以系统的方式关联起来。
这样,就可以运用常见的逻辑技术。例如,形式语言可以表达博弈的基本属性,而模型检查技术可以有效地确定这些属性在给定的具体博弈中是否成立(参见 Clarke、Grumberg 和 Peled,1999)。
示例:制胜策略。
考虑以下博弈树,其中双方玩家的移动关系,以及标记玩家 i 获胜位置的命题字母 wini。
下方标题链接中的博弈树及其详细说明
图 2. ⓘ
显然,玩家 E 有一个对抗玩家 A 的制胜策略,即无论 A 做什么,都能保证她获胜的秘诀。这可以用一个模态公式来表达,该公式恰好捕捉到了正确的动态:
[moveA]⟨moveE⟩winE
这里,[moveA] 是“针对玩家 A 的所有动作”的通用模态,而 ⟨moveE⟩ 是“针对玩家 E 的某些动作”的存在模态。这种基于两步模态或量词的反应模式对于任意博弈中的玩家战略力量而言都是典型的,因为它抓住了顺序交互的本质。至关重要的是,逻辑定律可以获得博弈论的意义。例如,将排中律应用于上述公式可得出:
[moveA]⟨moveE⟩winE∨¬[moveA]⟨moveE⟩winE
或者,用逻辑上等价的公式表达:
[moveA]⟨moveE⟩winE∨⟨moveA⟩[moveE]¬winE
在类似上述的两步博弈中,如果只有一名玩家获胜(即 winA↔¬winE),后一个公式表示玩家 E 或玩家 A 中至少有一个拥有制胜策略。更一般地说,这个析取断言是策梅洛定理的一个特例,该定理指出所有有限完全信息博弈都是确定的。在建立了与逻辑语言的联系之后,进一步的模型论主题可以有效地应用于博弈论。例如,基于语言的推理可以根据不同博弈定义的精确句法结构,检验其属性在它们之间的保存性。此外,逻辑语法也支持逻辑证明理论。因此,后者丰富的证明演算库可能有助于分析博弈论中的基本结果。本文阐述了以这种方式揭示的关于交互的主要重复推理模式。
博弈论还具有更深层次的自然表征,即抑制局部移动和选择的细节。最常见的形式是策略形式的博弈。在最简单的只有两个玩家的情况下,这些博弈对应一个二维矩阵,其中行代表某个玩家的策略,列代表另一个玩家的策略。因此,该矩阵的各个单元对应于博弈中不同的可能策略配置。通常,所有单元都标记有关于彼此使用相应策略的结果的信息。这种标签根据收益、更抽象的效用或玩家对结果的偏好顺序的序数标记来指定玩家对结果的态度。
策略形式的博弈也能模拟重要的社会场景。以下是来自社会行为演化的哲学文献的一个例子。
示例:以下矩阵形式的博弈是“Skyrms 猎鹿”(2003),其思想可以追溯到大卫·休谟。它是社会契约的隐喻。
E
H S
A H 1,1 1,0
S 0,1 2,2
每个代理都必须决定是追求自己的小项目、猎杀野兔,还是加入更大的集体行动。猎鹿。前者无论其他人做什么,都能带来适度但有保障的收入。而集体行动则只有所有人都参与才能成功,在这种情况下,每个人都能获得高额利润。然而,如果有人不加入,所有贡献都将化为乌有,任何贡献者都无法获得任何回报。在相应的战略形式博弈中,所有参与者必须同时决定下一步行动,而无需了解其他参与者的行动。
猎鹿博弈有两个纯策略纳什均衡:每个人都参与,以及没有人参与。哪种稳定结果最终会出现,关键取决于参与者的推理能力、他们对彼此的期望,甚至可能取决于赛前沟通等信息。
显然,分析战略博弈涉及主体信息、推理能力和期望。所有这些方面都与逻辑紧密相关。将结果视为可能世界,它们之间会出现三种相关的关系。在上面的矩阵中,关联同一行中的所有单元格可以确定行参与者A已经做出的唯一选择,同时让E的移动完全开放。简而言之,每一行水平线都列出了列玩家 E 的所有可能选择,而 A 必须将这些选择纳入考量。因此,相应的模态可以描述 A 在给定其选择的情况下对游戏结果的认知。仍然假设行玩家的视角,将单元格垂直而非水平关联起来,对应于 A 在可用策略中进行选择的自由。当然,也可以假设玩家 E 的视角,将水平方向视为 E 的行动自由,而垂直方向则捕捉她的认知不确定性。
因此,对于矩阵博弈,出现了一种双峰逻辑,其规则如下:
KEKAφ↔KAKEφ,
捕捉矩阵博弈的网格结构。对于两个以上的博弈者,这种逻辑增加了一些额外的选项和微妙之处,将在2.6节中讨论。
至关重要的第三个关系是博弈者对结果的偏好。这些偏好同样具有匹配的模态,这些模态现在取自偏好逻辑(Hansson 2001)。借助一些辅助手段,这三种模态可以定义博弈论的核心概念——纳什均衡(Harrenstein 2004;van der Hoek & Pauly 2007)。
矩阵博弈的逻辑与扩展博弈的逻辑不同,因为网格在复杂性方面与树的行为截然不同。然而,两者都属于相同的通用方法论。为了达成共识,人们可以将矩阵博弈的逻辑视为捕捉并行而非顺序行动的基本规律。
1.3 计算与代理
哲学逻辑和数理逻辑并非探讨博弈论的唯一启迪视角。第三个相关观点是计算逻辑。在现代计算中,范式不再是单一的图灵机,而是多处理器交互系统。这些处理器可以协作,但也可能竞争资源。因此,研究参与计算的多个代理(无论是在人类社会、人工社会还是混合社会中)通常都很有用。通过这样做,游戏也成为了计算的自然模型。事实上,游戏是一个丰富的多代理系统,其中代理处理信息、进行交流并参与行动,所有这些都由各自的偏好和目标驱动。反过来,复杂性和算法等计算机科学主题已经进入博弈论。由此催生了计算博弈论领域(Nisan 等人,2007)。有关代理和博弈的计算逻辑的更详尽综述,请参阅 van der Hoek 和 Pauly(2007)以及 Shoham 和 Leyton-Brown(2008)。本条目偶尔包含与计算相关的链接。这些链接尤其适用于对时间延展博弈及其策略的推理(第 4.2 和 4.4 节),以及在游戏化(第 6 节)的背景下,游戏被探索为经典逻辑系统的一种新语义。
1.4 逻辑中的博弈
最后,回顾本节的开头,但换个角度:与其问逻辑能为游戏做什么,不如问游戏能为逻辑做什么。论证和对话是逻辑的基本概念。两者都可以利用博弈论的技术和结果来研究(Lorenzen & Lorenz,1978;Hamblin,1970)。从这个角度来看,推论的逻辑有效性取决于,在博弈中,主张结论的一方拥有一种制胜策略,而主张前提的一方则拥有这种策略,其博弈的步法受逻辑常数的制约。自20世纪50年代以来,许多博弈在现代逻辑中得到了应用,用于模型比较的Ehrenfeucht-Fraïssé博弈就是一个典型例子。除此之外,语义验证或模型构建也可以被视为自然逻辑博弈。
这在逻辑哲学中引发了一个复杂的问题,即逻辑的本质,尤其是逻辑常数的本质。一个“弱命题”认为,博弈既是一种分析逻辑概念的自然技术,也是一种教授逻辑的教学工具,它直接诉诸于生动的直觉。然而,部分文献也支持一个“强命题”,这表明某些逻辑系统的主要语义可能是程序性的和博弈论性的,而非标准意义上的指称性。这种视角有时被称为“逻辑即游戏”,它出现在一些颇具吸引力的一阶语言语义学中(Hintikka & Sandu 1997),以及编程语言的游戏语义学中。
“逻辑即游戏”的主题在本条目中仅作简要介绍,本条目主要针对游戏逻辑。第六节将讨论将两种视角结合到逻辑与游戏界面时会产生哪些问题。
事实上,“逻辑即游戏”的视角具有更广泛的相关性。逻辑游戏最初是为逻辑内部的特定任务而设计的。然而,在现实中,它们可以帮助分析或简化实际的论证思路。因此,它们可以比作挑战推理能力的精心设计的客厅游戏。像《妙探寻凶》这样的游戏,不仅包含引人入胜的逻辑推理、抽牌或公开观察棋步获得的新信息,还包含玩家的私人交流行为 (van Ditmarsch 2000)。其他客厅游戏,例如《九人莫里斯》(Gasser 1996),是图形游戏 (Grädel, Thomas, & Wilke 2002),增加了随机走法,以降低在固定棋盘上找到可重复简单策略的风险。针对有限智能体设计的可玩性游戏的逻辑研究,以及此类新游戏的设计,是本条目的自然延伸 (参见 van Benthem & Liu 2019)。
1.5 概率
博弈论可以理解为广义交互式决策理论。后者的主要载体,正如标准决策理论一样,是概率论。在游戏中,概率可以扮演多种角色。例如,它可以量化地表达玩家的信念程度,但它也能丰富混合策略的行动空间,从而为一般均衡结果奠定基础。概率甚至可以在某些重要博弈的定义中发挥作用,尤其是在演化博弈论中(Osborne & Rubinstein 1994)。本文只是顺便提及了概率。然而,第五节概述了博弈研究中提出的一些逻辑与概率的结合。
1.6 放大
博弈与各种逻辑有着天然的接口,包括数学、哲学和计算逻辑。在一个方向上,逻辑可以为博弈论提供新的抽象概念。反过来,博弈论概念也可以丰富逻辑分析。本文主要关注第一个方向,即使用逻辑分析博弈。它主要从语义的角度进行,这是迄今为止该领域的主导范式。尽管偶尔也会提到证明论方法。接下来的章节将从几个维度详细阐述这一主题。具体视角包括游戏结构的逻辑(第2节)、玩家本质的逻辑分析(第3节)以及游戏过程的逻辑分析(第4节)。此外,本书还重点探讨了游戏语境中逻辑与概率的关系(第5节)以及游戏化的努力(第6节)。每一节都构成一个独立的论述,因此不可避免地会有一些内容重叠,但这些重叠或许是有益的。本书假设读者熟悉逻辑和博弈论的基本概念。特别是,本书未解释的博弈论概念,可以在相应的条目以及Leyton-Brown和Shoham(2008)的著作中找到。
2.博弈结构与博弈逻辑
本专题第一部分重点关注狭义的博弈结构。博弈形式撇开了主体及其典型概念,例如偏好或信息。玩家以及游戏的时间进程将在后续章节中介绍。即便如此,博弈形式中已经存在大量结构,可供逻辑技术研究。
2.1 表征层次
任何逻辑分析的起点都是确定其对博弈的视角。本节将回顾几个主要的候选视角,首先从两个最突出的视角开始。第一个视角明确了博弈的时间结构,将其表示为标准数学意义上的树。
示例:一个双人扩展形式博弈。
这是一个演示示例的博弈树图。扩展描述(链接见图注)将描述该树。
图 3. ⓘ
扩展形式的博弈是一棵树,其中每个非终端节点或状态指定下一步由哪个玩家移动,而边则对应于玩家可能的移动。最后,树叶表示博弈的可能结果 O。这些关于状态和移动的规定有很多可能的变体,但它们并不影响逻辑分析的本质。
博弈的第二个主要视角强调玩家可用的策略。在抑制所有关于时间结构的信息后,策略形式的博弈会呈现出博弈论中已知的矩阵图。在其经典解释中,策略形式的博弈代表一组玩家,每个玩家都为整个博弈选择一个完整的策略,而无需了解其他玩家的选择。每个策略概况,即每个玩家一个策略的组合,然后引发结果 Oi。这种结构的动机乍一看可能很复杂。然而,它也可以看作相当简单的东西:一个单步博弈,其移动是平行的而不是连续的,这是同时行动最简单的情况。