分析游戏的逻辑(二)
示例是双人广泛的形式游戏。
这是说明示例的游戏树图。 扩展描述(图标题中的链接)将描述树。
图3.ⓘ
以广泛形式的游戏是一棵树,其中每个非终端节点或状态指定接下来移动哪个播放器,而边缘对应于播放器可能的移动。 最后,树的叶子最终表示游戏的可能结果。 各种规定的这些规定有许多可能的变化,但它们不影响逻辑分析的必要性。
关于游戏的第二个主要视角强调了参与者的可用策略。 抑制关于时间结构的所有信息,战略形式的游戏产生了博弈论中已知的矩阵图片。 在经典的解释中,战略形式的游戏代表了一系列玩家,每个玩家都为整个游戏选择完整的策略,而不是了解其他玩家的选择。 每个策略简介,即每个玩家的一个策略的组合,然后诱导结果oi。 这一结构的动机在第一眼中看起来很复杂。 然而,它也可以被视为一个非常简单的东西:一个平行而不是顺序移动的一步游戏,这是同时动作的最简单情况。
示例是双人战略形式游戏。
e
一个b
一个c o1氧气
d o3 o4
广泛而战略形式的重点不同。 前者强调游戏的连续时间结构,而后者在玩耍前突出了战略选择。 一个人可以在适当的目的掌握之间自由切换。 除了这两个方面,还有其他自然尺寸,突出了运动员的力量,以影响关于游戏的结果(第2.5节)或球员信息(参见第3.6节)。
备注虽然到目前为止所有示例都有关两个玩家游戏,但没有需要这种限制。 尽管可能发生偶尔的微妙之处,但虽然可能发生了广泛的游戏和战略形式游戏。 下面将提到一些。 此外,通过更多的玩家,可能的联盟进入图片,这是一个在此条目中不会对待的话题。 最后,机构的选定方面有时可能进入后门。 现实生活中的许多情景都包含任何玩家控制之外的外部机会事件,例如模具,天气条件或技术故障的卷。 通常可以通过承认作为额外玩家的性质来纳入逻辑分析。
2.2游戏之间的不变性关系
用不同的方式代表游戏,有一个关于等价的自然跟进问题。 考虑到两个游戏结构,它们是什么时候是相同的底层游戏的表示? 答案是它非常依赖于对其感兴趣的方面。
示例相同的游戏,还是没有?
这有两个游戏树图,示出了示例。 扩展描述(图标题中的链接)将描述树。
图4.ⓘ
考虑上面的两种游戏形式。 如果一个人关注的动作序列或选择球员沿途,这些游戏是不同的。 左边的游戏首先移动,而E在右边的游戏中开始。 在右边的游戏中,A可以面临P和Q之间的选择。 这不能发生在左侧。
关心在这里完成的确切动作构成了对游戏的细粒度的透视。 还有其他人。 例如,当关注玩家的力量来带来某些结果,例如分析变化。 在左侧的游戏中,A有一个策略(播放左),确保游戏最终以满足P的结果,以及一个(竞争对手)限制可能结果给满足q∨r的那些结果。 通过这一策略,将Qorr中的进一步选择被实现为玩家E.也是第二名玩家,E,左边的比赛中有两种策略,一个(剩下左)确保了满足p∨q的结果,另一种(竞争对手)保证结果满足p∨r。
对右边的游戏执行相同的计算,几乎相同的玩家力量出现。 更确切地说,A的统一策略左右和右右产量P和q∨r分别与左游戏完全相同。 左右左右的两个剩余策略p∨q和p∨r,两者都仅仅削弱了A的力量来实现p。 因此,在玩家的力量水平,上述两种游戏形式应该被认为是相同的。
正如该示例所示,比较游戏的几种合法方式。 在对游戏的内部结构进行细微诱人的关注时,自然候选人是一番分布的概念(CF.Blackburn,De Rijke和Venema 2001)。 Bisimulationz⊆g1×G2与四个条件的两个游戏形式G1和G2涉及以下条件:状态M和N可能只与(i)在M和N中移动到M和N,(ii)m和n的任何基本本地属性中的任何相关的播放器(iiia)只要在G1中的类型A的可用移动导致状态M',就会有一个匹配的A中的G2中的可用移动,导致状态为N',反之亦然(iiib),导致G2的移动在一个状态n'中,在g1中存在相同类型的移动导致状态m'与m'zn'。
示例了游戏之间的双刺激。
这有两个游戏树图,示出了示例。 扩展描述(图标题中的链接)将描述树。
图5.ⓘ
这种特殊的双刺激概念不是对游戏有意义的唯一不变性。 例如,更粗糙的角度可能不会通过其特定的动作类型来区分移动,而是仅通过哪种播放器执行它们。 可以通过省略对上述条件(iiia)和(iiib)的特定动作类型来定义相应的双刺激。
Bisimulation的进一步概念在游戏的移动结构上采取偶数较粗糙的角度,例如通过允许在行连续几次移动的区域进行收缩。 最后,通过他们承认的移动序列,可以比较有关玩家及其选择的所有信息。 然而,这种纯粹的观察概念,称为计算中的痕量等价,可能在游戏的背景下不太重要。 粗化的替代方法侧重于球员的权力控制成果,参见 第2.5节和van Benthem,Bezhanishvili和Enqvist(2019a)。
虽然大多数概念讨论到目前为止与广泛的形式游戏有关,但类似的分析风格适用于战略形式的游戏。 Van Benthem,Pacuit和Roy(2011)定义了连接不同矩阵的结果状态的模态二分布,并将双重估计的前后条件应用于球员选择,自由和偏好的相关关系。
这可能是较好的指出,即通过仅涉及游戏形式,省略了任何玩家相关方面,例如结果之间的偏好。 添加这些时,识别适当的不变性概念变得更具挑战性,如下面第3节将在第3节中讨论。
2.3匹配不变性关系的语言
不变关系的选择反映哪种结构在游戏的给定透视中被视为相关。 用于带出这些相关方面的中央工具是存在符合某些不变性关系的逻辑语言。 一般来说,不变性的角度更细粒度,匹配语言的区别越多。
出于一开始,如果一个人对播放器可以通过移动带来的属性感兴趣,则良好的语言选择基于模态⟨movei⟩φ,表示我可用的至少一个移动导致下一阶段满足φ。 以下说明了这种语言如何在给定的广泛形式游戏中工作。
示例模态游戏语言。
这是说明示例的游戏树图。扩展描述(图片标题中的链接)将描述该树。
图 6。ⓘ
模态公式 [moveA]⟨moveE⟩winE,在根 r 处为真,表示 E 有一个确保她分两步获胜的策略:无论 A 做什么,E 都可以做出反应,最终到达一个她获胜的节点。从更细粒度的角度来看,模态语言可以为特定移动类型 a、b、… 添加表达式 [a]、[b]…。在这种语言中,粗粒度模态 ⟨movei⟩φ 可以通过析取 ⋁a 是 i⟨a⟩φ 的移动来定义,使新语言成为旧语言的改进。
这样,模态逻辑的一般结果适用于游戏。例如,采用带有当前时刻指标的游戏树等尖锐模型。每当两个这样的尖锐模型 G,m 和 G′,m′ 在上述第一种意义上是双相似的,等价关系 G,m⊨φ 当且仅当 G′,m′⊨φ 对于具有足够丰富的模态语言的所有公式 φ 都成立,并且每个移动标签的模态为 [a]。因此,可以根据给定游戏视角的便利性,在句法、基于语言的视角和语义不变关系之间切换。对于双模拟和权力视角的模态语言,或对于战略形式游戏,完全类似的观点成立。
最后,模态语言没有专有权。如果需要更细粒度的视角,更具表现力的一阶或高阶语言将成为描述游戏的有力竞争者。
2.4 广泛游戏的模态逻辑
游戏语言既有助于定义游戏属性,又有助于推理游戏属性。一个例子是刚刚讨论的两步广泛游戏中玩家的获胜策略。更一般地,对于任何有限的广泛博弈,每个代理 j 都有公式 φj,当且仅当 j 有一个获胜策略时,这些公式才为真:
φj:=[movei]⟨movej⟩[movei]…winj
其中公式中的运算符数对应于树的深度。
因此,使用此类公式进行推理的逻辑定律获得了博弈论内容。例如,否定一个玩家 A 有获胜策略的说法可证明等同于说另一个玩家 E 有获胜策略,至少在 A 获胜且仅当 E 不获胜的情况下:
¬φA =¬⟨moveA⟩[moveE]⟨moveE⟩…winA
↔[moveA]⟨moveE⟩[moveE]…¬winA
↔[moveA]⟨moveE⟩[moveE]…winE=φE
因此,模态形式的排中律对应于 Zermelo 定理,陈述有限博弈的确定性。
然而,从逻辑定律的角度来看,博弈论属性的这种表征存在局限性。说明某个玩家是否有获胜策略的公式因模型而异,因为模态运算符的数量取决于博弈树的大小。事实上,基本模态语言中并没有统一的公式来表达玩家i可以在任意有限扩展形式博弈中获胜。这样的公式只能在模态 μ 演算 (Venema 2008) 中找到,其中 i 有获胜策略的陈述可以用不动点公式来表示
μp.(wini∨(turni∧⟨i⟩p)∨
⋀
j≠i
(turnj∧[j]p)
这里更普遍的观点是,博弈论均衡和解决方案概念的递归性质自然反映在具有归纳和递归不动点运算符的逻辑中。
在这种情况下,已知的模态逻辑结果获得了新的意义。例如,在有限模型领域,在两个状态下具有相同的模态公式等同于存在连接这两个状态的双模拟(参见 Blackburn、de Rijke 和 Venema 2001)。因此,只要两个有限游戏在各自的根中满足相同的模态命题,它们在双模拟的意义上就是等价的。对于无限模型,这样的结果不太直接。例如,双模拟和满足相同公式之间的完全等价性只适用于具有无限合取和析取的扩展模态语言。其他相关结果包括存在定义给定尖锐模型直至双模拟的模态公式。这样的公式有时存在于基本模态语言中,有时存在于μ-演算中,并且总是存在于无限模态语言中。应用于具体游戏G,这些模态定义可以看作是G在相关不变性水平上的所有属性的完整描述。
最后,模态逻辑有许多完整的证明系统,用于捕捉各种模型类的有效后果(Blackburn、de Rijke和Venema 2001)。这些推理演算也适用于游戏,它们可以捕捉专门的博弈论论证的各个方面。证明论观点不是本条目的重点,但会在适当的情况下提到一些线索。
2.5 权力的模态邻域逻辑
除了扩展形式游戏之外,标准模态逻辑也适用于游戏结构的权力视角。有时,人们会完全忽略游戏的内部机制,仅仅将其视为黑箱社会机制,玩家在一定程度上控制结果。从这个角度来看,如果玩家掌握了一种策略,无论其他玩家做什么,都能确保游戏最终以 X 的结果结束,那么她就可以强制游戏结果处于某个集合 X 中(van der Hoek & Pauly 2007)。同样,如果玩家有能力强制游戏以 φ 状态结束,那么她就可以强制某个命题 φ 成立。代理可以强制的所有结果集的集合通常称为她的强制权力。在经典博弈论中,这些强制能力有时被称为有效性函数(Peleg 1997),它们也经常用于研究玩家联盟(参见 Pauly 2001;Goranko、Jamroga 和 Turrini 2013;以及用于分析标准形式游戏中权力的逻辑条目)。
广泛游戏中的示例权力。
这是说明示例的游戏树图。扩展描述(图片标题中的链接)将描述树。
图 7。ⓘ
值得注意的是,强制能力在合取下并不封闭。在上面的游戏中,代理 A 可以单独强制 p 和 q,而不能强制 p∧q。在模态逻辑术语中,强制能力产生了邻域逻辑(Pacuit 2017),其中邻域函数列出了玩家可以从给定状态强制执行的结果集。然后,对强制能力进行推理可以使用一种逻辑语言,其中每个玩家的强制模态为 {i}:
{i}φ:代理 i 可以强制游戏结果满足 φ。
这些模态可以通过上述具有邻域函数的扩展游戏形式进行解释。在语义方面,上述邻域模型的泛化支持广义的权力双模拟概念,参见 van Benthem、Pacuit 和 Roy (2011)。
权力的模态逻辑允许在全局描述层面上对游戏进行推理。邻域模型的模态逻辑验证了标准模态单调性原理
{i}φ→{i}(φ∨ψ),
如下所述,这是从强制模态的真实定义得出的。然而,由于强制能力在交集下不封闭,因此聚合定律失效:
({i}φ∧{i}ψ)↛{i}(φ∧ψ)。
相反,该逻辑包含与不同玩家的强制方式相关的新有效原则。例如,如果 i 可以强制 φ 为真,那么其他玩家 j 就不能强制其为假。因此,
{i}φ→¬{j}¬φ
是强制权力逻辑中“权力一致性”的有效原则。对于有两个玩家 i,j
¬{j}¬φ→{i}φ
的游戏,该原则的逆向表达了上一节中的确定性概念。这个公式通常无效,但它是特殊类别的确定性游戏的公理。
最后,还有另一种更代数的权力视角,假设前面提到的逻辑游戏视角。第 2.2 节核心示例中描述的两个游戏可以看作是命题公式的评估游戏
p∧(q∨r) 和 (p∧q)∨(p∧r)。
前面描述的它们的等价性(作为权力)与标准命题分布定律相匹配。这种代数视角将在第 2.9 节中再次出现。
强制和权力的最新观点将上述定义中使用的结果集 X 重新解释为指代两个玩家:一个玩家限制了总结果集,而另一个玩家可以实现该集合内的所有结果。约束和自由之间的这种平衡显著影响了相应的游戏等价概念以及所使用的模态语言(van Benthem、Bezhanishvili 和 Enqvist 2019b)。
2.6 战略游戏的模态逻辑
从战略角度来看,玩家同时选择行动,而无需了解对手的行动选择。这需要额外的分析水平。除了各种可能的举动之外,充分的表示还必须跟踪玩家对对手可能如何行动的不确定性。
在匹配逻辑语言方面,这表明了一种多模态方法,其中 [≈i] 涵盖 i 的可能选择,而 [≡i] 代表她对对手的不确定性,参见 van Benthem、Pacuit 和 Roy (2011)。此外,当考虑游戏而不是游戏形式时,这幅图需要用第三个特征来丰富,即偏好模态 [⪯i],参见第 3 节。
战略形式的游戏可以自然地视为选择性的模特语言的模型和不确定性,其中每个州M包括策略配置文件,即序列(M1,M2 ...)列出每个玩家的行动选择。 为方便起见,已包括偏好模态:
G,m⊨[≈I]φ。鉴于对手的动作,φ保持任何我所做的。
g,m⊨]φ。鉴于我的选择,φ保持对手做的任何事情。
g,m⊨]φ。φ至少与当前的状态一样好。
这种多模态语言可以表达关于战略形式游戏的各种陈述,例如:
⟨≈i⟩⟨≡i⟩φ。φ是游戏的可能结果
[≈I] [≡i]φ。游戏的所有结果都满足φ
[⪯i]⟨⪯i⟩φ。用于播放器的一些最佳状态满足φ
在两个玩家的情况下,一个代理的选择对应于另一个的不确定性,反之亦然。 这表明了原则的有效性
[≡i]φ↔[≈j]φ
更一般地,矩阵游戏的逻辑包括β≈I]和[≡i]的S5公理,还包括换向法
[≈i] [≡i]φ↔[≡i] [≈i]φ
表达矩阵游戏的网格状结构。 此逻辑与符合行动逻辑的相似之处(Herzig&Lorini 2010)。 从技术上讲,模型中的网格结构允许编码未定定的计算问题(Blackburn,de Rijke和Venema 2001),渲染它是一个开放问题的游戏矩阵的富有表现力模态逻辑是可解除的。
从两个到更多玩家的步骤,通常在认知逻辑中常规,可以在矩阵游戏的逻辑中精致。 [≈i]类型的可访问性关系,解释为除I-坐标之外的简档的标识,产生类似于首级逻辑的三次变量片段的产品逻辑,这是未定名的(BezhanishVili 2006)。 然而,只有在i-co坐标上的身份关系,即,[≡i],逻辑仍然可判定(Venema 1998; Van de Putte,Tamminga,&Duijf 2017; Lomuscio,Van der Meyden,&ryan 2000)。
2.7作为逻辑对象的策略
广泛的游戏中有更多的结构而不是单一的移动。 在游戏树中,玩家的策略指定在每次转弯时要做什么,无论是否会达到这种转弯。 越来越多的工作审查了这些策略及其潜在格式,见Van Benthem,Ghosh和Verbrugge(2015)以概述各种逻辑框架,了解策略。