分析游戏的逻辑(二)

示例是双人战略形式游戏。

e

一个b

一个c o1氧气

d o3 o4

广泛而战略形式的重点不同。 前者强调游戏的连续时间结构,而后者在玩耍前突出了战略选择。 一个人可以在适当的目的掌握之间自由切换。 除了这两个方面,还有其他自然尺寸,突出了运动员的力量,以影响关于游戏的结果(第2.5节)或球员信息(参见第3.6节)。

备注虽然到目前为止所有示例都有关两个玩家游戏,但没有需要这种限制。 尽管可能发生偶尔的微妙之处,但虽然可能发生了广泛的游戏和战略形式游戏。 下面将提到一些。 此外,通过更多的玩家,可能的联盟进入图片,这是一个在此条目中不会对待的话题。 最后,机构的选定方面有时可能进入后门。 现实生活中的许多情景都包含任何玩家控制之外的外部机会事件,例如模具,天气条件或技术故障的卷。 通常可以通过承认作为额外玩家的性质来纳入逻辑分析。

2.2游戏之间的不变性关系

用不同的方式代表游戏,有一个关于等价的自然跟进问题。 考虑到两个游戏结构,它们是什么时候是相同的底层游戏的表示? 答案是它非常依赖于对其感兴趣的方面。

示例相同的游戏,还是没有?

这有两个游戏树图,示出了示例。 扩展描述(图标题中的链接)将描述树。

图4.ⓘ

考虑上面的两种游戏形式。 如果一个人关注的动作序列或选择球员沿途,这些游戏是不同的。 左边的游戏首先移动,而E在右边的游戏中开始。 在右边的游戏中,A可以面临P和Q之间的选择。 这不能发生在左侧。

关心在这里完成的确切动作构成了对游戏的细粒度的透视。 还有其他人。 例如,当关注玩家的力量来带来某些结果,例如分析变化。 在左侧的游戏中,A有一个策略(播放左),确保游戏最终以满足P的结果,以及一个(竞争对手)限制可能结果给满足q∨r的那些结果。 通过这一策略,将Qorr中的进一步选择被实现为玩家E.也是第二名玩家,E,左边的比赛中有两种策略,一个(剩下左)确保了满足p∨q的结果,另一种(竞争对手)保证结果满足p∨r。

对右边的游戏执行相同的计算,几乎相同的玩家力量出现。 更确切地说,A的统一策略左右和右右产量P和q∨r分别与左游戏完全相同。 左右左右的两个剩余策略p∨q和p∨r,两者都仅仅削弱了A的力量来实现p。 因此,在玩家的力量水平,上述两种游戏形式应该被认为是相同的。

正如该示例所示,比较游戏的几种合法方式。 在对游戏的内部结构进行细微诱人的关注时,自然候选人是一番分布的概念(CF.Blackburn,De Rijke和Venema 2001)。 Bisimulationz⊆g1×G2与四个条件的两个游戏形式G1和G2涉及以下条件:状态M和N可能只与(i)在M和N中移动到M和N,(ii)m和n的任何基本本地属性中的任何相关的播放器(iiia)只要在G1中的类型A的可用移动导致状态M',就会有一个匹配的A中的G2中的可用移动,导致状态为N',反之亦然(iiib),导致G2的移动在一个状态n'中,在g1中存在相同类型的移动导致状态m'与m'zn'。

示例了游戏之间的双刺激。

这有两个游戏树图,示出了示例。 扩展描述(图标题中的链接)将描述树。

图5.ⓘ

这种特殊的双刺激概念不是对游戏有意义的唯一不变性。 例如,更粗糙的角度可能不会通过其特定的动作类型来区分移动,而是仅通过哪种播放器执行它们。 可以通过省略对上述条件(iiia)和(iiib)的特定动作类型来定义相应的双刺激。

Bisimulation的进一步概念在游戏的移动结构上采取偶数较粗糙的角度,例如通过允许在行连续几次移动的区域进行收缩。 最后,通过他们承认的移动序列,可以比较有关玩家及其选择的所有信息。 然而,这种纯粹的观察概念,称为计算中的痕量等价,可能在游戏的背景下不太重要。 粗化的替代方法侧重于球员的权力控制成果,参见 第2.5节和van Benthem,Bezhanishvili和Enqvist(2019a)。

虽然大多数概念讨论到目前为止与广泛的形式游戏有关,但类似的分析风格适用于战略形式的游戏。 Van Benthem,Pacuit和Roy(2011)定义了连接不同矩阵的结果状态的模态二分布,并将双重估计的前后条件应用于球员选择,自由和偏好的相关关系。

这可能是较好的指出,即通过仅涉及游戏形式,省略了任何玩家相关方面,例如结果之间的偏好。 添加这些时,识别适当的不变性概念变得更具挑战性,如下面第3节将在第3节中讨论。

2.3匹配不变性关系的语言

不变关系的选择反映哪种结构在游戏的给定透视中被视为相关。 用于带出这些相关方面的中央工具是存在符合某些不变性关系的逻辑语言。 一般来说,不变性的角度更细粒度,匹配语言的区别越多。

出于一开始,如果一个人对播放器可以通过移动带来的属性感兴趣,则良好的语言选择基于模态⟨movei⟩φ,表示我可用的至少一个移动导致下一阶段满足φ。 以下说明了这种语言如何在给定的广泛形式游戏中工作。

示例模态游戏语言。

这是说明示例的游戏树图。 扩展描述(图标题中的链接)将描述树。

图6.ⓘ

DomaL公式[Movea]⟨movee⟩wine在根r处,表达了e有一种策略,确保她的胜利分两步:无论是什么,E可以以这样的方式做出反应,以便她最终在她赢的节点中。 在更细粒度的角度下,模态语言可以添加表达式[A],[B] ......对于特定的移动类型A,B,......。 在这种语言中,粗粒度模态⟨movei⟩φ是可明确的,⋁a是i⟨a⟩φ的移动,使新语言成为旧的细化。

通过这种方式,模态逻辑的一般结果适用于游戏。 例如,拍摄尖头模型,例如游戏树,具有当前时刻的指示器。 每当两个这样的尖头模型G,M和G',M'在上面定义的第一感测,时,等效G,M∞φIFFG',M'∞φ以足够丰富的模态语言为所有公式φ保持,每个型号为每个型号[a]移动标签。 因此,可以在语法,语言基于语言的视角和语义不变性关系之间切换,具体取决于对游戏给定的透视的方便。 完全类似的积分,用于电力观点的Bisimulation和模态语言,或战略表格游戏。

最后,模态语言没有独家权利。 如果需要更细粒度的观点,那么更具表现力的一阶或高阶语言成为描述游戏的严重竞争者。

2.4广泛游戏的模态逻辑

游戏语言促进了两者,定义游戏的属性和推理它们。 刚才讨论的两步广泛游戏中的播放器策略是一个例子。 更一般地说,对于任何有限的广泛游戏,每个代理j都有formulasφj是真正的iff j有一个获胜策略:

φj:= [movei]⟨movej⟩[movei] ... winj

公式中运算符的数量对应于树的深度。

因此,逻辑法律治疗诸如如此公式的推理获取游戏理论内容。 例如,对一个玩家A的声明具有赢得策略的否定是可证明的,这些策略是指另一个玩家e的胜利策略,至少在那些赢得胜利的情况下,只有e:

¬φa=¬⟨movea⟩[movee]⟨movee⟩...维纳

↔[movea]⟨movee⟩[movee] ...¬wina

↔[movea]⟨movee⟩[movee] ...葡萄酒=φe

因此,在其模态幌子中排除中间的逻辑规律对应于Zermelo的定理,说明有限游戏的确定性。

然而,在逻辑法律方面存在局限性的游戏理论属性的特征。 公式说明某些玩家是否具有从模型到模型的获奖策略的变化,因为模态运算符的数量取决于游戏树的大小。 实际上,表达了播放器的基本模态语言中没有统一的公式,我可以在任意有限的广泛形式游戏中获胜。 这种公式只能在模态μ-微积分(Venema 2008)中找到,其中我有赢得策略的陈述可以用固定点公式表达

μp。(wini∨(turni∧⟨i⟩p)∨

j≠我

(turnj∧[j] p)

这里更通称的是,游戏理论均衡和解决方案概念的递归性质自然地反映了具有固定点操作者的逻辑,用于诱导和递归。

在此设置中,关于模态逻辑的已知结果获取新的意义。 例如,在有限模型的领域中,在两个状态下具有相同的模态公式,相当于与连接这两个状态的分发(CF.Blackburn,de Rijke和Venema 2001)。 因此,只要两个有限的游戏满足它们各自根部的相同模态命题,它们在双刺激感相同。 对于无限型号,这种结果不太直接。 例如,Bisimulation和满足相同公式之间的完整等价仅适用于具有无限连词和剖钉的扩展模态语言。 其他相关结果包括存在模态公式,其定义给出的尖头模型直到分布。 这种配方有时以基本的模态语言存在,有时在μ-微积分中,并且始终处于无限性的模态语言。 应用于具体游戏G,这些模态定义可以被视为G处于相关的不变性水平的所有属性的完整描述。

最后,模态逻辑有许多完整的证明系统,用于捕获各类模型的有效后果(Blackburn,de Rijke和Venema 2001)。 这些计算也适用于游戏,他们可以捕获专门的游戏理论论证的方面。 证明理论观点不是本入口的重点,但在适当的情况下将提及许多股线。

2.5 Modal邻域逻辑为权力

除了广泛的形式游戏外,标准模态逻辑也适用于游戏结构的电源透视。 有时候,人们忽略了一生游戏的内部机制,仅仅将其视为一个黑匣子社会机制,在一定程度上控制结果。 在这个角度来看,如果她命令一项策略,玩家可以强迫游戏的结果在一些集合x中,这是一个确保游戏最终在X的结果最终,无论其他玩家都做了什么(van der Hoek&Pauly 2007)。 类似地,如果她具有强制执行游戏以φ状态结束的电源,则玩家可以强迫一些命题φ保持。 所有代表代理商可以强迫的集合通常被称为她的强迫权力。 在古典博弈论中,这些强迫权力有时通过有效函数(Peleg 1997)的名称,这些功能通常也研究了参与者联盟(参见2001年的Pauly; Goranko,Jamroga,&Turrini 2013;以及进入用于分析正常形式游戏电力的逻辑)。

在广泛的游戏中的示例权力。

这是说明示例的游戏树图。 扩展描述(图标题中的链接)将描述树。

图7.ⓘ

值得注意的是,强迫权力并不结合关闭。 在上面的游戏中,代理A可以单独地强制P和Q而不能够强制p∧q。 在模态逻辑术语中,强制权力导致邻域逻辑(Pacuit 2017),其中邻域函数列表该组结果播放器可以从给定状态强制执行。 然后,对迫使权力的推理可以使用逻辑语言,其中每个玩家迫使模态{i}:

{i}φ:代理商我可以强迫游戏的结果满足φ。

这些模态可以通过与上述邻域功能的扩展游戏形式进行解释。 在语义方面,上述邻域模型的概括支持电力分布的广义概念,参见Van Benthem,Pacuit和Roy(2011)。

权力的模态逻辑允许在全球化的描述层面上推理游戏。 邻域模型的模态逻辑验证了标准的模态单调性原理

{我}φ→{我}(φ∨ψ),

如下所示的强迫模式的真相定义。 但是,由于迫使权力在交叉口下没有关闭,汇总法失败:

({我}φ∧{我}ψ)↛{我}(φ∧ψ)。

相反,逻辑包含新的有效原则,与不同的玩家有关迫使模态的新有效原则。 例如,如果我能强制φ的真实,那么没有其他玩家j可以强迫其虚伪性。 因此,

{我}φ→¬{j}¬φ

是迫使权力逻辑的“权力一致性”的有效原则。 这一原则的比赛与两个玩家I,J

¬{j}¬φ→{我}φ

表达了最后一节的确定性概念。 该公式通常不有效,但是特殊类别的游戏的公理。

最后,假设逻辑游戏的早期透视图,还存在有关权力的替代方案的透视。 第2.2节核心示例中描绘的两场比赛可以被视为命题公式的评估游戏

p∧(q∨r)和(p∧q)∨(p∧r)。

他们的等价Qua Powers之前描述的,然后符合标准的分布定律。 该代数透视将在第2.9节中返回。

最近的迫使和权力的看法重新解释了上述定义中所采用的结果的X次数,如涉及两名球员:一名球员限制了一组结果,而另一名球员可以在该集合中实现所有结果。 约束和自由之间的这种平衡显着影响了游戏等价的相应概念,以及使用的模态语言(Van Benthem,Bezhanishvili和Enqvist 2019b)。

2.6战略游戏的模态逻辑

在对比赛的战略角度来看,玩家同时选择行动,而不了解他们的对手的行动选择。 这需要额外的分析水平。 除了各种可能的动作之外,足够的代表还必须跟踪玩家对他们的对手如何行动的不确定性。

就匹配逻辑语言而言,这表明了一种多模态方法,[≈I]范围内的可能选择,而且[≡i]代表她对对手的不确定性,参见van Benthem,Pacuit和Roy(2011)。 此外,在考虑游戏而不是游戏形式时,需要丰富这张照片,并富有第三个功能。 偏好模式[⪯i],参见第3节。

战略形式的游戏可以自然地视为选择性的模特语言的模型和不确定性,其中每个州M包括策略配置文件,即序列(M1,M2 ...)列出每个玩家的行动选择。 为方便起见,已包括偏好模态:

G,m⊨[≈I]φ。鉴于对手的动作,φ保持任何我所做的。

g,m⊨]φ。鉴于我的选择,φ保持对手做的任何事情。

g,m⊨]φ。φ至少与当前的状态一样好。

这种多模态语言可以表达关于战略形式游戏的各种陈述,例如:

⟨≈i⟩⟨≡i⟩φ。φ是游戏的可能结果

[≈I] [≡i]φ。游戏的所有结果都满足φ

[⪯i]⟨⪯i⟩φ。用于播放器的一些最佳状态满足φ

在两个玩家的情况下,一个代理的选择对应于另一个的不确定性,反之亦然。 这表明了原则的有效性

[≡i]φ↔[≈j]φ

更一般地,矩阵游戏的逻辑包括β≈I]和[≡i]的S5公理,还包括换向法

[≈i] [≡i]φ↔[≡i] [≈i]φ

表达矩阵游戏的网格状结构。 此逻辑与符合行动逻辑的相似之处(Herzig&Lorini 2010)。 从技术上讲,模型中的网格结构允许编码未定定的计算问题(Blackburn,de Rijke和Venema 2001),渲染它是一个开放问题的游戏矩阵的富有表现力模态逻辑是可解除的。

从两个到更多玩家的步骤,通常在认知逻辑中常规,可以在矩阵游戏的逻辑中精致。 [≈i]类型的可访问性关系,解释为除I-坐标之外的简档的标识,产生类似于首级逻辑的三次变量片段的产品逻辑,这是未定名的(BezhanishVili 2006)。 然而,只有在i-co坐标上的身份关系,即,[≡i],逻辑仍然可判定(Venema 1998; Van de Putte,Tamminga,&Duijf 2017; Lomuscio,Van der Meyden,&ryan 2000)。

2.7作为逻辑对象的策略

广泛的游戏中有更多的结构而不是单一的移动。 在游戏树中,玩家的策略指定在每次转弯时要做什么,无论是否会达到这种转弯。 越来越多的工作审查了这些策略及其潜在格式,见Van Benthem,Ghosh和Verbrugge(2015)以概述各种逻辑框架,了解策略。

在一个具体的透视图中,策略类似于指示代理如何导航游戏树的程序。 因此,策略的自然逻辑使用程序PDL的命题动态逻辑语言,以后将返回的方法。 随着程序的一般非确定性,这种逻辑让策略推荐一个或多个动作代理应该在每转时接受。 在这种观点中,策略类似于可能持久的计划。

在程序格式中,策略从基本操作开始,表示单个在游戏树中移动。 从那里,可以使用包括顺序组合物π1的操作来创建复杂的程序π;Π2(π1,后跟π2),或选择π1∪iπ2(代理I在动作π1和π2之间拾取)。 此外,用于检查φ是否保持的测试操作?φ使策略能够对状态或对手的过去的特性作出反应。 最后,为了描述沿着游戏树的策略的连续执行,具有程序迭代的操作π*是有意义的,说明Π经常被任意地执行。

(本章完)

相关推荐