博弈论的认识论基础(九)

迭代弱优势的认知表征并不直接适应分析第3.1.2节讨论的迭代严格统治的分析。 特别是,任何这种分析必须解决战略推理之间的冲突,其中球员排除其对手的某些战略选择以及某种形式的谨慎性,其中球员认为其他球员的所有合理选择是可能的。 一些作者制定了解决这一冲突的框架(Brandenburger,Friedenberg,&Keisler 2008; Asheim&Dufwenberg 2003; Halpern&Pass 2019; Lorini 2013; Catonini&devito 2023 [其他互联网资源]; Stahl 1995; Hillas&Samet 2020)。 在本节的剩余部分中,我们从(Brandenburger,Friedenberg和Keisler 2008)中绘制其中一个解决方案

关键的想法是将球员的信念作为词典概率系统(LPS)代表。 LPS是具有支持的概率测量(P1,P2,...,Pn)的有限序列(在一组状态下定义的概率测量P的支持是具有非零概率的所有状态的集合;正式,pupp(p)= {w | p(w)> 0})不重叠。 这被解释如下:如果(p1,...,pn)代表安氏的信念,那么P1是Ann的“初步假设”,关于鲍勃将要做的是什么,P2是Ann的次要假设,等等。 例如,在图22的游戏中,我们可以描述鲍勃的信念如下:他的初步假设是安为Ann将选择U概率1,他的次要假设是她将选择D概率1.解释是,虽然鲍勃并没有完全排除Ann将选择D的可能性,他认为它不太可能比她选择你。

代表信仰作为词典概率措施使我们更接近解决战略推理与球员不发挥策略的策略之间的冲突,以解决迭代攻击弱统治策略的策略之间的冲突。 然而,存在迭代弱优势的认知分析中出现的另一个,更基本的问题:

根据可否受理,ANN考虑一切可能。 但这只是一个决定性的声明。 安在一场比赛中,所以我们想象她问自己:“鲍勃怎么样? 他认为可能是什么?“ 如果安妮真正考虑一切可能,那么似乎她应该允许鲍勃没有的可能性! 或者,似乎完全分析了可否受理要求应包括其他玩家不符合要求的想法。 (Brandenburger,Friedenberg,&Keisler 2008:313)

迭代弱优势的认知表征有两种主要成分。 首先是将球员的信仰代表作为词典概率系统。 第二是使用更强大的信仰概念:玩家假设一个事件e提供的E无数更有可能比

¯

e

(在有限空间上,这意味着E中的每个州都比不在e上的状态更有可能(见Brandenburger,Friedenberg和Keisler 2023,最近讨论这种信仰的概念)。 关键问题是:事件“合理性和合理性共同假设”之间的确切关系是什么以及迭代迭代脱击策略的策略? 答案的细节超出了本文的范围(见Brandenburger,Friedenberg,&Keisler 2008为答案)。

3.5前进诱导和广泛的形式合理化

与向后归纳不同,前向诱导不是以广泛形式的游戏的明确定义解决方案概念,而是一个局域网的概念,即球员在当前和未来决策节点的目前和未来决策节点中汲取策略和对他人的信仰的局面的术语,基于关于他们在过去所选择的内容的观察。 实际上,“向后归纳”术语“归纳”唤起了数学诱导的概念。 另一方面,“前进归纳”带来了更严格的感觉归因于归纳的理由:决策者基于有限数量的过去观察,得出关于未来观察的结论。 任何解决方案的任何解决方案概念的一个关键方面,它采用了前进的诱导推理,是玩家在游戏中观察令人惊讶的行动的反应的代表性:

面对令人惊讶的行为在游戏过程中,玩家必须决定那么相信。 他们的策略将根据他们的信仰如何修订,这反过来依据他们的认知优先事项 - 是否应将意外行动视为孤立的错误,从而阐述与后续行动的信仰独立于信仰,或者是否揭示,故意或无意中,关于玩家的期望,以及她在未来可能表现的方式。 (Stalnaker 1998:54)

正向感应方法的例子包括可解释的均衡(肾脏1992)和强烈的Δ-合理化,这是约束下的合理化的形式(Battigalli 2003; Battigalli&Siniscalchi 2003,Catonini 2019)。 在本节中,我们专注于广泛的形式合理化(Pearce 1984; Battigalli 1997),可以说是最富裕的前瞻性诱导方法。

广泛形式合理化的核心思想是,玩家应该尽可能地尝试,以解释其他玩家的理性选择。 在这里,“解释”意味着对他们过去选择是理性的另一名球员的属性信念(Battigalli 1997)。 为了说明,考虑众所周知的游戏,玩家A最初选择以2名球员的支付或播放战略形式游戏的支付(Kohlberg&Mertens 1986; Van Damme 1989)。 注意,这是具有同时移动的广泛游戏的示例,因为既不是玩家在第二决策节点处移动其他玩家。

一个图:链接到下面的扩展说明

图23 [图23的扩展说明在补充中。]

在图23中的游戏中,首先在使用B播放正常形式游戏之间,或者选择“外部选项”并在第一节点结束游戏。 一个不能合理选择我,除非她分配了至少2/3的概率,B将选择l。 否则,无论她在正常形式游戏中选择什么,她的预期效用低于她从外部选项O的保证2低于o.所以,如果b观察到选择我,他认为这是一个理性的选择,那么他必须至少结束至少有学位的理性选择2/3他将选择l。 然后,他还得出结论,正常形式游戏中唯一的理性选择是你,导致他选择l(假设他是理性的)。 换句话说,广泛的合理合理化需要B在观察她选择我之后,从中排除某些信仰,从中可以得出结论,她必须在正常的形式游戏中选择你。 如果这个推理对两个玩家都是透明的,那么A将选择我后跟U,B将选择l。

广泛形式合理化的主要认知表征是在普遍的强烈信仰方面,理性的强烈信仰(Battigalli&Siniscalchi 2002)。 我们简要介绍了第2.1.2节开始的“强烈信仰”。 Battigalli&Siniscalchi(2002)的信仰的数学表现不同,尽管潜在的想法是相同的。 强烈的信念的一个有用的特征是,一个玩家强烈相信一个事件e,只要她在比赛开始时确实是真实的(从意义上,她分配概率1到e)并继续相信e,只要它没有被她的证据排除在一起。 广泛形式游戏中的玩家可用的证据包括与与游戏树结构一致的先前动作的观察。 因此,对理性的普遍性的强烈信念意味着球员通常认为每个人都能合理化过去的举动,从而在这些动作不合理的情况下的执法意义上。

关于向后和前进归纳的重要结果是,在广泛的完美信息中,没有参与球员公用事业的关系,具有共同的合理性的信念,因此广泛的形式合理化产生了与SupgAlde完美均衡相同的结果(Battigalli 1997)。 这并不是说两个解决方案概念完全恰逢完美的信息游戏。 它们可以从Supgame完美均衡路径中进行不同的预测。 潜在的想法是与子纸牌完美均衡路径的偏差可能不可合理化,并且在这种情况下,广泛的形式合理化不会施加约束。 查看Heifetz&Perea(2015),Catonini(2019)和Perea(2018),在此结果的不同证据和Arieli&Aumann(2015),在特殊情况下,每个玩家只移动一次。

4.其他主题

本节介绍了对关于与前一节讨论的认识博弈理论的主要思想有关的有关主题的相关研究的简要概述和参考。

4.1结合不法

在本文中提出的所有结果中,假设参与者是玩家之间的常识,游戏结构(正在播放的偏好是什么是播放器的偏好)。 当然,玩家没有关于游戏的这些完整信息的情况。 第2节中提供的游戏模型可用于描述与游戏有关的玩家的信仰。 然而,这些模型不能捕获例如玩家甚至不能想到她对手将选择某种行动的可能性,或者更普遍认为不同的玩家对他们正在播放的游戏的看法完全不同的观点。 这种类型的无意识超越简单地认为,一个人的对手不可能选择一定的行动。 有一种广泛的文学,致力于开发可以代表球员不明确的模型。 有关这一广泛的文献的概述,以及例如,Rêgo和Halpern(2012)和Perea(2022),讨论了讨论了球员的关键导致认知博弈理论的关键结果的讨论。

4.2替代选择规则

在对游戏的认知分析中,参与者选择的具体建议或预测来自决策理论规则。 例如,预期效用的最大化是在认知博弈论中当代文学中的大部分结果的下潜。 然而,从方法的角度来看,建模者假定玩家的选择规则是简单的,只是一个可以变化的参数。 近年来,有一些初步尝试通过替代选择规则开发认知分析。 参见,La Mura(2009)和Halpern&Pass(2012),沿着这个方向的步骤,以及Galeazzi&Marti(2023),用于研究更高阶的不确定性,具有替代选择规则。

4.3动态游戏模型

在本条目中讨论的认知博弈论的关键是讨论的,认为球员处于某些知识和信仰状态,例如常见的理性信仰。 这叶打开了玩家如何到达这种知识和信仰状态的问题。 这一问题已从两个视角讨论。 第一个透视使用动态认知逻辑的模型(参见,例如,Baltag&Renne 2016),代表了更新游戏模型中所有玩家知识和信仰的公告和其他认识行为。 例如,在这种动态游戏模型中,玩家可以通过反复和公开宣布它们不是非理性(Van Benthem 2003)来消除对彼此的合理性的所有高阶的不确定性。 参见梵洁(2007年)为早期贡献,梵恒河,帕滕和罗伊(2019年)和范本林&Klein(2019 [2022]),用于该文献的调查。 第二个透视制定了模型,明确代表玩家审议他们在游戏中会做什么(Skyrms 1990; Binmore 1987,1988; Cubitt&Sugden 2011)。 例如,Skyrms(1990)解释了一个玩家的混合策略,就像在审议结束时那样对玩家在审议结束时做的主观不确定性。 然后,玩家通过计算预期的实用程序,然后使用这份新信息来重新计算他们在游戏中将做些什么和预期的公用事业(参见Fudenberg&Levine讨论的比赛的工作概率来重新计算他们的概率。 查看Pacuit(2015)了解一项调查,该调查描述了代表参与游戏在游戏中的推理的方法。

4.4有限的信仰层次结构

许多作者指出了普遍信仰理性的假设的力量(参见,例如,2009年Gintis 2009; De Bruin 2010)。 它要求玩家不仅相信其他人都是理性的,而且还相信每个人都认为其他人都是理性的,每个人都认为每个人都认为每个人都认为其他人认为其他人是理性的,等等。 有趣的研究线是研究进入中显示的每个结果的有界版本。 也就是说,假设玩家是理性的,这一有什么意义,相信其他人是合理的,等等的信仰,但没有(K + 1)的信仰? 见Rubinstein(1989); KETS(2012); 科曼(2003); De Weerd,Verbrugge,&Verheij(2013); Brandenburger,Danieli,&Friedenberg(2021)在这个问题上工作。

5.结束语

广泛地说,许多认知博弈论文献专注于两种类型的项目。 第一个项目的目标是映射在游戏情况下玩家所知道和相信的不同数学表现之间的关系。 沿着这些行的研究不仅提高了关于如何比较和对比玩家认知状态的不同数学模型的有趣技术问题,而且还突出了对游戏的认知分析的益处和限制。 第二个项目解决了游戏情况下的理性选择的性质。 这项项目的重要性很好地解释了Wolfgang Spohn:

......博弈论......是,强烈地说,对适当的理性概念混淆,它对其主题的理由(球员)的假设非常不清楚,因此,目前尚不清楚要应用的决策规则......定义理性行为的基本难度在游戏情况下,总的来说,总的来说,每个玩家的战略都将取决于他对其他玩家战略的期望。 我们可以假设他的期望是给出的,然后他的战略选择问题将成为一个普通的最大化问题:他可以简单地选择一个最大化他自己的回报的战略,以便其他球员按照他给出的预期行事。 但重点是,游戏理论不能认为球员对彼此的行为的期望; 相反,博弈论的最重要问题之一恰恰是决定智能玩家可以合理地娱乐其他智能球员的行为。 (Spohn 1982:267)

认识博弈论中的大部分工作都可以被视为试图利用球员知识和信仰的精确表示,以帮助解决上述报价中提到的一些混乱。

读者对本条目中讨论的所有或一些主题的更广泛的覆盖范围感兴趣,应咨询以下文章和书籍。

游戏中的逻辑,由Johan Van Benthem:本书广泛构思的莫代尔逻辑的工具讨论了本条目中提出的许多问题(2014年,MIT Press)。

博弈论的语言,由Adam Brandenburger:Brandenburger在认知博弈论的关键论文的集合(2014年,经济理论中的世界科学系列)。

“博弈论的认知基础”,由GIACOMO BONANNO:一份针对逻辑学家和计算机科学家的调查论文,涵盖了认知博弈论的主要技术导致(第9章在知识和信仰的逻辑手册中,2015年,Bonanno 2015年提供在线)。

Eddie Dekel和Faruk Gul的“博弈论中的理论理论的理性和知识”,剑桥大学出版社,Dekel和Gul 1997在线提供)。

“认知博弈论”,由Eddie Dekel和Marciano Siniscalchi:一份调查纸,旨在涵盖认知博弈论的主要技术结果(第12章在博弈论中的博弈论与经济应用,2015,Dekel和SINISCALCHI 2015年在线提供)。

认知博弈论:AndrésPerea的推理和选择:认知博弈论涉及本次入境中提供的许多主题(2012年,剑桥大学出版社)。

原因的界限:赫伯特·戈里斯的博弈论和行为科学的统一:本书提供了利用认识博弈论的思想(2009年,普林斯顿大学出版社)的广泛概述了社会和行为科学。

(本章完)

相关推荐