惯例(三)

Skyrms(2023)还讨论了概念概念概念,概括的相关平衡,概括相关平衡。 相关平衡和粗相关平衡之间的差异是这样。 在相关的平衡中,玩家从随机化设备接收推荐,并且通过偏离这一建议,她不能提高她的预期支付。 在粗相关的均衡中,玩家提前知道,从设备的建议的偏差不会在她收到任何特定建议之前计算的预期收益。 粗相关的平衡允许(虽然只有相关的平衡不允许)代理人希望在学习其特定建议之后偏离设备的建议。 因此,粗略相关的均衡可能没有稳定性的稳定性通常期望的稳定性。 Skyrms介绍了术语准则,以强调粗略相关均衡导致分享某些但并非所有重要特征的概念与我们直观的惯例。

4.5必须进行惯例解决协调问题?

Wayne Davis(2003),Andrei Marmor(1996,2009),苏默马勒(2001),Robert Sugden(1986/2004),彼得·沃尔索(1986/2004)(1998年)认为,公约不需要协调均衡。 例如,戴维斯声称时尚惯例不解决协调问题,因为我们通常不会关心别人的衣服。

为了培养这种反对意见,Sugden介绍了财产和互惠惯例的公约,也不是解决协调问题。 他用Hawk-Dove游戏说明了前者(有时也称为“鸡”):

Dovehawkdove1,10,2hawk2,01 / 2,1/2,1 / 21/2

Hawk-Dove支付矩阵

这里的直观解释是两个面临价值2项的人必须决定是否为它(鹰)或分享它(鸽子)。 如果两个播放鸽子,那么他们拆分它。 如果一个人扮演鹰和另一只鸽子,那么鹰就会得到整个好的。 如果他们都玩鹰,那么他们再次分开它,但它的价值减少了一半,以反映战斗的成本。 这场比赛没有协调均衡。 但是,考虑以下比赛的经常性实例的战略:“如果您已经拥有相关项目,那么玩鹰; 否则,播放鸽子。“ 这是两名球员扮演这一战略的均衡。 (在技术上,在Skyrms(1996)之后,我们可能将这种策略组合视为相关的均衡。)Sugden认为,这种均衡可能会成为在反复玩Hawk-Dove的代理人中的一般性。 但均衡不是根据刘易斯定义的公约。 如果我扮演我的结局,我不喜欢其他人同样做。 我更喜欢别人玩鸽子。 因此,平衡缺乏由刘易斯强调的主要特征之一:偏好对一般符合性的一般符合性。

Sugden说明与囚犯困境的互惠惯例,其中有以下付款矩阵:

CooperationFectCoopate2,20,3DEFect3,00,0

囚犯的困境支付矩阵

这个薪水矩阵的原始直观解释是警方分别审问两名囚犯,每个囚犯都必须决定是否通过承认沉默或是否“缺陷”与其他囚犯合作。 如果两者都合作,那么都接受非常轻的句子。 如果两个缺陷,那么都接受非常严厉的句子。 如果一个缺陷和其他合作,那么缺陷器在合作者接收到严格的句子时无偏航。 虽然这种情况似乎似乎是相当的,但我们可以将许多共同的社会互动模拟作为囚犯困境的实例。 Sugden提供作为两个学术界的一个例子,为他们的休假而交换房屋。 每个学术都必须决定是否以良好的状态保持对方的房子,即使让它乱七八糟也会更容易。

囚犯的困境没有协调均衡。 然而,当球员在某些无限期内反复发挥囚犯的困境时,审查可能会出现以下“TIT-FOR-TAT”战略(例如,两名学术界每年夏天交换房屋的两项学者):合作只要你的对手合作; 如果您的对手缺陷,那么在再次合作之前,将缺陷一些规定的圆形r�作为报复; 如果你的对手合作但是你错误地缺勤,那么在没有报复的情况下接受你的对手的惩罚。 这种均衡不是刘易斯的意义上的公约,因为一个人总是喜欢一个人的对手而不是缺陷。

为了应对这样的例子,Sugden(1986/2004)和Vanderschraaf(1998B)制定了不需要公约来解决协调问题的广义游戏理论分析。 在实践中,对刘易斯账户的必要修订并不是很彻底,因为它们基本上与他的概念分析中的兴奋条款(4)基本上。 Vanderschraaf(1998A)认为,这些修订产生了更接近Hume原始账户的理论。

Marmor(2009)还提出了Lewis的重点是协调问题。 Marmor强调实际的游戏,如国际象棋,而不是主要由游戏理论家研究的“游戏”,例如囚犯的困境。 根据Marmor,国际象棋规则是不解决协调问题的公约。 国际象棋活动并不涉及与其他玩家的行为协调一个人的行为,就像在道路右侧的感觉(而不是左侧)一样涉及代理商之间的协调。 绘制在约翰·塞尔(1969年)讨论“本构规则”,Marmor认为,刘易斯忽视了一项重要的公约,Marmor称之为“本质概况惯例”,在比赛规则之后建模。 粗略地说,一个本文的公约有助于“构成”社会实践,从而有助于定义实践是什么以及如何正确地参与它。 Marmor提供旨在适应刘易斯大道和本文惯例的广义分析。 分析类似于刘易斯,但没有提到协调问题,它不包含对共同知识的提及。

5.均衡选择

刘易斯要求大会在几个可能的替代方案中成为一个。 即使一个人在拒绝米勒拒绝那种要求时,似乎也明确表示有很多情况,例如单款货币的选择,我们必须从许多候选公约中选择。 这提出了我们选择特定候选人的问题。 博弈论更普遍地出现类似的问题,因为游戏可能有许多纳什均衡。 如果我相信其他代理商会发挥他们的部分,那么在纳什均衡中发挥我的部分是合理的。 但为什么我相信其他人会在这个特定的均衡中发挥他们的部分? 如果我们认为球员无法参与游戏前的沟通,则三个基本答案建议自己:玩家通过理性反思对他们的战略局势的逻辑的理性反思; 或者他们是由纯粹理性分析范围之外的心理因素引导; 或者他们从先前的经验中学到均衡的经验。 人们也可以将这三个建议彼此相结合。

一个古老的游戏理论传统拥抱了第一个建议。 希望如此,如果我们在参与游戏的支付结构和自己的合理性的球员之间假设足够的共同知识,那么通过相对先验的推理,他们可以成功预测其他人将选择其他均衡。 这种解释性传统的早期例子是由Ernst Zermelo(1913)引入的倒退诱导的方法。 传统在约翰哈列尼和Reinhard Selten的传统是一般的均衡选择理论(1988)。 但是,很少有研究人员仍然冠军这一传统。 从我们最简单的协调问题,餐厅会铃中,它的基本缺陷已经显而易见。 没有任何内在的合理性或逻辑的逻辑有利于另一个均衡。 事实上,Harsanyi和Selten的理论决定了每个玩家在Luigi和Fabio的情况下选择一个混合策略。 显然,Harsanyi和Selten无法解释如何在各种情况下,人们会汇聚在独特的非随机化解决方案。 我们似乎也可能通过对合理性的分析或精炼我们的解决方案概念来克服这种困难。 显然,在对称的均衡之间打破了搭配,要求我们使用人类心理学或来自经验的一些额外投入来补充纯粹的理性分析的AUSTERE观点。

5.1 Parience

继托马斯·斯科林(1960年)之后,介绍了焦点的概念,刘易斯认为,代理人将选择突出公约。 如果从其他选择“脱颖而出”,则公约突出(这是一个焦点)。 候选公约可能会通过先例,明确的协议或其自己的内在属性来获取显着性。 Schelling在着名的实验中说明了显着的概念。 他向受试者询问了在纽约市的一天内迎接一位朋友的时间和地点,没有任何关于在哪里或何时遇到的沟通的可能性。 大多数受访者在大中央驻地选择了中午。 不知何故,这种选择脱颖而出是最显着的。 随着Schelling的示例说明,显着性是一种“主观”心理特质,从战略情况的理性结构中没有任何明显的方式遵循。 休谟已经预期了主观心理特征的作用,并指出我们的惯例选择往往取决于“我们思想和概念的想象力或更轻浮的特性”(论文,第504页,注1)。

Pariences在刘易斯的账户中起两个不同的角色,对应于以下两个问题:如何发生约定? 为什么人们符合公约? 前一个问题涉及动态(即,关于约定如何运行和发展的因素),而后者涉及估计(具体地,在特定时刻维持公约的合理结构)。 刘易斯对第一个问题的答案是代理商最初通过机会,协议或内在的突出性选择一些均衡。 平衡逐渐变得更加突出,直到最终它成为约定。 刘易斯对第二个问题的答案是,预先存在的公约如此绝对突出,即代理人认为另一个人遵守它,期望提供符合符合要求的理由。

哲学家批评了刘易斯依赖的荣誉,争论显着的概念是模糊的,或者候选公约中往往没有突出的选择,或者优先级没有赋予显着,或者刘易斯未能融合Parience进入正式的游戏理论框架,否则塑造他的讨论。 玛格丽特吉尔伯特(1989年)认为,Parience无法提供行动的原因:仅仅观察一些可能的公约是突出者,因为我们不能认为其他人将遵守最大的公约。 在类似的静脉中,Brian Skyrms(1996)询问众所周知,他人如何选择替代方案的突出均衡。

尽管有这些批评,但是,许多作者在干预几十年中,如罗伯特·苏登(1986/2004,2011年)和Ken Binmore和Larry Samuelson(2006年)所认为,令人满意的均衡选择理论需要类似的东西刘易斯的显着概念。 另请注意,即使上述批评是合法的,他们并不是对刘易斯对何种约定的分析。 他们只表明,刘易斯没有提供完整的理论,这些理论是如何选择公约的,如何发展,以及他们如何维持自己。

5.2动态模型

另一种流行的均衡选择方法是广泛的动态。 动态方法是进化博弈论的分支,制定了策略选择如何在成员反复互相竞争的人群中发展的正式模型。 与“静态”博弈论相比(即,均衡的研究),动态模型包含明确的时间参数。 基本目标是研究具有各种性质的动态模型的条件倾向于收敛到具有各种性质的静态平衡。

均衡选择的动态模型沿几个尺寸不同。 该模型是否描绘了各个玩家或整体人口的总趋势? 对玩家的模型属性是多少合理性? 模型是确定性还是随机? 玩家是否有限或无限地记忆过往事件? 玩家对游戏的支付结构有多少常识? 玩家可以了解他们不参加的互动的结果吗? 同一个球员是否参与每一轮比赛,或者球员多次从较大的人口中重复绘制吗? 是更大的人口,建模为有限或无限吗? 对这些问题的蓬勃发展和禁止技术文献的概述,超出了本文的范围。 我们将注意力引入三个发展:Replicator Dynamics; 虚构的戏剧; 和复杂的贝叶斯学习。 感兴趣的读者应咨询Drew Fudenberg和David Levine(1998)和H.Peyton Young(2004)所提供的详细调查。

Replicator Dynamics:在这一确定性模型中,由Peter Taylor和Leo Jonker(1978)引入,选择一些策略的球员比例与整个策略的平均收益和整个人口的平均收益成比例地增长。 该模型没有描述各个玩家的行为如何随时间变化。 相反,该模型描述了整个人口中的总趋势。

动态系统的稳定稳定状态是一个具有以下两个特征的状态s�:一旦系统进入S∈,它就不会离开它; 一旦系统接近“足够”到S³,那么它始终靠近S³。 s�的吸引力盆地是一组状态,使得如果动态系统始于其中一个州,那么它最终会融入s�。 在许多情况下,理解动态系统的最佳方式是构建其稳定状态的“相位肖像”和它们的吸引力盆地。 在我们这里的感兴趣的情况下,动态系统的“状态”只是选择每个策略的玩家的比例。

两种简单的正规结果传达了复制器动力学研究的调味:每次稳定的复制器动力学状态都是纳什均衡; 并且每个进化稳定的均衡都是复制器动力学的稳定状态。

复制器动力学起源于进化生物学。 随后,Larry Samuelson(1997)等游戏理论家认为它阐明了人类之间的社会互动。 在哲学中,Brian Skyrms(1996年,1998年)认为,复制器动态表明,财产和语言意义的公约如何发展,而无需刘易斯“显着性” 他特别强调信令游戏,即发件人希望将消息传送到接收器的游戏,消息确定来自接收器的固定reperoire中的哪个动作。 (参见第7.1节以获取有关信令游戏的更多细节。)对于某些信令游戏,Replicator Dynamics几乎始终会收敛到进化稳定的信号约定。 出现了哪些公约仅取决于参与球员初始促进采用各种策略的初步的事实(即,系统恰好开始的吸引力)。 随着Skyrms所说的,“[W] HICH信号系统被选中是机会的问题,而不是Parience”(1996,第93页)。

尽管普及者动力学的普及,但Peyton Young(1998)等批评者仍然持怀疑态度。 复制器动力学的最自然动机是生物学的。 我们将球员概念化为遗传地编程以表现出某些行为。 获得更高的收益的生物具有更高的生殖健身,并将其战略选择传递给他们的后代。 因此,自然选择导致某些行为变得更加普遍。 在这些假设下,复制器动力学似乎是合理的。 但据说不可明确的是,类似的理由适用于人类互动,因为人类通常不仅仅基于他们的遗传编程,而是对他们的信仰和欲望来说。 为什么单个人类代理的选择会产生复制器动态描述的模式?

为了响应这种担忧,理论家试图从个人自适应行为的模型中派生复制器动态。 一些模特,人们倾向于模仿他人的行为,基于如何流行或如何成功似乎。 其他型号有点钢筋机制。 在理性解释的哲学家和经济学家之间的传统偏好方面都没有很好地符合。 萨缪尔森(1997,第23页)响应这些方法可能是合适的“如果我们对人民感兴趣,而不是理想的理性代理商。” 但很明显,我们对实际人类心理学的最佳认知科学将避免合理的解释,以支持目前正在调用的心理机制以承保复制器动态。

虚构的戏剧:乔治布朗(1951)将虚构的戏剧推出为“剧作”推理,其中一名球员精神上模拟了对想象中的对手的比赛反复试验,以预测她真正的对手的行为。 “虚构的游戏”这句话已成为一个不可思议的人,因为研究人员现在通常将其应用于玩家基于他们反复播放的实际经验的模型。 在范式虚拟播放模型中,每个玩家对她的对手过去行动的历史频率发挥着“最佳回复”。 如果:球员假设每个对手都占用的稳定(纯粹或混合)策略; 玩家采用贝叶斯更新来确定每个对手将在下一轮中执行给定行动的概率; 玩家要求基于她对手的行动的当前概率分布来最大化她的预期收益。 很容易表明,如果参与虚假游戏的玩家进入严格的纳什均衡,那么他们将永远留在它。 此外,有一些情况(例如,零和两人游戏),其中虚构的游戏会聚到纳什均衡行为。 然而,正如Lloyd Shapley(1964)首次出现的那样,有些游戏在其中虚构的游戏并不总是会聚到均衡行为。

文献探讨了这个主题的许多不同的变化。 人们可以限制玩家记得多少过去的试验或玩家在旧试验方面有多少重量。 人们可以将玩家嵌入大人物中,并限制玩家了解在该人群中的互动。 人们可以介绍“邻域结构”,以便玩家只与他们的邻居互动。 可以引入一个随机元素。 例如,在M. I. Friedlin和A. D.Ventzell(1984)的工作中建立工作,以及Michihiro Kandori,George Mailath和Rafael Rob(1993),H.Peyton Young(1993,1996,1998)发展关于约会如何发展的模型,其中每个玩家选择具有概率1-ε1-�的“最佳回复”和具有概率ε的一些随机策略。 人们还可以概括虚构的游戏框架以适应相关的均衡。 Peter Vanderschraaf(2001)探讨了一个虚构戏剧的变体,其中玩家帧假设关于她的对手战略与外部事件之间的相关性。 将本框架应用于公约,他认为,我们可以通过归纳审议将相关的均衡公约的出现作为理性信念固定的实例。

虚构的戏剧并不归因于其他人的收益或其合理性的知识。 它不会描绘球员作为推理他人的推理。 相反,它描绘了作为执行机械统计推断的玩家,将动作观察到的历史频率转换成关于其未来复发概率的预测。 出于这个原因,ehud kalai和ehud Lehrer(1993)等批评者争辩说,虚构的戏剧属性对玩家的认可不充分,以至于它们从事战略互动。 例如,一个符合虚构游戏的理由隐含地假设每个对手都占据了一些静止(纯粹或混合)的策略。 这种假设忽略了她的对手本身根据先前的互动来更新他们的信仰和行动。 它还防止了玩家检测数据中的模式(例如在奇数试验中发挥一个策略的对手以及偶数试验中的另一种策略)。 此外,虚构的戏剧指示玩家可以最大化当前回收的预期收益。 这种“近视”方法不能以降低一个人的当前收益的价格最大化一个人的未来预期收益(例如,即使我希望我的对手同样地表现为鹰而不是鸽子,因为我相信我最终可以“教”我的对手在未来的回合中回来并在鸽子中扮演鸽子)。

精致的贝叶斯学习:Paul Milgrom和John Robert(1991)发起的这种方法取代了虚构游戏所针对性的粗略统计推理,更加精致的归纳审议概念。 具体而言,它吸引了一个人面临来自一个人的对手的静止策略的可疑假设。 Ehud Kalai和Ehud Lehrer(1993)提供了广泛讨论的复杂贝叶斯学习模式。 参与无限重复的游戏的玩家不断更新在对手扮演的可能策略中定义的概率分布,其中策略是从一组可能的动作的可能历史的函数。 在每个阶段,玩家选择一个动作,以最大化她的收益的预期价值,以便为整个未来的试验序列,而不仅仅是目前的试验。 这种方法允许玩家在她的对手行为中辨别模式,包括依赖自己的行为的模式。 它还让她牺牲了较高预期的长期收益的当前收益。 Kalai和Lehrer证明了他们的程序几乎总是会聚到近似纳什均衡的东西,在关键的假设(“假设”的真理谷物中,每个玩家通过为实际发生的所有策略分配积极概率而开始。

(本章完)

相关推荐