常识(五)
如果μ*是严格的平衡,那么可以预测游戏中的代理的纯策略简介将遵循游戏的共同知识,合理性和μ*。 但是,如果μ*使得几个不同的纯策略简档相对于μ*满足(3.iv),则可以不再需要确定代理商会做什么。 例如,在图3.1的鸡游戏中,由α1=α2= 2/3定义的信仰分布在一起是纳什均衡的信念。 鉴于这种均衡的共同知识,纯策略是对每个代理的最佳答复,在纯粹策略最大化预期效用的情况下。 实际上,如果代理商也可以采用随机或混合策略,他们根据机会实验的结果遵循几种纯策略之一,那么代理人可能采用的任何无限混合的策略都可以采用鸡是给定μ*的最佳回复。[25] 因此,内源性相关的均衡概念在所有情况下,即使假设概率的一致性和独立性,也不会确定所有情况的精确结果,使得均衡是纳什均衡。
由AuMann(1974年,1987年)正式化的另一种相关的均衡概念确实给出了在给出适当的共同知识的游戏中所做的代理人的预测。 为了说明Aumann相关的均衡概念,让我们再次考虑图3.1游戏。 如果Joanna和Lizzi可以以某种方式将他们的策略与他们的世界知识系联,他们可以遵循相关策略的系统,这将产生一个回报载体,它们既喜欢混合纳什均衡一样,本身就是平衡。 他们可以实现这一目标是让他们的朋友ron通过隐藏在三个核桃壳之一下的豌豆来玩熟悉的壳牌游戏的变化,编号为1,2和3. joanna和lizzi都认为这三个相关的世界中的每一个对应于ωk= {the豌豆在shell k下面谎言}同样可能。 基于游戏的结果,ron然后提供Lizzi和Joanna每一个私人推荐,它定义了一个策略组合系统,如下所示
f(ω)= {
(S1,S1)如果ωk=ω1
(S1,S2)如果ωk=ω2
(S2,S1)如果ωk=ω3
F是一个相关的策略制度,因为代理人通过遵循其建议将其策略与世界ω的同一组国家联系起来。 F也是一个严格的Aumann相关均衡,因为如果每个代理人知道RON如何提出他的建议,但只知道他给她的建议,他们就会严格更糟糕的是她偏离了她的建议。[26] 由于有几个严格的鸡均衡,F对应于Vanderschraaf(1998)中定义的约定。 f的总体预期收益向量是(3,3),它在游戏纳什均衡的收益的凸壳之外,并且帕累托 - 占据了混合纳什均衡的预期收益载体(4/3,4 / 3)由α1= 2/3定义,i = 1,2。[27] 相关的平衡F的特征在于,在图3.3中给出了代理商在策略轮廓上发挥的概率分布:
乔安娜
s1 s2的
lizzi s1⅓⅓
s2的⅓0
图3.3
AUMANN(1987)证明了与普通知识相关的相关均衡概念。 要查看此结果,我们必须给予Aumann相关均衡的正式定义。
定义3.9
给定游戏γ=(n,s,u)与一个有限的可能的世界ω一起,矢量值函数f:ω→s是相关的n组。 如果f(ω)=(f1(ω),...,fn(ω))表示n的f的组件,则代理K的推荐策略在ω为fk(ω)。 F是Aumann相关平衡IFF
e(uk∘f)≥e(英国(f-k,gk)),
对于每个k∈n以及任何函数gk,这是fi的功能。
如果在每个可能的世界ω∈ω,则代理处于Aumann相关均衡,如果其他人遵循其推荐的策略,则没有代理商将偏离他的推荐策略。 因此,Aumann相关均衡独特地指定了每个代理的策略,通过明确引入可能与其行为相关的可能世界的空间。 偏差GI需要是FI,即一些具有FI的功能的功能,因为我仅被告知FI(ω),因此只能区分由FI的可能的ω的世界。 如上所述,Aumann之间的相关均衡和内源相关平衡之间的主要差异是,在Aumann相关的平衡中,该药剂将它们的策略与外部外部的ω∈ω相关联。游戏。 一种观察这种差异的一种方法是将他们的策略与外喻相关联的代理可以根据自己的策略计算他们的预期公用事业。
在AUMANN的模型中,每个可能的世界ω的描述包括以下描述:游戏γ,代理的私有信息分区,以及每个代理在ω的动作,以及每个代理的先前概率分布μk(⋅)OVERΩ。 基本思想是在ω的条件下,每个人都知道任何代理人都可以成为不确定性的对象,而是一般来说,没有代理人必然知道哪个世界ω是实际的世界。 代理商可以使用他们的前沿来计算播放各种动作组合s∈s的概率。 如果代理的前锋是所有I,j∈n,μi(ω)= 0iffμj(ω)= 0,则代理的前沿是相互连续的。 如果代理的前锋都同意,即每个ωνω的μ1(ω)= ... =μn(ω)=μ(ω),则表示满足公共先前假设或CPA。 如果代理遵循Aumann相关的平衡F并且满足CPA,则F是目标Aumann相关平衡。 如果满足CPA并且代理的分布满足概率独立,则Aumann相关平衡是纳什均衡。[28]
让Si(ω)表示代理I在可能的世界ω选择的策略。 然后S:ω→S由s(ω)=(s1(ω),...,sn(ω))是相关的n组。 鉴于HI是Ω的分区,[29]函数Si:ω→Si,如果每个Hijęhi,Si(Ω')对于每个ω'∈hij是恒定的。 鉴于她的信息,您可以说是一种正式的说法,我知道她会在每个可能的世界中做些什么。
定义3.10
代理i是达ωνω的贝叶斯(或者,ω-bayes Rational)IFF Si是Hi-Temicable和
e(ui∘s|hi)(ω)≥e(ui(vi,s-1)|hi)(ω)
对于任何Hi-Measultable函数VI:ω→Si。
注意,Aumann对ω-贝叶斯合理性的定义意味着μi(hi(ω))>0,从而定义了条件期望。 Aumann的主要结果是接下来的,隐含地假设每个代理i∈n的μi(hi(ω))>0,也是每个可能的世界ω∈ω。 如果CPA满意,甚至代价是这种情况,即使电视互连只有,如果这是这种情况,那么这种情况也不是互连的。
命题3.11(AUMANN 1987)
如果每个代理i∈n是在每个可能的世界ωνω的Ω-bayes合理的情况下,则代理遵循Aumann相关的平衡。 如果满足CPA,则相关的平衡是目标。
证明。
代理人可能对其情况的一部分不确定性是所有代理人是否有理由。 但是,如果假设所有代理在每个ωωΩΩΩΩΩΩ时,则该事实的描述形成了每个可能ω的描述,因此在代理分区的满足中形成了部分。 如上所述,代理人的前瞻描述的描述,他们的分区和游戏也构成了每个可能的世界的描述,因此对应于这些事实的命题也位于代理商分区的会议中。 所以陈述Aumann主要结果的另一种方式如下:每个可能的世界的Ω贝叶斯理性的常识意味着代理遵循Aumann相关的平衡。
命题3.7和3.11是强大的结果。 他们说,彼此的合理性和代理信念的共同知识,随着他们可能遵循的策略概况的概率分布量化,意味着代理人的信念表征了比赛的平衡。 然后,如果代理人的信仰是无条件的,则主题3.7表示,该试剂是合理的,以遵循与相应的内源相关平衡一致的策略简档。 如果他们的信仰是有条件的私人信息分区,那么主题3.11表示,他们是合理的,以遵循相应的Aumann相关均衡建议。 然而,我们不得高估这些结果的重要性,因为他们对理性和信仰的共同知识的起源没有说。 例如,在图3.1的鸡游戏中,我们考虑了一个相关的平衡的例子,其中假设Lizzi和Joanna对由(⋆)定义的推荐策略系统共同了解。 鉴于这种共同的知识,乔安娜和Lizzi确实具有遵循Aumann相关均衡F的决定性理由。 但这种常识来自哪里? 一般而言,如何具有共同的知识,证明其符合均衡的证明? 哲学家和社会科学家在解决这个问题方面只取得了有限的进展。
3.4完美信息的游戏
在广泛的形式游戏中,代理商按顺序移动。 在每个阶段,搬家的代理人必须基于她对前面的动作所了解的决定。 代理的知识的这一部分是由信息集的特征,这是代理人知道她的前任可能选择的替代方案的集合。 例如,考虑图3.4的广泛形式游戏:
缺少文本,请告知
图3.4
当Joans移动时,她在她的信息SET I22 = {C1,D1}时,就是她的动作,知道Lizzi可能选择了C1或D1,因此这个游戏是图3.1鸡游戏的广泛形式表示。
在一个完美信息的游戏中,每个信息集都包括游戏树中的单个节点,因为根据每个州的定义,代理程序谁将何地知道她的前辈所移动的方式。 在实施例1.4中,注意到,向后感应的方法可以应用于完美信息的任何游戏。[30] 向后感应解决方案是完美信息游戏的独特纳入均衡。 以下结果提供了足够的条件,以证明在完美信息的游戏中向后感应播放:
命题3.12(Bicchieri 1993)
在完善的完美信息的广泛游戏中,如果对每个信息集IIK的每个代理I满足以下条件,则代理遵循向后感应解决方案:
我是理性的,我知道这个,我知道游戏,还有
在任何信息集IJK + 1立即跟随IIK,我知道IIK在IJK + 1知道什么。
证明。
命题3.12表示远低于游戏的共同知识和合理性,以便在完美信息的游戏中获得倒退的归纳解决方案。 所需要的只是对每个信息集的每个代理都是理性的,要了解游戏并了解下一个代理商搬家! 例如,在图1.2游戏中,如果R1(R2)代表“ALAN(FIONA)是Rational”,并且Ki(γ)代表“我知道游戏γ”,那么后面的倒置感应解决方案是:
在I24,R2和K2(γ)。
在I13,R1,K1(γ),K1(R2)和K1K2(γ)。
在I22,K2(R1),K2K1(R2)和K2K1K2(γ)。
在I11,K1K2(R1),K1K2K1(R2)和K1K2K1K2(γ)。[31]
有人可能认为一个主题提出3.11是,在一个完美信息的游戏中,游戏和合理性的常识意味着向后感应解决方案。 这是向后感应解决方案的经典论点。 许多游戏理论家继续接受古典论点,但近年来,该论点受到强烈挑战,由仁文(1988,1992),Binmore(1987)和Bicchieri(1989,1993)领导。 可以用图1.2游戏说明他们对向后诱导批评的基本思想。 根据古典论证,如果艾伦和菲奥娜具有共同的合理性知识和游戏,那么每个都会预测另一个将跟随她的倒退感应解决方案的结束,其倒退诱导解决方案的结尾是他独特的最佳反应。 但是,如果FIONA重新考虑该怎么办,如果在信息集I22的情况下,该怎么办? 如果到达信息集I22,则Alan当然没有遵循向后感应解决方案。 如果我们假设在I22,FIONA只知道(III)中所述的内容,那么她可以在I22中解释I1111K1(R2)或K1K2K1K2(γ)的I22。 在这种情况下,菲奥纳认为I11的¬k1k2k1(r2)或¬k1k2k1k2(γ)与Alan实际上确实知道在I11中,因此Fiona不一定会惊讶地发现她自己在I22,并鉴于她所知道的是(III)的特征,后面的倒退感应解决方案是她最好的策略。 但如果合理性和游戏是普通知识,甚至是菲奥纳和艾伦都刚刚具有以(iii)和(iv)的陈述相互了解,那么在I22,Fiona知道K1K2K1(R2)或在I11的K1K2K1K2(γ)。 因此,鉴于这种相互的知识,Fiona不再可以解释为什么Alan已经偏离了向后感应解决方案,因为这种偏差矛盾是他们的相互知识的一部分。 因此,如果她发现自己在I22,Fiona并不一定有充分的理由认为Alan将从I22开始遵循Subgare的倒退感应解决方案,因此她可能没有充分的理由遵循向后感应解决方案。 Bicchieri(1993)以及宾莫尔(1987年)和仁文(1988年,1992年)将此论点扩展到具有任意长度的完善信息的游戏,绘制了一场令人惊叹的结论:如果代理人严格太少或严格过多相互了解合理性和游戏相对于潜在的潜在行动的数量,一个人无法预测他们将遵循向后感应解决方案。 这将破坏核心角色后退归纳在分析广泛形式的游戏中发挥作用。 为什么代理商的共同知识水平的数量取决于游戏的长度?
向后归纳的古典论证隐含地假设在游戏的每个阶段,代理商折扣前面的举措与战略性无关紧要。 古典论证的捍卫者可以争辩说,此假设是有意义的,因为根据任何代理的决策节点定义,现在已修复导致此节点的先前移动。 批评者的批评问题质疑这一假设,审议了推理如何在他的任何信息集上移动时,包括那些不在向后感应均衡路径的那些,代理商必须考虑的一部分是什么条件可能导致他在该信息集中的情况。 换句话说,代理商应该纳入关于先前搬家者的推理,或前向感应推理的推理,或者向前诱导推理,以在如何在给定的信息集上移动。 Binmore(1987)和Bicchieri(1993)争辩说,游戏的倒退感应解决方案应该与解决方案相应的前向感应参数建议一致。 正如我们所看到的,鉴于游戏的共同知识和合理性,前瞻性感应推理可以引导代理人表达矛盾:向后诱导的古典论证是预测他们在从未达到的树中的节点中进行的。 他们根据他们对游戏的共同知识和合理性来使这些预测进行了解。 但是,前瞻性诱导推理似乎暗示如果达到任何偏离均衡节点,则合理性和游戏的常识必须失败,因此代理商如何预测这些节点会发生什么?
3.5通信网络
人口P成员愿意参与某种过程的情况,规定,足够大的P部分参与一些适当的行为是集体行动的典型问题。 考虑争论是否加入反叛的代理人的案例。 她加入或不加入的决定将取决于她期望加入反叛的其他代理人的数量。 如果这样的数字太低,她更愿意不要反抗,而如果数字足够大,她将更喜欢反抗。 Michael Chwe提出了一种模型,在理论上是游戏中的这种情况。 玩家对其他玩家意图的了解取决于球员所在的社交网络。 每个玩家的个人'阈值'(该特定播放器所需的其他代理的数量)仅是网络中的直接邻居所知的。 除了CHWE关于集体行动主题的研究结果获得的结果的内在价值,他的模型还提供了关于社会网络与共同知识与共同知识关系的见解,以及常识在集体行动中的作用。 例如,在某些情况下,其他代理人的个人门槛的一阶知识不足以激励代理人采取行动,而高阶知识或在极限中,常识是。
我们介绍了Chwe的模型(Chwe 1999)和(Chwe 2000)。 假设有一群人的P群,每个特工有两种策略:r(反抗,参加集体行动)和s(留在家里并没有参加)。 每个代理都有自己的单个阈值θ∞{1,2,...,n + 1},如果并且只有在重构的玩家总数大于或等于她的阈值时,她才喜欢r。 阈值1的代理总是旋转; 只有阈值2的代理才能何时何地旋转; 只有当所有代理商均进行阈值N旋转的代理; 具有阈值N + 1的代理从不旋转。代理商位于社交网络中,由二进制关系→通过P. I→J的预期含义是我“会谈”代理J,也就是说,代理商知道代理商的阈值j。 如果我们将B(i)定义为集合{j∈p:j→i},我们可以将b(i)解释为我的“邻居”并说明,通常,我知道她邻居中所有代理商的门槛。 进一步的假设是,对于所有J,K-B(I),我知道J→K是否或不是,也就是说,每个代理都知道她的邻居是否正在彼此通信。 关系→被认为是反身的(一个人知道她自己的门槛)。
玩家的知识在可能的世界框架中常见地表示。 考虑例如有两个代理的情况,其中两个代理有一个阈值1,2或3.有九个可能的世界,由有序的数对表示,分别代表第一和第二玩家的单个阈值:11,12,13,...,32,33。如果是玩家没有沟通,每个人只知道她自己的门槛。 玩家1的信息分区反映了她对玩家的2个阈值的无知,并且它由集合{11,12,13},{21,22,23},{31,32,33}组成; 同样,玩家2的分区包括集{11,21,31},{12,22,32},{13,23,33}。 如果玩家1的阈值是1,则无论玩家2的阈值是什么,她都会旋转。 因此,{11,12,13}中的玩家1旋转。 如果玩家1的阈值是3,她永远不会旋转。 因此,她在{31,32,33}中扮演。 如果她的门槛是2,只有其他球员革命,她才旋转。 由于在该示例中,我们假设代理商之间没有通信,玩家1不能确定玩家的2动作,并选择{21,22,23}中的非风险S。 类似地,玩家2在{11,21,31}中播放r&s。 现在考虑其中1→2和2→1的情况。 两个玩家现在都有最好的信息分区。 再次为两个玩家分别为1和3的阈值,分别为两个玩家。 然而,在玩家1的细胞{21}和{22}中,她知道玩家2将反抗,并且有阈值2,她也是旋转的。 同样,对于他的细胞2中的玩家2和{22}。 注意,两个玩家具有阈值2的情况,产生的均衡既有均衡,其中每个玩家都留在家里的球员反抗和均衡。 假设在多均衡的情况下,将获得最大反射的情况。
缺少文本,请告知
图3.5
上面示例的分析适用于具有N代理的通用网络。 考虑例如图3.5a中表示的三个人网络1→2,2→1,2→3(注意对称链路由没有箭头的线表示)并假设每个播放器具有阈值2.播放器1和2之间的网络与上面的网络相同,因此,如果它们具有阈值2,则它们都是反抗,无论播放器的阈值如何3.播放器3,另一方面,知道她自己的阈值和玩家2。 因此,如果它们都有阈值2,则不能区分集合{122,222,322,422}的可能性。 在422处,特别是玩家1和球员2起叛乱,因此玩家3不能承担风险,也不会反叛,即使事实上,她也有一个叛逆的邻居。 将链接1→3添加到网络(图3.5b),我们提供了有关玩家1的动作的知识,因此在这种情况下,如果它们都有阈值2,则它们都是反抗。 请注意,如果我们打破播放器1和2之间的链接(以便网络为1→3和2→3),则播放器3知道1和2无法通信,因此在222处不会反抗,因此她也选择s。 了解其他玩家对其他玩家的了解至关重要。