常识(四)
命题3.1
让ω成为世界各州的有限态。 假设
代理I和j在Ω的事件中具有常见的先前概率分布μ(⋅),例如μ(ω)>0,每个ωΩΩ,和
它是ω的常见知识,即我的事件E的后验概率是qi(e),并且j的e的后验概率是qj(e)。
然后qi(e)= qj(e)。
证明。
[请注意,在该命题的证明中,在续集中,μ(⋅|b|b)表示条件概率; 即,给定μ(b)>0,μ(a |b)=μ(a∩b)/μ(b)。]
在后面的文章中,AUMANN(1987)认为,每个ωνω的Ω是有限的假设,并且每个ωνω的μ(ω)>0反映了代理视为“真的”可能是它们分配正概率的有限突出世界的有限集合,因此可以从状态空间的描述中丢弃具有概率0的状态。 AUMANN还指出,该结果隐含地假设代理具有对其分区的共同知识,因为每个可能的世界的描述包括代理的可能性集的描述。 当然,该结果至关重要(i),其被称为共同的先前假设(CPA)。
AuMann的“没有分歧”定理在文献中以多种方式推广。 洞穴1983概括了3代理的论点。 Bacharach 1985将其扩展到代理商观察彼此的决定而不是后海后的案例。 1982年Milgrom和Stokey,为他们的无贸易定理来说,它没有任何分歧,表明投机性贸易是不可能的。 Geanakoplos和Polemarchakis 1982概括了一个动态设置的论点,其中两个代理在达成协议之前来回传达他们的后验概率 - 这一特别关注协议定理的特征在于动态认识逻辑2009年的Dégremont和罗伊,并应用于Sillari 2019年的认知同伴分歧的案例.Mckelvey和Page 1986进一步将Geanakoplos和Polemarchakis的结果扩展到N个体的情况。 (另见Monder和Samet 1989,以及调查,Geanakoplos 1994.)
然而,所有这些“没有分歧”结果提高了Aumann原始结果提出的同样的哲学难题:我们如何解释信仰的差异? AUMANN的结果有两种选择:(1)承认,在某种程度上,代理人的信念的共同知识或它们如何形成他们的信仰失败,或(2)否认注册会计师。 因此,即使代理商确实为事件分配了精确的后验概率,Aumann也表明,如果它们仅仅是后哨的一阶相互了解,他们就可以“同意不同意”。[18] Aumann的结果可能失败的另一种方式是如果代理商没有共同的知识,他们通过贝叶斯的条件化更新他们的信仰。 然后,由于他人以“错误”方式修改信仰的结果,代理商可以解释发散的意见。 但是,有些案例既不解释似乎令人信服,否认必要的常识似乎是一个相当临时的举动。 为什么有人应该认为这种常识的失败为不同的信念提供了一般性解释?
第二种选择是什么,即否认注册会计师?[19]所提出的支持注册会计师的主要论点是,代理商的概率的任何差异都应该是他们拥有不同信息的结果,即没有理由认为代理商的不同信念是没有理由的关于相同的事件是除了不同信息之外的任何事件的结果。 但是,人们可以回答这一论点只是重述Harsanyi Doctrine的资格。[20]
3.2公约
Schelling的百货商店的例子问题是一个非常简单的例子,其中代理通过建立公约适当地解决它们的协调问题。 (另见该百科全书中的公约条目。)使用博弈论的词汇,刘易斯(1969)将一份公约定义为一个严格的游戏的协调均衡,代理人遵循他们的共同知识,他们都更愿意遵循这一切经常性协调问题的协调均衡。 游戏的协调平衡是一种策略组合,使得如果任何代理人单侧偏离这种组合,则没有代理商更好。 与均衡一样,如果任何偏离均衡的代理人严格越来越严格,协调均衡是严格的。 图1.3的战略形式游戏总结了Liz和Robert的情况。 百货商店游戏在纯策略中有四种纳什均衡结果:(S1,S1),(S2,S2),(S3,S3),和(S4,S4)。[21] 这四种均衡都是严格的协调均衡。 如果代理遵循这些均衡中的任何一个,那么它们成功协调。 对于在这种情况下遵循刘易斯公约的代理人,他们必须遵循游戏的一个协调均衡之一。 然而,对于刘易斯遵循协调均衡不是遵守公约的代理人的足够条件。 为了假设Liz和Robert根本无法分析它们的困境,但Liz选择S2和Robert选择S2,使它们通过纯粹运气协调(S2,S2)。 刘易斯并未计数以惯例为此排序的意外协调。
假设接下来两个代理人都是贝叶斯理性的,每个代理商都知道的那部分是交叉游戏的支付结构。 如果代理人彼此希望遵循(S2,S2)并且因此成功协调,那么他们是否在惯例之后? 不一定,对刘易斯在一个微妙的论点上抗争。 59个公约。 虽然每个代理都知道游戏,但她是理性的,她仍然可能不会将与另一个代理商相同的知识。 如果每个代理商认为其他代理人将遵循其结束(S2,S2)均衡,那么她的最佳响应是跟随她的结束(S2,S2)。 但在这种情况下,由于他们的结果,代理人错误地认为,另一个人像自动化一样的行为,刘易斯认为任何适当的公约叙述必须要求代理商对彼此进行正确的信念。 特别是,刘易斯要求涉及公约中所涉及的各代理人必须具有相互期望,每个人都以与另一个人协调的目的在一起。 该论点可以进一步携带。 如果两个代理人认为他们会遵循的话怎么办(S2,S2),并相信彼此会这样做,以至于认为另一个是合理选择的S2,而不是无意识的? 然后,说,Liz会根据她的错误二阶相信,罗伯特认为Liz令人沮丧。 同样,对于任何更高阶的知识来说,对于三阶信念而言。
刘易斯得出结论,遵循公约的代理人的必要条件是遵循相应的协调均衡的偏好是共同的知识(最近关于公约是否需要普通知识的问题,CF. Cubitt和Sugden 2003,Binmore 2008年,Sillari 2008,以及一种实验方法,请参阅Devetag等人2013,了解与规则跟随的主题,见Sillari 2013)。 因此,在刘易斯的账户中,一套代理公约是一项协调均衡,即代理人遵循其合理性的共同知识,相关游戏的支付结构以及每个经纪人遵循她的部分均衡。
在经常性情况下,人口P成员的行为的规律性r是一个公约如果才是如此,并且它在P的任何情况下都是常识,并且在P的任何情况下,
每个人都符合r;
每个人都希望其他人都符合r;
每个人都有大致相同的偏好,就所有可能的行为组合;
每个人都喜欢每个人都符合R,因为至少是一个但是一个符合R的条件;
每个人都宁愿每个人都符合R',因为至少是一个符合R',
其中R'是S中P成员行为的一些可能规律性,使得P成员中的任何实例中没有人可以符合R'和R.
(刘易斯1969,第76页)[22]
刘易斯包括以下要求,除了均衡的衡量之外,还有所有遵循的均衡均衡R',以捕捉到遵守公约的代理人的基本直觉,这依赖于他们对其他人的表现方式。
Sugden(1986)和Vanderschraaf(1998年)认为,对相应的均衡是一种协调均衡,这对公约的概念来说并不至关重要。 刘易斯的关键洞察力是,“公约”是一种互利行为的模式,这取决于代理商的常识,所有这些都遵循这种模式,而且没有其他。 Vanderschraeaaf将常规定义为严格的均衡,与众不同,所有人都遵循这一均衡,所有这些都会遵循不同的均衡,他们的信仰彼此不同。 下面在图3.1示例的讨论中给出了这种更常规的惯例的一个例子。
3.3战略形式游戏
刘易斯将普通知识的概念制定为他对普通公约的一部分。 在公约出版的几年里,游戏理论家已经认识到,在比赛中对特定的比赛模式的任何解释都认为是互相和共同的知识假设。 更具体地说,博弈论的解决方案概念在大部分中,游戏中的代理人对其情况的互相知识都是有动机和合理的。
为了建立将在讨论中使用的符号,在此提供了以战略形式,预期的效用和代理商在其对手的策略中的通常定义:
定义3.2
游戏γ是由以下元素组成的有序三倍(n,s,u):
一个有限的设置n = {1,2,...,n},称为代理或玩家集。
对于每个代理k∈n,有一个有限的SEC = {sk1,sk2,...,sknk},称为代理k的替代纯策略。 笛卡尔产品S = S1×...×SN被称为游戏γ设置的纯策略。
地图U:S→ℜn,称为纯策略集上的实用程序或支付功能。 在每个策略组合S =(S1J1,......,SNJN)∈s,代理K的特定支付或实用程序由U的犹太条件给出,即代理K在S处的UK US所确定的
英国(s)= ik(u(s1j1,...,snjn))
其中ik(x)将xīn投射到其kth组件上。
下标'-k'表示删除n组元组或n折叠笛卡尔产品的k个组件的结果。 例如,
s-k = s1×...×sk-1×sk + 1×...×sn
表示代理人K的对手可能会发挥的纯粹战略组合。
现在让我们正式将代理人的信念介绍到这一框架中。 ΔK(S-K)表示可测量空间(S-K,FK)上的一组概率分布,其中FK表示由策略组合S-K产生的布尔代数。 每个代理K具有概率分布μk∈δk(S-K),该分布确定K可能的行为中的每一个的预期实用程序:
e(英国(skj))=
σ
一个-k∈s-k
英国(SKJ,S-K)μk(S-K),J = 1,2,...,NK
如果我是k的对手,那么我的个人策略SIJ可以被称为战略组合的联盟⋃{s-k |k|sij∈s-k}∈fk,因此k的策略sij的边际概率可以计算为遵循:
μk(骶髂关节)=
σ
{s-k|sij∈s-k}
μk(s-k)
μk(⋅|aα)表示k的条件概率分布给定A组,e(⋅|a|a)表示k的条件期望给出μk(⋅|aα)。
首先假设代理商对他们从事的游戏的全部支付结构具有共同的知识,并且它们都是理性的,并且没有其他信息是常识。 换句话说,每个代理都知道她的对手是预期的效用最大化器,但一般不知道他们选择哪些战略或他们的行为的概率是什么。 这些常见的知识假设是伯恩姆姆(1984)和Pearce(1984)独立推出的非支持性游戏的解决方案概念的激励基础。 粗略地说,合理化的战略是代理人可以选择的任何战略,而不违反贝叶斯理性的共同知识。 伯恩海姆和珍珠争辩说,只有游戏的结构和代理商的贝叶斯理性是普通知识时,如果每个经纪人发挥合理化策略,游戏应该被视为“解决”。 例如,在具有由图3.1定义的收益结构的“鸡”游戏中,
乔安娜
s1 s2的
lizzi s1(3,3)(2,4)
s2的(4,2)(0,0)
图3.1
如果乔安娜和Lizzi对每个策略组合的所有收益都具有共同的知识,并且他们具有共同的知识,两者都是贝叶斯理性的,那么四个纯策略概况中的任何一个都是合理的。 因为如果彼此的信仰是由概率定义的
α1。=μ1(joanna播放s1),和
α2。=μ2(Lizzi Plays S1)
然后
e(ui(s1))=3αi+ 2(1-αi)=αi+ 2
和
E(UI(S2))=4αi+ 0(1-αi)=4α,i = 1,2
因此,如果αi+2≥4αi或αi≤2/ 3,则通过演奏S1并通过演奏S2,如果αi≥2/ 3,则通过演奏S2最大化她的预期效用,最大化她的预期效用。 如果它发生了这两个代理的αi> 2/3,那么通过扮演他们的信仰的策略组合的各自结束,尤其符合贝叶斯理性,即使每个人都希望从这种策略组合中缺陷,她也可以发现另一个策略组合的缺陷实际上是为了发挥S2。 请注意,游戏的纯策略纳什均衡(S1,S2)和(S2,S1)是合理的,因为它对于Lizzi和Joanna符合均衡给出适当的分布而合理。 一般来说,游戏合理化战略组合的集合包含了游戏的纯策略纳什均衡集。[23]
可合理化可以以多种方式正式地定义。 这里给出了Bernheim原始(1984)定义的变化。
定义3.3
鉴于每个代理k∈n具有概率分布μk∈δk(s-k),信仰系统
μ=(μ1,...,μn)∈δ1(s-1)×⋯×δn(s-n)
贝内斯协调且仅当才有,
(3.i)
对于i∈K,μi(skj)>0⇒skj最大化k的预期效用,对于一些σk∈δk(s-k),
(3.i)是常识。 纯策略组合S =(S1J1,...,SNJN)∈s是可合理的,如果代理具有贝叶斯态度系统μ的信仰和每个代理k∈n,则只有
(3.ii)
E(英国(skjk))≥e(英国(skik)),适用于ik≠jk。[24]
以下结果表明,定义3.1中的分布的共同知识限制正式地确定了代理商对贝叶斯理性的共同知识的假设。
命题3.4
在游戏γ中,如果(3.i)是常识,则满足贝叶斯合理性的共同知识。
证明。
当代理商有普通的游戏和贝叶斯理性知识时,人们可以预测他们将遵循合理的策略概况。 然而,如果代理商更加了解彼此,则合理化成为一个不稳定的解决方案概念。 例如,在上面的鸡实例与αi>2/3中,I = 1,2,如果任一剂都要发现其他代理人对她的信念,她将有充分的理由不遵循(S2,S2)的简介并修改对其他代理人的自己的信念。 另一方面,如果α1= 1且α2= 0,则通过以下方式最大化预期的回收率(S2,S1)轮廓,那么如果代理商彼此发现他们的信仰,它们仍然会遵循(S2,S1)。 实际上,如果他们的信仰是普通知识,那么可以确定他们会遵循的确定(S2,S1)。 NASH平衡(S2,S1)的特征在于由α1= 1和α2= 0限定的信念分布。
纳什均衡是相关的平衡概念的特殊情况,其在游戏中的代理人的信仰分布方面定义。 通常,相关的均衡的惯量是一种代理商的概率分布系统,其仍然稳定对游戏的共同知识,合理性和信仰本身。 我们将审查两种替代相关的均衡概念(Aumann 1974,1987; Vanderschraaf 1995,2001),并展示了每次概括纳什均衡概念。
定义3.5
鉴于每个代理k∈n具有概率分布μk∈δk(s-k),信仰系统
μ* =(μ
*
1
,...,μ
*
n
)∈δ1(s-1)×...×δn(s-n)
是一个内源性相关的平衡,如果,只有,
(3.iii)
对于i∈K,μ
*
一世
(skj)>0⇒skj最大化k给出μ的预期实用程序
*
k
。
如果μ*是内源性相关的平衡,则纯策略组合S * =(s
*
1
,...,s
*
n
)∈s是给定μ*的内源性相关平衡策略组合,并且仅适用于每个代理k∈n,
(3.iv)
e(英国(s
*
k
))≥为Ski≠s(英国(ski))
*
k
。
因此,内源性相关性平衡μ*限制了代理人可能遵循的一组策略,就像合理化的合理化情能性的相应信念一样。 然而,内源性相关的均衡概念是合理化化的适当细化,因为后者没有预先假定条件(3.Iii)相对于信仰的情况实际上拥有一个人的对手。 如果恰好纯粹的策略组合S *满足(3.iv)给定μ*,则μ*是严格的平衡,在这种情况下,可以确定肯定地预测代理商会为游戏,合理性及其信仰的共同知识进行预测。 请注意,定义3.5没有关于代理人是否将其对手的战略组合视为概率独立的。 此外,这种定义不要求代理商的概率一致,即代理对相互对手的行为同意的概率。 内源性相关均衡概念的简单细化表征了纳什均衡概念。
定义3.6
代理系统的信念μ*是纳什均衡,如果,才有,
条件(3.iii)满意,
对于每个k∈n,μ
*
k
满足概率的独立性
对于每个skjīsk,如果i,l∈K则μ
*
一世
(skj)=μ
*
l
(skj)。
换句话说,当每个试剂视为概率自独立的对手的移动时,内源性相关平衡是纳什均衡的信念,并且代理的概率是一致的。 注意,在2代理的情况下,定义3.6的条件(b)和(c)总是满足,因此对于2代理游戏,内源相关均衡概念减少到纳什均衡概念。 条件(b)和(c)传统上在博弈论中承担,但斯特尔斯(1991)和Vanderschraaf(1995年,2001年)认为,可能有很好的理由在3个或更多代理商中放松这些假设。
Brandenburger和Dekel(1988)显示,在2代理游戏中,如果代理商的信仰是常识,条件(3.iii)的特征是纳什均衡的信念。 如本说明,如果概率分布是一致的并且满足概率独立,条件(3.III)表征了N-Agent案例的纳入均衡。 主题3.7通过放松一致性和概率独立假设来扩展Brandenburger和Dekel的结果对内源性相关的均衡概念。
命题3.7
假设概率
μ=(μ1,...,μn)∈δ1(s-1)×...×δn(s-n)
是常识。 然后,如果μ是内源相关平衡,则满足贝叶斯合理性的常见知识。
证明。
另外,我们有:
Corollary 3.8(Brandenburger和Dekel,1988)
假设概率的2代理游戏
μ=(μ1,μ2)∈δ1(s-1)×δ2(s-2)
是常识。 然后,如果μ是纳什均衡,则才满足贝叶斯合理性的常见知识。
证明。
内源性相关的平衡概念减少到2-药用案件中的纳什均衡概念,因此通过命题3.7遵循推动。