博弈论的认识论基础(三)
一个图:链接到下面的扩展说明
图7 [图7的扩展说明在补充中。]
实线代表Ann的分区,虚线代表Bob的分区。 我们进一步假设存在共同的先前的P:W→[0,1],其中概率分配给写在状态右侧的每个状态(例如,p(w2)=
1
8
)。 让e = {w2,w5,w6}是一个事件。 然后,我们有
b
1
2
一种
(e)= {w|p(e|πa(w))=
p(e∩πa(w))
p(πa(w))
≥
1
2
} = {W1,W2,W3,W4,W5,W6}:“ANN将至少1/2分配给事件e给定她所有状态的信息”。
bb(e)= b
1
b
(e)= {w2,w5,w3,w6}。 特别地,注意在W6,代理人认为(具有概率1),即E为真,但不知道E为πb(w6)⊈e。 因此,特工考虑可能的国家之间存在区别(鉴于他们的“硬信息”)和球员分配非零概率的状态。
让u = {w1,w2,w3}是Ann播放u和l = {w1,w4}的事件,鲍勃播放l。 然后,我们有
ka(u)= u和kb(l)= l:Ann和Bob知道他们选择的策略;
b
1
2
一种
(l)= u:在Ann播放U的所有国家,安为鲍勃扮演L概率1/2; 和
学士学位(b
1
2
b
(U))= {W1,W2,W3} = U:在Ann扮演你的所有状态下,她认为鲍勃认为她正在播放你的概率1/2。
2.1.3认识概率模型中的理性选择
在游戏的认识概率模型中的每个状态描述了玩家的选择和每个玩家对其他玩家的选择的信念。 假设⟨n,(si)i∈n,(ui)i∈n⟩是战略形式的游戏,⟨w,(πi)i∈n,(pi)i∈n,σ⟩是g的认识概率模型。对于每个策略简介s∈s,让Si是I在S(即,SI是S的IITH组件中所选择的动作,S-I是所有玩家的选择的组成部分。 每个策略个人资料S都与以下事件相关联:
[si] = {w |σ(w)i = si}是播放器我选择si的事件。
[s-i] = {w |σ(w)-i = s-i} =⋂ji [sj]是所有播放器之外的事件,除了我在s-i中选择了他们的动作。
[s] = {w |σ(w)= s} =⋂i[si]是游戏结果的事件。
对于每个玩家I,让S-I =×isj是所有玩家的所有可能的选项组合,除了我。 对于每个i∈n和每个s-i∈S-i,p
w
一世
([S-I])是玩家我分配给在S-I中选择他们策略的其他玩家的概率。 然后,播放器我在州W中选择的播放器的预期效用,表示欧盟(I,W),是:
σ
s-i∈s-我
p
w
一世
([s-我])u(σ(w)我,s-1)
其中U(σ(w)i,s-i)是分配给战略简介s'''s的实用程序
'
一世
=σ(w)i和s
'
一I
= s-我。 当我在州W中选择的预期效用是关于我的其他可用选择的预期效用时 也就是说,我在所有s'∈si时是合理的,
σ
s-i∈s-我
p
w
一世
([s-我])ui(σ(w)我,s-1)≥
σ
s-i∈s-我
p
w
一世
([s-我])ui(s',s-1)
然后,对于每个i∈n,事件Rati = {W| I在州W中是合理的}是播放器I的rational的事件,rat =⋂i∈nrati是所有玩家都是理性的事件。
为了说明上述定义,考虑图7中描绘的概率概率模型对于图4中描绘的游戏描述了图4中所示的概念概率模型
[(u,r)] = {w2,w3}
[(u,r)一个] = [u] = {w1,w2,w3}
[(u,r) - 一] = [(u,r)b] = [r] = {w2,w3,w5,w6}
对于w∈{W1,W2,W3},我们有以下内容:
欧盟(σa(w),w)=欧盟(u,w)
= p
w
一种
([l])ua(u,l)+ p
w
一种
([r])ua(u,r)
=
1
2
⋅3+
1
2
⋅0
=
3
2
欧盟(d,w)= p
w
一种
([l])ua(d,l)+ p
w
一种
([r])ua(d,r)
=
1
2
⋅0+
1
2
⋅1
=
1
2
对于w∈{W4,W5,W6},我们有以下内容:
欧盟(σa(w),w)=欧盟(d,w)
= p
w
一种
([l])ua(d,l)+ p
w
一种
([r])ua(d,r)
=
1
6
⋅0+
5
6
⋅1
=
5
6
欧盟(u,w)= p
w
一种
([l])ua(u,l)+ p
w
一种
([r])ua(u,r)
=
1
6
⋅3+
5
6
⋅0
=
1
2
因此,我们有那个
按比例= {w1,w2,w3,w4,w5,w6}。
类似的计算显示
ratb = {w1,w4,w3,w6}。
因此,
大鼠= {w1,w4,w3,w6}。
2.2型空格
型空间最初是在Harsanyi的一个开创性的三部分纸上引入的,“贝叶斯人”球员(1967-68)播放的不完整信息的游戏“。 Harsanyi旨在开发一个用于玩家的游戏模型可能缺乏关于其他玩家甚至他们自己的收益函数的完整信息,缺乏关于其他玩家甚至他们自己可用的物理设施和策略的完整信息,缺乏关于其他玩家对游戏情况各个方面的信息量的完整信息,等等。(1967:163)
。
。Harsanyi 试图解决的主要问题是“玩家之间相互期望的无限回归”(1967:163)。Harsanyi 提出的解决方案是分配给每个玩家一个“类型”,这代表了他们关于任何可能影响他们对游戏收益和其他玩家类型的信念的因素的私人信息。主要思想是,每个玩家的类型都会生成一个信念层次结构,描述该玩家相信什么、相信其他玩家相信什么等等。因此,类型空间是与游戏相关的玩家信念层次结构的紧凑表示。
。
。有关类型空间的概述,请参阅 Siniscalchi (2008),有关 Harsanyi (1967–68) 开创性贡献的一些历史评论,请参阅 Myerson (2004)。
2.2.1 信念层次
博弈论分析的一个关键组成部分是参与者的信念层次。对于具有一组策略配置文件 S 的博弈,参与者 i 的信念层次是一个无限的概率测度序列 (p
1
i
,p
2
i
,p
3
i
,…),其中,对于每个 k≥1,p
k
i
表示参与者 i 的第 k 阶信念。信念层次的正式定义对于两个参与者来说最容易解释。考虑两个参与者 a 和 b 的博弈,Sa 是 a 的策略集,Sb 是 b 的策略集。回想一下,S−b=Sa 且 S−a=Sb。那么,对于 i∈{a,b},玩家 i 的一阶和二阶信念定义如下:
i 的一阶信念是关于另一个玩家将在游戏中做什么。因此,p
1
i
是对另一个玩家策略的概率测度:p
1
i
∈Δ(S−i).
i 的二阶信念是关于另一个玩家将在游戏中做什么以及另一个玩家相信 i 将在游戏中做什么。由于集合 S−i×Δ(Si) 包含所有由另一个玩家的选择和另一个玩家的一阶信念组成的对,因此我们有 p
2
i
∈Δ(S−i×Δ(Si)).
以此类推,玩家 i 的第 k 阶信念 p
k
i
定义如下。对于每个 i∈{a,b},对于所有 k≥1,递归定义集合 X
k
−i
如下:设 X
0
−a
=Sb 且 X
0
−b
=Sa,对于 k≥1,设
X
k
−i
=X
k−1
−i
×Δ(X
k−1
i
),
其中 X
k−1
i
是 −i 的 (k−1) 阶信念的定义域(例如,Sa 是 b 的一阶信念的定义域)。然后,我们有 p
k
i
∈Δ(X
k
−i
)。因此,玩家 i 的所有信念层次的集合为集合 ×k≥0Δ(X
k
−i
)。
关于玩家信念层次,务必牢记以下几点:
在上一节定义认知概率模型时,我们没有定义σ代数,也没有提及正式定义概率测度所需的任何其他数学假设。这是因为我们只关注有限博弈和具有有限状态集的认知概率模型。然而,即使 X 是有限的,X 上的概率测度集合 Δ(X) 也是无限的(实际上,它是不可数的)。因此,在正式定义 k≥2 的 k 阶信念时需要谨慎。有关数学细节,请参阅 Billingsley (1999)。
信念层次并不代表玩家自身选择或信念的不确定性。注意 p
2
i
∈Δ(S−i×Δ(Si)),因此 p
2
i
确实为 Δ(Si) 的元素分配了概率。然而,Δ(Si) 的元素被解释为玩家 −i 的信念,而不是玩家 i 的混合策略或玩家 i 对其自身策略的信念(参见第 3.3.2 节)。认知博弈论中的标准假设是,玩家确定自己的策略,并且在确定自己信念的意义上是完全内省的。
。给定一个信念层次,有两种方法可以定义玩家的第 k 阶信念。例如,考虑 p
2
i
∈Δ(S−i×Δ(Si))。该概率测度通过对 S-i 取边际(即,通过求出 S-i 中每个元素对 Δ(S-i) 的期望)生成 S-i 上的概率,记为 margS-ip
2
i
(即,margS-ip
2
i
∈Δ(S-i))。一个自然的假设是要求 margS-ip
2
i
和 p
1
i
是相同的概率测度。更一般地,当对于所有 k≥2,margX
k-1
−i
p
k
i
=p
k-1
i
时,信念层次结构(p
1
i
,p
2
i
,…)是一致的。
鉴于先前的评论,人们可能会想知道为什么 p
2
i
被定义为 S−i×Δ(Si) 上的概率,而不是使用更简单的定义 p
2
i
∈Δ(Δ(Si))。主要的观察结果是,为了评估 i 赋予玩家 −i 理性的概率,我们需要当 −i 具有某某信念时,−i 选择某种策略的概率。仅仅表示 i 对 −i 将要做什么的信念(Δ(S−i) 的一个元素)以及 i 认为 −i 相信 i 将要做什么(Δ(Δ(Si)) 的一个元素)是不够的。关于理性的信念涉及关于选择与信念正确匹配的信念。
许多认知博弈论文献并没有使用一组信念层次结构作为博弈模型,而是使用一种称为类型空间的模型,该模型由 Harsanyi 在其开创性论文 (1967-68) 中提出,用于表示玩家的信念层次结构(有关在 Harsanyi 模型中表示信念层次结构的扩展讨论,请参阅 Brandenburger & Dekel 1993;Mertens & Zamir 1985;以及 Perea & Kets 2016)。
。
。2.2.2 定性类型空间
。我们首先定义一个非概率版本的类型空间。
。
。定义 2.6(定性类型空间)假设
。
。G=⟨N,(Si)i∈N,(ui)i∈N⟩
。是一个战略形式的博弈。 G 的定性类型空间是一个元组 ⟨S,(Ti)i∈N,(λi)i∈N⟩,其中对于每个 i∈N,Ti 是一个非空集合(其中的元素称为类型),S 是 G 中的策略配置文件集合,并且
λi:Ti→℘(T−i×S−i)。
其中 T=×iTi,T−i=×j≠iTj,S=×iSi,且 S−i=×j≠iSj。
因此,对于每个玩家 i∈N,λi 函数为每个类型 t∈Ti 分配一组元组,描述其他玩家的类型和选择。
考虑图 1 中 Ann (a) 和 Bob (b) 之间协调博弈的初始示例。在这种情况下,策略概况集为 S={(u,l),(d,l),(u,r),(d,r)}。然后,S−b=Sa={u,d} 和 S−a=Sb={l,r}。假设每个玩家有两种类型:Ta={t1,t2} 和 Tb={t
′
1
,t
′
2
}。假设函数 λa 和 λb 定义如下:
λa:Ta→℘(Tb×Sb) 是函数,其中
λa(t1)={(t
′
1
,l),(t
′
2
,l)} 和 λa(t2)={(t
′
2
,l)}
λb:Tb→℘(Ta×Sa) 是函数,其中
λb(t
′
1
)={(t1,u)} 和 λb(t
′
2
)={(t2,d)}
表示这些函数的一种便捷方式如下:
l r
λa(t1) t
′
1
1 0
t
′
2
1 0
l r
λa(t2) t
′
1
0 0
t
′
2
1 0
u d
λb(t
′
1
) t1 1 0
t2 0 0
u d
λb(t
′
2
) t1 0 0
t2 0 1
图 8
其中对于每个 i∈{a,b} 和每个 t∈Ti,上述矩阵的 (t′,s) 项中的 1 表示 (t′,s)∈λi(t)。在给出定性类型空间中信念的正式定义之前,我们对上述类型结构做出以下观察:
Ann 的两种类型都认为 Bob 会选择 l:在两个矩阵 λa(t1) 和 λa(t2) 中,唯一出现 1 的位置都在 l 列下。
类型 t2 认为 Bob 认为她会选择 d:类型 t2 分配为 1 的唯一行是 t
′
2
,类型 t
′
2
分配为 1 的唯一列是 d.
Bob 的两种类型都认为 Ann 认为他会选择 l。类型 t
′
1
分配为 1 的唯一行是 t1,类型 t
′
2
分配为 1 的唯一行是 t2,并且,如第 1 项所述,Ann 的两种类型都认为 Bob 会选择 l.
使用以下概念可以使这些非正式的观察更加精确:为游戏 G=⟨N,(Si)i∈N,(ui)i∈N⟩ 固定一个定性类型空间 ⟨(Ti)i∈N,(λi)i∈N,S⟩。
。一个(全局)状态,或可能世界,是一个元组 (t1,t2,…,tn,s),其中对于每个 i∈N 和 s∈S,ti∈Ti。将可能世界写成如下形式很方便:(t1,s1,t2,s2,…,tn,sn),其中对于每个 i∈N,si∈Si。
。类型空间描述玩家对其他玩家选择(和信念)的信念,因此事件需要相对于玩家而言。对于玩家 i 来说,事件是 ×j≠iTj×S−i 的子集。
。假设 E 是参与者 i 的一个事件,那么我们说 i 在 (t1,t2,…,tn,s) 时相信 E,前提是 λ(ti)⊆E。