博弈论的认识论基础(四)
在上面的示例中,ANN的事件是TB×SB的子集,并且BOB的事件是TA×SA的子集。 然后,我们有以下正式版本的上述非正式观察,了解图8中的定性型空间。
让l = {(t
'
1
,l),(t
'
2
,l)}是鲍勃选择策略l的事件。 然后,自从
λa(t1的)= {(t
'
1
,l),(t
'
2
,l)}⊆l
和
λa(t2的)= {(t
'
2
,l)}⊆l,
我们有那个
学士学位(l)= {(t1的,u),(t1的,d),(t2的,u),(t2的,d)}
假设d = {(t1,d),(t2,d)}是ANN选择策略D的事件。 然后
bb(d)= {(t
'
2
,l),(t
'
2
,r)}。
自从
λa(t1的)= {(t
'
1
,l),(t
'
2
,l)}⊈bb(d)
和
λa(t2的)= {(t
'
2
,l)}⊆bb(d),
我们有那个
学士学位(bb(d))= {(t2的,u),(t2的,d)}。
召回l = {(t
'
1
,l),(t
'
2
,l)}和
学士学位(l)= {(t1的,u),(t1的,d),(t2的,u),(t2的,d)}。
然后,检查这一点很简单
bb(学士学位(l))= {(t
'
1
,l),(t
'
2
,r),(t
'
2
,l),(t
'
2
,r)}
请注意,事件BA(L)是BOB的事件,事件BB(D)是ANN的事件。
2.2.3概率型空间
定性类型空间的定义(定义2.6)的少量变化允许我们代表概率信念:
定义2.7(类型空间)假设g =⟨n,(si)i∈n,(ui)i∈n⟩是战略形式的游戏。 g的类型空间是元组⟨s,(ti)i∈n,(λi)i∈n⟩,其中每个i∈n,ti是一个非空的集合(其元素称为类型),s是g中的一组策略配置文件,
λi:首选的TI→δ(×j≠itj×s-1)。
λi下的类型及其相关图像对玩家的信仰层次进行编码。 例如,如果t∈ti,则λi(t)是T-I×S-I的概率,因此Margs-Iλi(t)∈δ(S-I)是我的一阶信念。 对于t∈ti,让p
1
t
表示对与T相关的玩家的一阶相信(即,p
1
t
= margs-iλi(t))。 我们说明如何通过示例来定义高阶信仰。
例2.8
再次返回我们正在运行的示例游戏,其中Ann(a)有两个可用操作{u,d}和bob(b)有两个可用的动作{l,r}。 假设Ann Ta = {T1}有一种类型,并且Bob Tb = {t的两种类型
'
1
,t
'
2
在以下矩阵中给出的λa和λb的定义:
l r
λa(t1的)t
'
1
0.5 0
t
'
2
0.4 0.1
图9:安妮对鲍勃的信念
u d
λb(t
'
1
)t1的1 0
u d
λb(t
'
2
)t1的0.2 0.8
图10:Bob对Ann的信念
在上面的类型空间中编码的球员的第一和二阶信念是:
对于安,我们有那个p
1
t1的
是概率
p
1
t1的
(l)=λa(t1的)(l,t
'
1
)+λa(t1的)(l,t
'
2
)= 0.5 + 0.4 = 0.9
和
p
1
t1的
(r)=λa(t1的)(r,t
'
1
)+λa(t1的)(r,t
'
2
)= 0 + 0.1 = 0.1。
对于鲍勃,我们有那个p
1
t
'
1
是p的概率
1
t
'
1
(U)= 1.0和p
1
t
'
1
(d)= 0.0和p
1
t
'
2
是p的概率
1
t
'
2
(U)= 0.2和p
1
t
'
2
(d)= 0.8
ANN考虑同样可能的鲍勃类型(0.5):ANN的鲍勃是T型的概率
'
1
是
λa(t1的)(l,t
'
1
)+λa(t1的)(r,t
'
1
)= 0.5 + 0 = 0.5
鲍勃是t的概率
'
2
是
λa(t1的)(l,t
'
2
)+λa(t1的)(r,t
'
2
)= 0.4 + 0.1 = 0.5。
这意味着她认为这同样可能是鲍勃确实像鲍勃一样扮演概率0.2她扮演你。 更确切地说,T1的二阶概率表示p
2
t1的
,定义如下:
p
2
t1的
(l,p
1
t
'
1
)= 0.5,
p
2
t1的
(r,p
1
t
'
1
)= 0.0,
p
2
t1的
(l,p
1
t
'
2
)= 0.4,和
p
2
t1的
(u,p
1
t
'
2
)= 0.1。
由于ANN有一个独特的类型,因此ANN是T1类型的,因此Bob的二阶(和高阶)概率仅基于他的一阶信念。
以上类型的空间是玩家信仰的非常紧凑的描述。 不难看出,每个类型的空间都可以转换为认知概率模型。 假设t =⟨s,(ti)i∈n,(λi)i∈n⟩是游戏G =⟨n,(si)i∈n,(ui)i∈n⟩的类型空间。 我们可以将t转化为认知概率模型mt =⟨wt,(〜
t
一世
)i∈n,(p
t
一世
)i∈n⟩,在哪里
wt = t×s,其中t =×i∈nti和s =×i∈nsi
对于(t,s),(t',s')∈wt,我们有(t,s)〜
t
一世
(t',s')如果且仅当ti = t
'
一世
和si = s
'
一世
p
t
一世
是(t,s)∈wt,p的功能
t
一世
(t,s)是以下概率:
p
t
一世
(t,s)(t',s')= {
λi(t)(t
'
一I
,s
'
一I
)如果(t',s')∈[(t,s)] i
0。否则
它立即成为同等游戏模型,从而在它们生成相同的信仰层次结构中。 为了说明上述构造,以下识别概率模型是MT,其中T是来自上述示例2.8的类型空间。 (在下图中,给出了每个玩家i∈{a,b}的功能pi,给出了先前概率pa和pb,并且通过调节函数pa和pb,如第2.1.2节所述。)
一个图:链接到下面的扩展说明
图11 [图11的扩展说明在补充中。]
一些简单(但有效的!)计算表明,上述认知概率模型描述了与上述示例2.8的类型空间相同的信念。 来自认知概率模型的构造和等效类型空间更复杂。 参见Galeazzi&Lorini 2016和Bjorndahl&Halpern 2017年讨论(CF.也是Fagin,Geanakoplos,等。1999; Brandenburger&Dekel 1993; Heifetz和Samet 1998;和Klein&Pacuit 2014进一步讨论了型空间和认识概率模型之间的关系)。
2.2.4型空间中的理性选择
类型空间中的状态是一对(t,s),其中t列出了每个玩家的类型,并且s是底层游戏中的策略配置文件。 假设
g =⟨n,(丝)i∈n,(ui)i∈n⟩
是战略形式的比赛
⟨s,(首选的TI)i∈n,(λi)i∈n⟩
是G.的类型空间。
对于每个州(t,s),对于每个玩家i∈n,t∈ti,播放器我是一阶信仰p
1
首选的TI
∈δ(S-I)定义为p
1
首选的TI
= margs-iλ(首选的TI)。 当类型和策略集是有限时,这意味着p
1
首选的TI
定义如下:
p
1
首选的TI
(s-1)=
σ
t-i∈t-我
λi(首选的TI)(s-我,t-1)
鉴于一个国家(t,s),我们说,当Si最大化播放器时,我在(t,s)中是合理的,当时我的一阶信仰p最大化播放器
1
首选的TI
(对于策略x和概率p,我们为x的预期效用写入eu(x,p))。 也就是说,我在所有s'∈si时,我是合理的(t,s),
欧盟(丝,p
1
首选的TI
)=
σ
s
'
一I
∈s-我
p
1
首选的TI
(s
'
一I
)ui(丝,s
'
一I
)
≥
σ
s
'
一I
∈s-我
p
1
首选的TI
(s
'
一I
)ui(s',s
'
一I
)
=欧盟(s',p
1
首选的TI
)
让rat⊆t×s成为所有球员都是理性的州的集合:
鼠= {(t,s)|(t,s)∈t×s和我在所有i∈n的(t,s)中是合理的
鉴于所有玩家都是理性的状态的集合RAT,我们定义了以下集合:
rati = {(首选的TI,丝)|(t,s)∈rat}
大鼠-我= {(t-我,s-1)|(t,s)∈rat}
为了说明上述定义,请考虑图4中的游戏和来自上述示例2.8的类型空间。 以下计算表明,您最大限度地提高了播放器的预期效用,给出了T1所定义的她的信仰:
欧盟(u,p
1
t1的
)= p
1
TA
(l)ua(u,l)+ p
1
TA
(r)ua(u,r)
= [λa(t1的)(l,t
'
1
)+λa(t1的)(l,t
'
2
)]⋅ua(u,l)
+ [λa(t1的)(r,t
'
1
)+λa(t1的)(r,t
'
2
)]⋅ua(u,r)
=(0.5 + 0.4)⋅3+(0 + 0.1)⋅0
= 2.7
欧盟(d,p
1
t1的
)= p
1
TA
(l)ua(d,l)+苯二甲酸(r)ua(d,r)
= [λa(t1的)(l,t
'
1
)+λa(t1的)(l,t
'
2
)]⋅ua(d,l)
+ [λa(t1的)(r,t
'
1
)+λa(t1的)(r,t
'
2
)]⋅ua(d,r)
=(0.5 + 0.4)⋅0+(0 + 0.1)⋅1
= 0.1
自欧盟(U,P
1
t1的
)>欧盟(d,p
1
t1的
),U最大化T1类型的预期效用。 类似的计算显示,鼠= {(t1,t
'
1
,u,l),(t1的,t
'
2
,u,r)}。
2.3常识和信仰
博弈论中的标准假设是游戏中的球员是理性的,并且通常是已知的或常见的,以至于球员是合理的。 游戏理论家和逻辑学家都广泛讨论了一个小组的知识和信仰的不同概念,例如共同的知识和信念。 有关相关文献的更多信息和指导者,请参阅Vanderschraaf&Sillari(2005 [2022]); Fagin,Halpern,等。 (1995:Ch。6); 和雷德曼(2018A)。
假设G是与玩家N的游戏,(ki)i∈n是来自某些事故(-probiability)模型的知识运营商,我们定义了群组知识的以下概念:
如果所有的玩家都知道E:每个事件e让
K(e):=
⋂
i∈n
ki(e)。
对于K≥0,事件E的kth级知识递归定义如下:
K0(E)=E且对于k≥1,Kk(E)=K(Kk−1(E))
。如果E是一组参与者的共同知识,那么不仅每个参与者都知道E为真,而且这个事实对所有参与者来说都是完全透明的。然后,按照Aumann (1976)的说法,E的共同知识被定义为以下无限合取:
。
。CK(E)=
。⋂
。k≥0
。Kk(E)
。解开定义,我们得到
。
。CK(E)=E∩K(E)∩K(K(E))∩K(K(K(E)))∩⋯
。有关共同知识其他定义的讨论,请参阅Barwise 1988、Heifetz 1999a、Cubitt & Sugden 2014 和 Lederman 2018b。
。
。上述定义共同知识的方法可以看作是定义共同(稳健/强)信念的秘诀(只需将知识算子 Ki 替换为适当的信念算子)。例如,类型空间中共同信念的定义遵循类似的模式。
假设 G=⟨N,(Si)i∈N,(ui)i∈N⟩ 是一个战略形式的博弈,⟨S,(Ti)i∈N,(λi)i∈N⟩ 是 G 的类型空间。假设 i∈N,E⊆S−i×T−i 是玩家 i 的事件。当玩家 i 的类型将概率 1 分配给 E 时,我们说该类型相信 E(在认知博弈论文献中,通常使用“信念”而不是“确定性”来表示概率 1)。令 Bi(E) 为玩家 i 的策略类型对集合,使得该类型将概率 1 分配给 E:
Bi(E)={(si,ti)∣(s,t)∈S×T 且 λi(ti)(E)=1}
。假设 (Ei)i∈N 是一个事件序列,其中对于每个 i∈N,Ei⊆S−i×T−i。令 E=×i∈NEi 且 E−i=×j≠iEj。则 E 的相互信任度记为 B(E),定义如下:
。
。B(E)=×i∈NBi(E−i)
。注意到 B(E)−i=×j≠iBj(E−j),经过明显的变换,我们可以将该集合视为 S−i×T−i 的子集。因此,我们可以滥用符号,将策略类型对的集合写为 Bi(B(E)−i),使得该类型将 E 的相互信任度概率设置为 1。E 的第 k 级信任度定义如上:
。
B1(E)=B(E),且对于k≥2,Bk(E)=B(Bk−1(E))
最后,对E的共同信念也定义如上:
CB(E)=
⋂
k≥1
Bk(E)
有关共同信念逻辑的讨论,请参阅Bonanno (1996) 和 Lismont & Mongin (1994, 2003)。虽然我们在本条目中不讨论,但Monderer & Samet (1989) 引入了一种概率变体的共同信念。
2.4 博弈模型中的自指悖论
任何博弈的认知分析的第一步都是使用第2节中介绍的模型(或其变体)来描述玩家的知识和信念。正如我们在第2.1.1节中提到的,关于玩家对博弈情境以及彼此的了解和信念,有些陈述在某些模型中是众所周知的,但在其他模型中则不然:
在任何特定的(类型)结构中,某些信念(关于信念的信念……)都会存在,而其他信念则不会存在。因此,在选择(类型)结构背后有一个重要的隐含假设。那就是,对于玩家来说,该类型结构中的信念——而且只有这些信念——是可能的,这是“透明的”……其理念是,战略情境存在一个“背景”(例如,历史、惯例等),而这个“背景”会导致玩家排除某些信念。(Brandenburger & Friedenberg 2010: 801)
排除某些信念配置构成了对决策过程中玩家推理的实质性假设。换句话说,实质性假设是关于玩家对游戏以及彼此的了解和信念,超越了玩家知识和信念的数学表征所固有的内容。不难看出,在有限博弈模型中总能找到实质性假设:给定一组可数无限的基本事实(例如,命题语言中的原子命题),在任何有限博弈模型中,这些基本事实的某些逻辑一致的组合无法实现将是常识,更不用说关于这些基本事实的(高阶)信念/知识的逻辑一致的配置也无法实现。另一方面,信念/知识算子的单调性是非实质性假设的典型例子。更一般地说,正如我们在第二节中定义的,不存在任何博弈模型,其中玩家相信其信念的所有逻辑后果并非常识。)11)