博弈论的认知基础(三)

合理的排序

在上述模型中尚未表示的信仰的一个关键方面是它们在存在新信息的情况下可停下来。 虽然“AGM”风格的信仰修订理论有广泛的文学(AGM“风格(Alchourón,Gärdenfors,&Makinson 1985),我们专注于如何扩展认识模型,并具有更柔软,可再动信息态度。 标准方法是包括每个试剂的合理性排序:预订(反射和传递)表示⪯i⊆w×w。 如果w⪯iv我们说“我认为播放器至少像v一样粘合。” 对于一个事件xīw,让

min⪯i(x)= {v∈w| v⪯iwfor allw∈x}

根据⪯i表示X的最小元素集。 因此,虽然~i根据代理的硬信息分区可能的世界,但是⪯i代表了代理更有可能认为的可能世界(即,它代表播放器软信息)。

定义2.4(认识性 - 合理性模型)假设G是一个战略游戏,S是G的一组策略概况,N是球员。 认知 - 合理的模型是一个元组⟨w,{πi}i∈n,{⪯i}i∈n,σ⟩,其中⟨w,{Πi}i∈n,σ⟩是一个认知模型,σ:W→S和每个i∈n,⪯i是一个熟悉的,[9]对所有W,v∈w满足以下属性的反射和传递关系

合理性意味着可能性:如果w⪯iv然后v∈πi(w)。

本地连接的:如果v∈πi(w)那么w⪯iv或v⪯iw。

备注2.5请注意,如果v∉πi(w)那么w∉πi(v)。 因此,按财产1,w⪯̸iv和v⪯̸iw。 因此,我们具有以下等价:v∈πi(W)IFFw⪯iv或v⪯iw。

局部连通性意味着⪯i完全订购πi(w)和良好的创建意味着min⪯i(πi(w))是非空的。 这种更丰富的模型使我们能够正式地定义各种(软)信息态度。 我们首先需要一些额外的符号:PLAUSIBIBLE关系⪯i可以提升到W的子集如下[10]

所有xīx和y∈Y的x⪯iyiff xiiy

假设m =⟨w,{πi}i∈n,{⪯i}i∈n,σ⟩是一个认识的合理性模型,考虑以下运算符(正式,每个都是来自℘(w)到℘(w)的函数到上面定义的知识运营商):

信仰:Bi(e)= {ww|min⪯i(πi(w))⊆e}

这是一种常见的信仰概念,其满足上面讨论的标准性质(例如,一致性,积极和消极的内省)。

强大的信念:b

r

一世

(e)= {ww|v∈e,对于所有与w⪯iv}

所以,如果在所有世界中都是妥当的世界,那么E非常符合当前的世界。 这种更强大的信仰概念也被一些作者所要求的(参见Shoham&Leyton-Brown 2008:Sec。13.7)。

坚强的信念:

b

s

一世

(e)= {W |w|e∩πi(w)≠∅和e∩πi(w)⪯i-e∩πi(w)}

因此,提供了e被强烈认为,如果它是认识的,并且代理商在E中的补充中的任何状态中,我认为任何状态都会更合理。

如果代理商,我知道那么我(强大地,强烈地)认为E.然而,关于这些不同概念之间的逻辑关系,更重要的是。 (这些概念的逻辑已被Alexandru Baltag和Sonja Smets在一系列文章中进行了广泛研究,请参阅其他互联网资源的Baltag和Smets 2009用于参考。)

如上所述,这些信息态度的关键特征是它们可能会被适当证据击败。 事实上,我们可以在可以提示代理人调整她的信仰的证据类型方面表征这些态度。 为了使这种精确地,我们介绍了条件信仰的概念:假设m =⟨w,{πi}i∈n,{⪯i}i∈n,σ⟩是一个认识的合理性模型,e和f是事件,然后条件信仰运营商定义如下:

b

f

一世

(e)= {w|min⪯i(f∩πi(w))⊆e}

所以,'b

f

一世

'编码我认为在接受(可能误导)的证据时,我将相信哪些代理商是真实的。

我们将本节结束为示例来说明上述概念。 再次召回图4的协调游戏:玩家1(ANN),U和D有两个动作,以及玩家2(BOB),R和L的两个动作。 同样,玩家的偏好(或公用事业)在这个阶段并不重要,因为我们只对描述玩家的信息感兴趣。 以下认知可编集模型是可以与此游戏相关联的玩家的信息态度的可能描述。 实线代表玩家1的信息态度,虚线代表玩家2的。 箭头对应于来自W到V意义的i-arrow的玩家合理性排序,意思是v⪯iw(我们没有绘制所有箭头:可以通过填充来自反射性和传递性的箭头来完成每个合理的顺序。 不同的地区代表了球员的难题。

[标记为w_1的六个圆圈图

通过w_6。 在左下角,W_1位于W_2的左侧(每个

封闭文本'U,L'),它们通过虚线连接

箭头线标记为'2',从w_2到w_1和一个坚实的

Doublearroweweded线标记为'1'。 在它们之上是w_3封闭

文字'U,R'; 标有“1”标记为“1”的实心箭头线到W_1和

w_2。 上面的w_3是用虚线括在一起的文本'u,r'

箭头线标记为'2'从它到w_2,也是坚实的

箭头线标记为“1”,从中到W_3。 这四个

圆圈被矩形括起来。 在这个矩形的右边

封闭文本'd,l'低于w_6,括在于文本'd,r'。 一种

实心箭头线从W_6到W_5和另一个矩形

包裹这两个圆圈。 一个虚线箭头线标记为'2'

从W_5到W_2以及虚线区域括起来,括起来,w_2和w_5。

标记为'2'的虚线箭头线从w_4到w_6和a

划doublearrowheaded线标记为'2'连接w_3和w_6。 一种

虚线区域括在一起W_3,W_4和W_6。]

图7

假设实际的播放状态是W4。 所以,玩家1(ANN)选择U和Player 2(Bob)选择r。 此外,假设L = {W1,W2,W5}是播放器2选择L的事件(类似于U,D和R)的事件

B1(L):“玩家1认为玩家2正在选择L”

B1(B2(U)):“玩家1认为玩家2认为玩家1选择你”

b

r

1

(-B2(U)):“鉴于玩家2选择R,玩家1认为玩家2不相信她正在选择你”

最后的公式很有趣,因为它“预编码”播放器1将相信的球员2在学习播放器时选择R.注意,在接收到这一真实信息时,玩家1让她的信仰表明她们2相信她正在选择你。 如果只有关于播放器策略选择的局部信息的语言有陈述,情况会更有趣。 假设E是事件{W4,W6}。 现在E在W4和Player 2认为玩家1选择D为真实(即,w4∈b)

e

2

(d))。 因此,通过揭示真实(虽然部分)信息E.,玩家1可以“虚张声”。

概率

以上模型使用“清晰”的不确定性概念,即,对于每个代理和州W,任何其他州v∈w或者不可能比w更合理。 然而,有一个广泛的文学专注于分级,或定量,不确定性模型(Huber 2009; Halpern 2003)。 例如,在游戏理论文献中,它是代表概率的信念(AUMANN 1999B; Harsanyi 1967-68)的标准。 这个想法很简单:用概率分布替换合理性排序:

定义2.6(认识概率模型)假设G是一个战略游戏,S是G的策略简介集,n是一组球员。 认知 - 概率模型是一个元组

是=⟨w,{~i}i∈n,{的PI}i∈n,σ⟩

其中⟨w,{Πi}i∈n,σ⟩是一个认知模型

PI的:w→δ(w)

Δ(w)= {p:w→[0,1] |是概率测量}

分配给每个州的概率测量W。写入p

w

一世

对于我的州W的概率措施。 我们制作了两个自然假设(参见第2.4页):

对于所有v∈w,如果p

w

一世

(v)>0然后p

w

一世

= p

v

一世

; 和

对于所有v∉πi(w),p

w

一世

(v)= 0。

属性1表示,如果我在州W处为态V分配非零概率,则代理在两个状态下使用相同的概率测量。 这意味着玩家“知道”他们自己的概率措施。 第二属性意味着玩家必须将零的概率分配给当前(硬)信息单元之外的所有状态。 这些模型提供了非常精确的参与者的硬和情感态度描述。 但是,请注意,编写模型需要我们为每个分区单元指定可以非常麻烦的不同概率测量。 幸运的是,上述定义中的属性意味着,对于每个代理,我们可以通过条件化从一个概率测量来看代理的概率措施。 正式地,对于每个i∈n,代理商I的(主观)先前概率是pi∈δ(W)的任何元素。 然后,为了定义概念概率模型,我们只需要为每个代理I∈N,(1)是先前概率pi∈δ(w)和(2)为每个w∈w,pi(πi(w))>的分区πi。0。 然后通过以下定义每个i∈n的概率措施:

的PI(w)=的PI(⋅|πi(w))=

的PI(⋅∩πi(w))

的PI(πi(w))

当然,对于每个w∈w,pi(πi(w))>0的侧条件是重要的,因为我们不能除以零 - 这将在后面的部分中更详细地讨论。 实际上,(假设w是有限的[11])给定每个代理商,每个代理商都可以找到的任何认知合理性模型,该模型是如上所述的模型生成模型的先前(可能不同的代理)。 这不仅是技术观察:这意味着我们假设参与者对情况结果的信念是通过对代理商的难道信息的条件化来源的,以前临时信仰是固定的。 (请参阅Morris 1995,在有常见的情况下进行广泛讨论情况。)我们将在整个文本中返回这些关键假设。

如上,我们可以定义信仰运营商,这次指定代理人认为事件的精确程度:

概率信念:b

r

一世

(e)= {w|p

w

一世

(e)= r}

这里,R可以是单位间隔中的任何实数; 然而,通常足以限制在单位间隔中对合理数量的关注。

全面信念:BI(e)= b

1

一世

(e)= {w|p

w

一世

(e)= 1}

因此,全面信仰被定义为对概率的信念。 这是这种文献中的标准假设,尽管许多知名的概念困难(见Huber 2009,用于对此和相关问题的广泛讨论)。 与以下替代表征合作有时适用于全面信念(给予更多“模态”味道):代理商,我认为州W提供了我在E中分配正常概率的所有州

bi(e)= {w |for所有v,如果p

w

一世

(v)>0然后v∈e}

这些模型也受到了复杂的逻辑分析(Fagin,Halpern,&Megiddo 1990; Heifetz&Mongin 2001)补充了上面讨论的逻辑框架(CF.Baltag和Smets 2006)。

我们将本节与认知概率模型的一个例子结束。 再次召回图4的协调游戏:玩家1(ANN),U和D有两个动作,以及玩家2(BOB),R和L的两个动作。 由于我们只对描述玩家信息感兴趣,因此玩家的偏好(或公用事业)在这个阶段并不重要。

[阵列中的6个圆圈图

高,三个宽,标记在顶部w_1到w_3

在底部w_4到w_6。 每个垂直对都被a包围

虚线和每个水平三重态由实线。 w_1包

文本'u,l',w_4文本'd,l',w_2和w_3每个都附上文本

'U,R'和W_5和W_6每个都附上文本'D,R'。 w_1,w_4,w_2,

和W_5也标有“1/8”标记。 W_3也有标签'0'和

w_6标签'1/2'。 阴影灰色区域包括W_2,W_5和

w_6。]

图8

实线是Ann的信息分区,虚线是Bob的信息分区。 我们进一步假设存在共同的先前P0,其中概率分配给在右侧写入的每个状态。 让e = {w2,w5,w6}是一个事件。 然后,我们有

b

1

2

1

(e)= {w|p0(e|π1(w))=

p0(e∩π1(w))

p0(π1(w))

=

1

2

} = {W1,W2,W3}:“ANN将概率1/2分配给事件E给定她的信息小区π1(W1)。

b2的(e)= b

1

2

(e)= {w2,w5,w3,w6}。 特别地,注意在W6,代理相信(具有概率1),即E为真,但不知道E为π2(w6)⊈e。 因此,特工考虑可能的国家之间存在区别(鉴于他们的“硬信息”)和球员分配非零概率的状态。

让u = {w1,w2,w3}是Ann播放u和l = {w1,w4}的事件,鲍勃播放l。 然后,我们有

K1(U)= U和K2(L)= L:ANN和BOB都知道他们选择的策略;

b

1

2

1

(l)= u:在Ann播放U的所有国家,安为鲍勃扮演L概率1/2; 和

b1的(b

1

2

2

(U))= {W1,W2,W3} = U:在Ann扮演你的所有状态下,她认为鲍勃认为她正在播放你的概率1/2。

2.3 Harsanyi型空间

在他的精英纸上由Harsanyi启动了建模信仰的替代方法(Harsanyi 1967-68)。 Harsanyi而不是“可能的世界”,而不是“可能的世界”,将球员类型的概念作为原始。 正式地,播放器被分配了一个非空的类型集。 通常,假设玩家知道自己的类型,而不是其他玩家的类型。 正如我们将看到的,每种类型都可以与特定的信仰层次相关联

定义2.7(定性型空间)自然S和代理N的(非空白)集的定性型空间是一个元组⟨{ti}i∈n,{λi}i∈n,s⟩,每个i∈n,ti是一个不可拍的集合

λi:首选的TI→℘(xj≠itj×s)。

因此,每个类型的t∈ti与一组组成的组组合,包括其他玩家的类型和自然状态。 为简单起见,假设只有两个玩家,安和鲍勃。 直观地,(t',o')∈λann(t)意味着Ann的T型认为结果是O'和Bob是T'类型。 由于球员的不确定性被引导到其他玩家的选择和类型,因此这些模型捕获的信息态度肯定不满足真相公理。 实际上,可以看到定性型空间仅仅是上面讨论的关系模型的“重新包装”(参见讨论的Zvesper 2010)。

再次考虑Ann和Bob之间的协调游戏的运行示例(如图1所示)。 在这种情况下,性质的一组状态是s = {(u,l),(d,l),(u,r),(d,r)}。 在此上下文中,修改类型函数λi的定义是自然的,以便玩家只不确定其他玩家的选择:让SA = {U,D}和SB = {L,R}并假设TA和TB是非空的类型组。 定义λa和λb,如下所示:

λa:TA→℘(tb×某人)λb:tb→℘(TA×sa)

假设每个播放器有两种类型:Ta = {t

一种

1

,t

一种

2

}和tb = {t

b

1

,t

b

2

}。 描述地图λa和λb的方便方式是:

λa(t

一种

1

l r

t

b

1

1 0

t

b

2

1 0

λa(t

一种

2

l r

t

b

1

0 0

t

b

2

1 0

λb(t

b

1

u d

t

一种

1

1 0

t

一种

2

0 0

λb(t

b

2

u d

t

一种

1

0 0

t

一种

2

0 1

图9

其中(t',s)中上述矩阵的1 1对应于假设(t',s)∈λi(t)(i = a,b)。 Ann(Bob)是什么意思在类型结构中相信事件e? 我们从关于上述结构的一些直观观察开始:

无论我们分配到Ann的类型,她认为鲍勃将在矩阵中选择l,λa(t

一种

1

)和λa(t

一种

2

),唯一一个出现的地方在l列下。 因此,在所有情况下修复ANN的类型,ANN认为可能是Bob选择L.

(本章完)

相关推荐