博弈论的认知基础(二)

规划阶段:在规划他在酒吧旅行回家的同时,决策者面临“继续”之间的选择 继续“和”退出“。 由于他无法区分两个交叉路口,因此他无法在第二个十字路口中“退出”(他必须在X和Y中规划相同的行为)。 由于“退出”将导致最糟糕的结果(具有0的退款),最佳策略是“继续; 继续“保证1的1。

行动阶段:到达交叉路口时,决策者面临着“退出”或“继续”的本地选择(可能其次是另一种决定)。 现在,决策者知道,由于他致力于在每个交叉路口选择“继续”的计划,因此他可能是在第二个交叉路口。 实际上,决策者的结论是他处于第一个概率1/2的十字路口。 但后来,他的预期“退出”是2,这比遵循他之前承诺的战略的策略大于保证的收益。 因此,他选择“退出”。

一些不同的研究人员讨论了这个问题。[4] 它超出了本文的范围,以讨论不同分析的复杂性。 整个出现的游戏和经济行为(第20卷)致力于对这个问题的分析。 有关此问题的方法的代表性采样,请参阅kline(2002); Aumann,Hart和Perry(1997); 董事会(2003); Halpern(1997); Piccione&Rubinstein(1997b)。

1.6混合策略

混合策略在许多游戏理论分析中发挥着重要作用。 设Δ(x)表示在有限情况下的一组概率测量尺寸X.玩家I的混合策略,是元素mi∈δ(Si)。 如果mi∈δ(si)将概率1分配给元素si∈si,则Mi被称为纯策略(在这种情况下,我为mi写入si)。 混合策略纳入游戏理论分析如下。 假设g =⟨n,{si,ui}i∈n⟩是一个有限的战略游戏。 G的混合延伸是播放器I的策略是G(即δ(Si))的混合策略,并且计算了联合混合策略m∈πi∈nδ(Si)的玩家I(表示UI)的实用性以明显的方式(让M(s)= m1(s1)⋅m2(s2)⋯mn(sn)用于s∈πi∈nsi):

ui(是)=

σ

s∈πi∈nsi

是(s)⋅ui(s)

因此,游戏G的混合延伸的溶液空间是设定的πi∈nδ(Si)。

尽管他们在博弈论方面突出,但混合策略的解释是有争议的,因为Ariel Rubinstein注意:

我们不愿意相信我们的决定是随机制作的。 我们更愿意指出我们采取的每个行动的原因。 在拉斯维加斯之外,我们不会旋转轮盘。 (Rubinstein 1991:913)。

在认知博弈论中,与混合策略的替代解释工作更自然:球员的混合策略我是我对她将要做什么的对手信仰的代表。 罗伯特Aumann的有影响力纸张(Aumann 1987见,特别是本文的第6节,讨论了这种混合策略的解释):

我们方法的一个重要特征是,它不需要在玩家的一部分中进行显式随机化。 每个玩家总是选择一个明确的纯粹策略,没有试图随机化; 策略的概率性质反映了其他玩家的不确定性。 (AUMANN 1987:3)

2.游戏模型

游戏模型是表示游戏给定播放的信息背景的结构。 在游戏模型中的州或可能的世界描述了游戏的可能播放和影响玩家选择的特定信息(在每个状态下可能不同)。 这包括每个玩家的选择和对她对手的选择和“信仰”的看法的“知识”。 构建游戏型号时的关键挑战是如何代表玩家的不同信息态度。 对决策理论,认识和Doxastic逻辑的基础感兴趣的研究人员,最近,正式的认识论已经开发出许多不同的正式模型,可以描述对于评估在决策或游戏理论上的选择理性代理人的选择的许多各种信息态度情况。

在讨论在描述游戏的信息语境时出现的一些常规问题,我们介绍了两种主要类型的模型,这些模型已被用于描述游戏情况下的玩家信仰(和其他信息态度):型空间(Harsanyi 1967-68; SINISCALCHI 2008)和所谓的AUMANN或KRIPKE-结构(AUMANN 1999A; FAGIN,HALPERN,MOSES和VARDI 1995)。 虽然这两种方法有很大的共同之处,但我们在下面突出的一些重要差异。 在文献中发现的第二个,更基本的区别在于“定量”结构之间,代表“渐变”态度(通常通过概率分布),以及表示“全局”态度的“定性”结构。 Kripke结构通常与前者相关联,以及后者键入空格,但这不是严格的分类。

2.1一般问题

2.1.1各种信息态度

广告的信息语境可以包括各种形式的态度,从古典知识和坚固的信仰(Stalnaker 1994)和强大的(Battigalli&Siniscalchi 2002)的信念,每个都在不同的游戏的不同概念 - 理论上的概念理性。 它超出了本文的范围,以调查这一广大文学的细节(参见此文献的一些讨论的下一部分)。 相反,我们将在艰难和软态度之间介绍一般的区别,主要是在动态认知逻辑(Van Benthem 2011)中发展的区别,这证明了解认知博弈论提出的各种哲学问题。

我们称之为难以解决的信息,验证,全面的内省,不可撤销。 这种概念旨在捕获代理商完全和正确地确定在给定的交互式情况中的内容。 例如,在Ex Interim阶段,玩家有关于他们自己选择的难题。 他们“知道”他们选择了哪种策略,他们知道他们知道这一点,而且没有新的传入信息可以让他们改变他们的意见。 正如这种措辞所建议的那样,术语知识经常使用,因为没有更好的术语,描述这种非常强烈的信息态度。 认知逻辑学家和游戏理论家非常了解这种艰难的“知识”与我们对这一概念的直观甚至哲学理解之间可能的差异。 在目前的背景下,遵守难题股份的一些特征是归因于认识论文献中的知识,例如真实性。 此外,硬信息可能更接近被称为“隐式知识”(参见下面的第5.3节)。 无论如何,似乎是哲学上更具建设性的,密切关注难题的普遍陷入认识博弈论的反向直观性质,而不是拒绝这种概念在地上拒绝这一概念。

软信息粗略地说,任何不是“硬”的东西:它不一定是明显的,不一定在新信息存在下完全内在的和/或高度可再次可再动。 因此,它越来越近的信仰。 再次,哲学仔细是在此处的顺序。 被标记为“信仰”的整个信息态度确实属于可以被描述为“关于真实”(Schwitzgebel 2010)的态度类别,其中在哲学意义上似乎是形成一个适当的子类别。

2.1.2可能的世界模型

下面介绍的模型描述了互动情况下的玩家的硬和软信息。 它们在他们对世界状况的代表中不同,但它们都可以广泛地被描述为大部分哲学逻辑文学中熟悉的“可能的世界模型”。 起点是描述外源参数(即物理世界的事实)的自然界的非空(有限或无限)集合,其不依赖于代理商的不确定性。 除非另有说明,否则S是游戏可能结果的集合,所有策略概况的集合。[6] 每个玩家都被认为招待了许多可能的可能性,称为可能的世界或简单(认知)状态。 这些“可能性”旨在代表游戏情况可能发展的可能方法。 因此,每种可能性都将与独特的性质相关联(即,来自特性可能的世界的功能,但此功能不需要1-1甚至是1-1)。 对游戏中的合理性分析至关重要,以至于可能存在与同一性质相关的不同世界。 这种可能的世界很重要,因为它们打开了代表不同信息的门。 这种基于国家的建模自然地产生了代理商的信息态度的命题观点。 代理人将有信仰/知识的主张,这些主张也被称为游戏理论文学中的事件,并被代表成为可能的世界。 这些基本的建模选择不是难以诉讼,但这些问题并非我们在此条目中的担忧。

2.2关系模型

我们从哲学逻辑学家(Van Benthem 2010)和计算机科学家(Fagin等,1995)开始的模型。 这些模型由Robert Aumann(1976)在他的精英论文同意不同意(参见Vanderschraaf&Sillari 2009,第2.3节,以讨论此结果)。 首先,一些术语:给定一个国家或可能的世界,让我们呼吁任何子集e⊆w一个事件或命题。 给定事件e⊆w和f⊆w,我们使用标准集理符号(e∩f,read“e和f”),Union(e∪f,读取“e或f”)和(相对)补充(-e,读取“不是e”)。 我们说,如果w∈e,则在州w发生事件e⊆w。 该术语对于研究以下模型至关重要。

定义2.1(认知模型)假设G是一个战略游戏,S是G的一组策略概况,而N是一组球员。 基于S和N的认知模型是三重⟨w,{πi}i∈n,σ⟩,其中w是一个非空置集,每个i∈n,πi是w和σ:w→s的分区[7]。

认知模型代表了在游戏各州的可能配置以及代理对它们的难题的信息的信息的信息背景。 函数σ分配给每个可能的游戏的独特状态,其中每个地面事实是真或假的。 如果Σ(w)=σ(w')那么两个世界w,w'将就所有地面事实(即,玩家将选择的行动)达成一致,但至关重要,代理商可能有不同的信息。 因此,W的元素比S的元素更富裕(下面更多)。

给定状态w∈w,小区πi(w)称为代理I的信息集。 在标准术语之后,如果Πi(w)⊆e,我们说代理商我在州w处知道事件e。 鉴于事件e,该事件我知道e的事件被表示为ki(e)。 正式地,我们为每个代理程序定义一个知识函数为每个事件发送给我所知道的代理商E的事件:

定义2.2(知识函数)让m =⟨w,{πi}i∈n,σ⟩是一个认知模型。 基于M的Agent I的知识功能是Ki:℘(W)→℘(W):

ki(e)= {w|πi(w)⊆e}

在哪里对于任何SET X,℘(x)是X的Powerset。

备注2.3往往方便与等价关系而不是分区。 在这种情况下,基于S和N的认知模型也可以被定义为三重⟨w,{~i}i∈n,其中w和σ如上所述,并且对于每个i∈n,~i⊆w×w是反射,传递和对称。 鉴于这样的模型⟨w,{~i}i∈n,σ⟩,我们写

[w]我= {v∈w|w~iv}

对于w的等同类。 由于等价关系和分区之间存在1-1个对应关系,因此我们将滥用符号并互换使用~i和πi。

应用上述评论,ki(e)的替代定义是E在所有国家都认为可能的状态中的e为真实(根据我的艰难信息)。 也就是说,ki(e)= {w| [w]i⊆e}。

分区或等价关系旨在表示每个州的代理商的硬信息。 众所周知,知识运营商满足认知逻辑S5的性质(参见讨论的Hendricks&Symons 2009)。 我们不会在此讨论此和相关问题,而是专注于这些模型如何用于提供游戏的信息语境。

一个例子。 考虑Ann(播放器1)和鲍勃(播放器2)之间的以下协调游戏。 如众所周知,有两个纯策略腹部均衡((U,L)和(D,R))。

鲍勃

l r

u 3,3 0,0

d 0,0 1,1

图4:Ann和Bob之间的战略协调比赛

在这个阶段,球员的公用事业对我们并不重要。 为了构建这场比赛的认知模型,我们首先需要指定我们将考虑的自然状态是什么。 为简单起见,将它们带到一组策略配置文件S = {(U,L),(D,L),(U,R),(D,L)}。 该组代理当然是n = {a,b}。 什么是各种各样的国家? 我们首先假设w = s,因此与每个性质状态相对应的是一个可能的世界。 这不一定是这样,但这将有助于说明我们的观点。

Ann和Bob有许多不同的分区,我们可以用来完成这个简单的认知模型的描述。 尽管如此,并非所有分区都适用于分析决策过程的EX临时阶段。 例如,假设Πa=πb= {w}并考虑事件u = {(u,l),(u,r)}表示安选择u的情况。 请注意,KA(U)=∅从所有w∈w,Πa(w)⊈u,所以没有国家知道她选择你。 这意味着该模型是适合于推理关于前蚂蚁阶段而不是EX临时阶段的推理。 这可以通过额外的技术假设轻松修复:假设S是一些(战略或广泛的)游戏的一组策略配置文件,与玩家n = {1,...,n}。

M =⟨w,{πi}i∈n,σ⟩据说是一个EX Interim认知模型,如果所有i∈n和w,v∈w,如果v∈πi(w)那么σi(w)=σi(v)

其中Σi(w)是分配给w的策略简档的第i个组件。 与各州的Ex Interim认知模型的示例是:

Πa= {{(u,l),(u,r)},{(d,l),(d,r)}}和

πb= {{(u,l),(d,l)},{(u,r),(d,r)}}。

请注意,这简单地将图1中的游戏矩阵重新诠释为识次模型,其中行是ANN的信息集,列是BOB的信息集。 除非另有说明,否则我们将始终认为我们的认知模型是EX临时。 前临时认知模型的类别非常丰富,模型描述了(硬)信息,代理商对自己的选择,(可能的)选择其他玩家和更高阶(Hard)信息(例如,“Ann知道Bob知道......”)关于“)这些决定。

我们现在更详细地查看上面描述的认知模型。 我们经常使用模型的以下示意表示来缓解阐述。 状态由节点中的节点表示,其中当Wi和Wj在同一分区小区中时,在状态Wi和Wj之间存在(无向)边缘。 我们使用标有一个用于Ann的分区的实线,并且用B标有B用于Bob分区的虚线(反射边没有为简单地表示)。 表示命题“Ann决定选择选项U”的事件U = {W1,W3}是阴影灰色区域:

[正方形中四个圆圈的二甲。

两个顶部圆圈通过标记为'a'的实线连接

与两个底部圆圈相同; 连接了两个右圆圈

通过标记为“B”的虚线,与两个左圈子相同。

左上圆圈括在于“u,l”并标记为w_1。 这

左下角围绕文本“d,l”并标记为w_2。 这

右上圆圈封闭文本'U,R'并标有W_3。 这

右下圆圈括在于“D,R”并标记为W_4。 这

两个顶部圆圈被锯齿状矩形如阴影灰色封闭

地区标记为“U”。]

图5

请注意,所有状态都属实以下事件:

-KB(U):“鲍勃不知道安决定选择你”

KB(KA(U)∨ka(-U)):“鲍勃知道安知道她是否决定选择你”

KA(-KB(U)):“安知道鲍勃不知道她决定选择你”

特别是,这些事件在州W1处是真实的,其中ANN已经决定选择U(即,w1∈u)。 鉴于前临时阶段的可用信息的假设,第一个事件是有道理的:每个玩家都知道自己的选择,而不是其他玩家的选择。 第二个事件是关于可用信息的另一个假设的具体示例:Bob具有ANN的信息实际上是一些选择。 但是,鲍勃不知道她选择了你(第三次活动)是什么认罪 这是一个关于鲍勃希望她所做的事情的知识的更重要的陈述。 事实上,在某些情况下,安格可能有非常好的理由认为鲍勃实际上是为了选择你。 我们可以找到此事件(-kb(-kb())的前临时认知模型在W1中是真的,但这需要添加新的可能世界:

[正方形和四个圆圈的二甲

左边的一个圆圈与两个顶部圈子排列

广场。 正方形的两个顶部圆圈通过固体连接

线标记为“a”,与两个底部圆圈相同; 圆圈

到左边也连接到广场的左上角

通过标记为“A”的实线; 广场的两个右圈是

用虚线连接的虚线标记为'b',与两个左侧相同

圆圈。 广场的左上角围绕文本'U,L'

并标记为w_1。 左下角围绕文本'd,l'

并标记为w_2。 右上角围绕文本'U,R'和

标记为w_3。 右下圆圈附带文本'd,r'和

标记为w_4。 左边的圆圈封闭了文本'u,l'

并标记为w \ prime。 三个顶部圆圈被a包围

像阴影灰色区域一样锯齿状矩形标有'U'。]

图6

请注意,由于Πb(w')= {{w'}}⊆u我们有w'kb(u)。 也就是说,Bob知道Ann在州W'选择你。 最后,简单的计算显示,根据需要,显示w1∈-ka(-kb(u))。 当然,我们可以质疑内置于此模型的其他实质假设(例如,在W1,Bob知道Ann不知道他会选择l)并继续修改模型。 这提高了我们在第7节中讨论的一些有趣的概念和技术问题。

2.2.1添加信仰

到目前为止,我们研究了硬信息的关系模型。 这些模型的小型修改使我们能够建模更软的信息态度。 实际上,通过简单地替换与序列性关系~i的反射性的假设(对于每个州w,有一个状态v这样w ~iv),但保持模型的另一个方面是相同的,我们可以捕捉到史史史逻辑学家称为“信仰”。 正式地,一种十足模型是元组⟨w,{Ri}i∈n,v⟩,其中W是一个非空的状态,Ri是W和V上的传递,欧几里德和串行关系是估值功能(CF.定义2.1)。 这种信仰概念非常接近上述艰难的信息态度,事实上,除了真实性之外,股票上市的所有属性(这被替换为代理人“一致”,所以无法相信矛盾)。 这指出了对各种“桥梁原则”的信息态度的逻辑分析与各种“桥梁原则”相关的知识和信念(例如知道某些东西意味着相信它或者代理人认为φ然后代理人知道他相信它)。 然而,我们在这里没有讨论这种研究行,因为这些模型不是代表代理的软信息的首选方式(参见,例如,Halpern 1991和Stalnaker 2006)。

(本章完)

相关推荐