博弈论的认识论基础(五)

是否存在不做实质性假设或至少尽可能少做实质性假设的模型?这个问题在认知博弈论中得到了广泛的讨论——例如,参见Dekel & Gul (1997)、Aumann (1999a, 1999b) 和 Samuelson (1992)。直观地说,一个没有任何实质性假设的模型必须代表玩家所有可能的(高阶)知识和信念状态。这种模型是否存在,部分取决于玩家信息态度的表示方式——例如,作为概率测度或集值知识/信念函数。

对于一个模型来说,最小化关于玩家彼此之间以及对博弈的了解和信念的实质性假设意味着什么,存在不同的理解方式。我们并不打算在此对这类有趣的文献进行完整的概述(有关讨论和相关结果的指向,请参阅 Brandenburger & Keisler(2006:第 11 节)和 Siniscalchi(2008:第 3 节)。一种方法是考虑所有(Harsanyi 类型/认知/认知概率)模型的空间,并尝试找到一个在某种适当意义上“包含”所有其他模型的单一模型。这样的模型通常被称为通用结构(或范畴论语言中的终端对象),如果它存在的话,它包含了分析师可以想象的任何实质性假设。已经证明概率类型空间存在通用结构(Mertens & Zamir 1985;Brandenburger & Dekel 1993)。然而,认识论模型并没有类似的通用结构 (Heifetz & Samet 1998; Fagin, Geanakoplos, Halpern & Vardi 1999; Meier 2005),并且对用于描述参与者知识的语言也有一些限制 (Heifetz 1999b; Roy & Pacuit 2013)。

第二种方法从内部视角出发,询问对于一组固定的状态或类型,参与者是否对对手的知识或信念做出任何实质性假设。其目的是在给定模型中识别一组关于参与者的可能猜想。例如,在基于一组状态 W 的认识论模型中,这可能是 W 所有子集的集合,或者在某些合适的逻辑语言中是 W 的可定义子集的集合。如果每个代理都正确地考虑了关于其对手的每个可能猜想,则称该空间是完备的。一个简单的计数论证表明,当猜想集合是状态集合的所有子集时,不可能存在完整的结构(Brandenburger 2003)。然而,还有一个更深层次的结果,我们将在下面讨论。

勃兰登堡-凯斯勒悖论

Adam Brandenburger 和 H. Jerome Keisler (2006) 提出了以下罗素式悖论。该悖论的表述涉及两个概念:信念和假设。对于一个参与者来说,假设是该参与者最强的信念:它是一组状态,蕴含了给定状态下所有其他信念。我们将在下面详细解释假设。假设有两个参与者,Ann 和 Bob,并考虑以下信念描述。

(S)

Ann 认为 Bob 假设 Ann 认为 Bob 的假设是错误的。

通过提出以下问题引发了一个悖论:

(Q)

Ann 认为 Bob 的假设是错误的吗?

。为了方便讨论,令 C 为 (S) 中 Bob 的假设:即 C 为语句:

。(C)

。Ann 认为 Bob 的假设是错误的。

。因此,(Q) 询问 C 是真还是假。我们将论证 C 为真当且仅当 C 为假。

。假设 C 为真。那么,Ann 认为 Bob 的假设是错误的,并且通过(积极)内省,她相信她相信这一点。也就是说,Ann 相信 C 是正确的。此外,根据 (S),Ann 认为 Bob 的假设是 C。因此,Ann 实际上认为 Bob 的假设是正确的(她相信 Bob 的假设是 C,并且 C 是正确的)。所以,C 为假。

。假设 C 为假。因此 Ann 不认为 Bob 的假设是错误的。也就是说,安不相信 C 是错的。通过(负向)内省,安相信她不相信 C 是错的。现在,通过(S),安相信鲍勃的假设是她相信 C 是错的,而安相信她不相信 C 是错的。因此,安相信鲍勃的假设是错的。所以,C 为真。

Brandenburger 和 Keisler 将上述论证形式化,以证明关于所谓假设完全结构存在的一个非常强的不可能结果。我们需要一些符号来表述这个结果。在两人定性类型空间中工作最为方便(定义 2.6)。两人定性类型空间 N={a,b} 是一个结构(状态集对于这个论证并不重要,因此我们将其省略)⟨(Ta,Tb),(λa,λb)⟩,其中

λa:Ta→℘(Tb)λb:Tb→℘(Ta)

。关于 Ann (a) 的猜想集合是子集 Ca⊆℘(Ta)(类似地,关于 Bob 的猜想集合是子集 Cb⊆℘(Tb))。结构 ⟨(Ta,Tb),(λa,λb)⟩ 被称为对于猜想 Ca 和 Cb 是假设完备的,前提是 Ca 中的每个猜想都有一个类型假设该猜想(Bob 的情况类似)。形式上,对于每个 Y∈Cb,存在一个 t∈Ta 使得 λa(t)=Y,对于 Bob 的情况类似。如上文所述,一个简单的计数论证表明,当 Ca=℘(Ta) 且 Cb=℘(Tb) 时,假设完备模型仅在平凡情况下存在。一个更深层次的结论是:

定理2.9(Brandenburger&Keisler 2006:Theorem 5.4)对于包含一阶可定义子集的猜想集没有假设完整的结构结构。

请参阅讨论本定理证明的补充(见补充,第2节)。

咨询Pacuit(2007),Abramsky&Zvesper(2015),以及Başkent(2015,2018),进行了广泛的分析和泛化。 但是,这不是所有坏消息:Mariotti,Meier,&Piccione(2005)构建一个假设完整的结构,其中一组猜想是一些表现良好的拓扑空间的紧凑型亚群。

3.解决方案概念的认知特征

认识博弈论中的一个中枢性问题涉及确定对玩家合理性的假设以及球员认识到彼此的合理性,以保证玩家的决定导致由给定解决方案概念定义的策略配置文件。 在游戏模型(认识概率模型或类型空间)中,每个状态对应于策略简档。 解决方案概念的认知表征的目的是在玩家的理性和他们的高阶信仰和关于其他玩家的理性方面描述一组状态,这对应于由给定解决方案概念识别的策略概况。

3.1认知博弈论的基本定理

被称为认知博弈论的基本定理是,合理性和共识的合理信念意味着球员选择迭代迭代消除严格统治战略的策略(此结果也在第3.3节中讨论Vanderschraaf&Sillari 2005 [2022])。 由于几个原因,这一结果是基本的。 从历史上看,它标志着对游戏的认知分析的开始作为均衡细化计划的替代方案。 事实上,当伯恩姆(1984年)和PEARCE(1984)独立提出“合理化战略”作为解决方案概念时,他们采取了明确的目标,使均衡细化计划恢复到更加古典决策理论基础。 在SPOHN(1982)中,还存在相同的动机,其具有更接近当代结果的制剂。

3.1.1严格的统治地位

理性选择的基本原则是决策者不会选择严格主导的行为(De Finetti 1974)。 要将此概念应用于游戏中的玩家,我们需要一些符号。 假设

g =⟨n,(丝)i∈n,(ui)i∈n⟩

是战略形式的游戏,m∈δ(si)是玩家i的混合策略。 如果s-i∈s-i是除了我以外的玩家的一系列策略序列

ui(是,s-1)=

σ

s∈si

是(s)* ui(s,s-1),

其中UI(s,s-i)是播放器i的效用,我选择s的策略档案和其他玩家选择在s-i中。

定义3.1(严格的主导地位)假设

g =⟨n,(丝)i∈n,(ui)i∈n⟩

是战略形式和Xïs-i的游戏。 让m,m'∈δ(si)是玩家i的两个混合策略。 该策略M严格占据了所有S-i∈x的x的m',

ui(是,s-1)> ui(是',s-1)。

我们说m严格占主导地位,只要有一些m'ōδ(si)严格占主导地位。

我们说,当M严格地占据S-I的M'时,策略m∈δ(SI)严格占据m'∈δ(SI)。 因此,无论其他玩家都这样做,m严格地占据了M'时的M'(即,给玩家I的预期收益较高)。

严格统治的定义是在玩家的混合策略方面给出的。 混合策略对于定义严格的主导是重要的,因为有一些纯粹策略的游戏是严格的混合策略主导,而不是任何纯粹的策略。[12] 咨询APT(2007)和第3.4节,以获得上述严格统治概念的进一步变体。

严格主导定义中的参数x旨在代表其他玩家的选择,即我所采取的“现场可能性”。 一个重要的特例是,当球员考虑他们所有的对手的策略时。 应该清楚的是,理性球员永远不会选择关于S-I严格主导的策略。 也就是说,如果S是严格主导的那样,那么就没有信念,我可以对她的对手有关球员我选择s的理性。 更正式的是,给定概率p∈δ(x)在集合x-s-i上,我们说s∈si是对P的最佳回应,为所有S'∈Si提供了

σ

s-i∈s-我

p(s-1)* ui(s,s-1)≥

σ

s-i∈s-我

p(s-1)* ui(s',s-1)。

我们现在可以说明以下众所周知的引理。

LEMMA 3.2假设G =⟨n,(si)i∈n,(ui)i∈n⟩是战略形式的游戏。 对于x⊆s-i IFF,X = I IFF的策略S�SI是严格地主导(可能是混合策略),没有概率测量p∈δ(x),使得s是关于p的最佳响应。

该引理的证明在补充项第1节中给出。

严格的主导地位的第二个重要特征是,如果战略严格统治,则仍然如此,如果玩家获取更多关于她的对手(可能)的信息。 也就是说,我们有以下单调性财产:

观察3.3假设g =⟨n,(si)i∈n,(ui)i∈n⟩是战略形式的游戏。 对于所有策略S∈SI,如果S严格地主导了Xïs-i和x'ūx,则S严格地主导了X'。

3.1.2普通信念的理性和迭代消除严格主导的策略

合理性的共同信念长期以来一直被用作古典游戏理论分析潜在的理想化的非正式解释(参见,例如,Myerson 1991)。 结果在本节中显示,一旦正式化,此假设会导致经典的解决方案概念,即迭代消除严格主导的策略。 然而,它不足以确保玩家将发挥纳什均衡(参见第3.3节以讨论纳什均衡的认知表征)。

迭代消除严格统治策略(IESDS)是一个如下所示的解决方案概念。 首先,对于每个玩家I,从原始游戏中删除任何严格主导的策略(关于所有对手的战略概要文件)。 在删除原始游戏中的所有严格主导的策略后出现的子赌灯中,删除在子轨道中严格主导的所有策略。 重复此过程,直到消除不会删除任何策略。 据说这种进程的概况概括地是迭代的。

例如,考虑以下战略游戏:

鲍勃

l c r

人工神经网络x 3,3 1,1 0,0

y 1,1 3,3 1,0

z 0,4 0,0 4,0

图12

策略r严格地由L for Bob主导。 一旦r从游戏中删除,z就会严格为ANN主导。 因此,{(x,l),(x,c),(y,l),(y,c)}被迭代地undomed。 也就是说,迭代地删除严格统治的策略会产生以下序列:

l c r

x 3,3 1,1 0,0

y 1,1 3,3 1,0

z。0,4。0,0。4,0↣

l c

x 3,3 1,1

y 1,1 3,3

z。0,4。0.0‰

l c

x 3,3 1,1

y 1,1 3,3

图13

对于任意大(有限)战略游戏,如果所有球员都是理性的,并且常见的是,所有球员都是理性的,那么球员的选择将是一个迭代地非主导的战略概况。 在说明正式结果之前,我们用一个例子说明了它。 考虑一个类型的空间

t =⟨(TA,tb),(λa,λb),s⟩,

其中n = {a,b}是一组播放器(对于Bob的ANN和B),并且S是图12中所描绘的游戏中的一组策略配置文件。假设ANN(TA = {A1,A2})有两种类型和三种类型鲍勃(TB = {B1,B2,B3})。 类型函数λa和λb定义如下:

l c r

λa(a1)b1的0.5 0.5 0

b2的0 0 0

b3的0 0 0

l c r

λa(的a2)b1的0 0.5 0

b2的0 0 0.5

b3的0 0 0

x y z

λb(b1的)a1 0.5 0.5 0

的a2 0 0 0

x y z

λb(b2的)a1 0.25 0.25 0

的a2 0.25 0.25 0

x y z

λb(b3的)a1 0.5 0 0

的a2 0 0 0.5

图14

然后,我们考虑同对,其中s∈si和t∈ti,并在2.2.4节中识别所有Rational对(即,s是对λi(t)的最佳响应)。

按比例= {(x,a1),(y,a1),(z,的a2)}

ratb = {(l,b1的),(c,b1的),(l,b2的),(c,b2的),(l,b3的)}

下一步是识别相信其他玩家是合理的类型。 对于A1类型,我们有λa(a1)(rayb)= 1; 然而,λa(a2)(b2,r)= 0.5但(r,b2)∉ratb。 因此,B2型并不相信玩家B是合理的。 这可以基于来自第2.3节的型空间的常见信念的定义变成迭代过程:对于每个i∈n,让r

1

一世

= rati。 假设为每个i∈n,r

n

一世

已被定义。 然后,定义r

n

一I

如下:

r

n

一I

= {(s,t)||s∈s-i,t∈t-j,以及每个j∈I,(sj,tj)∈r

n

j

}。

对于每个n> 1,定义R

n

一世

归纳如下:

r

n + 1

一世

= {(s,t)|(s,t)∈r

n

一世

λi(t)分配概率1至r

n

一I

}

因此,我们有r

2

一种

= {(x,a1),(y,a1)}。 请注意,B2为该对(Y,A2)分配非零概率,该对(y,a2)不在r中

1

一种

,B2不相信A是合理的。 因此,我们有r

2

b

= {(l,b1的),(c,b1的),(l,b3的)}。 继续这个过程,我们有r

2

一种

= r

3

一种

。 但是,B3为不在r中的(z,a2)分配非零概率

2

一种

,所以r

3

b

= {(l,b1的),(c,b1的)}。 我们一起把一切都放在一起

n≥1

r

n

一种

×

n≥1

r

n

b

= {(x,a1),(y,a1)}×{(l,b1的),(c,b1的)}。

因此,所有迭代删除严格统治策略的概况,即(x,l),(y,l),(x,c)和(y,c)都与玩家合理的国家一致,并且通常认为它们是合理的。

请注意,上述过程不需要生成所有生存的策略,迭代地删除严格主导的策略。 例如,考虑带有ANN的单个A1的类型空间,以及用于BOB的单个B1。 假设λa(l,b1)= 1 =λb(u,a1)。 然后,(U,L)是该模型中唯一的策略简介,并且满足了合理性的明显合理性和共同信念。 但是,对于任何类型的空间,如果战略简介与合理性符合合理性和合理性的共识,那么它必须是在迭代地删除严格主导的策略(Brandenburger&Dekel 1987的一系列策略中的战略Tan&Werlang 1988):

定理3.4假设G是一个战略游戏,T是G的任何类型空间。如果(S,T)是其中所有玩家都是理性的状态,对于每个人来说,每个

(丝,首选的TI)∈

n≥1

r

n

一世

- 他是一个策略型材,才能迭代地删除严格统治战略。

这结果,这建立了一个足够的条件,即战略简介在迭代地消除严格占主导地位的策略,也具有逆向方向。 鉴于任何幸存者才能消除严格主导的策略的策略档案,有一个模型,其中所有球员都是理性的,这是普遍的信念。 换句话说,人们总是可以解释一个策略简介的选择,这些策略简介将在迭代消除程序中存活,作为理性球员在共同信仰的合理性中扮演的一个。

可以加强这种匡威方向,表明,在迭代地删除严格统治战略的整套策略概况是符合理性和合理性的共识(Brandenburger&Dekel 1987; Tan&Werlang 1988):

对于任何游戏G的定理3.5,该游戏有一种类型的结构,其中策略简档与理性和合理性共识的策略概况是迭代迭代删除严格占主导地位的策略的一系列策略。

查看riderenberg&Keisler(2021)以获得上述结果的最强大版本。 使用不同的游戏模型已经证明了上述结果的类似物。 例如,APT&Zvesper(2010),Halpern&Moses(2017),Bonanno(2015)和Lorini(2016)使用认知(-Probability)模型证明了类似结果。

(本章完)

相关推荐