博弈论的认识论基础(二)
许多不同的研究人员已经讨论过这个问题。)3) 讨论不同分析的细节超出了本文的范围。《博弈论与经济行为》(1997 年第 20 卷)整整一期都在分析这个问题。有关该问题方法的代表性样本,请参阅 Aumann、Hart 和 Perry (1997);Board (2003);Halpern (1997);Piccione 和 Rubinstein (1997b);Kline (2002);Levati、Uhl 和 Zultan (2014);Schwarz (2015);以及 Milano 和 Perea (2023)。
2. 博弈模型
对决策理论和博弈论基础、认识论和信念逻辑以及形式认识论感兴趣的研究人员已经开发出许多不同的形式模型,这些模型可以描述各种信息态度,而这些信息态度对于评估博弈中玩家的选择至关重要。本文不打算详细探讨这些不同模型的细节(参见 Genin & Huber 2020 2022 和 Weisberg 2015 2021)。本节将介绍认知博弈论文献中发现的两种主要模型类型:认知概率模型(也称为奥曼结构或克里普克结构)(Aumann 1999a;Fagin、Halpern、Moses & Vardi 1995)和类型空间(Harsanyi 1967–68;Siniscalchi 2008)。
。博弈模型既体现了每个玩家选择的策略,也体现了玩家对其他玩家选择和观点的看法。玩家的观点可以用硬信息态度和软信息态度来描述(参见 van Benthem 2011)。硬信息态度捕捉的是玩家在博弈中确定的事物。它们是真实的、完全内省的且不可修改的。例如,在过渡阶段之前,玩家掌握了关于自身选择的硬信息。他们“知道”自己选择了哪种策略,他们知道自己知道这一点,并且任何新的信息都无法改变他们对所选策略的看法。正如这一表述所暗示的,在没有更好的术语的情况下,“知识”一词通常被用来描述这种非常强的信息态度。5)软信息态度不一定是真实的,也不一定完全内省,并且/或者在出现新信息时不可修改。因此,它们更接近于信念。)6)本条目讨论的博弈模型可以广泛描述为“可能世界模型”,通常与玩家信息态度的命题观点相关。玩家对命题有信念 / 知识,在博弈论文献中称为事件,以可能世界的集合表示。这些基本的建模选择并非没有争议,但这些问题不是我们在本条目中关注的重点。
。
。2.1 认识论概率模型
。我们从哲学逻辑(van Benthem 2010)和计算机科学(Fagin、Halpern 等 1995)文献中熟悉的模型开始。罗伯特·奥曼在其开创性论文《同意不同意》(1976)中将这些模型引入博弈论。
。
。起点是一个非空(有限)集合 S(包含某些底层博弈的策略概况)7)和一组可能世界或(认知)状态的集合 W。每个可能世界都与 S 的一个唯一元素相关联(即,存在一个从 W 到 S 的函数,但该函数不必是一对一或甚至到上的)。对于博弈中的理性分析至关重要的是,不同的可能世界可能与相同的策略概况相关联,以表示玩家的不同信息状态。
。
。2.1.1 认识论模型
。在给出博弈的认识论模型的定义之前,我们需要一些符号。设 W 是一个非空集,其元素称为状态或可能世界。子集 E⊆W 称为事件或命题。给定事件 E⊆W 和 F⊆W,我们使用标准集合论符号表示交集(E∩F,读作“E 和 F”)、并集(E∪F,读作“E 或 F”)和(相对)补集(−E,读作“非 E”)。
当 w∈E 时,我们称事件 E⊆W 发生在状态 w。给定集合 X,我们将 X 的幂集(即 W 的所有子集的集合)写为℘(X)。当 1. Π 中的集合两两不相交:对于所有 E,F∈Π,E∩F=∅;以及 2. Π 中集合的并集为 W:⋃Π=W 时,集合 Π⊆℘(W) 称为 W 上的划分。如果 Π 是 W 上的划分且 w∈W,则 Π(w) 是 Π 中包含 w 的唯一元素。
定义 2.1(认知模型)假设
G=⟨N,(Si)i∈N,(ui)i∈N⟩
是一个策略形式的博弈。G 的认知模型是一个三元组⟨W,(Πi)i∈N,σ⟩,其中 W 为非空集,对于每个 i∈N,Πi 是 W 上的一个划分,σ:W→×i∈NSi。
函数 σ 为每个状态赋予一个唯一的博弈结果。如果 σ(w)=σ(w′),则两个世界 w 和 w′ 在博弈中的选择上达成一致,但至关重要的是,博弈者在 w 和 w′ 处可能拥有不同的信息(即 w 和 w′ 可能属于 Πi 的不同元素)。因此,可能世界 W 比 S 的元素更丰富(下文将详细介绍)。
给定状态 w∈W,包含 w 的分区 Πi 的元素记为 Πi(w),称为参与者 i 在 w 时的信息集。按照标准术语,如果 Πi(w)⊆E,则称参与者 i 知道事件 E 在状态 w 成立。形式化地,对于每个参与者 i,我们定义一个知识函数,将参与者 i 知道事件 E 的事件分配给每个事件 E:
定义 2.2(知识函数)设 M=⟨W,(Πi)i∈N,σ⟩ 为博弈的认知模型。基于 M 的 i∈N 的知识函数为函数 Ki:℘(W)→℘(W),定义如下:对于所有 E⊆W,Ki(E)={w∣Πi(w)⊆E}
备注 2.3 在认知模型中,使用等价关系通常比划分更方便。在这种情况下,认知模型是一个三元组 ⟨W,(∼i)i∈N,σ⟩,其中 W 和 σ 如上所述,并且对于每个 i∈N,∼i⊆W×W 是 W 上的自反、传递和对称关系。对于每个 w∈W,令 )w)i={v∈W∣w∼iv} 为 w 的等价类。由于等价关系和划分之间存在对应关系,)8) 我们将滥用符号,互换使用 ∼i 和 Πi。具体而言,Ki 的另一种定义是 Ki(E)={w∣)w)i⊆E}。也就是说,当 E 包含所有根据 ∼i 与 w 等价的状态时,w∈Ki(E)。
划分(或等价关系)旨在表示参与者的硬信息。众所周知,基于认识论模型的知识函数满足以下性质(有关讨论请参见 Rendsvig & Symons 2019 2021)。对于所有参与者 i 以及事件 E 和 F:
。
。(单调性)如果 E⊆F,则 Ki(E)⊆Ki(F)
。(合取)Ki(E)∩Ki(F)=Ki(E∩F)
。(真值)Ki(E)⊆E
。(正向自省)Ki(E)⊆Ki(Ki(E))
。(负向自省)−Ki(E)⊆Ki(−Ki(E))
。备注 2.4 参与者的信念可以通过改变博弈认识论模型中与参与者相关的关系的属性来表示。例如,游戏 G 的信念模型是一个元组 ⟨W,(Ri)i∈N,σ⟩,其中 W 和 σ 的定义如定义 2.1 所示,对于每个 i∈N,Ri⊆W×W 是串行的(对于所有 w∈W,存在一个 v∈W 使得 wRiv)、传递的(对于所有 w,v,x∈W,如果 wRiv 且 vRix,则 wRix)和欧几里得的(对于所有 w,v,x∈W,如果 wRiv 且 wRix,则 vRix)。对于状态 w,v∈W 和玩家 i,wRiv 表示 v 是玩家 i 在状态 w 下的信念可能性。那么,当 {v∣wRiv}⊆E 时,玩家 i 在状态 w 下相信事件 E⊆W。这种信念概念具有上面列出的 Ki 的所有属性,除了真实性(这被一个较弱的“一致性”假设所取代,指出玩家不相信矛盾)。
为了说明博弈的认知模型,请考虑 Ann (a) 和 Bob (b) 之间的以下协调博弈。
b
l r
a u 3,3 0,0
d 0,0 1,1
图 4:两个玩家 a 和 b 之间的战略协调博弈。
策略概况集合为 S={(u,l),(d,l),(u,r),(d,l)},玩家集合为 N={a,b}。为了完成博弈模型的描述,我们必须指定可能世界集合 W 以及 W 上的划分。
为简单起见,我们首先假设 W=S,因此每个策略概况对应一个可能世界。玩家对 W 有许多不同的划分,我们可以使用这些划分来完成这个简单的认知模型的描述。然而,并非所有划分都适用于分析决策过程的事前(ex interim)阶段。例如,假设 Πa=Πb={W},并考虑事件 U={(u,l),(u,r)},该事件表示 Ann 选择 u。注意到 Ka(U)=∅,因为对于所有 w∈W,Πa(w)⊈U,所以不存在 Ann 知道自己选择 u 的状态。这意味着该模型更适合表示博弈中决策的事前阶段,而非事前(ex interim)阶段。这可以通过一个附加假设轻松解决:
。
。如果对于所有 i∈N 和 w,v∈W,如果 v∈Πi(w) 且 σi(w)=σi(v)
,则博弈 ⟨W,(Πi)i∈N,σ⟩ 的认知模型为事前(ex interim)认知模型。其中 σi(w) 是参与者 i 在策略概况 s∈S 中的组成部分,由 σ 赋值给 w。状态为 W 的临时认知模型示例如下:
Πa={{(u,l),(u,r)},{(d,l),(d,r)}} 和
Πb={{(u,l),(d,l)},{(u,r),(d,r)}}.
请注意,这只是将图 4 中的博弈矩阵重新解释为一个认知模型,其中行是 a 的信息集,列是 b 的信息集。
除非另有说明,否则我们假设我们的认知模型是临时的。临时认知模型种类繁多,涵盖了描述参与者自身选择(硬)信息、其他参与者(可能)选择以及参与者高阶(硬)信息(例如,“a 知道 b 知道……”)的模型。
。为了便于说明,通常使用以下认知模型图解。假设 W={w1,w2,w3,w4},σ 为函数,其中 σ(w1)=(u,l),σ(w2)=(d,l),σ(w3)=(u,r),σ(w4)=(d,r)。此外,参与者的划分为 Πa={{w1,w3},{w2,w4}} 和 Πb={{w1,w2},{w3,w4}}。该认知模型如图 5 所示,其中节点表示状态,其策略概况显示在节点内部。当 wi 和 wj 位于同一分区单元时,状态 wi 和 wj 之间存在一条(无向)边。我们使用标记为 a 的实线表示 a 的分区,使用标记为 b 的虚线表示 b 的分区。请注意,自反边和可通过传递性推断的边通常不会表示出来(例如,w1 与其自身之间没有边)。表示“a 选择策略 u”命题的事件 U={w1,w3} 是阴影灰色区域。
图表:指向下方扩展描述的链接
图 5(图 5 的扩展描述在附录中。)
请注意,以下事件在所有状态下均为真:
−Kb(U)=W:在每个状态下,“b 不知道 a 选择的动作 u”。
Kb(Ka(U)∪Ka(−U))=W:在每个状态下,“b 知道 a 知道她是否选择了动作 u”。
Ka(−Kb(U))=W:在每个状态下,“a 知道 b 不知道她选择了动作 u”。
特别地,这些事件在 w1 状态下成立,此时 a 选择了 u(即 w1∈U)。根据前一阶段可用信息的假设,第一个事件是有意义的:每个玩家都知道自己的选择,但通常不知道其他玩家的选择。第二个事件是关于 b 在游戏中关于 a 的选择的信息的自然假设:b 拥有 a 实际上已经做出某个选择的信息。但 a 有什么理由得出结论说 b 不知道她选择了 u(第三个事件)?这是一个关于 a 知道 b 期望她做什么的实质性假设。事实上,在某些情况下,a 可能有充分的理由认为 b 实际上知道她选择了 u。有一个临时认知模型,其中此事件 (−Ka(−Kb(U))) 在 w1 处为真,但这需要在 W 中添加一个额外元素:
图表:链接至下方的扩展描述
图 6(图 6 的扩展描述见补充材料。)
请注意,由于 Πb(w′)={w′}⊆U,我们有 w′∈Kb(U)。也就是说,b 知道 a 在 w′ 状态下选择了 u。最后,通过简单的计算即可得出 w1∈−Ka(−Kb(U)),正如预期。当然,这个新模型还内置了其他实质性假设(例如,在 w1 处,b 知道 a 不知道自己会选择 l),这可能需要进行其他修改(参见 Roy & Pacuit 2013)。这引发了一些有趣的概念和技术问题,我们将在第 2.4 节中讨论。
2.1.2 添加信念
有多种方法可以用玩家的信念来扩展博弈的认知模型。我们首先概述一种受信念修正研究启发的方法(有关概述,请参阅 van Benthem 2011;Baltag & Renne 2016;以及 Baltag & Smets 2006)。
博弈论的认识论似真性模型 G=⟨N,(Si)i∈N,(ui)i∈N⟩ 是一个元组 ⟨W,(Πi)i∈N,(⪰i)i∈N,σ⟩,其中 W 是状态的非空有限集,⟨W,(Πi)i∈N,σ⟩ 是 G 的认识论模型,对于每个 i∈N,⪰i 是 W 上的自反和传递关系,满足以下属性)9),对于所有 w,v∈W,
(似真性意味着可能性)如果 v⪰iw 则 v∈Πi(w),以及
(局部连通)如果 v∈Πi(w) 则 w⪰iv 或 v⪰iw。
。似真性排序不仅描述了参与者的信念,还描述了参与者在出现新信息时如何修改他们的信念(有关讨论请参见 Baltag & Renne 2016 的 4.3 节)。可以使用似真性排序定义不同类型的信念算子。首先我们需要一些符号。首先,对于事件 E⊆W,令
Max⪰i(E)={v∈W | v⪰iw 对所有 w∈E }
根据 ⪰i 表示 E 中最大元素的集合。其次,似真性关系 ⪰i 可以提升到 W 的子集,如下所示:X⪰iY 当且仅当 对所有 x∈X 和 y∈Y,x⪰iy。
信念:对于任何事件 E⊆W,令
Bi(E)={w∣Max⪰i(Πi(w))⊆E}
。这是通常的信念概念,它满足上面讨论的标准属性(例如,一致性以及积极和消极的内省)。
。
。稳健信念:对于任何事件 E⊆W,令
。
。RBi(E)={w∣v∈E,对于所有 v,且 v⪰iw}
。因此,如果 E 在所有世界中都至少与当前世界一样可信,则 E 被稳健地相信。这种更强的信念概念也被一些作者称为确定性(参见 Leyton-Brown & Shoham 2008:第 13.7 节)。
。
。强信念:对于任何事件 E⊆W,令
SBI(e)= {w |w|e∩πi(w)≠∅
(e∩πi(w))⪰i(-e∩πi(w))}
因此,e被强烈认为,它提供了认识论可能,并且播放器在e比任何州内的任何国家都认为任何状态都会更合理。
有条件的信念:对于事件e,f⊆w,让
b
f
一世
(e)= {w|max⪰i(f∩πi(w))⊆e}
所以,'b
f
一世
'编码我认为在接受(可能误导)的证据时,我将相信哪些代理商是真实的。
认知博弈理论的标准方法是使用概率代表球员的信念,而不是使用合理性排序来代表球员的定性信念:
定义2.5(认识概率模型)假设
g =⟨n,(丝)i∈n,(ui)i∈n⟩
是一个战略形式的游戏。 g的认识概率模型是元组
⟨w,(πi)i∈n,(PI的)i∈n,σ⟩
其中W是一个非空的有限组状态,⟨w,(πi)i∈n,σ⟩是g的认知模型,并且对于每个i∈n,pi:w→δ(w)将概率测量[10]分配给W令人满意的每个元素以下两个假设:
对于所有vκW,如果pi(w)(v)> 0那么pi(w)= pi(v); 和
对于所有vκπi(w),pi(w)(v)= 0。
为了简化符号,每个i∈n和w∈w,写p
w
一世
对于pi(w)。
属性1表示,如果我在州W处为态V分配非零概率,则播放器被分配了W和v的相同概率测量。这意味着我们可以将PI视为为I的信息单元中的每一个分配概率度量。 第二个属性表示,分配给信息小区的任何概率测量必须将概率零分配给信息小区之外的所有状态。
在许多应用中,观看玩家的概率测量与每个信息小区相关联的应用程序是有用的,因为通过条件化由单个概率测量产生的每个信息单元。 对于每个i∈n,播放器I的(主观)先前概率是pi∈δ(w)的元素。 然后,通过指定每个i∈n,(1)先前概率pi∈δ(w)和(2)对每个w∈w,pi(πi(w))> 0的分区πi来定义至少限定概率概率模型。 然后定义与每个可能的世界相关联的每个i∈n的概率措施如下:
的PI(w)(⋅)=的PI(⋅|πi(w))=
的PI(⋅∩πi(w))
的PI(πi(w))
当然,对于每个w∈w,pi(πi(w))> 0的侧条件是重要的,因为我们不能除以零 - 这将在后面的部分中更详细地讨论。
对于每个玩家的任何认识概率模型,对于每个玩家来说,对于任何认知概率模型,存在如上所述的模型,对于每个概念概率模型,存在现有概率(可能不同的玩家)的现有概率(可能不同的玩家)。 这意味着认识概率模型假设参与者对游戏可能结果的信念是固定的前蚂蚁,并且通过在玩家的硬信息上通过条件化来实现的前临时信念。 有关常见的事先(即,所有玩家的先前,请参阅莫里斯1995年对情况进行广泛讨论。
如上,我们可以定义信仰运营商,这次指定代理人认为事件的精确程度:
概率信仰:对于每个r∈[0,1],让
(b
r
一世
(e)= {w|p
w
一世
(e)≥r}
全面信念:BI(e)= b
1
一世
(e)= {w|p
w
一世
(e)= 1}
因此,全面信仰被定义为具有概率1的信念1.这是这种文献中的标准假设,尽管许多知名的概念困难(参见Genin&Huber 2020 [2022]以广泛地讨论这一和相关问题)。 有时候可以使用以下替代表征的全面信念(给予它更为“的模态”味道):播放器我认为州W在州W的情况下,只要我在W的概率的支持是E.的子集,那就是
bi(e)= {w |for所有v,如果p
w
一世
(v)> 0然后v∈e}
查看Fagin,Halpern,&Megiddo(1990); Heifetz&Mongin(2001); 和周(2010)为这些信仰运营商的逻辑分析。
我们将本节与认知概率模型的一个例子结束。 回想一下图4所示的协调游戏:玩家ANN(A),U和D有两个动作,以及BOB(B),L和R的两个动作。 这组策略配置文件是{(u,l),(u,r),(d,l),(d,r)}。 由于我们只对描述参与者的知识和信仰感兴趣,因此玩家的偏好(或公用事业)在这个阶段并不重要。