进化博弈论(一)

进化博弈论起源于游戏数学理论的应用,从实现频率依赖性健身引入演化的战略方面引起的。 然而,最近,进化博弈论是对经济学家,社会学家和人类学家和社会科学家的利益增加 - 以及哲学家。 具有明确生物根系的社会科学家的兴趣来自三个事实。 首先,进化博弈理论治疗的“演变”不需要是生物学进化。 在这种情况下,“演变”可能会被理解为文化进化,这是指随着时间的推移对信仰和规范的变化。 其次,在许多情况下,潜在的进化博弈理论的理性假设,更适合社会制度的建模,而不是传统的游戏理论的假设。 第三,进化博弈论作为明确动态理论,提供了传统理论缺失的重要因素。 在演变和游戏理论的序言中,Maynard Smith指出“[P]稻草上,事实证明,博弈论更容易应用于生物学,而不是最初设计的经济行为领域。” 这可能是双重矛盾的,随后,随后的进化博弈论的发展已经产生了一种对社会科学家来说具有巨大的承担的理论,并且可以随时应用于经济行为领域,因为它最初设计为本。

1.历史发展

2.进化博弈论的两种方法

2.1进化稳定的定义

2.2进化稳定性的动态概念

3.动态,稳定性和理性结果

4.为什么进化博弈论?

4.1均衡选择问题

4.2高音理体的问题

4.3在传统的游戏理论中缺乏动态理论

5.进化博弈论的应用

5.1公平感

5.2语言的出现。

6.进化博弈论的哲学问题

6.1文化进化解释的健身意义

6.2进化博弈论的解释性不相关

6.3进化游戏理论解释的价值

参考书目

学术工具

其他互联网资源

相关条目

1.历史发展

进化博弈论是由R. A. Fisher开发的第一次发达的 益智渔业面临的是:为什么在大多数男性从未交配的许多物种中,性别比例大致相等? (例如,参见北大象封印Mirounga angustristris。)在这些物种中,非交配的男性似乎是剩下的人口周围的超重行李,没有真正的用途。 费舍尔意识到,如果我们在预期的孙子孙女数量衡量个人健身,那么个人的健身就取决于人口中的男性和女性的分布。 当人口中有更多的女性时,雄性具有更高的个人健身; 当人口中有更多的雄性时,女性具有更高的个人健身。 Fisher指出,在这种情况下,进化动态导致性别比率在平等数量的男性和女性身上固定。 个人健身取决于男性的相对频率和人口中的女性的相对频率引入了进化的战略要素。

Fisher的论点理论上可以理解游戏,但他没有在这些条款中说明它。 1961年,R.C. Lewontin首次明确在“进化和游戏理论”中进化生物学的博弈论(不要与同名的Maynard Smith工作混淆)。 1972年,Maynard Smith首先在“博弈论和战斗中的演变”章节中介绍了进化稳定的策略(以下eSS)的概念 然而,它是“动物冲突逻辑”的出版,由Maynard Smith和1973年的价格引入了ESES概念进入广泛的流通。 1982年,Maynard Smith的开创性演变和游戏理论出现了,随后由Robert Axelrod的着名作品在1984年的合作演变之后。从那时起,经济学家和社会科学家的兴趣是真实的爆炸在进化博弈论中(见下面的参考书目)。

最初,据认为,进化博弈论可能会循环解决传统博弈论的均衡选择问题。 虽然传统博弈论的基本解决方案概念,纳什均衡,但随着允许混合策略的情况,仍有有限数量的玩家和策略的任何游戏的理想性能,但它有几种偏离。 纳什均衡不保证是独一无二的(有时即使是不可数的许多纳什均衡存在),并不总是似乎对应合理的结果(见Hargreaves Heap和Varoufakis,2004),偶尔与人民冲突直接如何算作理性的结果。 相比之下,可以表明,完全混合的进化稳定的策略是独一无二的,即最多只有有限数量的进化稳定的策略,并且几种直观的进化稳定性定义相当于Maynard Smith和价格的原始定义。

很快意识到进化博弈论本身在结构上存在与均衡选择问题类似的问题。 提出了几种进化稳定性的竞争定义,每种竞争定义都有一定的直观优点。 此外,由于详细探讨了进化博弈论的静态和动态方法之间的联系,发现最多,在进化稳定性的静态概念和动态稳定性之间存在不完美的舒适。 此外,从传统博弈理论的角度来看,进化博弈理论的动态模型导致了结果,从传统博弈论的角度来看,如保护严格占主导地位的策略。

2.进化博弈论的两种方法

进化博弈论有两种方法。 第一种方法来自Maynard Smith的工作和价格,并采用了进化地稳定战略的概念作为分析的主要工具。 第二种方法构建了一个明确的过程模型,通过该过程,通过该过程的频率在该模型中的进化动力学的群体变化和研究性质。

因此,第一方法可以被认为是提供进化稳定性的静态概念分析。 “静态”因为,虽然给出了进化稳定性的定义,但定义高级通常不指的是群体中的行为(或策略)变化的底层过程。 相比之下,第二种方法并不试图确定进化稳定性的概念:一旦指定了人口动态的模型,就可以将用于分析动态系统分析的所有标准稳定性概念。

2.1进化稳定的定义

在博弈论中,主要解决方案概念是纳什均衡。 纳什均衡是策略的概况(即每个玩家的策略分配),这是一个互动的最佳反应,这意味着没有玩家没有任何激励偏离他们所选择的策略。

要了解为什么纳什均衡的传统游戏理论概念太弱而无法捕获进化稳定性的概念,考虑到图1.纯策略中有两种纳什均衡:(S1,S1)和(S2,S2)。 由于纳什均衡是一系列互补的响应,因此不能采用不同的策略来提高他们的回报,但纳什均衡允许偏离其均衡战略的球员接收相同的回报。 这是(S2,S2)平衡的情况。 这就是为什么纳什均衡不足以进化进化稳定性:它允许远离均衡的可能性,最终导致更换现任策略。

为了看到这一点,假设个体的人口都遵循了战略S2。 如果突变似乎发挥了策略S1,则S1-突变体的回报与其他人的群体相同,因此对突变体没有选择压力。 如果出现第二个突变体,则S1-S1相互作用所获得的回报将产生大于人口平均适应性的适应性。 这将允许S1突变体传播并最终接管其余人口。

s1 s2的

s1(2,2)(1,1)

s2的(1,1)(1,1)

图1.纳什均衡不足以捕获纳什均衡的概念

严格的纳什均衡是从玩家均衡战略的任何单侧偏差离开球员更糟糕的地方。 虽然严格的纳什均衡直观地捕捉了一种进化稳定性(它可以被认为是一种“本地最佳”),但也可以表明严格的纳什均衡太强而无法捕获进化稳定性的想法。

要查看这一点,请考虑鹰鸽游戏,由Maynard Smith和20173年的价格分析为“动物冲突的逻辑” 在这个游戏中,两个个人竞争固定值V的资源。(在生物背景中,资源的值v对应于获得资源的个人的达尔文的健身的增加;在文化背景下,资源的价值v需要给予替代解释更适合于手头的特定模型。)每个人恰好遵循以下两个策略之一:

鹰。 启动攻击性行为,直到受伤或直到一个人的对手背后。

鸽子。 如果一个人的对手启动攻击行为,请立即退缩。

现在假设以下内容:

每当两个球员都发起攻击行为时,最终发生冲突,两者都同样可能受伤。

这种冲突通过一些恒定的值C减少了受伤方的个体健身。

当一个鹰遇到鸽子时,鸽子立即撤退,鹰获得资源。

当两个鸽子符合资源时,它们之间同样共享。

鉴于此,根据以下矩阵总结了Hawk-Dove游戏的健身资金:

鹰鸽子

鹰(

v-c

2

v-c

2

)(v,0)

鸽子。(0,v)(

v

2

v

2

图2.鹰鸽游戏。 (假设v<c,否则鹰派主导鸽子。)

Hawk-Dove游戏在纯策略中没有NASH均衡,并且在混合策略中恰好纳入均衡。 混合策略纳什均衡有两个人在概率上玩鹰

v

c

和概率1-

v

c

。 通过σ表示该策略。 根据混合策略纳什均衡的基本定理(见Gintis,2009),就是这种情况

π(hawk|σ)=π(dove|σ)=π(σ|σ),

其中“π(x |y)”表示当使用策略y播放策略x时获得的回报。 由此,如此,对于任何其他混合策略μ,π(μsσ)=π(σ|σ)的情况是π(σ|σ),因此纳什均衡不是严格的。 然而,每个人都遵循策略σ仍然能够抵抗侵袭,因此可以示出π(σμm)>π(μμm)。 也就是说,现任策略Σ在与任何突变策略拍摄时获得的更高的回收,而不是在突然策略时收到突变策略。

这些考虑因素牵头Maynard Smith(1982)提出以下定义:[1]

定义。 策略Σ是一种进化稳定的策略(ESS),如果只有对所有其他策略μ∈Σ,那么π(σ|σ)>π(μsσ)或π(σ|σ)=π(μsσ)的情况和π(σμm)>π(μμm)。

或者:

定义。 策略Σ是一种进化稳定的策略(ESS),如果只有,对于所有其他策略μ∈Σ,

π(σ|σ)≥π(μ|σ)

如果π(σ|σ)=π(μsσ),则π(σ|μ)>π(μμm)。

第二种定义,而在逻辑上相当于第一定义,其优点是使其清楚的是,每个进化稳定的策略也是纳什均衡。 来自Maynard Smith的第一个定义具有使其清楚的优点,即每个严格的纳什均衡也是进化的稳定性。

由此,我们看到进化稳定的策略是纳什均衡,其额外的二阶稳定标准。 它是纳什均衡概念的正确加强,因为与许多玩家和有限数量的每场比赛都有至少一个纳什均衡(如果允许混合策略),而不是每场比赛都有一种进化稳定的策略。 很容易显示,摇滚剪纸的游戏,如图3所示,没有进化稳定的策略。 (进化稳定的唯一潜在候选者是NASH均衡混合策略σ,它为所有三种纯策略分配相同的概率。但由于π(σ|σ)=π(摇滚|σ)和π(Σ1μR)=π(Rock1 rock),它没有进化稳定。)

岩石剪刀纸张

岩石(0,0)(1,-1)(-1,1)

剪刀(-1,1)(0,0)(1,-1)

纸张(1,-1(-1,1)(0,0)

图3.摇滚剪纸的游戏没有进化稳定的策略。

尽管事实上,进化稳定的策略并不总是存在,但是Maynard Smith的一个优势和进化稳定的策略的价格定义是,可以证明它相当于定义的进化稳定性的另外两种概念。 由于这三个进化稳定性的定义并不明显相同,因此他们结果是逻辑上等同的事实是有趣的。 在说明等效结果之前,我们简要讨论以下其他概念。

首先,回顾上面关于图1的比赛的讨论如何,我们对突变试图侵犯人口的突变体内的想法,所有这些都遵循单一现任战略。 为了使这个想法精确,我们需要介绍一些符号:让μ,σ是两个策略,让0<ε<1。 然后εμ+(1-ε)σ表示具有概率ε的μ的策略,并播放概率1-ε的σ。 然而,我们也可以将其解释为代表从大多数(1-ε)遵循策略σ和少数群体(ε)遵循试图侵入的策略μS的大量人群中所选择的播放器。

定义。 如果存在,策略σ具有统一的入侵屏障

ˉ

ε

>0使得对于所有μ∈Σ和ε∈(0,

ˉ

ε

),

π(σ|εμ+(1-ε)σ)>π(μ|εμ+(1-ε)σ)。

统一的入侵屏障是进化稳定性的自然概念。 它说,当人口均遵循相同的策略σ时,除了突变的一小部分突变体之外,所有突变均遵循单一策略μ,现有的策略σ在混合人群中具有比入侵策略μ的严格更高的预期健康。[2] 因此,将有针对入侵策略选择,并且在足够大的突变数量的人群中,σ将进化稳定。

进化稳定性的第二个概念在直觉上取决于稳定的策略应该排除漂移的可能性。 毕竟,毕竟,对于图1的比赛的纯策略中的第二次纳什均衡产生了什么问题。表征这一点如下。

定义。 如果存在关于所有策略μ∈u的邻静脉,则策略σ被认为是局部优越的,如果对于所有策略μ∈u,其中μ∈Σ,则是π(σμm)>π(μμm)的情况。

然后可以证明以下内容:

定理(Hofbauer等,1979)以下是等同的:

σ是一种进化稳定的策略。

σ具有均匀的入侵屏障。

σ是局部优越的。

在Maynard史密斯和价格的原始工作之后,已经提出了进化博弈理论的替代分析解决方案概念。 一个这样的替代方案是进化稳定的集合的想法(参见Thomas 1984,1985a,b)。 通过动机,如图4所示的游戏。在该游戏中,没有进化稳定的策略,因为S1和S2彼此播放时都接受相同的回报。 然而,含有S1和S2的混合物的任何群体在某种意义上是稳定的:尽管对于S1和S2的确切比例肯定会发生漂移,但是无论特定混合物仍然往往倾向于驱除任何S3或S4突变体,由于预期的健身的差异。

s1 s2的s3的s4

s1(1,1)(1,1)(1,

1

2

)(1,

1

2

s2的(1,1)(1,1)(1,

1

2

)(1,

1

2

s3的(

1

2

,1(

1

2

,1)(

1

2

1

2

)(

1

2

1

2

s4(

1

2

,1(

1

2

,1)(

1

2

1

2

)(

1

2

1

2

图4.一个没有进化的游戏,没有稳定的策略,但一个带有进化稳定的套装。

也存在其他分析解决方案概念。 Swinkels(1992)介绍了平衡进化稳定的集合的想法,进一步改进了进化稳定的集合的想法。 (每个进化稳定的设置都包含一些平衡进化稳定的集合,但并非每个平衡进化稳定的集合都是进化稳定的集合。)因此我们看到寻找足以捕获进化稳定性遭遇遇到的概念的静态解决方案概念在传统游戏理论中的平衡选择问题的结构上的一个问题:有多种竞争的进化稳定性概念,所有这些都具有一些直观的符号索赔。

2.2进化稳定性的动态概念

作为第二种方法的一个例子,考虑着众所周知的囚犯的困境。 在这个游戏中,个人选择两个策略中的一个,通常称为“合作”和“缺陷” 这是囚犯困境的支付矩阵的一般形式:

合作缺陷

合作(r,r)(s,t)

缺陷(t,s)(p,p)

图5.囚犯困境的支付矩阵。

在图5中,假设收益满足排序T>r>p>

t + s

2

<r。 后者的要求虽然通常在囚犯的困境中讨论遗漏,但确保在无限重复的游戏的背景下,在合作缺陷和缺陷合作之间交替的球员中没有净整体优势。

扮演囚犯困境的人口如何随着时间的推移而发展? 如果没有引入有关人口性质的一些假设,我们无法回答这个问题。 首先,假设人口相当大,并且与合作者或缺陷器交互的概率等于该策略之后的人口的比例。 这使我们能够通过简单地跟踪措施遵循策略和缺陷的比例来代表人口的状态。 让PC和PD表示这些比例。 通过WC和WD分别表示合作者和缺陷的预期健身,并让

(本章完)

相关推荐