博弈论与道德(三)
一个图:链接到下面的扩展说明
图9.葡萄酒讨价还价问题[图9的扩展说明在补充中。]
这里,克劳迪娅的回报被描绘在横轴上,劳拉的回力被描绘在垂直轴上。 绿色阴影区域代表了劳拉和克劳迪亚制造兼容索赔的可行的收益载体λ,即x1 +x2≤1。 虽然对应于(H,H)结果的收益载体U0 =( - 1,-1)表示其非识别点。
在社会契约上下文中,我们可以将非识别点U0视为代表自然状态的,并且可行的集合λ作为各种合同各方的代表可能会同意。 每个点Uγλ都是弱帕匹省优于U0,因此表征了合作盈余的社会契约(Gauthier 1986:141)。[2] 并且,当一组索赔构成相关讨价还价问题的均衡解决方案时,这使我们可以说合同的各方都有很好的理由遵守其术语。 然而,我们将在下面看到,从规范的角度来看,有各种方法可以识别最具吸引力的均衡。 使用NASH讨价还价方法来建立社会契约的优点是,这种形式化有助于澄清这些方法之间的差异。[3]
Braithwaite在他的剑桥讲座中分析的基础游戏非常适合说明讨价还价问题的公理方法。 在这场比赛中,两个代理商,卢克和马修,争夺有限资源的股份。 像葡萄酒问题一样,Braithwaite基础游戏是一个冲突协调游戏,每个代理商都有两种纯粹的策略,其中代理人声称所有擅长的股份,以及他声称的D. 这里(h,d)是最有利的纳什平衡,(d,h)是最有利的平衡。 然而,如图10所示,该游戏在葡萄酒问题中具有不存在的不对称性。[4]
代理2(马修)
d h
代理人1(Luke)天。(
1
6
,0)(
1
2
,1)
h(1,
2
9
)(0,
1
9
)
d = dove(索赔无),h =鹰(索赔全部)
图10. Braithwaite基础游戏
再次,如前所述,可以扩展这个游戏以适应代理人可以申请良好股票的情况。 如果再次非反应点再次产生冲突结果(H,H)产生的收益,因为Braithwaite所谓的,那么Matthew和Luke在纳什议价问题中,可行的设置λ和非识别点U0 =(0,
1
9
)。 图11描绘了这种游戏的可行设置λ(再次以绿色阴影)。 然而,这一数字还确定了与三个解决方案概念相关的收益向量,这些概念在社会合同的游戏理论分析中特别有影响力(即纳什,比例和最大比例增益解决方案)。
一个图:链接到下面的扩展说明
图11. Braithwaite讨价还价问题[图11的扩展说明在补充中。]
这里,Luke的回报被描绘在水平轴上,而Matthew在垂直轴上。 我们可以看到,虽然解决方案有所不同,但每次留下Matthew的收益高于卢克接收。 这是因为每个解决方案都分配了Matthew的良好份额,[5]并且是由于非识别点的不对称性,表征了Braithwaite问题。 具体而言,(H,H)是卢克最糟糕的结果,但不是马修的,所以马修有一个威胁优势。 在较少的技术条款中,因为未能同意对马修不同意不太糟糕,他可以利用非造就的威胁按向他更有利的协议。 而这种不对称区分了图9所示的葡萄酒分割问题的Braithwaite讨价还价问题,其中三种解决方案与点U * =(
1
2
,
1
2
)其中涉及的代理人每次接受平等股份。
在他自己的分析中,Braithwaite赞成比例解决方案,以便在帕雷托前沿的点选择点,其中每个特工相对于非造型点的回报是与一些独立指定的公平收益衡量相称。[6] 另一方面,Gauthier(1986,2013)捍卫Maximin比例增益解决方案,通过将代理的收益相对于非识别点进行比较,而且还考虑到了代理商票价相对于他们理想的回报。[7] 然而,在博弈论文献中,纳什解决方案仍然是利用最广泛的解决方案概念,这在提供社会合同的游戏理论治疗的哲学家中可以说是真实的(参见,例如,1994年,1994年,1994年,1994年,1994年,1994年,参见1994年,1994年,参见1994年,1994年,1994年。2016年20月)。 粗略地说,这个解决方案挑选出了最大化合作盈余的重点,尽管一些哲学家提供了对保证收益的概念的改进,但达到最低限度的概念(Mohler 2018)。[8]
在利用社会合同的游戏理论的辩论的核心中,上面提到的每个解决方案概念,以及任何解决方案的解决方案,都可能满足了我们可能想要的几个,但不是所有直观的合理的约束。一个公平的讨价还价的程序实现。 例如,NASH的解决方案是唯一满足所有四种的解决方案概念:
帕累托最优性,
对称,
规模(或实用程序)不变性,和
重复稳定性。[9]
但它未能满足:
个人单调性,和
人口单调性。
在这种情况下,如果没有其他代理商对某些代理商更好的其他结果而没有对他人更糟糕的情况而言,结果(或其相关的收益载体)是帕累托最佳的。[10] 如果当这些代理具有相同的公用事业职能,非识别点和策略时,则解决代理从相同股票的收益获得的收益是对称的。[11] 如果解决方案不依赖于如何代表回报,则这是规模不变的。[12] 如果将解决方案概念应用于讨价还价问题的解决方案概念在其可以申请的良好的相对股份,则重复稳定。[13] 虽然如果通过扩展可行的设置以包括对代理更有利的新结果来修改议价问题,但是如果在讨价还价问题的情况下,可以单独单调,则可以单独单调单调。 如果为一套给定的索赔人,则是人口单调的,而其他人只是因为设定离开和/或新索赔人的某些成员而获得的。
另一方面,Maximin比例增益解决方案是单独和群体单调,但不稳定的重复。 虽然比例溶液是单调的单调,人口单调,并重新销料稳定,但不是不变的。 最终,那么,就像箭头的不可能性和相关结果一样令人怀疑是否存在用于聚合偏好或制作集体决策的独特最佳程序,没有一个解决方案概念,可以清楚地讨价还价的问题。 也就是说,讨价还价理论在社会合同的哲学分析中的应用一直有用,因为它提供了一个框架,以说明社会契约的一个特征是理论主义者的尊重,以及识别与这些特征相关的权衡可能是什么。 因此,例如,人们可能会透露与纳什和比例解决方案概念相关的重复稳定性属性将允许基于其中一个人的社会合同,以便在面对社会变革时更适合防止防撞冲突。 这是因为这种合同将是关于在未来可能出现的合作效益的变化的重新解决方案,例如,由于社会中新成员的涌入或发现新技术的资源开发的新技术。 但这种稳定必须以使用特权代表代理人的收益,或者接受合同各方,如果他们更加讨价还价,则不一定会更好地取得更好。 虽然这个权衡可能最终是合理的,但重要的一点是合同理论家的任何权衡都使她犯下一套规范判断,博弈论可以帮助澄清这些是什么。 例如,理论上思想的哲学家的许多游戏都争辩说,任何特权特权的特权的账户无法避免将某些道德判断纳入这些公用事业(森1980; Mohler 2018)。
4.2社会合同的进化方法
侧重于在社会契约的哲学分析中使用讨价还价理论,我们现在将简要介绍进化博弈论与这项任务的相关性。 回想一下,进化博弈论是建模如何在这些特征决定具有它们的代理人互动的代理人如何发展时如何发展人口中的特征如何发展的正式方法。 Gaus(2010)和Muldoon(2016年)是最近借鉴非正式进化模型的两个作品,以便展示社会合同的条款如何以及为何随着时间的推移而发展,以适应多元化的政策。 虽然采取了更正式的方法,亚历山大(2007)探讨了如何随着时间的推移表征社交网络中的女性正常规范的均衡程度。 这是Brian Skyrms(1996年[2014],2004)的作品,这一直是将进化博弈理论赋予社会合同的最有影响力。
Skyrms的签名使用中的一个进化博弈理论是解释纳什议会问题的各种“公平”解决方案的起源(1996 [2014]:第1章)。 正如我们上面所见,不同的公理解决方案概念都可以推荐不同的解决方案到相同的讨价还价问题。 但是,即使一个人赞同有利于特定解决方案概念的论据,尚未表明从事讨价还价问题的实际索赔人往往会遵循这种解决方案。 这是因为典型的讨价还价问题通常会有大量的均衡,每个均力可能更有利地对他人的某些和更不利。 因此,人们可能怀疑实际索赔人可以居中入任何均衡,更不用说均衡,这些均衡表征了我们将视为公平的结果。
为了获得这个问题的牵引力,Skyrms考虑了一个简单但非活动的3件纳什需求游戏,这些纳什需求游戏在结构上类似于图8的扩展葡萄酒问题。在此目前熟悉的游戏一对代理商争夺了一个好的股份。 当货的索赔兼容时,每个问题并获得与她索赔相当的回报,并且每个人在他们的索赔不兼容时都会收到任何内容。 在Skyrms的版本中,索赔人可以发出最小的索赔,D,到良好的1/3; 最大索赔,h,到2/3的好处; 或者是“中间”索赔,m,它的1/2。 [14]作为斯特尔斯票据(1996年[2014:4]),在这种情况的游戏中,我们倾向于认为有一个结果索赔人应该遵循,即,每个索赔的一半津贴的公平结果。 这对应于M之后的每一侧,并且如我们之前所看到的,(M,M)是游戏的均衡。 但问题仍然存在,为什么申明人会在有其他均衡时选择公平结果?
一个答案的答案是,当代理人反复进入彼此的彼此相互同意时,但只能在他们同意一个可行的划分时获得良好的份额,抑制自己从压力的最大索赔的代理商更有可能遇到其他代理人谁是可行的便宜货。 换句话说,正如我们在第2节在略微不同的背景下看到的那样,从长远来看,从志同道合的代理商成功地提出的效果超过了可能偶尔通过压制不太公平的分歧的上面的收益。 Skyrms通过应用进化的动态模型,转速器动态,对他的纳什需求游戏进行测试。 图12示出了一个人可以用于总结该动态的单纯x。
三角形:链接到下面的扩展说明
图12. Skyrms Nash需求游戏的策略Simplex [图12的扩展描述是补充。]
单位中的每个点对应于可以由有序三联(Z1,Z2,Z3)表示的群体中的特定剂型组合,其中Z1是遵循的群体的一部分,Z2跟随M的分数和Z3如此接近单位的顶点的H.点的级分表示混合,其中更多代理遵循与该顶点相关的策略。 然后,复制器动态总结了人口态的演变,其中代表的策略的分数随着其平均生殖健身的成比例而变化。 在这里,战略的平均生殖健康对应于它相对于在特定时间内人口中所代表的其他策略的平均薪水的平均收益。[15] 为了说明,在图12中,点z0 =(
1
6
,
1
3
,
1
2
)表示初始状态
1
6
人口遵循D,
1
3
关注m,和
1
2
遵循H.给定这个起点,转速器动态然后追踪从Z0的轨道追踪,该轨道会聚到E2 =(0,1,0),整个人口遵循纯策略M的顶点。
通过在图12中的初始状态的宽带上施加复制器动态,斯基斯然后显示公平的结果,E2,每个人按压等权利要求,最有可能进化。 我们在这里复制斯基斯的实验。 图13描绘了从图12的随机选择的初始群体状态开始的复制器动态的200个轨道。
三角形:链接到下面的扩展说明
图13. Skyrms Nash需求游戏的Replicator动态轨道[图13的扩展说明在补充中。]
如该图说明了索赔类型的大多数初始分布,最终会聚到所有代理遵循的均衡和1/2的压力机权利要求。 要使用技术术语,我们可以说E2拥有最大的吸引力流域。[16] 要了解为什么这是这种情况,我们可以考虑如何在人口的代理随机会面并从事纳什需求游戏时如何替换不同的纯策略类型。 打动D声称D声称的代理商总是到达可行的讨价还价,但特别是他们从未做过的互动,以及按下M或H声称的合作伙伴,另一方面,当与按下最低限度索赔的代理商匹配时,他们才能获得可行的票价。D,可以被利用。 与此同时,在与D继伙伴或其他M-Welder伙伴相匹配时,打动M索赔的代理商到达可行的讨价还价。 然后,除非有这么多的H追随者,M-Persioners比D-Powersers和H-Founders更好地做得好,除非有这么多的H追随者,在人口中很少有人遇到的粉丝,在个人遭遇中,M-Wollower更有可能达到H-WOWER比另一个人追随者或D-jolower。[17] 事实上,M是这场比赛的进化稳定的策略(Maynard Smith 1982)。 这意味着,如果e2是当前人口状态,那么m是唯一的现任策略,那么E2可以击退任何有限的侵入某些不同的突变策略。[18]
在某些方面,Skyrms的观察表明,通过从理性选择理论的范围内绘制资源,可以加强如何加强Gauthier对受限制的最大化的论点。 事实上,斯基尔斯表明,当药剂变得更容易与自己的策略类型的药剂更容易互动时,所有剂的均衡的吸引力为公平均衡,当时他们可能有些能够识别自己的代理人,所以当药剂变得更容易与他们自己的策略类型的药剂相互作用时,所有剂的均衡都会扩张。 例如,图14描绘了相关的复制器动态矽卡虫的一系列轨道用于模拟这种情况。 在这种动态中,代理符合相同纯策略类型的对应物,概率大于普通复制器动态的随机机会概率。[19] 而且,正如我们所看到的,即使在相同类型交互的可能性相对较小的情况下,也是所有修改的复制器动态轨道现在都会收敛到E2。[20]
三角形:链接到下面的扩展说明
图14. Skyrms Nash需求游戏的相关性复制器动态轨道[图14的扩展描述是补充。]
或者,Skyrms展示了对特定地点或事物的附件如何进化,更重要的是,发出信号的能力可以帮助解决像纳什需求游戏等冲突的协调问题。 特别是斯基尔斯(1996年[2014]:第4章)显示,通过制定产权的原始概念,参与此类游戏的代理可以通过在家里玩Hawk和远离家乡来关联他们的行为,从而避免导致的各种相互作用冲突或抛弃资源的两个代理商。 然而,在一天结束时,Skyrms利用的进化博弈论只能为Gauthier的视图提供了如此多的支持。 一方面,游戏Skyrms模型假定代理具有固定类型,并且不能根据其他人制造的权利要求来修改他们的索赔。 此外,有一件事要解释为什么公平划分或受约束的最大化会发展,或者表明这可能对个人代理和群体都有益,而是为了表明这些不一定表明约束一个人的行为是理性课程行动。
5.分析道德上重大的社会问题
如果合同辩护的方法,以理解道德和政治命令是使用游戏理论的伦理领域,其部署可能最有影响的领域是在对道德大规模的社会问题的分析中的分析。 示例范围从全球问题,如如何打击气候变化; 在国家或社区内出现的问题,如税收政策或如何管理公共池资源; 对于主要关注个人和群体的问题,如如何引起从事合作务实的个人的最佳努力。 下面我们将更详细地讨论三个例子。
5.1核冲突
在第二次世界大战期间,博弈论的许多早期进展是在第二次世界大战期间和冷战的早期阶段,个人与有兴趣推进我们对核冲突的理解的组织。 例如,John Von Neumann,我们在第1节中描述的博弈论的早期捐款确实为曼哈顿项目工作,这是在核武器发展的工具,他经常被赋予制定互行的破坏(疯狂)的战略,这些战略发挥着突出的在冷战核政策中的作用(Macrae 1992)。 疯狂是一项管理核武器的政策,核电否则通过可靠地威胁到核罢工的核罢工来避免核冲突,这将是足够的破坏性的核罢工,以否定第一次罢工的任何战略或战术优势。
不出所料,与核武器的使用相关的道德问题最终会在哲学文献中受到广泛的关注。 这项工作的大部分都侧重于核伦理如何提高对伦理的功利或外界方法的问题,尤其是威胁巨大邪恶是可以接受的问题,以便可能避免。 而且,虽然在这一领域工作的大多数哲学家几乎没有利用游戏理论,但他们所解决的许多问题被Gregory Kavka,Russell Hardin的重要工作框架框架,以及一些广泛使用正式和非正式游戏理论工具的其他人(见,例如,Kavka 1987; R. Hardin 1983; Gauthier 1984; Maclean 1984)。 特别是,这项工作有助于识别与疯狂和其他威慑理论相关的一些悖论,澄清了既然和反对单方面裁军的情况,并会对更多关于理性的辩论有影响(特别是有关意图本质的辩论模块化是否是理性的需求)。