博弈论与道德(一)

博弈论是对相互依存的选择和行动的研究。 它包括对战略决策的研究,分析理性代理人的选择和决定如何依赖于其他代理人的选择,以及对组动力学的选择,以及分析人口中策略分布方式的分析背景和这些分布如何影响个人互动的结果。 它应该与决策理论的区别,对代理商独立于其他代理商选择的背景下的个别选择的研究,以及来自社会选择理论,集体决策的研究。 我们的重点将是博弈论与道德和政治哲学的相关性。 彻底讨论博弈论及其与其他哲学领域的相关性,参见博弈论。

我们可以区分游戏理论与道德相关的两种方式。 第一个是解释性的。 游戏理论工具可用于解释(i)道德和(ii)道德实践的一般特征,(iii)在道德或政治上重要的社会问题的动态和(iv)特定的出现,存在和稳定性的动态道德规范。 游戏理论与道德相关的第二种方式是一个正当的。 这里的游戏理论工具用于证明(i)特定规范或原则,向(ii)大规模社会机构,或(iii)道德实践的一般特征。 在如下,我们将考虑这些用途,包括前者补充后者的方式。

1.历史

2.道德的作用

3.协调道德和审慎合理性

3.1不可分割的商品策略

3.2社会制裁策略

3.3改革决策理论策略

3.4和解项目的限制

4.博弈论和合同主义

4.1讨价还价问题

4.2社会合同的进化方法

5.分析道德上重大的社会问题

5.1核冲突

5.2规范不佳

5.3气候变化和环境

6.结论

参考书目

学术工具

其他互联网资源

相关条目

1.历史

John Von Neumann和Oskar Morgenstern在他们的论文和经济行为理论中奠定了古典博弈论的基础(冯·纳尤曼和Morgenstern 1944)。 在20世纪50年代发表了一系列的一系列内容,由众多的理论家发表,最重要的是约翰纳什,游戏理论随后在未来几十年的过程中改变了社会科学。 非自由作博弈论,博弈论的基本分支,探讨了代理人行动结果取决于其他代理人的情况,以及代理人缺乏执行协议的外部机制。 更确切地说,它提供了满足某些合理性标准的代理商在游戏中互动的模型,其特征在于每个代理人的行动或策略和他们可以实现的收益。 这种情况的收益是由各自代理人独立选择的行动和获取的世界的行动所定义的联合战略简介的产物,这些行为能够反映出可变的游戏的各个方面,没有代理人可以控制。 使用从可能结果的代理排名构建的序数偏好,可以果断地分析非自由作博弈论中的许多情景。 然而,Von Neumann和Morgenstern还推出了一种基本公用事业理论,通过使用代理商对彩票的偏好提供更精确的收益来反映给另一个代理商的偏好。 利用此框架,开发了一种更多样化的解决方案概念来预测如何播放游戏,并确定各个代理程序何时采用最佳策略以及这对所有代理商的后果是什么。

利用最广泛的解决方案概念之一是纳什均衡。 基于贝叶斯理性标准的基于哪一个选择,以便最大化她的预期效用,纳什均衡是一组代理采用的策略概况,其中每个代理通过的策略最大化了她的各自支付其他代理商采用的概率主义独立策略。 换句话说,在纳什均衡时,每个代理的策略都是对其他人的策略的最佳反应,因此在给予别人正在做的事情时,没有人可以做得更好。 虽然纳什不是第一个介绍这一均衡概念,但它的广泛适用性仅在纳什精炼的概念之后得到了认可,并且如果非自由度游戏具有有限的许多纯策略概况,则至少存在一个纳什均衡总是存在。 在纳什证据之前,众所周知,许多游戏在纯策略中缺乏纳什均衡,其中每个代理通过采用她的一个可用的行动来最佳地响应每个其他代理的策略。 这最初限制了可以应用概念的问题的类别,但是纳什表明,在这种情况下,在混合策略中总是纳入均衡,每个药剂通过选择与一些概率可用的策略的子集进行最佳地响应其他代理人所做的。 然后,这种概念的有用性将通过随后的改进进一步扩展,包括最重要的是由John Harsanyi和Reinhard Selten制作的最重要的内容(参见,例如,Harsanyi&Selten 1988)。

除了他的工作炼制解决方案概念,纳什还对合作博弈理论做出了重要贡献,这是一种建模战略相互作用的方法,允许通过拟订协议可以限制代理人的可能性。 除此之外,合作博弈理论提供了一组工具,用于分析与联盟建设有关的问题,以及在特工可以依赖外部当局执行协议的情况下出现的问题。 NASH最重要的贡献是介绍两种分析讨价还价问题的方法。 这一问题在合同道德和政治订单的合同方法中一直很重要,这是一个主题,我们将在第4节返回。

使用游戏理论工具来建模社交互动的第三种方法探讨了由于归纳学习或焦点存在而如何实现一定的结果。 这种方法的归纳学习方面被称为进化博弈论,所谓的,因为归因于电感学习的大部分工作都适用于为什么各种生物特征或行为模式在特定种群中出现的问题。 John Maynard Smith的演变和游戏理论(1982年)是这一传统的早期经典,而随后的人类学家,经济学家和政治科学家将把这种方法应用于社会和政治哲学家的利益问题,包括特别是如何持续合作在大群体中。 在生物学家完成了归纳学习的大部分基础上,在经济学家完成了大部分关于焦点的早期工作,托马斯·斯科林的预言冲突策略(1960年)特别有影响力。 粗略地说,焦点是可能是突出(Lewis 1969:35-36)的行为或结果,以至于他们将“脱颖而出”到参与游戏的代理商。 随着Schelling所显示的,这些点在战略空间大和/或有许多潜在的均衡的游戏中尤为重要。

Richard Braithwaite是第一个在分析道德问题时正式使用博弈理论的专业哲学家。 在1954年的游戏讲义中作为道德哲学家的工具(1955年出版),Braithwaite使用了Nash的讨价还价问题,以便为公平分区问题争论特定的决议。 他还审议了博弈论可能改变道德哲学,就像统计数据转化了社会科学一样。 虽然这一转型在哲学中没有以其对其他社会科学的方式发生的方式,但博弈论在自布鲁特瓦特讲座以来的几年内取得了重大进展道德和政治哲学。 David Gauthier通过协议(1986)和Ken Binmore的博弈论和社会合同(2卷,1994年,1998)的道德可以说是展示从游戏理论基础建立的系统道德理论的前两项工作。 Gauthier的理论源于古典博弈论,尽管他提出了对古典理论通常假设的贝叶斯合理性的正统叙述的修订。 另一方面,Binmore的理论集成了进化和古典博弈论的元素。 游戏理论在道德中的其他重要用途包括,但不限于:

普通知识(LEWIS 1969; Vanderschraef 2019)预测的社会公约的社会惯例分析

社会规范分析(Ullmann-Margalit 1977; Basu 2000; Bicchieri 2006,2017; Brennan,Eriksson,Goodin&Southwood 2013);

进化博弈论方面的社会合同要素的解释(Sugden 1986; Skyrms 1996); 和

纳什议价理论在替代社会合同理论中的应用(Gaus 2016; 2016年20月; Mohler 2018; Vanderschraaf 2019)。

此外,尽管与博弈论相关的正式框架直到二十世纪中期没有出现,但现在普遍认识到,许多早期哲学家的工作适用于游戏理论分析,而且,在许多情况下,这些工作明确预期了重要的博弈论的发展。 例如,巴里(1965),Gauthier(1969),Hampton(1986),Kavka(1986)和Taylor(1987)提供了霍布斯的争论的理论特征,以便不可避免地在自然状态下的战争和建立一个主权的利益。 事实上,这家霍布斯奖学金的分支仍然发展,韦尔萨夫(2007年和2010),Mohler(2009)和钟(2015年)所证明的近期作品所证明。 而且,兴趣爱好者的论点吸引了来自游戏理论思想的学者,Grotius(1625),Pufendorf(1673),Locke(1689),Hume(1740)和Rousseau(1755)提供在讨论道德,自然状态和自然法中的非正式游戏理论论点中可以被解释。 其中,休谟对论文(HUME 1740:3.2.2-10)的公约分析尤其值得注意的是其非正式账户对均衡的非正式账效和分析互联者在允许代理人到达和维持某些均衡的角色(Vanderschraaf 1998)。 此外,由于逐步试验和错误流程的结果,休谟如何讨论代理商如何定居,以及他的建议,即代理作为使某些替代方案显着的属性,即根据归纳学习的比赛分析焦点(Skyrms 1996; Sugden 1986)。

2.道德的作用

道德中最广泛使用的游戏理论之一是假设道德的各种功能,并确定其一些重要特征。 这是一个早期的例子是Edna Ullmann-Margalit的旨在认为道德可以被理解为一种规范的制度,使者能够协调其行动,以便在追求自我的情况下实现彼此互利的结果兴趣通常会阻止这一点(Ullmann-Margalit 1977)。 她用来说明的现在经典例子涉及两名士兵,他们必须选择是否迫击敌人的迫击炮,或逃离。 如果留下来,肯定会停止敌人的进步,但士兵几乎肯定会受伤。 如果逃离,敌人不仅能够乘坐山口,它也能够超越并捕捉逃离士兵。 如果只有其中一个逃命,那么勇敢的士兵会死于抓住敌人,而另一个将有足够的时间逃避安全。

情景Ullmann-Margalit提供的是囚犯困境的一个例子,如下图1所示。 在这场战略形式游戏中,每个士兵都在没有观察到另一个行动的行为。 每个士兵都可以选择逃离(f)或留住的策略。 矩阵中的细胞对应于每个可能对的结果,其中包含代表士兵的结果的特征的细胞中的数字。 具体地,更高的数字对应于更优选的结果,并且第一数量表示在与行对应的动作之间选择的士兵1的支付,而第二个数字表示在与列对应的动作之间选择的士兵2的支付。

士兵2

s f

士兵1。s。(2,2)(0,3)

f(3,0)(1,1)

s =留下来,f =逃跑

图1. Ullmann-Margalit的Mortarmen的困境

在这种情况下,每个士兵都有一个逃离的理由。 这是因为逃跑提供了逃离逃避的唯一可能性,这是每个最喜欢的结果。 但是,情况是困境,因为如果每个士兵追求这一行动的行动,那么他们都会最终更糟糕,而不是如果两者都没有。 此外,困境是通过对每个士兵来说的困境,F是对其他士兵可能选择的任何策略的独特反应。 也就是说,F是每个士兵的严格主导的策略,(F,F)是这种游戏的独特纳什均衡,即使两个士兵都会更好的是他们可以以某种方式跟随(s,s)。

Ullmann-Margalit指出,如果士兵理解他们的困境的性质,他们可能想要做某事,以防止自己逃离并随后被捕获。 更重要的是,她认为,囚犯的困境表征他们的困境是在每天都发现自己的无数互动中。 乍一看,对这些困境的明显解决方案可能似乎是士兵只是为了留在他们的帖子中。 然而,问题在于,在这种承诺的情况下,不可能是可信的,并且即使他们是,他们都容易被剥削。 相反,士兵所需要的是一种字面意思或比喻自己的方式。 借鉴这一观察,Ullmann-Margalit的建议是,这是做这项工作的道德规范。 更具体地说,这不是留在他们解决士兵困境的帖子中的承诺,就像他们承诺保留承诺并批准那些没有的人。

理解观点的一种方式是道德的函数是为了防止合理性的失败。 在下一节中,我们将讨论游戏理论如何用于分析道德和审慎合理性之间的关系。 然而,在最近的文献中,越来越多的共识,即社会道德发挥的角色规范并不一定要限制我们的乐器推理,以便我们能够克服审慎合理性的失败,而是改变像囚犯的困境一样改变混合动机游戏进入协调问题,互利结果更稳定,更容易到达。 这种方法的一个经典例子是bicchieri(2006)。 像Ullmann-Margalit一样,Bicchieri在我们对某些行动方案的承诺方面表征了规范,并强调了在这种情况下制裁的重要性。 然而,Bicchieri在社会规范和其他类型的规范之间取得了区分,并认为将前者与后者的区别是我们对他们承诺的条件性质。 特别是,遵守社会规范的遵守基础是个人(i)的经验预期,足够大的人口符合规范,(ii)她规范性预期,即足够大的人口期望他人预期符合规范。 只有当这两个预期都满足时,个人才会遵守社会规范。 因为有些人对他人的期望更敏感,或者更倾向于希望看到特定的规范符合符合的规范,相关的期望可能因个人而异。 只有当预期对足够大的人满足,那么,常态将成功地成功地改变社交困境,其中互利结果不稳定进入更容易解决的协调问题。 虽然乍一看似乎很奇怪,但鉴于我们只有条件地致力于是社会道德的局限性,鉴于社会困境的重要作用,鉴于社会困境的重要作用,这在防止我们居住在一起,这不应该令人惊讶。 对于更彻底的讨论这些问题,请参阅社会规范的条目。

到目前为止,我们的讨论集中了解游戏理论如何用于说明道德和角色社会规范在其中发挥的一些性化功能。 然而,博弈论也被利用来确定可能是重要的特定规范,以及确定规范的重要特征。 而且,前面的分析主要依赖于非合作博弈论的工具,这里是进化博弈论,这是特别照明的。 在这方面特别有影响力是在20世纪80年代初的合作演变的罗伯特阿克罗德及其同事的工作,以及罗伯特博尔德,彼得里希森和各种合作者的随后工作(见Axelrod 2006和Boyd&Boyd&Richerson 2005对于相关工作的摘要)。 通过分析重复的社会困境中各种固定策略的表现,他们能够说明条件策略和愿意在允许合作和其他女性行为方面发挥不利行为的重要作用,而不是从否认的情况下变得最佳个人。 更具体地说,他们表明,在个人对具有互利结果的长期兴趣的环境中,对于利用别人的短期利益来实现最大收益,因此(i)个人不遗弃自己易受反复利用的影响,并(ii)至少有些人愿意惩罚利用行为。

对于Axelrod,他们主要在重复囚犯的困境范围内研究了这些问题,所以上面确定的两个要求相同的东西。 无条件合作的战略允许个人反复利用。 为了防止这种情况,她应该只与那些类似愿意合作的人合作。 更准确地说,她应该很好(那就是她最初愿意与任何人合作),但她也应该占据(这是她应该准备与任何利用她的人合作,至少有一定的时间)。 而且,因为持续的合作是每个人的长期兴趣,因为在这种情况下,撤回未来的合作,因此是因为被惩罚是一种惩罚的形式。

然而,由于Boyd和Richerson展示了许多背景,每个人都不愿意惩罚不良行为。 重要的是,足够的人愿意这样做。 但是,这会产生一对谜题。 首先,在许多情况下,警方规范昂贵。 为了维持合作,群体经常需要他们的一些成员可以准备好参与利他主义的惩罚。 也就是说,有些人需要愿意愿意承担与惩罚相关的个人成本,因为他的利益。 其次,一些个人向警方规范的意愿不仅仅允许合作和其他女性规范的演变。 相反,它可能允许任何规范出现并变得稳定。 所以,虽然我们看到游戏理论如何有助于解释为什么遵守和警察某些规范的性格可能是道德的重要特征,但重要的问题仍然有关这是否必须从个人的角度来理解。 我们现在将转向这些问题。 在第5节中,我们将返回如何区分良好规范的问题。

3.协调道德和审慎合理性

Kavka(1984)将审议审慎合理性要求遵守审慎合理要求,将试图致力于建立遵守道德要求的遵守。 由于柏拉图哲学家已经与这个项目进行了擒抱,并且游戏理论可以帮助我们区分他们所采取的三种方法。

霍布斯在利维坦(Hobbes 1651:第15章)上幸福的挑战很好地表现了在和解项目中的股份。 这是在某些情况下保持了一个人的“最合理”的行动方案是犯下不公正。 具体而言,如果公约已经持续(或将被迫保留)承诺(霍布斯1651:15:15),那么人们应该有时打破她作为契约的一部分所做的承诺。 这是因为表演作为契约需要昂贵,并且合理性兼容性要求,如果一个人不能通过导致它们进一步获得任何东西,应避免这种成本。 该挑战在下面的图2中的决策树中示出。

决策树:链接到下面的扩展说明

图2. Foole的机会游戏[图2的扩展描述在补充中。]

在这里,克劳迪娅和劳拉通过交换承诺创建了双边契约。 但由于克劳迪娅已经履行了她的部门,劳拉知道这一点,劳拉站在愚蠢的位置,可以通过打破她的承诺和利用克劳迪娅来表演(p)作为契约(a)早期的表现。 由于这种收益结构,鉴于这一支付结构,A是劳拉独特的贝叶斯理性选择。

然而,重要的是,对于那些认可她推理的人来说,这是对人们不仅对那些挑战。 这是因为为了避免被人们喜欢像愚蠢的人那样优势,否则可能倾向于保持其承诺的个人有时会有理由打破承诺。 我们在下面的图3中看到了这一点,描绘了序列囚犯的困境,从图2中扩展了决策树来包括克劳迪娅的初步举措。

(本章完)

相关推荐