博弈论与道德（二）_数学联邦政治世界观

决策树：链接到下面的扩展说明

图3.顺序囚犯的困境[图3的扩展描述是补充。]

在这一广泛的形式游戏中，这使得代理程序的顺序顺序，每个收益载体的第i个组成部分是在游戏中移动的IITH代理的支付（因此，克劳迪娅的收益是首先描绘的，因为她首先采取行动。在这里，我们可以假设克劳迪娅不同意一个人应该违反她的承诺，如果一个人的合作伙伴保持承诺，那么如果克劳迪娅怀疑劳拉可能会同意这种情况，那就出现了困境。这是因为克劳迪娅可能有理由，如果她表演，那么劳拉，已经受益，并没有进一步获得任何东西，不会回报。因此，克劳迪亚，预期（a）劳拉的侵略，决定不履行劳拉，现在可以理解，不可能表演，这样每个人都最终比他们均表现得比更糟糕。

为了占领和解项目是争辩的霍布斯，即愚蠢是不对的，而且我们不必担心，因为我们的一些合理性可能会劝告道德所要求的。而且，正如我们在上面所说，这样做有三种主要策略。

3.1不可分割的商品策略

不可分割的商品策略对某些福利提出呼吁只能通过在道德上行事来获得或保存，即愚蠢的明显未能考虑。柏拉图对乔治亚和共和国司法福利的说法是这种方法的一个例子。柏拉图坚持认为，如果一个人犯了不公正，那么一个人的灵魂将被腐败，他进一步坚持认为，有一个腐败的灵魂是所有可能的不幸（Gorgias 478C3-478E5，共和国353D3-354A7）。或者，人们可能会遵循阿奎那争辩说，像偷窃这样的不公正是一个凡人的罪，它将带来可怕的后缀（Aquinas 1271：Ii.ii问答66 A. 6）带来可怕的后果。或者强调职责的内部制裁的斯蒂威克可能会因为他们的不道德行为而遭受（Sidgwick 1874 [2011：164]）。通过博弈论镜头观察，即不可分割的商品方法建议那些怀疑在道德上行事的审慎合理性应根据股权的总量重新评估他们的偏好。例如，下面的图4说明了图3中描绘的情景如何改变，如果劳拉被说服，她将遭受成本γ＞1，因为克劳迪娅打破了她的契约，也许由于她可能觉得犯下的内疚感不公正。

决策树：链接到下面的扩展说明

图4.具有修订后的后交换游戏，[图4的扩展说明在补充中。]

这种广泛的形式游戏描绘了Laura的真正收益，包括Sidgwick将呼吁内部制裁的内疚的成本。在这个游戏中，如果克劳迪娅正如承诺，那么按照司法要求遵循P，现在是Laura的最佳反应。然而，这不是因为我们只是假设一个人无法通过违反承诺来获得。为了看看为什么，请注意，如果克劳迪娅首先打破她的承诺，那么一个仍然是劳拉的最佳反应。正如我们在讨论合作演变的讨论所示，道德不能要求我们成为吸盘。或者，为了使用Kavka的有用术语，司法可能禁止违反一个人的承诺，禁止一个人的承诺，同时允许捍卫他人不能合理地预期我们荣誉的契约（Kavka 1986：139）。因此，如果克劳迪亚通过以下劳拉冲进前劳拉违反了她的契约，那么如果劳拉以实物作出反应，劳拉的违规行为不应导致与犯下不公正相关的内部制裁。此外，请注意，即使这些不普遍觉得，内部制裁的存在也会改变事物。例如，即使克劳迪亚自己觉得违反其约定的克劳迪亚人会难以计，如果克劳迪娅知道劳拉会遭受内部制裁成本γ＞1的侵犯性侵犯，那么克劳迪亚可以预计劳拉在她也是如此在这种情况下，她在一开始就遵循PE。

3.2社会制裁策略

如果以前的和解项目依赖于代理人对自己的制裁依赖于制裁，则社会制裁策略依赖于他人施加的费用。这种策略是通过霍布斯对愚蠢和休谟对收获困境的讨论的反应的举例说明的，其中斯蒂姆斯（1998）和Sobel（2009）鉴定了先前图2中所示的游戏。霍布斯认为进攻违反契约是做出一种选择，往往是自我毁灭的选择，因为其他人不愿意进入未来的契约，其中一个人知道这样做（霍布斯1651：15：5）。同样，休谟认为，我们承诺旨在创造对未来行为的期望，并且我们保留承诺，以便保护我们希望进入和受益于未来契约（Hume 1740：3.3.5：8-12）所需的其他人的信任。随着我们早先讨论期待合作的演变，我们可以利用重复游戏理论来阐明这一战略。

当代理参与一系列相互作用时，每个都可以被称为单个非自由度游戏，然后它们可以采用历史依赖性策略，其中他们在游戏的任何特定迭代中的行动取决于在先前迭代中采取的行动。早期，游戏理论家认识到，当代理商在无限期地重复的游戏时，他们可以使用此类策略到达均衡，其中包括从未重复的任何组成游戏的部分均衡的行为。这种洞察力导致了一系列被称为民间定理的成果，该定理建立了历史依赖策略的简档将是无限重复的比赛的均衡。 Sugden（1986）和Skyrms（1998年）是第一个争论霍布斯对Veope和Hume对承诺分析的回应的讨论者存在原始民间定理论点。

为了说明民间定理如何支持社会制裁策略，假设劳拉和克劳迪娅有兴趣彼此交流，其状况具有下文图5所示的囚犯困境的结构。

派对2（劳拉）

p一个

派对1（克劳迪娅）p。（2,2）（0,3）

一个（3,0）（1,1）

p =执行，a =预期

图5.囚犯的困境

这个囚犯的困境与图1的尸体的困境是结构相同的，但在这里，我们在这里诠释了各方的策略。（a，a）是该游戏的独特均衡，其特征是劳拉和克劳迪娅的特殊互动彼此。但是，如果我们认为他们的互动是他们将互相进入其社区和其他成员的无限相互作用序列之一，那么他们可以遵循历史依赖策略。由Sugden（1986年）制定的一种这样的策略是防斗战略：

H *：如果我现在的伴侣是无辜的，请遵循P，然后遵循如果她有罪，

如果她在过去的某个时候预测或侵犯了一个无辜的合作伙伴，那么一个人有罪，否则她是无辜的。如果克劳迪亚预计她的所有合作伙伴在无限重复的囚犯的困境中关注H *，那么H *可以是克劳迪娅的最佳反应。例如，如果克劳迪娅和劳拉在囚犯的困境中遇到时都是无辜的，那么如果克劳迪娅遵循H *，她会表演并保持无辜，所以她可以期待她的合作伙伴在未来的迭代中与她一起表演，因为他们也跟随她们。另一方面，如果克劳迪娅对劳拉预测，那么克劳迪亚变得内疚，她应该期待未来的合作伙伴在未来的迭代中预期，因为H *所需的未来迭代。换句话说，如果克劳迪亚对迭代囚犯的困境序列持续存在的足够高的期望，那么从进攻性违反她与劳拉的契约中的短暂福利将被未来的互利互动的长期收益淹没H *启用和预测排除。此外，保持她的声誉完整的长期好处意味着只要克劳迪亚的折扣率不太高，那么即使她与劳拉误读了事物，也可能是真实的，并且被她利用。最后，因为他们的情况是对称的，H *可以是劳拉和所有其他社区成员的最佳反应，只要他们都希望大多数其他社区成员都关注H *。

上面的讨论表明，遵守司法要求避免违规违规的契约可能是合理的，尽管在任何特定的情况下可能似乎都没有理性。就像不可分割的商品策略一样，社会制裁策略意味着难以误解的是误导，这些游戏表征了道德对我们有所要求的社会互动。然而，在不可分割的商品策略表明，斯洛梅忽视了一些货物的道德行为，社会制裁策略警告了他们应该关注的游戏，这不是任何特殊的互动，而是无限期地区的社会互动。他们不可避免地参与其中。也就是说，每个代理采用H *的战略概况不是无限期重复囚犯困境的唯一可能的均衡。事实上，这种游戏的可能均衡存在巨大数量，其中许多人不涉及使用H *战略的任何个人，而不是所有这些都会导致所有（甚至最多）代理人遵守其承诺的合作结果。

3.3改革决策理论策略

与不可分割的商品和社会制裁策略相比，质疑愚蠢的方案表征导致道德和理性之间的情景，改革的决策理论战略建议，像愚蠢的代理商重新审视他们对理性选择的理解。特别是它提出了一个理性选择的陈述，这些选择比正统的贝叶斯账户更微妙，根据哪种理性选择是最大化预期效用的相当直截了当的问题。 David Gauthier（1986）和Edward McClennen（1990）是这种方法中最突出的示例，通过Gauthier提出了一个受约束的最大化和McClennen的原则，是解决方案的原则。为了便于阐述，我们专注于Gauthier。

通过协议，Gauthier的道德区别于直接的最大化器和约束的最大化器之间。直截了当的最大化器是一个正统的贝叶斯，在任何特定的时刻，选择，以便让她的预期效用最大化，因为她对相关的有关国家和她的同行可能会产生的选择。另一方面，一个受限制的最大化器通过做她的部分来从正统贝叶斯的推理中离开正统和最佳的结果，如果（i）她希望她的同行能够在提出这一结果的情况下，以及（ii）她的利益所有遵循它的结果。受限制的最大化器会限制她一些时间的追求她的兴趣，但如果她希望她的对应物充当最大的最大化者，或者如果她没有受益于相对于情景约束她的行为，则恢复直截了当的最大化没有人限制他们的行为。

例如，如果克劳迪亚是一个受约束的最大化器，那么在图5中描绘的囚犯的困境中，如果她认为劳拉也是一个受限制的最大化器，但会预期如果她相信劳拉是一个直截了当的最大化器。了解限制最大化如何修改代理人的行为的一种方法是将一个人的理性原则作为参与囚犯困境游戏的元策略。如果克劳迪娅和劳拉各自采用直接的最大化器（SM）或约束的最大化器（CM）元策略，那么图5中描绘的囚犯的困境被转变为下面图6所示的游戏。

派对2（劳拉）

cm sm

派对1（克劳迪娅）厘米。（2,2）（1,1）

sm（1,1）（1,1）

CM =约束最大化，SM =直接最大化

图6.囚犯困境的Meta-Strategy游戏

在这里，无论对方遵循的策略如何，一个始终至少也是如此遵循厘米，而不是SM。也就是说，CM是克劳迪娅和劳拉的弱优势策略，（cm，cm）是独特的帕累托 - 最佳纳什均衡。 Gauthier认为，至少有各种各样的社交困境，其中限制最大的最大票价，并且最直接的最大化器，并且通常可以严格更好地票价，只要代理人对受限制或直截了当的最大化彼此充分清晰地充分清晰。因此，Gauthier得出结论，代理商应该采取受限制的最大化原则，而且，当他们这样做时，遵守道德要求与理性选择一致。

3.4和解项目的限制

正如我们所看到的那样，博弈论已被纳入对帐项目的每个主要方法。然而，游戏理论分析也可以展示为什么这些策略中的每一个都可能与审慎合理性充满努力调和道德。例如，对于不可分割的商品策略是有效的，必须说服像傻瓜这样的代理商，只有所做的货物是如此巨大的价值，或者与不公正相关的费用是如此重要，这是一个不公正的风险愚蠢的风险。但它远非很明显，这始终（甚至通常）是真实的。

同样，虽然人们可以向社交制裁争论呈现在道德上的代理，但这些论点依赖于社会的成员愿意制裁不良行为并能够如此有效地进行，而且这绝不是保证。事实上，这是难以清楚地预测的规范的功能分析。例如，除了突出条件策略的重要性以及愿意制裁不良行为的意愿Axelrod（1984）还强调了雇用易于其他人来解释的策略的重要性。虽然Bicchieri（2006）强调，在不清楚适用的情况下，易于出现的问题，而Boyd＆Richerson（2005）则引起关注与警务规范相关的成本。因此，愚蠢的可能对象，即使她的社区所有成员致力于尽可能地追随像防斗战略的东西，也不明显他们能够可靠地遵循它。事实上，双肢策略依赖于一些相当苛刻的认知假设，包括特别是社区成员可以可靠地区分内疚和无辜的合作伙伴，这可能越来越不太可能随着社区的规模增加而越来越不可能。

此外，由于民间定理意味着，虽然社区的所有成员当然可以遵循像H *这样的策略，但在像Foole发现自己的情况下，也可能有许多其他均衡。此外，这些均衡中的一些可能很难彼此区分，特别是如果像傻瓜这样的代理人足够少见，并且在这些均衡中的一些情况下，它可能是难以进攻违反契约的兴趣。然后，社会制裁策略的有效性明显依赖于社区成员建立和维持可靠的声誉的能力，并依赖于彼此的互动中的这些信息。

最后，通过Gauthier和McClennen提出的改革决策理论战略核心的防御性原则依赖于代理人采取倾向的能力，以便有条件地遵循某些亲社会战略，无论是在行动时代的代理人的最佳利益。然而，这种策略的批评者质疑以这种方式对她的过去的承诺束缚，他们还确定了许多案例，在那里既不是代理人的短暂也不是长期的兴趣。此外，虽然Gauthier对受约束最大化的好处的分析是类似的，但在某些方面是Bicchieri分析社会规范如何将混合动机社会困境转变为协调游戏，但后者依赖于A中的制裁（或对制裁的期望）前者没有的方式。结果，即使代理商可以可靠地采取倾向，以限制其未来的行为，对于规则，如受限制的最大化，使其实际工作必须能够承认谁并且尚未采取有关的性格。然而，一些评论家怀疑我们可以可靠地认识到谁采用这种处置。当然，改革决策理论战略的支持者非常了解这些批评，并对他们的作品提出了谨慎的回应。然而，到目前为止，其批评者尚未努力，而改革的决策理论策略一直是这里描述的方法的最少影响。

4.博弈论和合同主义

可以说，在道德和政治哲学中最具系统地利用博弈论一直处于合理道德或政治秩序的合同方法中。哲学家通常将社会合同作为一系列规范社区成员互动的规则。通过提供正式的互动决策模型，博弈论明显与对此类合同的分析有关。尽管如此，对社会合同的游戏理论分析特别鲜明的是重点是讨价还价的问题。正如我们将讨论的那样，NASH讨价还价问题提供了一个简单但灵活性和概念上强大的框架，用于识别可能包含合同的哪些规则，可以说是对社区每个成员的互利（或可接受的）。在我们遵循的两个小部分的主要文本中，我们试图展示此框架的相对非技术概述。如果对概念的正式特征很重要，或者在讨论技术问题的讨论可能会为某些读者身上照明，我们已经在各个小节结束时出现的讨论。为了更彻底地分析合同辩护，以证明道德和政治命令的辩护，包括进一步讨论这些技术问题的一些问题，请参阅当代对社会合同的途径进入。

4.1讨价还价问题

正如Gauthier（1986）所说，讨价还价问题通过建模有部分冲突利益的缔约方可能会达到一组相互可接受的规则，为社会合同进行合同分析，为他们所能遵循他们自己的优势，为社会合同进行了合同分析。这与Harsanyi（1953,1955,1977），Rawls（1958,1971）和Scanlon（1982,1998）的契约主义方法形成鲜明对比，该杨氏（1982年，1998年）是社会合同作为理性选择的对象旨在确保选择的限制是适当的不偏见，并且原则上可以由单一代理制成。 Braithwaite（1955）是第一个使用纳什议价问题衍生社会契约的案件，以便公平地分为两个索赔人之间的资源规则。后来，汉普顿（1986年）和Kavka（1986）认为，通过设计创建英联邦的霍比亚设备包括纳什议会问题的元素。 Gauthier（1986年）和Binmore（1994年，1998年）使用了纳什议价问题，以发展分配正义的独立理论。最近，Muldoon（2016）和Mohler（2018年）使用了纳什议价问题来模仿深度多元社会的成员如何安静地找到生活规则的问题。

纳什特征是讨价还价的问题，作为（i）一个可行的回报的组合，即一组代理可以实现与各种动作相关的代理商，代理必须共同同意遵循，并且（ii）指定每个代理的非识别点如果他们未能遵循任何这些联合行动集。纳什讨价还价问题的一个例子是下面图7所示的2代理葡萄酒问题。

代理2（劳拉）

d h

代理人1（克劳迪娅）天。（0,0）（0,1）

h（1,0）（-1，-1）

d = dove（索赔无），h =鹰（索赔全部）

图7.葡萄酒问题

在这场比赛中，克劳迪娅和劳拉每次都有两种纯粹的策略：鹰（H），它是索取一瓶可用的葡萄酒，或鸽子（D），这是将瓶子留给另一瓶。游戏在纯策略中有两种纳什均衡：（H，D），最有利的结果，最有利，（D，H），最有利的结果对劳拉最有利。如果两者都试图要求瓶子，所得到的（h，h）结果他们的战斗，也没有得到任何葡萄酒，他们都是最糟糕的结果。葡萄酒问题是冲突协调游戏的一个例子（Vanderschraaf＆Richards 1997），所谓的，因为它有多个均衡，任何代理商只能通过协调他们的行动来实现，并且在冲突的偏好方面的协调复杂的地方不同可用均衡的代理商。[1]

人们可能认为葡萄酒问题的自然解决方案是针对克劳迪娅和劳拉到每个口瓶的一半。因此，图8如此说明了葡萄酒问题的扩展版本，其中每个代理现在具有第三纯策略，其中她声称瓶瓶。

代理2（劳拉）

d是h

代理人1（克劳迪娅）天。（0,0）（0，

）（0,1）

是（

，0）（

，

）（-1，-1）

h（1,0）（-1，-1）（-1，-1）

d =鸽子（索赔，没有），m =中度（一个半），h =鹰（索赔全部）

图8.扩展的葡萄酒问题

在这场比赛中，如果他们的索赔兼容，劳拉和克劳迪亚每人都收到她声称的葡萄酒数量，即如果有足够的葡萄酒来满足每个索赔。但是，如果他们的索赔不相容，他们会战斗。现在有一个新的纳什均衡，（m，m），劳拉和克劳迪娅每个人每人都收到一半。这不是一个上面的结论，它们将沉淀到（m，m）中，但是，对于（h，d）和（d，h）保持均衡，并且前者仍然是克劳迪娅最优选的，并且后者最优选的是Laura。

此外，如果每个人可以解决一半瓶子，为什么他们不应该索取其他股票？下面的图9总结了当克劳迪亚可以要求葡萄酒和劳拉的任何份额X1时出现的讨价还价问题，并且劳拉可以类似地索取任何份额X2。

（本章完）

博弈论与道德（二）

相关推荐

缪斯乐园

陶者碎文录

异兽笔记

久柉神识述世间百态

翔霖：旧爱拾起

余妄—春篇