游戏理论(一)
1。哲学和历史动机
2。游戏理论的基本要素和假设
2.1实用程序
2.2游戏和理性
2.3棵树和矩阵
2.4囚犯的困境作为战略形式与广泛代表的一个例子
2.5解决方案概念和平衡
2.6子游戏完美
2.7解释收益:游戏的道德和效率
2.8颤抖的手和数量反应平衡
3。不确定性,风险和顺序平衡
3.1信念和主观概率
4。重复的游戏和协调
5。团队推理和有条件的比赛
6。承诺
7。进化游戏理论
8。游戏理论和行为证据
8.1实验室中的游戏理论
8.2神经经济学和游戏理论
8.3游戏的人性理论模型
9.向前看:当前创新领域
参考书目
学术工具
其他互联网资源
相关条目
1。哲学和历史动机
约翰·冯·诺伊曼(John von Neumann)和奥斯卡·莫根斯特(Oskar Morgenstern)(1944年)赋予了经济学家,社会科学家和生物学家已知的形式的游戏理论。出于稍后讨论的原因,其正式框架中的限制最初使该理论仅在特殊和有限的条件下适用。在过去的七十年中,随着框架经过加深和广泛的化,这种情况在过去的七十年中,我们将以我们的前进方式进行了巨大变化。仍在进行改进,我们将回顾一些在文章结束时沿这些发展的前沿边缘的一些杰出问题。但是,至少从1970年代后期开始,就有可能充满信心地说,游戏理论是分析师套件中最重要,最有用的工具,每当她面对情况下,这是一个代理人的最佳行动(对她来说)取决于期望关于一个或多个其他代理商将做什么,以及什么是最佳行动(对他们来说),同样取决于对她的期望。
尽管仅仅自1944年以来,游戏理论才在数学上和逻辑上进行了系统性渲染,但可以在回到远古时代的评论员中找到游戏理论的见解。例如,在柏拉图的两篇文章中,拉赫斯和研讨会,苏格拉底回忆起熟食之战中的一集,一些评论员(可能是过时的)涉及以下情况。考虑一名士兵在前面,与同志们等待击退敌人的进攻。他可能会想到,如果辩方可能会成功,那么他自己的个人贡献将是必不可少的。但是,如果他留下来,他就有被杀害或受伤的风险 - 绝对无关。另一方面,如果敌人要赢得战斗,那么他的死亡或受伤机会仍然更高,现在很清楚,因为无论如何这条线将被压倒。基于这种推理,无论谁将赢得战斗,士兵似乎最好逃跑。但是,如果所有士兵都以这种方式推理 - 显然应该因为他们都处于相同的状态,那么这肯定会带来丢失战斗的结果。当然,这一点,由于我们作为分析师已经发生了,因此士兵也可能发生。这是否给他们留在他们的职位上的理由吗?相反的是:士兵们对战斗将会丢失的恐惧越大,他们越多的动力使自己摆脱了伤害。而且,士兵们相信这场战斗将被赢得胜利,而无需任何特定个人的贡献,他们必须留下和战斗的原因就越少。如果每个士兵都期待其他士兵的推理,那么所有人都会迅速将自己陷入恐慌之中,而他们恐怖的指挥官将在敌人订婚之前就陷入困境。
在游戏理论出现的时间很久以来,分析师如何系统地思考这种问题,它就发生在一些实际的军事领导人身上并影响了他们的策略。因此,西班牙征服者科尔特斯(Cortez他们降落的。由于务虚会在身体上变得不可能,因此西班牙士兵没有比站立和战斗更好的行动方针,而且还可以尽力而为。从科尔特斯的角度来看,更好的是,他的行动对阿兹台克人的动机产生了令人沮丧的影响。他非常明显地燃烧自己的船只,以便阿兹台克人一定会看到他做了什么。然后,他们认为以下内容:任何可能如此自信的指挥官,以至于如果战斗对他进行糟糕的情况,必须谨慎地摧毁自己的选择,以使这种极端乐观的理由有充分的理由。攻击有充分理由的对手(确切地说,可能是),这是明智的明智,因为他不能输掉他。因此,阿兹台克人撤退到周围的山丘中,科尔特斯最容易胜利。
这两种情况在Delium和由Cortez操纵的情况下具有共同且有趣的潜在逻辑。请注意,士兵没有通过对战斗的危险和自身利益进行合理评估,甚至主要是撤退的动力。相反,他们发现了一个合理的理由来逃跑,因为他们意识到对自己的意义有意义取决于他人对他人的意义,而其他所有人也可以注意到这一点。即使是一个非常勇敢的士兵也可能喜欢奔跑,而不是英雄地奔跑,但毫无意义,试图独自消灭迎面而来的潮流。因此,我们可以想象,没有矛盾的情况,在敌人采取行动之前,一支军队(所有成员都勇敢的军队都以最高的速度逃离。如果士兵真的很勇敢,那么这肯定不是他们想要的结果。每个人都希望所有人都站起来。因此,我们在这里拥有的是一种情况,在这种情况下,许多个人合理的决策过程(每个士兵的一个过程)的相互作用产生了任何人的意图。 (许多军队试图像科尔特斯一样避免这个问题。由于它们通常不能使身体不可能使其在经济上变得不合理:在大多数历史上,执行逃兵是标准的军事实践。在这种情况下,毕竟是每个士兵的个人合理行动方案,因为预期的跑步成本至少与住宿成本一样高。)
在莎士比亚的亨利五世(Henry V.道德品格。亨利(Henry)提出非战略考虑的原因:他担心囚犯会释放自己并威胁他的立场。但是,游戏理论家可能为他提供了补充战略(同样的审慎,虽然不是道德)的理由。他自己的部队观察到囚犯已被杀,并观察到敌人已经观察到了这一点。因此,他们知道,如果他们不赢,他们将在敌人的手上等待什么命运。隐喻,但非常有效地,他们的船被烧毁了。囚犯对囚犯的屠杀合理地向双方的士兵发出了信号,从而改变了他们的激励措施,以支持英国前景取得胜利。
这些示例似乎仅与那些发现自己处于切割竞争的情况下有关。也许,人们可能会认为,这对于将军,政客,黑手党,体育教练和其他工作涉及战略性操纵他人的其他人来说很重要,但哲学家只应对其道德道德感到遗憾。但是,这样的结论将是高度的。在现代政治哲学中,对激励措施,战略互动和成果之间相互关系的逻辑的研究至关重要,因为几个世纪以来,任何人都有这种逻辑的明确名称。哲学家与社会科学家分享需要能够代表和系统地建模他们认为人们规范上应该做的事情,还需要在互动情况下实际做的事情。
霍布斯(Hobbes)的利维坦(Leviathan)通常被视为现代政治哲学中的创始作品,该文本开始了对国家功能和正当理由的持续分析及其对个人自由的限制。霍布斯推理的核心可以直接给出如下。对于所有人来说,最好的情况是每个人都可以随意做的。 (一个人可能与心理学或意识形态有关,但这可能是同意的,但这是霍布斯的假设。)通常,这种自由的人会希望彼此合作,以实现对个人行动是不可能的项目独自的。但是,如果周围有任何不道德或不道德的代理人,他们会注意到,他们的利益至少有时可以通过从合作中获得利益而没有归还他们的利益。例如,假设您同意帮助我建造我的房子,以换取我的诺言,以帮助您建立自己的房子。我的房子完成后,我只需兑现我的诺言,就可以使您的劳动自由。但是,我意识到,如果这使您没有房子,您将有动力去我。这将使我不断地害怕您,并迫使我花费宝贵的时间和资源来保护自己。我可以通过首先打击并在第一个机会杀死您来最大程度地减少这些成本。当然,您可以预料到我的所有这些推理,因此有充分的理由试图击败我。由于我可以预料到您的理由,所以我最初对您的恐惧不是偏执的。你也不是我。实际上,我们俩实际上都不需要不道德才能实现这一相互推理的链条。我们只需要认为对方可能会尝试讨价还价的可能性。一旦一小撮怀疑进入任何一个思想,害怕被抢占的后果(首次击中之前)引起的激励措施在双方都变得压倒性。如果我们中的任何一个都有我们自己可能想要的任何资源,那么这种谋杀的逻辑就可以持续很长时间,以至于我们变得如此愚蠢,以至于想象我们实际上可以达成协议,以帮助彼此之间建造房屋首位。留给自己的设备,至少有时是自私自利的代理商可能会反复获得合作的好处,而是用霍布斯的话将其陷入“全部反对所有战争”的状态。在这种情况下,正如他生动和著名地说的那样,人类的生活将是“孤独,贫穷,讨厌,残酷和矮小”。
霍布斯提出的解决这个问题的解决方案是暴政。人民可以雇用一名政府的代理人是惩罚任何违反任何诺言的人。只要受到威胁的惩罚足够严峻,兑现承诺的成本就会超过保留诺言的成本。这里的逻辑与军队威胁要射击逃兵时所使用的逻辑相同。如果所有人都知道这些激励措施对大多数其他人都持有,那么合作不仅可能是可能的,而且可以是预期的规范,因此所有人与所有人的战争都成为了普遍的和平。
霍布斯(Hobbes)将这一论点的逻辑推向了一个非常有力的结论,认为它不仅意味着具有权利和执行合作权的政府,而且是一个“未分明的”政府,单个统治者的任意意志必须施加绝对的义务总的来说。很少有当代政治理论家认为,霍布斯(Hobbes)的特定步骤他得出这一结论既健有又有效。但是,在这里解决这些问题将使我们远离我们的话题,成为合同主义政治哲学的细节。在当前情况下,重要的是,这些细节实际上是在当代辩论中进行的,涉及使用现代游戏理论的资源对问题进行复杂的解释(例如,参见Hampton 1986)。此外,霍布斯最基本的观点是,强制性权威和政府实践的基本理由是人们自己的需要,以保护自己免受游戏理论家所谓的“社会困境”的影响,这是许多(如果不是大多数政治理论家)所接受的。请注意,霍布斯并没有说暴政本身就是理想的事情。他的论点的结构是,战略互动的逻辑仅留下了两个一般的政治成果:暴政和无政府状态。然后,明智的代理人选择暴政作为两个邪恶中的少数。
雅典士兵,科尔特斯和霍布斯政治特工的推理具有共同的逻辑,这是从他们的情况中得出的。在每种情况下,对于代理商实现其首选结果最重要的环境方面是其他代理商对其策略的期望和可能的反应。在被动世界上参数作用与在试图预期这些行为行动的世界上进行参数作用之间的区别是基本的。如果您想在山上踢一块岩石,您只需要关心岩石的质量,相对于您的打击力量,其与其支撑面粘结的程度,地面的斜率在岩石以及碰撞对脚的预期影响。所有这些变量的价值观都独立于您的计划和意图,因为岩石没有自己的利益,并且不采取任何行动来帮助您或挫败您。相比之下,如果您想将一个人踢在山上,那么除非该人无意识,束缚或其他丧失能力,否则您可能不会成功,除非您可以掩盖计划,否则您的计划直到为时已晚,以使他采取回避或防止行动。此外,应该期望他的可能回复访问您的费用,这是明智的考虑。最后,他的回答的相对概率将取决于他对您对他的回应可能反应的期望。 (考虑一下你们中的一个或两个人都比另一个人更大,或者你们中的一个是对方的老板,请考虑一下与您中的一个或两个人相关的差异。)与第二种相关的逻辑问题情况(与岩石相对的人踢人)通常会更加复杂,因为一个简单的假设例子将说明。
首先,您想越过三座桥梁跨越的河流。 (假设游泳,涉水或划船是不可能的。)已知第一座桥没有障碍;如果您尝试越过那里,您将成功。第二座桥位于悬崖下,大岩石有时会掉下来。第三个是由致命的眼镜蛇居住的。现在,假设您希望将三个桥梁排好,以相对于它们作为交叉点的优势。除非您从冒险的冒险中获得积极的享受(这在不违反任何经济学家的理性观念的情况下,您可能会很高兴(我们将在本文稍后稍后遇到的并发症),然后您的决策问题很简单。第一座桥显然是最好的,因为它是最安全的。为了排序其他两个桥梁,您需要有关其相对危险水平的信息。如果您可以研究一段时间的岩石往返频率和眼镜蛇的动作,那么您也许可以计算出第二桥上被岩石压碎的概率是10%,并且在COBRA击中了Cobra第三座桥是20%。您在这里的推理严格是参数,因为岩石和眼镜蛇都没有试图通过掩盖其典型的行为模式来影响您的行为,因为他们知道您正在研究它们。很明显,您应该在这里做什么:在安全的桥上越过。现在让我们使情况变得复杂。假设带有岩石的桥在您面前,而安全的桥则是一天上游的艰难徒步旅行。您这里的决策情况稍微复杂一些,但这仍然是参数。您必须决定是否值得交换长期徒步旅行的成本,以换取被岩石击中10%的机会的罚款。但是,这就是您必须决定的,您成功穿越的可能性完全取决于您;环境对您的计划不感兴趣。
但是,如果我们现在通过添加非参数元素来使情况变得复杂,那么它将变得更具挑战性。假设您是某种逃犯,而在河的另一侧则是您的追求者。只有当她在桥上等您试图越过的桥时,她才会抓住并射击你。否则,您将逃脱。当您选择桥梁的选择时,您会发生她在那儿试图预见您的推理。看来,当然,立即选择安全的桥梁是一个错误,因为那正是她所期望的,而您的死亡机会会确定。因此,也许您应该冒险冒险,因为这些赔率要好得多。但是,等等……如果您能得出这个结论,那么您的追求者,即您的态度也是如此,可以预期您将达到它,如果您逃避岩石,将会等待您。因此,也许您必须抓住眼镜蛇的机会;这就是她最不期望的。但是,不,不……如果她期望您期望她最不期望这一点,那么她最期待的。您意识到这一困境是一般的:您必须做最不希望的事情;但是,您最期望她最不期望的一切都是她最期望的。您似乎被困在犹豫不决。但是应该在这里安慰您的是,在河的另一侧,您的追随者被困在完全相同的难题中,无法决定要等待哪座桥如果她能找到挑选桥梁的最佳理由,那么您可以预料到同样的原因,然后避开她。
从经验中,我们知道,在这种情况下,人们通常不会永远站立并在圈子中摇摆不定。正如我们稍后会看到的那样,每个玩家都有一个独特的最佳解决方案。但是,直到1940年代,哲学家和经济学家都不知道如何数学地找到它。结果,经济学家被迫对待非参数影响,就像对参数的并发症一样。这很可能会使读者奇怪,因为作为我们的桥接问题的示例旨在表明,非参数特征通常是决策问题的基本特征。游戏理论相对较晚进入该领域的解释的一部分在于经济学家历来关注的问题。亚当·史密斯(Adam Smith)和戴维·里卡多(David Ricardo)等古典经济学家主要对大型市场中的代理商(全国家)如何互动以为自己带来最大的货币财富而感兴趣。史密斯(Smith)的基本见解,即效率最大化的代理商首先区分了他们的潜在贡献,然后自由地寻求互惠互利的便宜货,在20世纪进行了数学验证。但是,这一事实的演示仅适用于“完美竞争”的条件,即,当个人或公司不面临进入或退出市场的成本时,当没有规模经济经济时,并且没有代理商的行为是意想不到的。对其他代理商的福祉产生副作用。经济学家始终认识到,这组假设纯粹是用于分析目的的理想化,而不是任何人可以尝试(或应该尝试)制度化的事务状态。但是,直到游戏理论的数学在1970年代末期成熟之前,经济学家必须希望市场越接近完美的竞争,它将越有效。但是,通常没有这种希望在数学上或逻辑上是合理的。确实,作为严格的概括,该假设早在1950年代就被证明是错误的。
本文与经济学的基础无关,而是要了解游戏理论的起源和范围很重要,即知道完全竞争性的市场已建立在它们中的功能,使它们容易受到参数分析的影响。由于代理商不面对市场的入境成本,因此他们将在任何给定的市场开设商店,直到竞争将所有利润驱动到零为止。这意味着,如果生产成本是固定的并且需求是外源的,那么如果试图最大限度地提高其成本和收入之间的差异,则没有选择生产的选择。这些生产水平可以分别为每个代理商确定,因此无需注意其他人的所作所为。每个代理商都将同行视为环境的被动特征。可以在不求助于游戏理论的情况下应用古典经济分析的另一种情况是许多客户面临的垄断。在这里,只要没有任何客户的需求份额足够大,可以发挥战略杠杆作用,非参数考虑因素就会退出,而公司的任务仅是确定价格和生产量的结合,在该价格和生产量中最大化利润。但是,完美和垄断竞争都是非常特殊和不寻常的市场安排。因此,在游戏理论出现之前,经济学家在可以直接应用模型的情况下受到严重限制。
哲学家与经济学家分享对福利最大化的条件和技术的专业兴趣。此外,哲学家特别关心行动的逻辑依据,并且通常通过参考其预期结果来证明行动是合理的。 (道德哲学,功利主义的一种传统是基于这样的观念,即所有道德上重要的行动都是最好以这种方式证明的。)如果没有游戏理论,这两个问题都可以在非参数方面都无法分析。我们将在不久之后参考最著名的游戏(尽管不是最典型)的游戏,所谓的囚犯困境以及其他更典型的游戏。为此,我们需要介绍,定义和说明游戏理论的基本要素和技术。
2。游戏理论的基本要素和假设
2.1实用程序
从定义上讲,经济积极是具有偏好的实体。游戏理论家,就像研究实践选择的经济学家和哲学家一样,通过称为实用程序的抽象概念来描述这些选择。这是指在某些指定规模上的一些排名,即代理商从事件中衍生的主观福利或主观福利的变化。通过“福利”,我们指的是世界各州与代理人对所讨论国家的估值之间相对一致性的某些规范指数,这是通过参考某些背景框架的合理性。例如,我们可以通过参考其人均收入来评估国家的相对福利(我们可以作为某些目的的代理人建模),并且在预测和解释其行为的背景下,我们可以评估动物的相对福利。通过参考其预期的进化适应性来处理。就人们而言,在游戏理论的经济学和应用中最典型的是通过参考自己的隐式或明确的判断来评估其相对福利。这就是为什么我们在上面提到主观福利的原因。考虑一个崇拜咸菜但不喜欢洋葱的人。可以说,她将更高的公用事业与世界各州联系起来,在所有其他国家,她消耗的咸菜和洋葱少于她消耗更多的洋葱和更少的泡菜的州。这种例子表明,“效用”表示一种主观心理成就的度量,这确实是经济学家和哲学家最初受到杰里米·本瑟姆(Jeremy Bentham)功利主义影响的经济学家和哲学家的解释。然而,20世纪初期的经济学家越来越清楚地认识到,他们的主要兴趣是对边际需求减少的市场财产,而不管是由满足的个体消费者还是其他某些因素产生的。在1930年代,这种经济学家的动机既舒适地符合心理学和科学哲学中的行为主义和激进经验主义的主导地位。行为主义者和激进的经验家反对“心理满足商”等不可观察的实体的理论使用。概念而不是基于投机心理学的概念。由于萨缪尔森(Samuelson)的重新定义在1950年代成为标准,当我们说代理商行动以使她的效用最大化时,我们的意思是“实用程序”,只是无论代理人的行为表明她始终如一地行动,以使可能更有可能。如果对您来说这是循环的,它应该:遵循萨缪尔森的理论家打算“代理人行动,以使他们的效用最大化”作为重言式,其中“(经济)代理人”是任何可以准确地描述为行动的实体最大化效用函数,“动作”是从一组可能的替代方案中获得的任何实用性最大化选择,而“能力函数”是经济代理人最大化的。就像科学理论基础中发生的其他重二列力一样,这种定义的互锁(递归)系统本身不是有用的,而是因为它有助于修复我们的探究背景。