理性选择的规范理论:预期效用(一)
我们必须经常在不确定性条件下做出决定。 追求生物学学位可能导致利润丰厚的就业,或失业和破坏债务。 医生的预约可能导致早期的检测和治疗疾病,或者可能是浪费金钱。 预期的效用理论是如何在您不确定您的行为导致的结果时选择合理的理由。 它的基本口号是:选择具有最高预期实用程序的行为。
本文讨论了预期的实用理论作为规范理论 - 即人们如何做出决策的理论。 在古典经济学中,预期的实用理论往往被用作描述性理论 - 即人们如何做出决定的理论 - 或者作为预测理论 - 这是一个理论,虽然它可能无法准确地模拟决策的心理机制,正确预测人们选择。 预期的实用理论对人们在许多现实生活选择情况下的决策有问题(见Kahneman&Tversky 1982); 但是,这不清楚人们是否应该根据预期的效用考虑做出决定。
行为的预期效用是每个可能结果的公用事业的加权平均值,其中结果测量该结果是优选的,或者优选的替代方案。 每个结果的效用是根据该法令将导致这种结果的概率的加权。 第1节以更严格的术语拾取了预期效用的这一基本定义,并讨论了其与选择的关系。 第2节讨论了预期实用理论的两种类型:表示定理和长期统计参数。 第3节认为对预期的实用理论的反对意见; 第4节讨论了宗教,经济学,道德和认识论哲学的应用。
1.定义预期的效用
1.1条件概率
1.2结果实用程序
2.预期实用理论的论据
2.1长期参数
2.2表示定理
3.反对预期的实用理论
3.1最大化预期效用是不可能的
3.2最大化预期效用是不合理的
4.应用程序
4.1经济和公共政策
4.2道德
4.3认识学
4.4法律
参考书目
学术工具
其他互联网资源
相关条目
1.定义预期的效用
预期效用的概念最佳说明。 假设我计划漫长的散步,需要决定是否带上雨伞。 我宁愿在阳光灿烂的日子里不要戳伞,但我宁愿用雨伞拍下雨而不是没有它。 我有两项动作:用雨伞,并在家里留下它。 我应该选择哪种行为?
在三种实体方面,这种非正式的问题描述可以重新循环,稍微正式。 首先,存在非乐器偏好的结果 - 对象。 在该示例中,我们可能会区分三个结果:我最终干燥和不受控制; 我最终干燥,受到了笨拙的伞的困难; 或者我最终潮湿了。 其次,在决策者的控制之外存在各种各样的东西,这影响了决定的结果。 在该示例中,有两个状态:下雨,或者它不是。 最后,有决策者的乐器偏好的行为 - 对象,在某种意义上,她可以做的事情。 在该示例中,有两项行为:我可以带上伞; 或者把它留在家里。 预期的实用理论提供了一种根据选择性的方式排名行为的方式:预期的效用越高,选择该行为越好。 (因此最好选择具有最高预期效用的行为 - 或其中一个,如果有几项行为被捆绑在一起。)
遵循普通公约,我将对行为,州和结果之间的关系作出以下假设。
国家,行为和结果是命题,即可能性。 存在最大的可能性,ω,其中每个状态,行为或结果都是子集。
该组行为,状态集和结果集是ω的所有分区。 换句话说,动作和状态是个性化的,使得ω的各种可能性是一个恰好一个状态获得的,代理表现出一个动作,并且恰好是一个结果。
行为和各国在逻辑上独立,因此没有国家规定任何行为的表现。
我将在鉴于世界的时刻假设,每个行为都有一个可能的结果。 (第1.1节简要讨论如何削弱这种假设。)
因此,可以在以下矩阵中描绘伞的示例,其中每列对应于世界的状态; 每行对应一个行为; 每个条目都对应于在世界中行动所在行动时产生的结果。
状态
下雨了。它没有下雨
行为。采取伞。陷入干燥。陷入干燥
留下雨伞。湿。自由,干燥
设置了基本框架,我现在可以严格定义预期的实用程序。 ACT A的预期效用(例如,拍我的伞)取决于问题的两个特征:
每个结果的值,通过称为实用程序的实数来测量。
每个结果有条件的概率。
鉴于这三条信息,A的预期实用程序被定义为:
欧盟(一)=
σ
o∈o
尼龙(o)u(o)
其中o是一组结果,PA(O)是A的结果O条件的概率,而U(O)是o的效用。
接下来的两个子部分将解压缩条件概率函数PA和实用程序功能U.
1.1条件概率
术语Pa(o)表示o给定的o的概率,即将出现这种结果o的概率,在代理选择法案A的假设上会发生这种情况。(对于概率的公理,参见概率解释的进入。)要理解这意味着什么,我们必须回答两个问题。 首先,对概率的解释是合适的? 其次,在代理选择ACT A的假设上分配概率是什么意思的?
预期的实用机构经常将概率解释为衡量个人信仰程度,使得一个命题E可能(代理人)在该代理对E有信心的程度上(参见,例如,Ramsey 1926,Savage 1972,Jeffrey 1983)。 但预期效用理论的形式主义中没有任何内容迫使这一解释对我们来说。 相反,我们可以将概率解释为客观机会(如von Neumann和Morgenstern 1944),或者作为证据保证的信仰程度,如果我们认为这些是一个更好的理性行动指南。 (请参阅对讨论这些和其他选项的概率的解释。)
代理选择a的假设有概率是什么? 在这里,有两种基本类型的答案,对应于证据决策理论和因果决策理论。
根据证据决策理论,由Jeffrey(1983)认可,相关备注概率Pa(O)是条件概率p(o o o),定义为两个无条件概率的比例:p(a&o)/ p(a)。
针对Jeffrey对预期效用的定义,Spehn(1977)和Levi(1991)对象,决策者不应将概率分配给审议下的行为:当自由决定是否执行ACT A,您不应该考虑到您的关于你是否会执行A的信念。如果Spohn和Levi是对的,那么Jeffrey的比率是未定义的(因为它的分母未定义)。
Nozick(1969)提出了另一种反对意见:Jeffrey的定义在Newcomb问题中产生了奇怪的结果。 一个预测的盒子,你是一个封闭的盒子,包含0美元或100万美元,并为您提供一个开放式盒子,包含额外的1,000美元。 您可以拒绝打开框(“一箱”)或拍摄打开框(“双箱”)。 但是有一个捕获:预测器预先预测了您的选择,她的所有预测都是90%的准确性。 换句话说,你一箱的概率给出了她预测你的一个盒子,是90%,而你双手的概率,给出了她预测你的双手,是90%。 最后,封闭盒的内容取决于预测:如果预测器认为你会有两个盒子,她在封闭的盒子里放了什么,而如果她认为你会是一个盒子,她把100万美元放在封闭的盒子里。 您决定的矩阵看起来像这样:
状态
封闭盒100万美元。封闭盒中0美元
行为一框中$ 1,000,000 $ 0
两个框中$ 1,001,000 $ 1,000
双拳击占单拳:在每个状态下,双拳都产生更好的结果。 然而,在杰弗里的条件概率的定义中,单盒子具有比双拳击更高的预期效用。 在封闭盒中找到100万美元的有条件有条件概率,鉴于您的一个方框,所以一盒盒装有一个高预期的效用。 同样地,在封闭盒中找到了一个很高的有条件概率,因为你的双盒子,所以双拳有一个低预期的实用程序。
因果决策理论是围绕这些问题的替代建议。 它不需要(但仍然允许)对概率进行概率,并且它建议在Newcomb问题中推荐两个拳击。
因果决策理论有很多品种,但我会考虑萨维奇(1972)提出的代表版,通过总结了与行为A的概率来计算PA(O),导致结果o。 让FA,S(o)是一个结果,如果O在状态S中执行o将O到0映射,则将其映射到1。 然后
尼龙(o)=
σ
s∈s
p(s)发,s(o)
在萨维奇的建议上,双拳击出来的效用比单拳更高。 无论您在决策之前您分配到哪些概率,此结果都可以保持该结果。 让x成为您分配到封闭盒中包含100万美元的状态的概率。 根据野蛮人,单盒和双拳的预期实用程序分别是:
x⋅u($ 1,000,000)+(1-x)⋅u($ 0)
和
x⋅u($ 1,001,000)+(1-x)⋅u($ 1,000)
只要较大的货币金额被分配严格更大的公用事业,第二和(双拳击的效用)被保证大于第一(单盒的效用)。
野蛮人假设每个行为和国家足以唯一地确定结果。 但是存在这种假设的案例。 假设您提供销售我的以下赌博:你将折腾一个硬币; 如果硬币落地头,我赢得了100美元; 如果硬币降落了尾巴,我就会失去100美元。 但我拒绝赌博,硬币永远不会被扔。 没有结果会导致,因为硬币被扔了 - 我可能会赢得100美元,我可能已经损失了100美元。
我们可以通过让FA,S成为概率函数将结果映射到[0,1]间隔中的实数。 Lewis(1981),Skyrms(1980)和Sobel(1994)等同于FA,如果所获得的状态S和代理选择A.
在某些情况下 - 最着名的Newcomb问题 - 杰弗里的定义和预期效用的野蛮定义分开。 但只要满足以下两个条件,他们就会同意。
行为是概率主义的独立性。 在正式的条款,对于所有行为A和国家,
p(s)= p(s|a)=
p(s和一个)
p(一)
。
(这是Newcomb问题中违反的条件。)
对于所有结果o,行为A和状态S,FA,S(O)等于给定A和S的条件概率; 在正式条款,
发,s(o)= p(o|a&s)=
p(o和一个与s)
p(一个与s)
。
(在行为和国家未能独特地确定结果时出现这种情况的需求;请参阅LEWIS 1981.)
1.2结果实用程序
术语U(O)代表结果O-粗略的效用,如何有价值的o。 正式,U是将实数分配给每个结果的函数。 (与U相关联的单位通常被称为Utiles,以便如果U(O)= 2,我们说O值为2个使用者。)实用程序越大,结果越大。
在使用中测量什么样的价值? 使用者通常不会被视为货币单位,如美元,磅或日元。 Bernoulli(1738)认为金钱和其他商品的边际效用减少:由于代理人变得更加丰富,每次连续美元(或金手表)对她而言对她的价值不太有价值。 他给出了以下例子:它对富人来说是理性的感觉,但不适合贫民,支付9,000名杜卡特以换取彩票,以达到20,000只杜卡特的50%的机会和50%的机会。 由于彩票给两个男人同时在每个货币奖的机会中,奖品必须有不同的价值观,具体取决于玩家是否差或富裕。
经典的功利主义者,如Bentham(1789),Mill(1861)和Sidgwick(1907)解释了效用,以衡量快乐或幸福。 对于这些作者来说,要说A比B比B更大的效用(对于代理商或一组代理商)表示,结果比B更愉快或幸福的结果(对于那种代理商或代理商)。
对此申请解释的一个反对意见是可能没有单一的好(或确实是任何好的),合理性要求我们寻求。 但是,如果我们理解“效用”大众化,而且包括所有可能所潜在理想的结束 - 快乐,知识,友谊,健康等 - 并不清楚,在不同货物之间进行权衡,以便每个结果都有一个独特的正确方法。 对于禁令和禁令的生活在幸福的自由度的生活中含有或多或少的问题,可能没有良好的答案,但为这些选项分配公用事业而导致我们比较它们。
当代决策理论家通常将公用事业解释为偏好的尺寸,从而说A比B具有更大的效用(对于代理)来说只是说代理更喜欢A到B.这对偏好不仅在结果之间保持偏好(例如乐趣的数量或快乐和知识的组合),也是在不确定的前景之间(如彩票,如果特定硬币落地1万美元的彩票,如果硬币降落尾部,则在一小时的痛苦电击中导致一小时)。 本文第2节详细介绍了偏好与选择之间的正式关系。
预期的实用理论不要求偏好是自私或自私的。 有人可以愿意将钱捐给慈善机构在奢侈的晚餐上花钱,或者更喜欢牺牲自己的生命,让他的孩子死。 SEN(1977)表明,每个人的心理学都是最好的三个排名代表:一个代表这个人狭隘的自身利益,第二个代表这个人的自我利益,更广泛地解释了同情的感受(例如,在观看另一个人时遭受痛苦的痛苦)和第三个代表该人承诺,这可能要求她违背自我利益而被广泛解释。
布鲁姆(1991年,Ch。正如概率理论的形式主义中没有任何内容要求我们使用主观而不是客观的概率,因此预期实用理论的形式主义中没有任何内容要求我们使用主观而不是客观价值。
那些在个人偏好方面解释公用事业的人面临着特别的挑战:所谓的人际关贸比较问题。 在做出关于如何分发共享资源的决定时,我们经常想知道我们的行为是否会使爱丽丝比鲍默更好 - 如果是的话,有多开。 但如果实用程序是一个衡量个人偏好的衡量标准,就没有明确,有意义的方式来实现这些比较。 Alice的公用事业由Alice的偏好构成,Bob的公用事业由Bob的偏好构成,并且没有员工遍布Alice和Bob的偏好。 我们不能假设Alice的效用10相当于Bob的实用程序10,任何我们都可以假设在微分方程中获得一个等级相当于获得篮子编织等级。
现在是考虑实用程序函数的哪个功能携带有意义的信息。 比较是信息性的:如果U(O1)> U(O2)(对于一个人),则O1优于(或优先于)O2。 但是,如果预期的效用理论是给出有意义的结果,那么它不仅是信息的比较 - 实用程序必须携带其他信息。
要了解为什么,再次考虑伞示例。 这次,我已经填写了每个状态的概率,以及每个结果的效用。
状态
下雨(p = 0.6)它没有下雨(p = 0.4)
行为。采取伞。缠身,干燥(u = 5)缠身,干燥(u = 5)
留下雨伞。湿(u = 0)自由,干燥(U = 10)
采取伞的预期效用是
欧盟(采取)= ptake(押,干)⋅5
+ ptake(湿)⋅0
+ ptake(免费的,干)⋅10
= 5
虽然离开伞的预期效用是
欧盟(离开)= pleave(押,干)⋅5
+ pleave(湿)⋅0
+ pleave(免费的,干)⋅10
= 4
自欧盟(采取)>欧盟(离开)以来,预期的实用理论告诉我,伞比离开它更好。
但现在,假设我们改变结果的实用程序:而不是使用你,我们使用你。
状态
下雨(p = 0.6)它没有下雨(p = 0.4)
行为。采取伞。缠身,干燥(U'= 4)缠身,干燥(U'= 4)
留下雨伞。湿(U'= 2)自由,干燥(U'= 8)
采取伞的新预期效用是
欧盟(采取)= ptake(押,干)⋅4
+ ptake(湿)⋅2
+ ptake(免费的,干)⋅8
= 4
虽然离开伞的新预期效用是
欧盟(离开)= pleave(押,干)⋅4
+ pleave(湿)⋅2
+ pleave(免费的,干)⋅8
= 4.4
由于欧盟(采取)<欧盟(离开),预期的实用理论告诉我,离开伞比采取它更好。
实用功能U和U'在完全相同的方式中排名结果:免费,干燥是最好的; 在中间受到困扰,干法等级; 湿是最糟糕的。 然而,预期的实用理论在两个版本中提供了不同的建议。 因此,U'适当描述的偏好与U'适当描述的偏好必须存在一些实质性的差异。 否则,预期的效用理论是Fickle,并且在喂食同一问题的不同描述时易于改变其建议。
什么时候两个实用程序函数代表相同的基本状况? 测量理论通过表征实用功能的允许转换来回答问题,该方法可以改变它的所有有意义的功能完整。 如果我们在特征中的允许变换函数,因此我们已经指定了哪些功能有意义。
预期实用理论的捍卫者通常要求使用线性刻度来测量实用程序,其中允许的变换是全部且仅是正线性变换,即表单的功能f
f(u(o))=x⋅u(o)+ y
对于实数x>0和y。
结果实用程序的正线性变换永远不会影响预期实用工具的判决:如果A的预期效用比B可以通过功能U测量实用性,那么A的预期效用也比U的任何正线性变换来测量。
2.预期实用理论的论据
为什么选择最大化预期效用的行为? 一个可能的答案是,预期的实用理论是合理的基岩 - 这意味着最终的理性基本上涉及最大化预期的效用。 然而,对于那些发现这个答案不满意的人来说,有两种进一步的理由来源。 首先,有长期的论点,依赖于长期预期的实用性最大化的证据是一个有利可图的政策。 其次,存在基于表示定理的参数,这表明对偏好的某些合理约束需要所有的Rational代理最大化预期的实用程序。
2.1长期参数
最大化预期效用的一个原因是,从长远来看,它是为了良好的政策。 Feller(1968)给出了这个论点的一个版本。 他依赖于概率的两个数学事实:大量的强大和弱势法则。 这些事实涉及独立,相同的分布式试验的序列 - 这些设置中的一种设置,这些设置从反复投注相同的方式在一系列轮盘旋转或掷骰子游戏中。 大量弱者和强大的法律都说,大致,从长远来看,每次试验所获得的平均效用量绝大多数可能接近个人审判的预期价值。