决策理论(二)
VNM地址是:因此可以表示哪种偏好? 为了回答这个问题,我们必须在涉及彩票的这种情况下返回潜在的偏好关系⪯。 VNM定理要求设置的L型彩票相当广泛:它在“概率混合物”下关闭,即如果Li,lj∈l,那么将李和LJ的复合彩票也在L.(另一个技术假设,那将不会详细讨论,是按照概率的定律,始终减少复合彩票,只涉及基本奖品的简单彩票。)
已经讨论了对偏好关系的基本合理限制 - 它略微订购了选项(即,满足传递和完整性)。 将使用以下符号来介绍偏好的两个额外VNM公理:{PA,(1-P)B}表示在概率p或b中导致概率1-p的彩票,其中a和b可以是最终的结果,但也可以是彩票。
公理3(连续性)
假设a⪯b⪯c。 然后有一个p∈[0,1],这样:
{粘度(1-p)c} ~b
Axiom 4(独立)
假设a⪯b。 然后对于任何C,任何p∈[0,1]:
{粘度(1-p)c}⪯{pb,(1-p)c}
连续性意味着没有结果a是如此糟糕,你不愿意采取一些可能导致你结束的赌博,但可能会导致你结束的结果(c),你发现你的现状是边缘改善的结果(b),只要一个足够小的机会就足够了。 直观地,连续性保证,代理人的彩票评估适当敏感彩票奖项的概率。
独立意味着当两种替代方案具有相同的某些特定结果概率时,我们对两种替代方案的评估应与我们对该结果的看法无关。 直观地,这意味着彩票之间的偏好应该仅受诸如彩票的特征; 应有效地忽略彩票之间的共性。
有些人发现连续性公理是一个不合理的合理偏好的限制。 是否有任何概率p,使您愿意接受赌博,这对您失去了您的生活和概率(1-P)获得了10美元的概率? 许多人认为没有。 然而,同样的人可能会大肆横穿街道来拿起他们掉了10美元的钞票。 但这只是拍摄赌博,这是一辆被汽车杀死的非常小的概率,但获得10美元的更高可能性! 更一般地说,虽然人们很少地想到这一点,但他们不断地拿起赌博的赌场,这些赌注可能导致即将发生的死亡,而相应的非常高的奖励机会。
在摘要中考虑时,独立似乎是合理性的令人信服的要求。 尽管如此,人们经常违反独立的着名例子而没有看起来不合理。 这些实例涉及可能的彩票结果之间的互补性。 特别众所周知的这样一个例子是所谓的Allais Paradox,法国经济学家Maurice Allais(1953)首次在20世纪50年代初推出。 悖论转向比较人们对与表1中给出的两对彩票相似的歌曲的偏好。在与特定编号的票证相关的奖励方面描述了彩票,其中一张票将被随机绘制(例如,L1导致$的奖品2500如果绘制了2-34的选票中的一个)。
1 2-34 35-100
l1的$ 0 $ 2500 $ 2400
二级$ 2400 $ 2400 $ 2400
1 2-34 35-100
第3层$ 0 $ 2500 $ 0
腰4 $ 2400 $ 2400 $ 0
表1. allais'Aldox
在这种情况下,许多人严格偏爱L2,但也没有L4(如他们的选择行为所证明,以及他们的证词),一对偏好将被称为ALLAIS的偏好。[3] 一种常见的方法来合理化allais'偏好,是在第一选择的情况下,当一个人拥有2400美元时,最终没有任何东西的风险并不合理而达更高奖品的机会。 然而,在第二选择情况下,无论一个选择都有,最小的人都可以获得0美元。 因此,在这种情况下,很多人确实认为0美元的略微额外风险是值得更好奖品的机会。
虽然上述推理可能似乎引人注目,allais的偏好与独立公理相冲突。 以下两种选择情况都是如此:无论您所做的任何选择,如果绘制最后一列中的一个门票,您将获得相同的奖金。 因此,独立意味着您在L1和L2之间的偏好以及L3和L4之间的偏好都应与该列中的奖励无关。 但是,当您忽略最后一列时,L1变为L3和L2至L4。 因此,如果您更喜欢L2,但L3在L4上方,似乎在您的偏好排序中似乎是不一致的。 并且肯定会违反独立性(鉴于如何描述选项;我们在第5.1节返回的问题)。 结果,讨论的一对偏好不能表示为最大化预期效用。 (因此“悖论”:许多人认为独立是理性的要求,但也想声称Allais偏好没有任何不合理的问题。)
决定理论家已经以不同的方式对Allais'ArDox做出反应。 当讨论对欧盟理论的挑战,将在第5.1节中重新审视此问题。 目前的目标只是表明,连续性和独立性是对合理偏好的令人信服的限制,尽管没有没有他们的批评者。 因此,结果VNM证明可以总结:
定理2(冯Neumann-Morgenstern)
让O是有限的结果组,L在概率混合物中关闭的一组相应彩票,并在L上闭合偏好关系。然后⪯如果才能满足公理1-4,如果且仅存在函数U,则从o进入真实数字集中,那么是独一无二的直线转换,相对于哪个⪯可以表示为最大化预期效用。
David Kreps(1988)给出了本定理证明的可访问者。
3.做出真正的决定
VNM定理是测量Rational Agent的优先级的强度,通过确定选项(彩票有效地促进红衣主义措施的选择)。 但这并没有让我们一直在现实世界中做出理性决策; 我们尚未真正有决策理论。 定理仅限于评估概率分布的概率分布 - 一个情况决策理论家和经济学家经常被描述为“风险的选择”(骑士1921)。
在大多数普通选择情况下,我们必须拥有或形成偏好的选择对象并不像这样。 相反,决策者必须咨询他们自己的概率信念,了解一个结果是否有所作为。 在这种情况下的决策通常被描述为“在不确定性下的选择”(骑士1921)。 例如,考虑登山者的困境决定是否尝试危险的峰会上升,她是天气的关键因素。 如果她很幸运,她可能可以访问该地区的全面天气统计数据。 尽管如此,天气统计数据与彩票设置不同,因为它们不确定可能结果的可能结果与特定日期的可能结果。 并非最不重要的是,登山者必须考虑她在数据收集程序中有多自信,无论统计数据是否适用于当天,依此类推,依此类推。
一些最庆祝的结果在决策理论地址,在某种程度上是这些挑战。 它们包括在表现出“现实世界选项”上的偏好情况,足以存在一对公用事业和概率函数的存在,而代理可以表示为最大化预期效用。 标准解释是,就像实用程序代表代理人的欲望一样,因此概率函数代表她的信仰。 理论被称为主观预期效用(SEU)理论,因为他们关心一个对她自己信仰和欲望完全以完全特征的前景的偏好(但我们将继续使用更简单的标签欧盟理论)。 在本节中,将简要讨论其中两个结果:伦纳德萨维奇(1954年)和理查德杰弗里(1965年)。
注意,这些欧盟决策理论显然规定了两件事:(a)您应该具有一致的偏好态度,(b)您应该更喜欢对您目的的手段,或者至少您应该更喜欢您评估的意味着平均会导致您的目的(CF.Buchak 2016)。 问题出现:这些处方之间的关系是什么? 欧盟表示定理似乎仍然表明,尽管出现了,但两个处方实际上只是一个:任何一致态度的人都喜欢对她的目的的手段,反之亦然。 但是难题仍然存在有很多方法可以实现一致的偏好态度,并且并非所有这些金额都更愿意让自己的真实目的。 在各种顾客中评估欧盟理论时,这种难题值得介于思想 它会稍后再来。
3.1萨维奇的理论
Leonard Savage的决策理论,如他(1954年)统计的基础,毫无疑问,在不确定性下,毫无疑问是最着名的选择性理论,特别是在经济学和决策科学中。 在“书中,野蛮人介绍了一组限制偏好,而是通过一组选项来保证存在一对概率和实用程序功能,相对于哪个概率和实用程序功能可以表示为最大化预期实用程序。 在本书出版之前的近三十年,弗兰克佩尔·拉姆(1926年)实际上提出了不同的一组公理可以产生或多或少相同的结果。 尽管如此,萨维奇的理论比Ramsey更具影响力,也许是因为Ramsey既没有给出全面证明他的结果,也没有提供它如何走的细节(Bradley 2004)。 野蛮的结果不会完整详细描述。 然而,他定理的成分和结构将被布局,突出其优势和劣势。
野蛮理论的选项或前景与彩票类似,除了可能的结果并不存在概率,而是依赖于世界特定状态是否是实际的。 实际上,萨维奇理论中的基元是结果[4]和世界各国)。 前者是最重要的或坏国家,最终对代理人影响和重要,而后者是该代理人无法控制的世界的特征,这是她对世界不确定性的遗迹。 一组状态称为事件。 结果和各国之间的区别是整齐地分开的欲望和信念:前者是根据萨维奇的理论,欲望的目标,而后者是信仰的目标。
代理商有偏好的彩票的选择是一套丰富的行为,有效地达到了世界各国的所有可能的结果。 也就是说,动作是从状态空间到结果空间的函数,并且考虑到代理的偏好排序来定义所有这种可能的功能。 其中一些行为看起来非常明智:考虑分配给事件的行为“下雨”的结果“悲惨的湿漫步”并分配到事件“它没有下雨”结果“非常舒适的漫步”。 这显然是在没有伞的情况下漫步的行为。 其他野蛮行为看起来不太明智,例如分配给“下雨”和“它没有下雨”同样的“悲惨湿漫步”的不断行为。 (请注意,常量行为提供了一种方法,包括在偏好排序中确定结果。)此法令(以及许多其他人)的问题是,它与代理人甚至原则上的任何东西都不会选择做或表现。[5]
萨维奇的行为/州(事件)/结果区别可以自然地以表格形式表示,行为作为每个州/事件列产生给定结果的行为。 表2描绘了上面提到的两个行为加上决策者可能关心的第三个行为:“手动I)”在没有雨伞的情况下漫步“,ii)”用伞漫步“,而iii)奇异的不变性。 当然,萨维奇定理所需的一组行为涉及更多的行为,该行为占各国和结果的所有可能组合。
没有下雨。雨
没有伞漫步。散步非常舒适。悲惨的湿漫步
漫步着雨伞。舒适散步。舒适散步
不变的行为。悲惨的湿漫步。悲惨的湿漫步
表2.萨维奇式决策表
在讨论萨维奇的公理之前,让我们说明他们产生的结果。 将使用以下符号:F,G等是各种动作,即来自世界各州的集合的函数到结果的集合O,具有这些功能的集合。 F(SI)表示状态si∈s的结果是实际的。 根据萨维奇的理论,F的预期效用表示为U(f),由以下方式提供:
野人的等式
u(f)=σiu(f(丝))⋅p(丝)
证明的结果萨维格可以说明如下:[6]
定理3(野蛮人)。
让⪯是F的弱优先关系。如果⪯满足野蛮的公理,则以下持有:
代理人对S中国家现实的信心可以由独特(和有限添加)概率函数P;
她的终极结果的智慧的力量可以由效用函数U表示,这是正线性变换的独特;
而这对(p,u)产生了预期的效用函数U,这代表了她对F中替代品的偏好; 即,对于任何F,g∈f:
f⪯g⇔u(f)≤u(g)
以上结果似乎是显着的; 特别是一个人的偏好可以确定代表她信仰的独特概率函数。 然而,仔细看来,很明显,我们可以通过检查我们的偏好来确定我们的一些信念。 假设您在两次彩票之间提供了选择,其中一个导致您在赢得一个不错的奖项,如果硬币出现,如果硬币出现尾部,那么如果硬币出现尾部,那么导致你赢得同样的奖金,如果硬币出现,那么就赢得了同样的奖品头。 然后假设奖品的可取性(以及类似奖品的可取性)独立于硬币落地的偏好,您的两次彩票之间的偏好应该完全由您的比较信念确定硬币可以降落的两种方式。 例如,如果您严格更喜欢第一次彩票到第二个,那么这表明您认为比尾部更有可能。
以上观察表明,可以从她的偏好中衡量代理人的比较信念,也许更多。 野蛮人比这更好地走了一步,并在偏好方面定义了比较信念。 向萨维奇的定义,让。‖。 是一个薄弱的比较信念关系,在世界各国的集合上定义。 (.≺。〜。〜。.≾。.≾。以通常的方式。)
定义1(比较信念)。
假设e和f是两个事件(即s的子集)。 假设x和y是两个结果和f和g两个行为,具有以下属性:
f(si)= x为所有si∈E,但是f(si)= y为所有siðe,
g(si)= x为所有si∈f,但是所有si∉f的g(si)= y,
y⪯x。
然后e.≾.f⇔f⪯g。
定义1基于简单的观察,即人们通常更愿意在更少的可能事件中掌握良好的结果。 但这界定了比较信念的想法似乎是值得怀疑的。 例如,我们可以想象有乐于乐于理性的人,并且由于上述条件所有保持并且他们发现比E更可能更容易更喜欢G到F.而且,这种定义提出了如何确定无动于衷的人的比较信念的问题在所有结果(Eriksson和Hájek2007之间)之间。 也许没有这样的人(而萨维奇的Axiom P5确实明确表明他的结果与这些人没有讨论)。 然而,似乎对比较信念的定义不宜排除这样的人,如果存在,有严格的比较信念。 野蛮人表明,根据他的公理P4,这种比较信念的定义是合理的,下面将在下面说明。 在任何情况下,事实证明,当一个人的偏好满足野蛮的公理时,我们可以读取她的偏好,这是一个可以由(唯一)概率函数表示的比较信念关系。
没有进一步的ADO,让我们依次露出萨维奇的公理。 如上所述,这些旨在对代理的偏好关系,⪯,超过一组动作F。 萨维奇的第一个公理是基本的订购公理。
p1的。 (订货)
关系⪯是完整的和传递的。
下一个公理是让VNM的独立公理联想。 我们说替代方案F“在事件e中的任何情况下与事件e,f和g的任何状态同意,产生相同的结果。
p2的。 (肯定的事情)
如果f,g和f',g'是这样的:
f同意G和F'在事件中与G'同意,
F同意F'和G在事件E中同意G',
和f⪯g,
然后是f'⪯g'。
当然的事物背后 以表格形式提出原理可能使这种更加明显。 设置涉及四项具有以下形式的行为:
e¬e
f x z
g y z
f'x w
g'y w
STP后面的直觉是,如果g弱优选f,那么必须是因为后果y至少考虑为x,这与相同的推理意味着G'弱优先于f'。
野蛮人还要求结果的可取性与其发生的状态无关,因为它必须确定与代理商的偏好中的比较信念关系。 要将此要求正式化,Savage介绍了NULL事件的概念,定义如下:
定义2(null)
事件e是以无效的,以防任何替代方法f,g∈f,f ~g给出的e。
直觉是,null事件是代理确定的事件不会发生。 如果且仅在代理人确定E将不会发生E时,则对其在E的产量之前的行为漠不关心。以下公理然后规定了知道什么状态是实际的不影响偏好排序:
p3。 (国家中立)
如果f(si)= x和g(si)= y,只要siðe和e没有空,那么在x⪯y的情况下给出f⪯g。
下一个公理也需要确定与代理商的偏好中的比较信念关系。 上面有人建议,通过要求您掌握奖励硬币是否抬起头部或尾部,可以确定哪些事件,头或尾部,您发现更有可能。 但如果奖项的规模不会影响您对这两个事件的相对可能性的判断,那么这一建议才是合理的。 该假设由下一个公理捕获。 由于公理相当复杂,因此它将以表格形式说明:
p4。 考虑以下行为:
e¬e
F。x。X'
G。y。y'
f¬f
f'x x'
g'y y'
现在假设:
x'⪯x,
y'⪯y,
f'⪯f
然后
g'⪯g。
不太正式(并在严格的偏好方面说明),这个想法是,如果您更愿意在F而不是F'上纳入奖品x,则必须考虑比F更为可能。因此,由于奖品本身不会影响G而不是G',因此您应该更喜欢奖项Y而不是G'事件的可能性。
下一个公理可以说是可以说出理性要求,而是萨维奇的“结构公理”(Suppes 2002)。 代理人需要有一些偏好,以便可以从她的偏好中读出她的比较信仰; 并且,更一般地,为了使她能够以最大化预期的效用。 为此,下一个公理只是要求在哪些替代方案不漠不关心之间:
p5。
有一些f,g∈f这样的f≺g。
当这五个公理满足时,代理的偏好会引起比较信念关系,即。,它具有作为定性概率关系的性质,这是可能代表的必要条件。 通过概率函数。 换句话说,。 满足以下三种条件,对于任何事件E,F和G:
.≾。 是传递和完整的,
如果e∩g=∅=f∩g,则e.≾.f⇔e∪g.≾.f∪g,
∅.≾.e,∅.≺.s。
然而,作为一种定性概率关系,不足以确保概率表示的可能性。 为确保这种可能性,野蛮地添加了以下结构公理:
p6。 (非原子性)
假设f≺g。 然后,对于任何X∈O,有一个有限的分区,{e1,e2,... em},这样:
f'(si)= x用于任何si∈ej,但f'(si)= f(si)对于任何siðej,
g'(si)= x对于任何si∈ej,但是任何si∉ej的g'(si)= g(si),
f'əg和f≺g'。
与Vnm的连续性公理一样,非原子性意味着无论结果x多么糟糕,如果g已经优选f,那么如果我们将x添加为f的可能结果之一,从而构造新的替代方案F'-g仍然是优选的对于修改的替代方案,只要X的概率足够小。 实际上,非原子性意味着S包含任意小概率的事件。 想象如何满足,这是不是太难。 例如,如果某些硬币在被抛出,则任何事件F都可以根据一些硬币填充头部或尾部。 每个子事件可以根据同一硬币的第二次折腾的结果类似地分区。
野蛮人表明,每当满足这六个公理时,比较信念关系可以通过独特的概率函数来表示。 这样做,他可以依靠VNM表示定理表明,满足所有六个公理[7]的代理可以表示为最大化预期的实用程序,相对于符号代表代理人对各州的信仰和A的独特概率函数来说合理地代表了代理人的终极结果的常用功能(回想一下上面萨维奇定理的声明)。[8] 萨维奇自己的证据相当复杂,但Kreps(1988)提供了一个有用的例证。