决策理论(一)

决策理论涉及代理人选择的原因,无论是乘坐公共汽车还是获得出租车之间的平凡选择,或者更广泛的选择是否追求苛刻的政治事业。 (请注意,这里的“代理人”代表一个实体,通常是一个能够进行审议和行动的个人。)标准思维是,在任何特定的场合,代理人选择做的是完全由她的信仰和欲望或价值观决定,但这并不是无助的,但是将在下面注意到。 在任何情况下,决策理论都是信仰,欲望和其他相关态度的理论,因为它是一种选择理论; 重要的是这些各种态度如何(称为“偏好态度”)结合在一起。

该条目的重点是规范决策理论。 也就是说,兴趣的主要问题是代理人的偏好态度应该在任何一般情况下满足的标准。 鉴于手头的情况,这增加了一个最小的理性,其中一方搁置了对适当欲望和合理信仰的更实质性问题。 最小账户的关键问题是治疗不确定性。 正统的规范决策理论,预期的效用(欧盟)理论,基本上表示,在不确定性的情况下,人们应该更喜欢具有最大预期期望或价值的选择。 (注意,在这种情况下,“可取性”和“值”应理解为根据所讨论的代理人理解为可取性/值。)这个简单的格言将是我们大部分讨论的重点。

本条目的结构如下:第1节讨论了“对前景的偏好”的基本概念,其位于决策理论的核心。 第2节描述了在更强大的偏好措施方面的规范决策理论的发展。 第3节讨论了欧盟理论的两个最着名的版本。 第4条考虑欧盟实际行动,推理和重视欧盟理论的重要性。 第5节转向欧盟理论的突出挑战,而第6节涉及顺序决策,以及这种更丰富的设置有关Rational偏好的辩论。

1.对前景的偏好是什么?

2.偏好的实用措施

2.1序数用力

2.2 Cardinalizing Utility

2.3 von Neumann和Morgenstern(VNM)表示定理

3.做出真正的决定

3.1萨维奇的理论

3.2杰弗里的理论

4.预期效用(欧盟)理论的更广泛意义

4.1关于理性的信念

4.2关于理性欲望

5.对欧盟理论的挑战

5.1风险和遗憾态度

5.2完整性:模糊的信仰和欲望

5.3不明确

6.顺序决策

6.1尤利西斯理性吗?

6.2重新审视欧盟公理

7.结束语

参考书目

学术工具

其他互联网资源

相关条目

1.对前景的偏好是什么?

决策理论中的两个中央概念是偏好和潜在客户(或等效,选择)。 粗略地说,当我们(在本条文中)说,代理人“更喜欢”的“选项”,我们的意思是,代理人需要更加理想或选择 - 值得的是比B.这种粗略的定义明确表示偏好是比较态度。 除此之外,还有关于偏好如何偏好的论据,实际到或换句话说,当我们谈论他/她的偏好时,它涉及我们的代理人(也许是自己)。 本节考虑了一些初级问题,即设定介绍(在下一节)职业阶段的决策表和预期公用事业规则,即许多是决策理论的熟悉主题。 根据他们出现,将在后面解决有关偏好和前景的进一步解释问题。

尽管如此,请首先通过首先介绍(Rational)偏好的基本候选物业,并仅在转向解释问题之后。 如上所述,偏好涉及选项的比较; 它是选项之间的关系。 对于我们讲的选项域,我们通过讲代理的首选项排序,这是代理在该域中的任何两个选项之间生成的选项的排序。

在下面,⪯表示弱偏好关系。 所以Aïb意味着我们对认为选项B感兴趣的代理人至少可以作为选项A.从弱偏好关系中,我们可以定义严格的偏好关系,≺,如下:a≺b⇔a⪯b&¬(b⪯a),在哪里¬x表示“这不是X的情况”。 漠不关心关系〜,定义为:a〜a~b⇔a⪯b&b⪯a。 这代表了我们对认为A和B感兴趣的代理商同样优选。

我们说⪯无论何时满足以下两个条件,⪯弱命令选项的集合:

公理1(完整性)

对于任何A,b∈s:A 1B或b⪯a。

公理2(传递率)

对于任何A,B,c∈s:如果A 1B和b⪯c那么a⪯c。

以上可以作为对选择的理性偏好的初步表征。 然而,即使是这种有限的表征也是有争议的,并且指向“对前景/期权的偏好”的不同解释。

从完整性Axiom开始,这表示代理可以在弱偏好关系方面比较S.在S的所有选项方面。是否完整性是一种合理的理性约束取决于正在考虑的类型类型,以及我们如何解释偏好这些选项。 如果选项集包括各种事务状态,那么完整性并不立即引人注目。 例如,可疑代理人是否应该能够比较世界上两个额外的人的选项,以便在六十人达到六十岁的左右的选择中取得了识字。 另一方面,如果集合中的所有选项相互作用,例如,所有选项都是投资组合,那么完整性更引人注目。 但即使我们没有限制所考虑的各种选项,也应该满足完整性是否应对偏好的含义来说。 例如,如果偏好仅仅代表选择行为或选择性,那么根据经济学家中的“透露偏好理论”,他们在经济学家中受欢迎(见1973年),那么完全满足完整性,假设必须不可避免地制作选择。 相比之下,如果偏好被理解,而是作为精神态度,通常考虑关于选项是否比另一个更好或更希望的判断,那么对上述完整性的疑虑是相关的(用于进一步讨论,见Mandler 2001)。

大多数哲学家和决策理论家都订阅了后者的偏好解释,作为一种解释的判断,而不是与选择处理和结合选择行为相同(参见,例如,Hausman 2011,2011B; Dietrich和List,2016A和2016B; Bradley 2017;虽然至少在经济经济学的背景下,但最近的“透露偏好理论”的近期防御,也可以看到2020B和Vredenburgh 2020。 此外,许多人认为,完整性不合理地要求,因为他们认为合理性只有在代理人实际持有的判决中所要求的需求,而且还没有说判决是否必须首先举行。 然而,在理查德杰弗里(1983年)之后,大多数决定理论家认为合理性要求偏好是连贯的延伸。 这意味着即使您的偏好不完整,也可以在不违反任何合理所需的条件下,在不违反任何权限的情况下完成它们。

这将我们带到过渡公理,这表示如果选择B弱优选A,并且C弱优先于B的C,则C对于A弱优先于A.最近对转运术的挑战在于上面的完整性讨论。。 但这里有一个不同的偏好解释是为了承担选项的比较。 这个想法是,偏好或判断期望,可能对显着性条件响应。 例如,假设比较汽车A和B的最突出的功能是它们可以被驱动的速度快,并且B在这方面没有差,但比较汽车B和C的最突出的特征是它们的安全性,并且在这方面,C是多于B的安全性。 此外,当比较A和C时,最突出的特征是它们的美丽。 在这种情况下,一些争论(例如,Temkin 2012)没有理由应该对关于A,B和C的偏好感到满足的转运性。其他(例如,Broome 1991a)认为转运是非常的一部分卓越关系的含义(或客观的比较可取性); 如果合理的偏好是对更好性或期望的判断,则传递性是不可谈判的。 关于汽车示例,艺术家将争辩说,完全指定选项的可取性不应改变,简单地利用它与其比较的其他选项。 选择上下文会影响代理人如何在手中感知,在这种情况下,选项的描述应该反映这一点,否则选择上下文不会影响选项。 无论哪种方式,都应该满足传递。

在偏好中有更直接的传递措施; 遵守可能降临可能降临任何违反公理的人的损失的防守。 这是所谓的金钱泵参数(见Davidson等。1955年,对于这种参数的最近讨论和修订,请参阅Gustafsson 2010和2013)。 它是基于假设,如果你至少可以像y找到x,那么你应该乐于交易后者的前者。 假设你违反过渡; 为您:a⪯b,b⪯c但c≺a。 而且,假设你现在有A.那么你应该愿意为B. B和C交易A.你应该愿意为C交易B.你严格地更喜欢C,所以你应该愿意在C加上A.现在你在与你开始的情况一样,有一个,既不是b也不是c,除了你丢失了$ x! 因此,在几个步骤中,每个步骤都与您的偏好一致,您可以在一个明显更差的情况下发现自己比您的灯光更糟糕。 如果我们想象可以重复这个过程,那么这张照片就会变得更加戏剧性,让你进入“金钱泵”。 因此,论点是,关于你的不及物偏好,有一些东西(乐于乐于乐于乐于乐于乐意上)。 如果您的偏好是传递的,那么您将不容易受到选择主导选项并用作货币泵。 因此,您的偏好应该是传递的。

虽然上述争议尚未解决,但下列假设将在本条目的剩余时间内进行:i)偏好对象可能是异质前景,纳入富含和不同的属性领域,II)偏好是选项之间的偏好是判断比较申请或选择性和选择性和III)偏好满足完整性和转运(尽管前一条条件将在第5节中重访)。 现在出现的问题是对合理偏好对选项进行进一步的普遍约束。

2.偏好的实用措施

在我们继续调查对理性偏好过度前景的情况下,偏好排序的数值代表(或测量)将变得重要。 相关的数值措施称为实用程序功能。 将发挥作用的两个主要类型的实用程序函数是序数效用函数和更多信息丰富的间隔值(或基本)实用程序功能。

2.1序数用力

事实证明,只要潜在客户/选项的集合是有限的,S中选项的任何弱顺序都可以由序数用力函数表示。 要精确,让我们说U具有域S的实用程序函数。我们说函数U表示刚刚在s中的选项之间的首选项⪯:

对于任何A,b∈s:U(a)≤u(b)⇔a⪯b

另一个方法是,当上面的保留时,偏好关系可以表示为最大化实用程序,因为它始终有利于更高的实用程序。

序数实用程序表示中唯一包含的唯一信息是从最少到最优选的over ofference所代表的代理商的命令选项。 这意味着,如果你是代表订购的顺序实用程序函数,那么任何公用事业函数U'那就是U的序数转换,也就是说,您的任何转换也满足(1)-REPRESNEN中的Biconditional你。 因此,我们说序数效用函数仅为序数转换。

上面提到的结果可以概括如下:

定理1(序数表示)。 让S成为一个有限的组,并且⪯在S弱的偏好关系。然后有一个序数效用函数,表示⪯只是在⪯完全和传递。

这个定理不应该太令人惊讶。 如果⪯在S上完整和传递,则可以从最多到最不当的方式放置S中的选项,其中一些选项可能落在相同的位置(如果它们被认为是同样所希望的),但是在没有循环,环路或间隙的情况下。 定理1只是说我们可以以代表此订单的方式分配给s的选项。 (对于定理1的简单证明,除了严格而不是弱偏好关系,咨询Peterson 2009:95.)

请注意,序数用力不是非常数学上的“强大”,所以说话。 例如,它没有有意义,可以比较不同序数公用事业集的概率预期。 例如,考虑以下两对潜在客户:第一对的元素被分配了2和4的序数实用程序,而第二对中的那些在0和5中分配了序数实用程序。让我们在每种情况下指定“扁平”概率分布,使得两者中的每个元素对对应于0.5的概率。 相对于这种概率分配,第一对序数公用事业的期望是3,其大于2.5,对第二对的期望。 然而,当我们以允许的方式转换序数实用程序 - 例如,通过将第二对中的最高效用从5到10增加 - 预期的顺序逆转; 现在比较在3到5之间。当我们转向彩票的比较评估和风险选择时,这一点的重要性将变得更加清晰。 以一致方式评估彩票/危险前景所必需的间隔值或基本实用功能。 通过同样的令牌,为了构建或概念性的效用功能,一个人通常会吸引彩票的偏好。 (虽然请参阅Alt 1936的“无风险”的基本效用,即一个不吸引彩票的“无风险”建造。)

2.2 Cardinalizing Utility

为了获得偏好排序-i.e的基本(间隔值)实用程序,即代表代理商如何订购选项的措施,但也表示有关选项之间的渴望“距离”的措施 - 我们需要更丰富的环境; 选项集和相应的首选项排序需要具有比序数实用程序的结构更多的结构。 由于John Von Neumann和Oskar Morgenstern(1944年),一个这样的帐户将在下面详细兑现。 目前,专注于理解和构建红衣主义功能的关键的选项是有用的:彩票。[1]

考虑第一次订购三个常规选项,例如,三个假期目的地阿姆斯特丹,曼谷和加夫,分别表示为A,B和C. 假设您的偏好订购是a≺b≺c。 这些信息足以代表您的判断; 回想一下,只要C获得比B更高的值比a更高的值,就可以接受任何公用事业分配。但是我们想从这种实用程序函数中推断出更多的东西 - 我们希望知道B的优先于B的优先考虑,而B是优选的多少过了一个。例如,曼谷可能被认为是随意的时代,但阿姆斯特丹在曼谷的漫长方式,相对而言。 否则曼谷也比阿姆斯特丹更好地比阿姆斯特丹更好,相比加上卡迪夫比曼谷更好。 这种关于选项之间的相对距离的信息,就偏好或期望的强度而言,正是通过间隔值效用功能给出的。 问题是如何确定这些信息。

为了解决这个问题,Ramsey(1926)和后来的冯Neumann和Morgenstern(以下vnm)提出了以下建议:我们构建一个新的选择,彩票,L,其中一个和C,作为可能的“奖品”,我们弄清楚了什么机会彩票必须达成协议,让您在曼谷的彩票和假期之间漠不关心。 基本思想是,您对曼谷的判断,相对于卡迪夫的一方面和阿姆斯特丹在另一方面,可以通过涉及卡迪夫和阿姆斯特丹的风险来衡量您认为曼谷的彩票。 例如,如果您在曼谷和彩票之间无动于衷,那么提供了非常低的机会赢得卡迪夫之旅的机会,那么您显然不关心曼谷比阿姆斯特丹更好,Vis-à-Vis-is-is vis-is-is vis-is and-is-is and 对你来说,即使是阿姆斯特丹的一小少,即,彩票,带有卡迪夫的机会而不是阿姆斯特丹的彩票,足以匹配曼谷。

以上分析假定彩票在其预期的选择或可取性方面进行评估。 也就是说,彩票的可取性有效地是每个奖项的机会的总和乘以该奖品的可取性。 考虑以下例子:假设您在曼谷的彩票和假期之间漠不关心,当彩票导致卡迪夫假期为3/4时。 称这个特定的彩票l'。 因此,曼谷是占地面积的三分之三,即在顶部的底部和卡迪夫的渴望规模。 如果我们规定U(a)= 0和u(c)= 1,那么u(b)= u(l')= 3/4。 这对应于预期的期望 - 或者,因为它通常被称为彩票的预期效用,因为1 /4⋅0+4⋅1= 3/4 = U(L')。 也就是说,彩票的可取性是其奖项的实用程序的概率加权之和,其中每个奖品的权重由彩票导致该奖品的概率决定。

因此,我们看,可以通过引入彩票选项来构建间隔值的效用措施。 顾名思义,间隔值的实用程序测量根据一些可致级刻度传送关于选项之间的间隔的相对大小的信息。 也就是说,在我们修复了测量的起点之后,公用事业公司是独一无二的。 在上面的示例中,我们可以具有例如1到a和5到c的实用程序值,在这种情况下,我们必须为4到b分配4到b的情况,因为4是1到5之间的3/4。换句话说,一旦我们分配了实用程序值A和C,L'和因此B的效用已经确定。 让我们称之为第二个实用程序功能U'。 它与我们的原始功能相关,如下:U'=4⋅u+ 1。 这种关系始终保持在两个这样的功能之间:如果你是表示偏好排序的间隔值的实用程序函数,则是另一个的另一个实用程序函数,也代表了相同的偏好排序,然后存在常量a和b,其中a必须是正的,这样u'=a⋅u+ b。 这就是说,间隔值的实用程序函数仅为正线性变换唯一。

在结束对测量效用的讨论之前,应提及关于信息的两个相关限制,应提及传送。 首先,由于选项的实用程序,无论是序数还是间隔,只能相对于其他选项的实用程序确定,因此没有作为一个选项的绝对实用程序这样的东西,至少不是没有进一步的假设。[2] 其次,通过相同的推理,如本文所讨论的,间隔值和序数效用措施都不是与效用的水平和单位间歇性地相似。 通过快速的插图,假设你和我都有上面描述的优先订购,在假期选择:a≺b≺c。 假设也是如上所述,我们在B和彩票L'之间无动于衷,有3/4机会屈服的C和1/4机会的机会。然后我们可以说给我加卡迪夫和你曼谷会相同的数量“完全渴望”作为给你的卡迪夫和我曼谷? 我们无权这样说。 例如,我们的共享偏好订购是,与我符合我在卡迪夫寻找一个梦想成真,而你只找到了一个糟糕的地段。 此外,我们甚至没有有权说,曼谷和阿姆斯特丹之间的可取性的差异是对我来说的同样的权利。 据我所知,三种选择的可取性可能从生活地狱到一个梦想成真,而根据你,从坏到相当糟糕; 这两个评估都与上述偏好排序一致。 事实上,同样可能对我们的偏好进行所有可能的选项,包括彩票:即使我们分享相同的总偏好排序,你也可能是你只是一个负面的处置 - 找不到巨大的选择,即我非常极端地找到一些优秀的选择纯粹的折磨。 因此,效用功能,无论是间隔值还是序数,不允许有意义的人际比较。 (Elster和Roemer 1993包含了一些论文讨论这些问题的论文;另请参阅社会选择理论的条目。)

2.3 von Neumann和Morgenstern(VNM)表示定理

最后一节提供了一个人对彩票的偏好的间歇值实用性,假设彩票在预期的效用方面评估。 有些人可能会发现这一点。 我们为什么要假设人们在预期的公用事业方面评估彩票? VNM定理通过将注意力转换回优先关系,有效地沿着推理的差距落下。 除了过渡和完整性之外,VNM还介绍了对彩票有理偏好的进一步原则,并表明,只要她的偏好满足这些原则,可以将代理商的偏好表示为最大化预期效用。

让我们首先以正式的方式定义彩票的预期效用:让Li是彩票集L彩票的彩票,以及概率PIK所产生的彩票李的结果,或奖品。 然后将LI的预期效用定义为:

VNM方程。

欧盟(li)

˙

=

σ

k

u(oik)⋅pik

现在,前面的假设可以正式说明:

对于任何Li,Ljīl:li⪯lj⇔eu(li)≤eu(lj)

当上面的保留时,我们说有一个代表代理的偏好的预期实用程序函数; 换句话说,代理可以表示为最大化预期实用程序。

(本章完)

相关推荐