决策理论(三)

毫无疑问,野蛮的预期效用表示定理非常强大。 然而,有两个重要问题是要询问野蛮人是否达到他的目标:1)野蛮人是否在仿真中表征了合理的偏好? 2)萨维奇的定理告诉我们如何在现实世界中做出理性决策吗? 萨维奇的理论有符合这两个要求的问题,共同占据了这两个要求。 可以说,理论的核心弱点是,当涉及构建现实决策模型时,它的各种约束和假设在不同方向上拉动,并且至少有一个约束(特别是,确定的事情原理)是在决策建模假设下的合理性应该是理论的产出,而不是输入。

萨维奇理论的一个公认的决策建模要求是,结果最大程度地是他们评估的各种方式。 如果不是这种情况,则例如,状态中性的公理是一个非常难以置信的理性约束。 例如,我们是想知道是否在周末购买可可或柠檬水,并假设我们发现每个选项如何取决于天气如何。 然后我们需要描述它们包括天气状态的结果。 因为如果我们不这样做,结果的可取性将取决于实际的状态。 由于柠檬水是,让我们假设炎热的日子比冷,这是“我本周末喝柠檬水”的结果,这取决于它是否发生在热或冷的状态。 这与国家中立的公理相反。 因此,在这种情况下适当的结果是“本周末在炎热天气中喝柠檬水”的形式。 (当然,如果还有进一步的特征,这种结果必须分成更细粒度的结果,如果有可能影响手动的选择,例如与喜欢柠檬水与喜欢热可可的朋友共享饮品的朋友分享饮品,等等。)

事实上,上述案件的结果必须足够特异性,以遏制天气状态可能看起来很无害。 然而,这一要求加剧了上述问题,即许多野蛮人所要求的野蛮人所要求定理的问题是荒谬的,因为状态/结果对的语义含量是矛盾的。 回想一下,在野蛮人的理论中排序的域名的域名从一组状态到一组结果(什么是Broome 1991a指的是矩形现场假设)。 因此,如果“在炎热的天气中喝柠檬水”是我们正在使用的结果之一,我们已经根据天气划分了一组状态,然后必须有一定的行为在寒冷的状态下具有这一结果的行为! 结果越详细(正如状态中立的合理性所需的),矩形现场假设的合理性较小。 这是野蛮框架中的内部紧张局势。 实际上,很难看出如何/为什么理性的代理人可以/应该在荒谬的行为中形成偏好(虽然看看1996年的DREIER为一个重要问题)。 然而,如果没有这种假设,代理的偏好订单将不会充分丰富地用于野蛮的合理限制,以产生欧盟表示结果。[9]

萨维奇理论中的公理是最受关注的是肯定的原则。 由于这些偏好与独立冲突(召回第2.3节),这并不难以与ALLAIS的偏好冲突(召回第2.3节)。 allais'挑战将稍后再次讨论。 目前,我们的担忧是肯定的是萨维奇理论的内部逻辑。 首先,确定原则,如国家中立,加剧了对矩形场的担忧。 这是因为如果结果足够特定的情况,肯定的原则只是合理的,以便考虑世界不同国家的结果之间的任何类型的依赖关系。 例如,如果一个人可以选择无风险的替代 - 从而保证可接受的结果 - 在患有风险之后(如在ALLAIS的问题中)的情况下,在没有任何内容的情况下,这是必须考虑的结果。 但是,如果我们在结果描述中考虑了此类依赖性,我们遇到了偏好的偏好排序的问题(参见,例如,Broome 1991a:Ch。5)。

萨维奇的理论有一个进一步的内部问题与肯定的事情有关:当建造决策模型时,原则只是合理的,使得代理商在考虑和确定这些行为的结果的世界之间存在概率的独立性。 回想一下,原则指出,如果我们有四个选择以下表格:

e¬e

f x z

g y z

f'x w

g'y w

然后,如果g弱优选F,则G'必须弱优先于F'。 然而,假设世界各国与我们正在考虑的替代方案之间存在概率依赖性,并且我们发现Z比X和Y更好,我们也发现W比X和Y更好。而且假设G更有可能比f确实,并且f'使¬e更可能比g'。 然后似乎似乎完全合理于优选g over f但f'over g'。

为什么需要概率独立问题? 对于一件事,在许多真实决策情况下,很难以这样的方式框架决策模型,即各国直观地独立于行为。 例如,假设代理人喜欢吸烟,并试图决定是否戒烟。 她生活有多长时间是影响吸烟期望的突发事件之一。 根据代理人生命的时间分配一组国家,这将是自然的。 但是,很明显,她正在考虑的选项可以影响她发现每个国家的可能性,因为它得到了很好的认识到借着吸烟减少了预期寿命。 因此,野蛮人需要替代代表决策问题 - 州不直接参考寿命,而是代理人的生理倾向以某种方式对吸烟作出反应。

也许总是有一种方法来实现决策模型,使得该行为直观地概率独立于各国。 但其中有更严重的问题。 回想一下,野蛮人正在努力制定一种决定理性代理人与对其偏好的信仰的方式,使得信仰最终可能由概率函数表示。 如果我们对现实世界的决定感兴趣,那么问题的行为应该是可识别的代理人的可识别选项(我们所看到的是可疑的)。 此外,现在我们看到萨维奇的一个合理性限制之一 - 肯定是肯定的原则 - 只有在模拟的行为概率独立于国家时,才能合理。 换句话说,如果促进相应的信仰和欲望的适当衡量标准,必须建立这种独立性。 但这就是假设我们已经有关于我们努力代表的态度的信仰的重要信息; 即她认为概率概括的国家分区独立于她的行为。

上述问题表明需要在不确定性下替代选择的选择理论。 Richard Jeffrey的理论将被讨论,避免到目前为止讨论的所有问题。 但正如我们将看到的那样,杰弗里的理论具有众所周知的问题,尽管不可逾越的问题。

3.2杰弗里的理论

理查德杰弗里的预期实用理论与野蛮人的潜在客户(即选项)的潜在客户(即选项)以及对这些前景的偏好的理性限制。 杰弗里的理论的明显优势是,现实世界决策问题可以像代理人所察觉的那样建模; 合理限制对偏好的合理性不依赖于以特定方式建模的决策问题。 我们首先描述了前景或决定设置和所产生的预期实用规则,然后转到偏好的相关性限制和相应定理。

与野蛮人不同,Jeffrey不会区分乐器和非工具欲望的对象(分别是行动和结果)和信仰的对象(世界各国)。 相反,Jeffrey假设描述事务状态的命题是欲望和信仰的对象。 一见钟情,这似乎是不可谴责的:正如我们可以有关于它是否会雨的看法,我们也可以有关于如何理想的意见。 这个设置的不舒服部分也是如此,只是命题 - 他们是普通的事务状态,代理人都有信仰和欲望。 正如代理人的偏好订购,比如周末的可能天气场景,她有一个优先订购她可能表现的可能的行为,并且在任何情况下都不是最优选的状态,这必然是最有可能是真实的。 换句话说,唯一挑选的行为是他们的实质内容 - 这些是代理人在给定情况下选择/赋予的权力的命题。 好像代理商评估自己的行动选项,相反,第三人称的观点。 如果一个人认为决策模型应该令人信服地代表所讨论的代理人的主观观点,这可以说是杰弗里理论的弱点,尽管它可能是一个没有后果的理论。[10]

在继续之前,关于命题的一个词可能有用:它们是抽象对象,可以是真或假的,并且通常用一套可能的世界识别。 可能是一个可能的世界被认为是一种抽象的表达方式是如何或者可以成为的东西(Stalnaker 1987;另请参阅可能的世界)。 例如,它在时间t下雨的命题只是它在时间t下雨的所有世界的集合。 这种特殊的命题是真的,以防实际的世界恰好是在时间t下雨的所有世界的成员。

Jeffrey理论的基本结果是,包括一个代表行为的命题的期望,包括一个代表行为所取决于命题可以是真实的不同方式的缺望,以及在这些相应的方式中的相对概率。 要更确切地说,请更确切地说,p,q等,将表示命题变量。 让{p1,p2,...,pn}在命题p的许多有限分区中是一个; 也就是说,可以实现命题P的相互不兼容但共同详尽的方式。 例如,如果P是下雨的命题,那么我们可以根据我们是否去海滩,但我们也可以将这种命题非常粗略地分配,但我们也可以根据每小时的精确毫米的雨量进行细化。 根据jeffrey的p的可取性,表示des(p),给出:

杰弗里的等式。

沙漠(p)=σides(PI的)⋅p(pi|p)

这有效地是评估p的条件预期实用公式。 如上所述,特殊情况是当P的内容是这样的,因为它被认为代理可以选择的东西,即,即行为。

Jeffrey期望公式和野蛮的预期公式的一个重要差异是,在可取性和“预期”期望之间没有区别,与在野蛮的理论中必须进行的东西,在效用之间有明显的区别,测量代理人的基本愿望为终极成果和预期的效用,衡量代理人对不确定的前景或行为的偏好。 这种矛内影像是由于没有任何意义,其中P的PI是必要是最终结果的评估; 他们自己可以被认为是在不同可能的实现方面评估的不确定前景。

关于Jeffrey的计算期望的另一个重要的事情是,它在评估的替代方案之间不承担概率的独立性,P和可能的方式可以实现替代方案。 实际上,每个PI的概率在问题上明确有条件。 谈到评估行为时,这就是说(在野蛮的术语中),该法案可能的国家结果对的概率是有关所讨论的行为的条件。 因此,我们明白代理商可以像看到她的那样描述她的决策问题; 没有要求她识别一组国家(在Jeffrey的情况下,这将是与ACT分区正交的命题空间的分区),使得各州是适当的细粒度和概率地独立于行为。

由于讨论了第3.1节中确定的事情原则(STP)的讨论,因此据讨论了杰弗里的理论没有这种公理。 由于州可能依赖于行为,因此代理可以表示为违反STP时最大化Jeffrey期望功能的值。 此外,与野蛮人不同,Jeffrey的表示定理不依赖于矩形现场假设等任何东西。 考虑到特定国家和结果的解释,该代理人不需要对人为构建的行为或命令的命运或命题进行淫乱。 事实上,只有那些主张认为可能的代理(从意义上说,她将它们分配大于零的概率)是根据杰弗里的理论,包括在她的偏好排序中。

当然,我们仍然需要某些结构假设,以证明Jeffrey理论的代表性定理。 特别地,定义了偏好排序⪯的设定ω必须是一个主题的无原子布尔代数,从中被删除,表示⊥的不可能的命题。 布尔代数只是一组。 在古典逻辑运营商和否定下关闭的命题或句子。 在所有元素都可以将其分成更精细的元素的情况下,代数是无紫红色的。 ω是无粗紫色的假设与萨维奇的p6类似,并且可以给出类似的理由:任何方式Pi可以根据哪个方式划分为两个进一步的命题,如果折腾,一些硬币将如何降落。

因此,在什么条件下,设置ω的偏好关系⪯表示为最大化的期望? 目前,偏好的一些必要条件应该是熟悉的,并且不会进一步讨论。 特别是,⪯必须是传递,完整和连续的(在VNM连续性偏好公理的第2.3节中召回我们的讨论)。

然而,下两个条件不是到目前为止被认为的两个表示定理的一部分:

平均

如果p,则q∈ω是相互不兼容的

p⪯q⇔p⪯p∪q⪯q

公正

假设P,q∈ω相互不兼容,P~Q。 然后,如果与P和Q两者相互不兼容的一些R,并且是这样的¬(R至P),那么每个这样的R为p∪r~q∪rp∪r~q∪r。

平均是杰弗里理论的占状理性条件。 它实际上可以被视为独立性的弱版本,并且肯定的事情原则,它在杰弗里的理论中起着类似的作用。 但它与ALLAIS的偏好并非直接不一致,其合格性并不依赖于STP所暗示的概率独立类型。 假设要求,没有任何命题是严格的或差的,这似乎是一个合理的要求。 当P和Q相互不兼容时,p∪q意味着P或Q为真,但不是两者。 因此,似乎合理的是,p∪q应该是比P和Q都严格地更严格更多地或不太可取的。 假设P或Q中的一个比另一个更可取。 然后,由于p∪q与两者中所需的真实性兼容,因此p∪q的期望应该严格地落在P的P和Q中的那个。 但是,如果P和Q同样理想,则p∪q应尽可能地需要。

公正的直观上诉,在杰弗里的理论中起着类似的角色,因为P4在野蛮人中确实不如平均值那么大。 Jeffrey自己在他的评论中承认:

公理是因为我们需要它,并通过我们的先行信念在我们的意思中推断出来的合理性。 (1965:147)

然而,似乎可以提出任何合理的人来满足这种公理的论点。 假设您在两个命题,p和q之间漠不关心,不能同时为真。 并且假设我们发现一个命题r,这与p和q两者是不兼容的,并且你发现比p和q都更可取。 然后,如果事实证明,您在与R和Q的P与R连接的P之间无动于衷,那么必须是因为您发现P和Q同样可能。 否则,您将更喜欢包含您发现不太可能的P和Q之一的Union,因为这为您提供了更高的命题r的机会。 然后,对于满足R满足的上述条件的任何其他命题S,您也应该在p∪s和Qq∪s之间无动于衷,因为再次,两个工会同样可能导致s。

第一个证明定理说明了偏好关系的定理,以表示作为最大化杰弗里 - 期望函数的价值实际上不是杰弗里本人,而是数学家Ethan Bolker(1966年,1967年)。 他证明了以下结果(回想起上面给出的“渴望措施”的定义):[11]

定理4(Bolker)

让ω成为一个命题的完整和无关的布尔代数,以及∖的连续,传递和完整的关系,满足平均和公正性。 然后,在ω的期望测量和相对于其可以表示为最大化性的∖的仪表测量值。

不幸的是,Bolker的代表定理不会产生任何与野蛮人一样唯一的结果。 即使一个人的偏好满足Bolker定理中的所有条件,那么它既不保证也只有一个代表她的信仰的概率函数,也不是表示她欲望的期望函数将是独一无二的直线转换(除非)她的偏好是无限的)。 甚至更差,满足所有这些公理的相同偏好排序可以表示为相对于两个概率函数的最大化性,甚至没有根据其概率达成如何订购命题的概率函数。[12]

对于那些认为唯一确定一个人的比较信念的唯一方法是看她的偏好,杰弗里的理论缺乏唯一性是一个大问题。 实际上,这可能是经济学家在很大程度上忽视了杰弗里理论的主要原因之一。 传统上,经济学家对一个人的欲望和信仰的任何谈话都持怀疑态度,这些人的欲望和信仰超出了可以通过审查该人的偏好来建立的,他们认为是一个人的行为直接透露的唯一态度。 对于这些经济学家来说,如果我们甚至不是原则,那么它是不受欢迎的新闻,通过观察她的喜好来确定理性人的比较信仰。

然而,那些不太倾向于行为主义的人可能不会发现博克尔定理中缺乏唯一性成为一个问题。 例如,James Joyce(1999)认为杰弗里的理论在这方面完全正确地获得了事情,因为人们不应该指望对一个人偏好的合理条件足够,以确定代表该人信仰的独特概率函数。 只有通过施加过于强烈的条件,因为野蛮人,我们可以实现这一目标。 但是,如果唯一性是我们的唯一性,那么我们可以在Joyce指出的情况下,为博尔克尔 - 杰弗里公理有关代理人的比较信念关系(例如,Villegas 1964提出的那些)Bolker-Jeffrey公理,确保代理的偏好可以通过独特的概率函数和唯一直线变换来表示的。

随着Jeffce的建议,它可以通过丰富这一展望,而不是向杰弗里的理论添加特定的信念 - 偏向杰弗里的理论。 例如,理查德布拉德利(1998)所示,如果一个人将布尔代数在杰弗里的理论中扩展到指示性条件,那么就符合Bolker-Jeffrey公理的扩展领域的偏好关系(以及一些相关的域)特别适用于条件的公理是可表示的,因为最大化的期望,其中概率函数是唯一的,并且期望函数是唯一的线性变换。

4.预期效用(欧盟)理论的更广泛影响

从欧盟理论与理性选择的理论或行为中的整体偏好开始,这是指出的,因为它是一个理性信仰和欲望的理论。 这部分又扩展了欧盟理论的认识论和评价承诺。

4.1关于理性的信念

有些人将欧盟理论称为贝叶斯决策理论。 这一标签带来了前沿对概率主义的承诺,即,这种信念可能以非理性疼痛为程度,可以用数字方式表示。 因此,欧盟理论与概率之间存在强烈的联系,或者更普遍地在理性偏好和理性信念之间。 (合理偏好和相关理性信念的更精致的细节不是这里的重点;在下面第5节中解决了对欧盟理论的挑战。)

有些人在理性偏好和理性信念之间取得联系,确实非常深刻地奔跑。 在光谱的远端是信仰意义的位置涉及偏好。 事实上,在第3.1节之前讨论了萨维奇理论中的这种机动。 然而,许多质疑的合理性等同于比较信念与特别是特殊的前景的偏好。 更适中的位置是将这些偏好视为所需要的,但与相关的比较信仰不相同。

(本章完)

相关推荐