4.2.1单代理方法
有趣的是,智能代理概念的起源在于哲学。
首先,在追溯到亚里士多德的古典哲学传统中,与实践推理有着直接的联系。在这里,人们关注以三段论方式对行动的推理,例如从奥迪1999,第1页提出的以下示例。 729:
我会锻炼吗?
慢跑是运动。
因此,我会慢跑。
尽管这在熟悉的亚里士多德理论推理传统中具有演绎三段论的形式,但经过仔细检查,这种三段论似乎并没有表达纯粹的逻辑推论。 (结论并未从逻辑上遵循前提。)它构成了代理人决定的代表(前往慢跑),在该决定中,该决定基于代理人的心理态度,即。他/她的信念(慢跑是运动)和他/她的欲望或目标(我会锻炼的)。因此,正如Wooldridge(2000)所说,实用的推理是针对行动的推理,弄清楚该怎么做的过程。基于信念和欲望等精神状态的下一步做什么的推理过程称为审议。
丹内特(Dennett,1971)提出了故意立场的概念:通过对待实体的行为来解释实体行为的策略,好像它是一种理性的代理人,它通过考虑其信念和欲望来管理其行动选择。因此,它是所谓的设计(功能)姿态的拟人实例,对形态度,对应系统。事实证明,这种立场不仅在认知科学和生物学/伦理学(与动物行为有关)方面具有极大的影响力,而且是对人造药物的思考的起点。
最后,最重要的是,哲学家迈克尔·布拉特曼(Michael Bratman,1987)的作品,尽管首先针对人类代理人,但它奠定了BDI对人工代理人的基础。特别是,布拉特曼(Bratman)提出了描述代理行为的意图概念的理由。意图在选择所需的行动的选择中起着重要作用,并在如此选择的动作上附加了独特的承诺。除非有放弃承诺的理由(例如,已经实现了意图或认为无法实现的意图的信念),代理人应该坚持 /坚持其承诺,坚持下去,可以说,可以说,并且尝试实现它,
布拉特曼(Bratman)的哲学出版后,研究人员试图使用逻辑手段对这一理论进行形式化。我们在这里提到三种著名的方法。 Cohen and Levesque(1991)试图以线性时间的时间逻辑来捕捉Bratman的理论,他们为信仰和目标增加了原始的操作员,以及一些操作员来满足行动,例如表达行动即将成为行动的操作员执行(FENSα),刚刚完成了α),哪种药物是原始作用的参与者(Actiα:Agent I是α的参与者)。通过这个基本的设置,它们建立了一个框架,其中最终根据其他概念定义了意图概念。实际上,它们定义了两个概念:tirt_to_do和tirt_to_be。首先,他们定义了成就目标的概念(A-goal):A-CALAL是以后保持目标的目标,但现在认为现在不是真实的。然后,他们定义了一个持续的目标(P-goal):P-goal是一个目标,在被认为是不可能实现或被认为是不可能的之前,它没有被丢弃。然后,采取行动的意图被定义为采取行动的P-目标,以使代理商意识到这一行动的发生。达到满足ϕ的状态的意图是采取某些行动的p-goal,因此代理人意识到导致ϕ的事情,因此实际上发生的事情并不是代理人明确没有的事情作为目标。
接下来是Rao&Georgeff使用分支时间的时间逻辑CTL对BDI代理的形式化(Rao and Georgeff 1991,Rao and Georgeff 1998,Wooldridge 2000)。除了CTL之外,他们还介绍了模态操作员(BEL),目标(目标)(有时被欲望(DES)取代(des)和意图(TO_BE善良,打算),以及操作员来谈论成功(成功(e)(e) )和基本操作的失败(失败)e。因此,他们不是试图根据其他概念来定义意图,而是将意图作为单独的操作员引入意图,其含义后来受“合理”公理的约束。正式的语义基于Kripke模型,具有信念,目标和意图操作员的世界之间的可及性关系。但是,这里可能的世界是完整的时间树(对代理的各种行为进行建模),以通常的方式来解释CTL公式。接下来,他们提出了许多假设/公理,它们在操作员之间找到合理的相互作用,并相应地约束逻辑模型,以使这些公理成为有效性。例如,他们提出公式目标(α)→BEL(α)和意图(α)→目标(α),对于某些类别的公式α,其中α= E(ψ)是一个典型的例子。这里E代表CTL中存在的路径量词。 Rao和Georgeff还表明,人们可以以其逻辑表达承诺策略。例如,以下表达了“一心一意”的代理人,该代理一直致力于其意图,直到它认为它已经实现或认为它是不可能的(这与我们在方法中的意图定义中所看到的非常接近Cohen和Levesque):
意图(a⬦ϕ)→((aintect(a⬦ϕ))直到(bel(ϕ)∨贝尔(e⬦ϕ))))))
其中一个代表CTL中通用路径量词的位置。
最后,Van Linder等人是Karo方法。 (van der Hoek等,1998,Meyer等,1999),它将动态逻辑作为基础而不是时间逻辑。首先,核心是建立的,由命题动态逻辑的语言组成,并与模态操作员(k),信念(b)和欲望(d)以及具有执行动作能力的操作员(a)组成。接下来,该语言主要是通过缩写(根据其他操作员的定义)来扩展的,以获得符合BDI的逻辑。最杰出的运营商是:
采取行动的机会(这意味着可以执行该行动的方式导致下一个状态)
对主张采取行动的实际可能性(采取行动的能力和机会的结合,以及行动执行导致主张真相的说法)
可以对主张采取行动(知道对手头的主张采取行动的实际可能性)
断言的可靠性(存在计划的存在,即一系列原子行为,代理有可能在手头上的断言中执行的实际可能性)
关于断言的目标(断言的结合是可取的,不是真的,但可以实现)
可能打算就断言采取行动(表达代理人可以对他知道这是他的目标的主张采取行动)
此外,该框架还采取了特殊的行动和不合同的行动来控制代理商的承诺。这些动作的语义是使代理显然只有在有充分理由的情况下才能采取行动α。具有已知目标ϕ的结果可能存在α的意图。此外,药剂不能不集中某种动作α是代理人承诺的一部分,只要有一个充分的理由将其投入α,即只要涉及α的可能意图。这导致在karo中具有以下有效性:(这里i(α,ϕ)表示可能的意图算子,而com(α)是一种表达代理作用α的操作员,这与Cohen&Levesque相似,这与Cohen&Levesque的作用类似Cohen and Levesque 1990年的意向操作员Intend1。)
⊨I(α,ϕ)→⟨commit(α)⟩com(α)⊨I(α,ϕ)→€ununcommit(α)⊨com(α)→⟨uncommit(α)⟩ -COM(α)⟩com(α)⊨com (α1;α2)→kcom(α1)∧K[α1] com(α2)
这些公理会非正式地说:如果代理商可能打算采取行动来实现某个目标,那么它就有机会承担此行动,然后将其记录在其议程上;只要代理人可能打算采取行动,就无法不集中(这反映出承诺的持续形式:只要有充分的理由在议程上制定计划,就必须继续!);如果代理人致力于采取行动,它将有机会不参与其中(但它可能缺乏这样做的能力,请参见上一个公理);如果代理人承担了两个动作的序列,则它知道它已致力于第一个动作,并且还知道,在执行第一个动作后,它将承诺将其投入第二个动作。
除了关注BDI风格的代理逻辑传统中的动机态度外,Karo框架还提供了认识和吸毒态度的广泛描述。在van Linder等人中,这是最完全解决的。 1995年。这项工作将人工智能与哲学之间的一系列研究涉及。 动态的认知逻辑,其根源在于哲学,语言学,计算机科学和人工智能!动态认知逻辑(DEL)是知识变化的逻辑。这与一个特定的逻辑系统无关,而是关于整个逻辑家庭,使我们能够指定代理的知识和信念的静态和动态方面(参见van Ditmarsch等,2007)。该领域结合了哲学的见解(关于信仰修订,AGM风格(AGM 1985),正如我们在第1节中看到的那样),语言学和语言哲学的动态语义(如我们在第2节中所见),有关程序的推理,通过使用动态逻辑(我们在第3节中看到的)以及关于知识和行动如何相互影响的人工智能中的思想(Moore 1977)。更普遍地,我们可以看到van Benthem及其同事所主张的信息变化的逻辑分析的影响(van Benthem 1989,van Benthem 1994,Faller等,2000)。 Veltman的默认推理的更新语义(Veltman 1996)是人工智能中的重要推理方法(Reiter 1980; Russell和Norvig 1995),也可以看作是该范式的一部分。
出于本条目的目的,有趣的是,所采用的一般方法是应用行动逻辑,即。动态逻辑,以建模信息更改。这相当于一种方法,即将认知(或吸毒)更新置于逻辑中,因为它改变了代理的认知/作用状态。因此,例如在van Linder等人中。 1995年,我们遇到了诸如扩展(ϕ),合同(ϕ),修订(ϕ)之类的行为,分别指扩展,合同和修改,分别对公式ϕ的信念。可以通过将它们放入动态逻辑框和钻石中来理解这些问题,以便基本上使用动态逻辑扩展来进行这些更新的推理。进一步表明,这些动作满足AGM假设,因此可以将这种方法视为AGM框架的模态对应物。精神非常相似的是Segerberg(1995)对动态Doxastic逻辑(DDL)的工作,这是信念变化的模态逻辑。在DDL的模态算子中,[+ϕ],[*ϕ]和[ - ϕ]的形式运算符分别以非正式的含义引入:“在代理人通过线体扩展/修订/签约了他的信念之后”。结合“标准”的Doxastic操作员B,其中B ϕ被解释为“代理信念集中”,现在可以表达诸如[+ϕ]Bψ之类的属性,表达了在扩展其信念之后,代理人相信ψ(Agent相信ψ(也参见Hendricks and Symons 2006)。
最后,在本小节中,我们提到了最近的工作,其中karo形式主义被用作描述代理人认知行为的其他方面的基础,即“超越bdi”,即。关于情绪的态度(Meyer 2006; Steunebrink等,2007; Steunebrink等,2012)。这种方法的结果是,可以采用诸如卡罗之类的表现力逻辑来描述某些信息和动机态度,例如某些信仰和目标(''情感启发'),以及一旦引起了代理人的情绪状态,可能会影响其行为,尤其是其对下一步行动的决策。
4.2.2多代理方法
除了逻辑指定单一代理的态度外,还进行了将多代理系统的态度描述为批发的工作。首先,我们提到了Cohen&Levesque在这个方向上的工作(Levesque等,1990,Cohen and Levesque 1991)。这项工作对Karo的多代理版本产生了重大影响(Aldewereld等,2004)。共同目标概念中的一个重要复杂性涉及目标的持久性:在单一代理商中,代理人追求其目标,直到它认为它已经实现了,或者相信在多个代理商的背景下,它永远无法实现它意识到这一点的代理商必须将其告知团队的其他人,以便整个团队/团队都会相信这种情况并可能会删除目标。这是在上述方法中捕获的。相关工作,但在严格意义上不是行动的逻辑,涉及集体意图的逻辑处理(Keplicz and Verbrugge 2002)。
在这里还必须提到,受到Del和DDL所描述的知识和信念更新的启发,其中包括Del和DDL的知识和信念更新,并结合了常识群体中的知识(例如,参见Meyer和Meyer and Meyer和范德·霍克(Van der Hoek)1995),一个全新的子领域已经出现,可以看作是动态认知逻辑的多代理(反)部分。这涉及诸如公开公告的逻辑之类的问题,以及对代理人群体知识产生影响的更普遍的行动。这产生了不同作者的大量工作,例如Plaza(1989),Baltag(1999),Gerbrandy(1998),van Ditmarsch(2000)和Kooi(2003)。例如,公共公告逻辑(Plaza 1989)包含形式[ϕ]ψ的操作员,其中ϕ和ψ都是逻辑的公式,表达了“在公告ϕ之后,它认为ψ”。该逻辑可以再次看作是动态逻辑的一种形式,其中[ϕ]ψ的语义子句读取(以非正式的术语):[ϕ]ψ在模型状态对中是正确的,如果该模型中的真相是ϕ的真相。状态对意味着模型国家对中的ψ的真实性,其中状态是相同的,但是模型被转换以捕获ϕ中包含的信息。在其他方法中,通过传达信息引起的模型的转换起着重要作用,特别是在Baltag等人的方法中。 关于动作模型(Baltag 1999,Baltag and Moss 2004)。这种方法中的一个典型要素是,在行动模型逻辑中既具有认识论和行动模型,并且通过认知动作(影响一组代理的认知状态)对认知模型的更新则由a(该认知模型的模态产物和与该动作相关的动作模型。 (参见van Ditmarsch等人,2007年,第151页;这本书是对该领域的最新全面参考。)
最后,我们提到逻辑,将游戏理论的概念纳入了有关多代理系统的理由,例如游戏逻辑,联盟逻辑(Pauly 2001)和交替的时间逻辑(ATL,我们在主流计算机科学的末尾也遇到了这些逻辑!)及其认知变种Atel(Van der Hoek和Wooldridge 2003,van der Hoek等,2007)。例如,游戏逻辑是PDL的扩展,以推理所谓的2个玩家游戏。有趣的是,这些逻辑与我们在哲学中遇到的Stit方法之间存在联系。例如,与Herzig和Troquard共同联合的Broersen展示了几个连接,例如Comeition Logic和ATL的嵌入,以Stit逻辑的形式(Broersen等,2006a,b),以及Stit(and atl)的扩展(ATL)以迎合推理的推理。关于多代理系统的有趣属性(Broersen 2009,2010)。该区域目前正在快速增长,也旨在应用验证多代理系统(参见van der Hoek等,2007),即。 Dastani等。 2010年。后者在代理技术中仍然有点像圣杯。一方面,有许多逻辑需要对单个代理和多个代理进行推理,而另一方面,正在构建需要验证的多代理系统。直到今天,理论与实践之间仍然存在差距。为了结合所讨论的代理逻辑和主流计算机科学的逻辑技术以验证分布式系统的核对技术(从第3节),我们还没有做出许多工作,但是我们还没有在那里……!
结论
在本条目中,我们简要回顾了行动逻辑,哲学,语言学,计算机科学和人工智能的历史。尽管我们考虑的思想和技术是在这些独立的社区中开发的,但我们认为它们仍然非常相关,并且通过将它们放在一起,我们希望我们以适度的方式为某些交叉做出了贡献 - 这些社区之间关于这个有趣而重要的主题的施气。
数学联邦政治世界观提示您:看后求收藏(笔尖小说网http://www.bjxsw.cc),接着再看更方便。