行动的逻辑(三)
因此,他们不会尝试在其他概念方面定义意图,而是将意图引入单独的运营商,其中含义后来被“合理”的公理。 正式的语义是基于Kripke模型,具有世界之间的无障碍关系,以信仰,目标和意图运营商。 然而,这里可能的世界是完整的时间树(建模代理的各种行为),其中CTL公式以通常的方式解释。 接下来,他们提出了许多假设/公理,它们在操作员之间找到合理的相互作用,并相应地约束逻辑的模型,使得这些公理成为有效性。 例如,它们提出了公式目标(α)→Bel(α)和拟想(α)→目标(α),用于某种类式α,其中α= e(ψ)是典型的例子。 这里e代表CTL中的存在路径量化。 RAO和Georgeff还表明,人们可以在逻辑中表达承诺策略。 例如,以下表达了一个“单一思想的承诺”代理,这使其致力于其意图,直到它相信它已经实现或认为是不可能的(这是非常接近我们在Cohen和Levesque方法的意图定义中所看到的):
打算(a⬦φ)→(打算(a⬦φ),直到(贝尔(φ)∨¬bel(e⬦φ)))
其中A代表CTL中的通用路径量词。
最后有Van Linder等人的卡罗方法。 (van der Hoek等。1998年,Meyer等,1999),它将动态逻辑作为基础而不是时间逻辑。 首先建立一个核心,由命题动态逻辑的语言组成,该语言增强了用于知识(k),信仰(b)和欲望(d)以及代表执行动作的能力的操作员(a)的操作员(a)。 接下来,该语言主要由缩写(其他运算符而言的定义)扩展,以获得完全成熟的BDI逻辑。 最突出的运营商是:
做一个行动的机会(这意味着有办法可以执行动作导致下一个州)
对断言进行行动的实际可能性(以及执行行动的能力和机会的结合,以及执行行动的声明导致断言的真实性)
可以对断言进行行动(知道有能力对手头的断言进行行动)
断言的可实现性(计划的存在,即一系列原子行动,该代理具有关于手头断言的实际可能性的实际可能性)
关于断言的目标(断言的结合是理想的,而不是真实的,但可实现)
可能打算对断言做出行动(表达代理人可以对他认为它成为他的目标的主张来做出行动的行动
该框架还具有特殊的行动提交和解释来控制代理人的承诺。 这些行动的语义使得代理商显然只能承诺一个动作α如果它有充分的理由,viz。 结果,具有已知目标φ的可能意图。 此外,代理商不能毫不讨厌是代理人承诺的一部分的特定动作α,只要它致力于α,即就有一些可能的意图涉及α。 这导致在卡罗中具有以下有效性:(这里,I(α,φ)表示可能意向运算符和com(α)是表示代理致力于动作α的操作员,这类似于Cohen&Levesque的意图-To-Do Operator Intend1在Cohen和Levesque 1990.)
⊨i(α,φ)→⟨commit(α)⟩com(α)
⊨i(α,φ)→¬auncommit(α)
⊨com(α)→⟨uncommit(α)⟩¬com(α)
⊨com(α1;α2)→KCOM(α1)∧k[α1] COM(α2)
非正式地说,这些公理说明:如果代理人可能打算履行某个目标的行动,那么它有机会承诺这一行动,之后它记录在其议程上; 只要代理人可能意图是一种行动,它就无法毫不讨厌(这反映了一种坚持承诺的形式:只要它对议程的计划有一个充分的理由,它将必须留下来!); 如果代理人致力于一个行动,它有机会毫不讨厌(但它可能缺乏这样做的能力,参见之前的公理; 如果代理程序致力于两种操作的序列,则它知道它将其提交给第一个,并且还知道在执行第一个操作之后它将提交到第二个操作。
除了这一关注于BDI风格的代理逻辑传统的动机态度外,卡罗框架还提供了广泛的认识和夸张态度。 这在van linder等人中最完全解决。 1995年。这项工作勾勒出在人工智能和哲学之间的不同研究中的研究。 动态认知逻辑,其根源在哲学,语言学,计算机科学和人工智能中! 动态认知逻辑(Del)是知识变化的逻辑; 它不是关于一个特定的逻辑系统,而是关于整个逻辑系列,允许我们指定特工知识和信念的静态和动态方面(参见Van Ditmarsch等,2007)。 该领域与哲学的见解相结合(关于信仰修订,AGM-STYLE(AGM 1985),正如我们在第1节中所见的那样,语言学的动态语义和语言哲学(正如我们在第2节中所见),推理计划使用动态逻辑(如我们在第3节中看到的)在人工智能中思考知识和行动如何相互影响(Moore 1977)。 更一般一般来说,我们可以看到van Benthem及其同事所倡导的信息变化的影响(Van Benthem 1989,Van Benthem 1994,Faller等,2000)。 此外,veltman的默认推理更新语义(Veltman 1996),可以将视域的一个重要推理方法(Reiter 1980,Russell和Norvig 1995),可以被视为这个范式的一部分。
出于本条目的目的,有趣的是要注意采取的一般方法是应用逻辑动作,viz。 动态逻辑,以模拟信息变化。 这增加了一种方法,其中遗憾(或Doxastic)更新被重新装入逻辑作为改变代理人的认识性/ doxastic状态的动作。 因此,例如在van linder等人中。 1995年我们遇到了展开(φ),合同(φ),修改(φ)等行为,分别涉及扩展,收缩和修订,一个人对公式φ的信念。 可以通过将它们放入动态逻辑框和钻石中来推理这些,从而使用动态逻辑的基本扩展用于推理这些更新。 还可以示出这些动作满足AGM假设,使得该方法可以被视为AGM框架的模态对应物。 精神上非常相似是Segerberg(1995)对动态Doxastic逻辑(DDL)的工作,模仿信念变化的逻辑。 在DDL模态运算符中[+Φ],[*φ]和[-φ]分别引入了非正式含义:“在代理商扩展/修订/签订他的信仰之后,分别通过φ”。 结合'标准'doxastic运算符b,其中bφ被解释为“φ处于代理的信念集”,现在可以表达像[+φ] b的属性表示,在通过φ的信仰扩展到φ代理人认为ψ(也是CF. Hendricks和Symons 2006)。
最后,在这个小节中,我们提到了最近的工作,其中卡罗形式主义被用作描述代理人的认知行为的其他方面的基础,将“超越BDI”,VIZ。 关于情绪的态度(Meyer 2006,Steunebrink等,2007,Steunebrink等人2012)。 这种方法的结果是,诸如卡罗等表现力的行动逻辑可以效果努力地用来描述如何引发诸如某些信仰等某些信息和激励态度的情感目标(“情感诱惑”)以及如何引发,代理人的情绪状态可能会影响其行为,特别是关于下一个采取行动的决定。
4.2.2多代理方法
除了指定单个代理的态度的逻辑外,还完成了工作来描述多智能体系作为惠士的态度。 首先,我们在这个方向上提到了Cohen和Levesque的工作(Levesque等,1990,Cohen和Levesque 1991)。 这项工作是对卡罗的多代理版本的主要影响(Aldewereld等,2004)。 联合目标概念的重要并发症涉及目标的持久性:在单一代理人案件中,代理人追求其目标,直到它相信它已经实现或相信它永远无法实现,在多个代理人的背景下,实现这一目标的代理人告知他人的其他团队,以便整体集团/团队将相信这是如此,可能会降低目标。 这在上述方法中捕获。 相关工作,但没有严格意义的行动逻辑,涉及集体意图的逻辑治疗(Keplicz和柏格武器2002)。
此处还必须提及多个来源,其中包括Del和DDL所描述的个别代理人的知识和信仰更新的工作,以及在常见知识等代理组中的知识(参见,例如Meyer和Van der Hoek 1995)中的工作,出现了一个全新的子场,可以被视为动态认知逻辑的多助理(计数器)部分。 这项涉及公共公告逻辑等事项,以及更加普遍的行动,这些行动对代理组的知识产生影响。 这已经通过Plaza(1989),Baltag(1999),Gerbrandy(1998),Van Ditmarsch(2000)和Kooi(2003)等不同的作者产生了相当多的作者工作。 例如,公共公告逻辑(Plaza 1989)包含Form [φ]ψ的操作员,其中φ和ψ是逻辑的公式,表达“在φ公告后表示ψ”。 此逻辑可以再次被视为一种动态逻辑的形式,其中[φ]ψ读取的语义子句(以非正式术语):[φ]ψ在模型 - 状态对IFF中是真的,其中模型状态对中的φ的真实性意味着ψ的真实性在模型 - 状态对中,状态相同,但是将模型变换以捕获φ中包含的信息。 在另一种方法中,传送信息引起的模型的转换起着重要作用,特别是通过Baltag等人的方法。 在行动模型(Baltag 1999,Baltag和Moss 2004)。 这种方法中的典型元素是,在动作模型中,逻辑逻辑具有认识和动作模型,并且通过认知动作(影响一组代理的事故状态的动作)的认知模型的更新由该(限制)模态产品表示认知模型和与该行动相关的动作模型。 (见van ditmarsch等人。2007,p。151;本书是最近对该领域的全面参考。)
最后,我们提到将博弈论与博弈论的逻辑纳入多智能体系的逻辑,例如游戏逻辑,联盟逻辑(PAUME 2001)和交替的时间逻辑(ATL,我们在主流计算机科学的部分末尾也遇到过!),以及其认知变体ATEL(Van der Hoek和Wooldridge 2003,Van der Hoek等人)。 例如,游戏逻辑是PDL的扩展,原因是所谓的确定的2播放游戏。 有趣的是,这些逻辑与我们在哲学中遇到的拼写方法之间存在联系。 例如,部分与Herzig和Troarquard共同联合的浏览器已经显示了几种连接,例如联盟逻辑的嵌入和符号逻辑形式的嵌入(Broersen等,B)和股票的延伸(和ATL)迎合多助理系统的有趣特性的推理(Broersen 2009,1010)。 该地区目前正在快速增长,也旨在验证多智能体系(参见Van der Hoek等,2007),viz。 dastani等。 2010年。后者仍然是代理技术的一套神圣的格拉勒。 一方面,有许多逻辑有关单个和多个代理的原因,而另一方面则正在建立多种代理系统,需要验证。 到这一天,理论与实践之间仍然存在差距。 正在做很多工作来渲染逻辑手段,将讨论的代理逻辑与主流计算机科学的逻辑技术相结合,以便验证分布式系统(从第3节),但我们不在...!
总结
在本次进入中,我们简要介绍了在计算机科学和人工智能中介绍了哲学哲学的逻辑逻辑逻辑历史。 虽然我们考虑的思想和技术是以一种相当独立的方式在这些独立的社区中开发的,但我们觉得他们非常相关,并且通过将它们放在这个条目中,我们希望我们为这些社区之间的某种交叉施肥提供了贡献,这是关于这一有趣的一些交叉施肥和重要的主题。