行动的逻辑（二）_数学联邦政治世界观

3.1关于计划的推理

程序验证具有悠久的历史。自从计算机成立以来已经开始考虑分析程序的方式，以确保他们确保他们所做的事情。在60年代，计划正确性的真正数学理论的发展开始采取严重的形状（De Bakker 1980,466）。值得注意的是，当我们转向人工智能领域时，我们在稍后会遇到的约翰麦卡锡的工作在这里发挥了重要作用，区分和研究了“国家”，麦卡锡1963A的基本概念。这是一方面给了编程语言的语义领域，另一方面，弗洛伊德（1967年），瑙鲁（1966），HOARE（1969）和Dijkstra（1976）（De Bakker 1980）。 Floyd和Naur使用了一个基本的逐步诱导原理和谓词，该方法附加到程序点，以表达势在必行的计划（CousoT 1990,859），从基本分配陈述（算术表达式）建立的计划的不变性变量）并且可以通过排序，条件和重复来组成。虽然弗洛伊德 - 牛座接近归因于感应断言方法 - 引起验证条件的系统建设，但是一种通过逻辑来证明程序的正确性的方法，它不是严格意义上的逻辑本身。通过HOARE铺设了适当的程序逻辑的方法，其组成证明方法导致了现在称为HOARE逻辑的逻辑。通过利用（势在必行）程序的句法结构，HOARE能够将Floyd-Naur方法转变为真正的逻辑，作为所谓的{P} {Q}所谓的Hoare三元组，其中P和Q是一阶公式和s是一种以上述命令式编程语言的程序声明。预期的读数是如果p在执行之前p holleds，则q在终止时（执行）s =（执行终端的问题，可以在条件上（部分正确性）或非条件正确的），引起不同的逻辑，看Harel等人。2000）。为了给予Hoare风格的逻辑印象，我们在这里提供一种简单的编程语言的规则，这些语言由变量分配组成，并包含顺序（;），条件（IF）和重复（while）组成。

{p} s1 {q}，{q} s2的{r}

{P} S1; s2的{r}

{p∧b} s1 {q}，{p∧¬b} s2的{q}

{p} ifbthens1elses2 {q}

{p∧b} s {p}

{p} whilebdos {p∧¬b}

后来普拉特和哈尔尔广泛化的动态逻辑逻辑（Pratt 1976，Pratt 1979a，Harel 1979，Harel 1984，Kozen和Tiuryn 1990，Harel等人2000），其实现了[1]事实上，它实际上是模态逻辑的形式，通过将程序S的输入输出关系视为克莱波克式语义意义上的可访问性关系。[2] HOARE Triple {P} {Q}变为动态逻辑，下面的公式：P→[S] Q，其中[S]是与（与之相关的可访问性关系）的模态框操作员，程序S的输入输出关系。命题版本Fischer和Ladner（1977）引入了动态逻辑PDL，并成为本身研究的重要课题。 PDL的关键公理是感应公理

[s *]（p→[s] p）→（p→[s *] p）

其中*代表迭代运算符，s *表示程序s的任意（有限）迭代次数。Axiom表示，如果在使用s的任何数量的迭代之后，则在执行s的情况下保留，那么，如果p是真的在当前状态下，在任何数量的S.一种较弱的PDL形式的迭代之后，叫做HML的较弱形式，只有原子动作盒和钻石和命题连接，由Hennessy＆Milner引入了并发过程，以及特别是分析过程等价（Hennessy和Milner 1980）。

这里也值得一提的是，Dijkstra（1976）在最弱的前提下计数上的工作与动态逻辑（和HOARE的逻辑）非常有关。事实上，dijkstra调用最薄的自由主义前提条件，表示为WLP（s，q），与动态逻辑中的框运算符相同：WLP（s，q）= [s] q，而他最弱的前提，则表示wp（s，q）是这的总正确性变体，这意味着这种表达也需要终止陈述S（CousoT 1990）。

后来意识到动态逻辑的应用超出了节目验证或推理的关于程序。实际上，它构成了一般行动的逻辑。在Meyer 2000中，给出了动态逻辑的许多其他应用程序包括故乡逻辑（另见Meyer 1988），推理了关于数据库更新的推理，推理系统的语义如反射架构。除了旁边，我们在此处注意到Meyer 1988中提出的语义逻辑的动态逻辑需要延伸动作语言，特别是添加“动作否定”运算符。这个运营商的相当争议性质触发了行动否定本身的工作（参见例如Broersen 2004）。下面我们还将在指定智能代理时遇到人工智能中的动态逻辑。

迄今为止的逻辑足以推理应该终止并显示某个输入/输出行为的程序。然而，在七十年代末，一个人意识到还有没有这种的程序。反应性程序旨在对输入流反应，理论上可能是无限的，因此显示出理想的不贴入行为。没有那么多的输入 - 输出行为在这里相关，而是随着时间的推移是程序的行为。因此，Pnueli（1977）基于时间逻辑的逻辑，viz提出了对这种编程方式的不同推理方式。（线性时间）时间逻辑。（由于反应性往往涉及并发或并行编程，时间逻辑通常与这种编程风格相关联。但是，应该指出的是，一系列研究继续扩展了Hoare Logic与并发计划的使用（Lamport 1977，Cousot 1990，De Roever等人。2001）。）线性时间逻辑通常具有颞算子，例如下一次（将来），在某个时间（将来），直到和自从。

一方面的时间逻辑与另一方面逻辑和逻辑之间的一个有趣的区别，是前者是文献中的称为内源性逻辑，而后者是所谓的外源逻辑。如果程序在逻辑语言中明确，则逻辑是外部的，而对于内源逻辑，这不是这种情况。在诸如时间逻辑之类的内源性逻辑中，假设程序是固定的，并且被认为是逻辑被解释的结构的一部分（Harel等，2000,157）。外源逻辑是组成的，具有通过结构诱导进行分析的优点。后来普拉特（1979B）试图将时间和动态逻辑混合到他所谓的过程逻辑中，这是一个外部逻辑，旨在推理时间行为。

目前，计算机科学中应用的时间逻辑领域已独立于完整的子场，包括用于（半）自动推理和模型检查的技术和工具（参见艾默生1990）。还提出了基本线性时间模型的变体进行验证，例如分支时间逻辑（以及特别是逻辑CTL（计算树逻辑）及其扩展CTL *（emerson 1990），其中可以明确推理关于非法计算的（定量）替代路径，最近也是CTL的扩展，称为交替时间逻辑（ATL），具有表达一组代理商具有联合策略以确保其参数的模当态，以确保其参数的态度，以使其参数的联合策略来说被称为开放系统。这些是系统，其行为也取决于其环境的行为，请参阅Alur等人。1998。

最后，我们提到仍然是替代逻辑来推理关于程序，viz。固定点逻辑，具有作为典型的例子所谓的μ-演算，可追溯到斯科特和德·贝克（1969），并进一步发展希区柯克和公园1972，公园1976，德·贝克1980，和梅耶1985.的基本运算符是至少固定点操作员μ，捕获迭代和递归：如果φ（x）是一个逻辑表达式与一个免费的关系变量x，则表达式μxφ（x）表示的至少x这样φ（x）= x，如果这种x存在。 μ微积分的命题版本，称为命题或模态μ-微积分，包括命题构建体→和假，以及原子（动作）模态[a]和μ算子通过命题模态逻辑完全公开化加上Axiomφ[x /μx]→μxφ，其中φ[x / y]代表表达式φ，其中x由y代替x和规则

φ[x /ψ]→ψ

{μxφ→ψ}

（Kozen 1983，Bradfield和斯特林2007）。该逻辑是已知的（参见Harel等，2000）。

4.人工智能中的行动逻辑

在人工智能（AI）领域，目的是设计智能地行为基于计算机的工件（目的是了解人类智能或只是制作智能计算机系统和程序）。为了实现这一目标，在AI中存在传统，以根据所涉及的所有相关因素的符号表示来尝试和构建这些系统。这个传统被称为象征性的AI或'良好的老式'AI（戈夫牌）。在这一传统中，知识代表的子领域显然是重大重要性的：自从AI成立以来，它发挥了重要作用，并发展到自己的实质性领域。 KR中的一个突出区域涉及由系统设计或其环境中的演员执行的行动的表示。当然，除了他们的纯粹代表性，还有关于行动的推理很重要，因为与这些陈述的代表和推理被视为在KR内密切联系（其中一些也称为KR＆R，知识代表和推理）。 AI中的一个相关的，最近的发展是基于基于（智能）代理人的概念，自主行动实体的概念构建的，关于哪些，通过其本质，动作逻辑在获得逻辑描述和规范方面发挥着至关重要的作用。

4.1代表和推理行动

如上所述，与它们的原因表示行动和形式主义/逻辑的代表是AI的非常核心，特别是KR领域。一个主要问题的主要问题之一，即在AI中的行动推理的文献中遇到的，而且比在主流的计算机科学中更重要，是发现所谓的帧问题（McCarthy和Hayes 1969）。虽然这个问题被哲学家（如Dennett（1984））概括为与行动有关的属性的一般性问题，但问题的核心是，在“常识”设置为AI中的一个遇到，它几乎是不可能的通过关注的行动指定所有效果，以及特别是所有非效果。例如，鉴于一个动作，考虑如果执行操作，并且后者不太难以产生比前者更难以指定非效果的尝试，所以毫不犹豫地思考。但是当然还存在相关问题：与手中的问题有何相关方面; 我们需要考虑哪些属性？特别是，这也涉及一种行动的先决条件，以保证成功绩效/执行行动。再次，在常见的感觉环境中，这些都是强大的，并且可以始终想到应该合并的另一个（前）条件。例如，为了成功启动汽车的电机，应该有一个充电的电池，足够的燃料，而且也不会太冷的天气，甚至足够的动力在手指中能够转动起始键，在汽车中的电机，......等一个试图找到一个解决方案的帧问题，与最小的规格有关。虽然这个问题引起了所谓的不确定或非单调解决方案，如默认值（'通常是一辆汽车有电机'），这本身就引发了一个名为非单调或致辞推理的AI内的全新领域，这超出了超出范围此条目（我们将感兴趣的读者通过Thomason（2003）在此百科全书中引用文章）。我们专注于不吸引非单调（直接）的解决方案。

Reiter（2001）在框架内提出了一个（部分）解决方案，称为情况微积分，这在KR中一直非常受欢迎，特别是在北美，它由John McCarthy提出，AI的创始父亲之一（麦卡锡）1963B，McCarthy 1986）。情况微积分是一阶逻辑的方言，具有一些温和的二阶特征，特别是设计为有关动作的推理。（其一个独特的特征之一是所谓的语义概念（如诸如国家或可能的世界）（以及真理谓词）到对象语言中的句法实体（'情况'）的语义概念。）为了符合这种进入和原因空间，我们将尝试在（一阶）动态逻辑中渲染重新审议的想法，或者略有扩展。（我们需要行动变量来表示动作表达式和行动变量与动作（或相当动作表达式）之间的相位性，以及（通用）通过动作变量量化）。

所谓的帧问题的解决方案假定了一个所谓的封闭系统，也就是说，它是一种系统，其中所有（相关）动作和可变的属性（在这个设置中经常被称为“流利”而强调其随时间的变化性）。通过这种假设，可以表达（非）变化，以便执行操作以及检查前提是以非常简洁和优雅的方式成功的成功性能的问题，并在表格的所谓继承状态公理中投入

（∀a）[POSS（一）→（（[一个] f（x））↔（γ

（x，一个）∨（f（x）∧¬γ

（x，一个））））]

其中A是动作变量和γ

（x，a）和γ

（x，a）是'简单'表达式，没有动作模式，分别表达φ的条件变得真实和假。因此，根据与手动A相关的某些先决条件，在与动作有关的某些前提条件，如果条件γ只有

（x，a）保持或f（x）保持（在执行a之前）和条件γ

（x，a）（这将导致错误）不持有。此外，在这种公理中示意性地使用表达式（a），其中整个动作理论应与形式φa→poss（a）的所谓的前提公理互补，用于混凝土表达式φa，该φa表示成功所需的实际前提条件执行A.

要了解如何在实践中解决，我们考虑一个域中的一个例子，我们有一个可能被破坏的花瓶v（所以我们已经“破碎”作为流利的），以及行动下降和修理。我们还假设（不可改变的）谓词易碎和携带物体。现在，后继国家公理成为

（∀a）[POSS（一）→

（[一个]破碎（v）↔

（（一个=下降（v）∧fragile（v））∨（破碎（v）∧a≠修复（v））））]

作为前提公理，我们已经掌握了（x）→poss（drop（x））和破碎（x）→poft（修复（x））。这个动作理论非常简洁：每个行动只需要一个继承国公理，每个动作一个先决条件。

最后在这个小节中，我们必须提到一些其他着名的方法来推理行动和变革。事件微积分（Kowalski和Sergot 1986，Shanahan 1990，Shanahan 1995）和流利的微积分（Thielscher 2005）是在情况微积分中行动的基于行动代表的替代品。读者还称为Sandewall和Shoham 1994，用于历史和方法论问题以及与非单调推理的关系。这些想法导致了非常有效的规划系统（例如，Talplanner，Kvarnström和Doherty 2000）以及编程机器人代理的实用方式（例如，基于情况微积分，以及语言的语言和语言基于流畅的微积分的助焊剂（Thielscher 2005））。

4.2智能代理的描述和规范

在过去的二十年中，智能代理人的概念已经成为讨论人工智能理论和实践的统一概念（CF.Russell和Norvig 1995，Nilsson 1998）。简而言之，代理商是显示智能/合理性和自主形式的软件实体。他们能够主动，并决定在没有直接控制人类用户的情况下自行采取行动。在这个小节中，我们将看到逻辑（动作）如何用于描述/指定代理的（所需的）行为（CF.Wooldridge 2002）。首先，我们专注于单一代理，之后我们转向多个代理的设置，称为多代理系统（MAS）甚至代理社会。

4.2.1单代理方法

有趣的是，智能代理概念的起源在于哲学。

首先，在古典哲学传统回到亚里士多德的古典哲学传统中，有一个直接的联系。这里有人担心以三段的方式推理行动，例如从1999年的奥迪1999中取出的例子。 729：

那会锻炼。

慢跑是锻炼身体。

因此，我会慢跑。

虽然这在熟悉的亚里士多州的理论推理传统中具有演绎三段论的形式，但在仔细检查时，似乎这个三段论并没有表达纯粹的逻辑扣除。（结论在逻辑上从逻辑上遵循。）它宁愿构成代理人决定的代表（要慢跑），在此决定是基于代理人的心理态度，viz。他/她的信仰（慢跑是锻炼）和他/她的欲望或目标（我锻炼）。因此，实际推理是指导朝着行动的推理，弄清楚如何做的过程，因为Wooldridge（2000）把它放了。在诸如信仰和欲望的精神状态的基础上，推理接下来的方法是审议的。

Dennett（1971）提出了故意立场的概念：通过将其处理来解释实体的行为的策略，好像它是一个理性的代理人通过审议其信仰和欲望来控制其行动选择。因此，它是所谓的设计（功能）姿态，对抗物理姿态，对系统的拟人的实例。这种立场被证明是极其影响力，不仅是认知科学和生物学/道德（与动物行为有关），而且作为对人工代理人的起点。

最后，最重要的是，哲学家迈克尔布拉茨曼（1987年）的工作，虽然在旨在瞄准人类代理人的第一个实例中，将BDI方法的基础奠定了人工剂的基础。特别是，布拉茨曼在纳入描述代理行为的意图概念的情况下进行了案例。意图发挥了选择所需的行动的重要作用，并附上所选择的行动的明显承诺。除非有理由放弃承诺（例如已经达成了意图已经实现的意图或者认为是不可能实现的信念），否则代理人应该坚持/坚持承诺，坚持下去，所以说，并尝试实现它，

在Baratman的哲学出版后，研究人员试图使用逻辑手段正式化这一理论。我们在这里提到三种着名的方法。科恩和levesque（1991年）试图在线性时态逻辑中捕捉布拉茨曼的理论，在那里他们添加了原始的运营商，以获得信仰和目标以及一些运营商，以满足行动的行动，例如表示要表达行动的操作员（恰好α），刚刚完成α），哪种代理是原始动作的actor（Actiα：代理I是α的actor）。从此基本设置，他们构建了一个框架，最终就是在其他概念方面定义了意图的概念。事实上，他们定义了两个概念：一个意图_to_do和一个意图_to_be。首先，他们定义了成就目标的概念（A目标）：一个目标是稍后举行的目标，但据信并非如此。然后他们定义了一个持久的目标（p-geal）：一个p-oder是一个目标，在据信识别或被认为是不可能的之前没有下降。然后，做一个动作的意图被定义为做出行动的方法，以使代理知道它发生的方式。实现满足φ的态的意图是做出了一些具有φ的动作的p目标，其中代理知道发生的事情导致φ的某些事情，使得实际发生的事情不是代理明确没有作为目标的东西。

接下来，使用分支时间临时逻辑CTL（RAO和Georgeff 1991，Rao和Georgeff 1998，Wooldridge 2000），Rao＆Georgeff对BDI代理的形式化。在CTL之上，他们介绍了信仰（BEL），目标（目标）的模态运营商（有时被欲望（des））和意图（to_be善良，打算）以及运营商谈论成功（成功（e））和失败（失败）基本行动e。

（本章完）

行动的逻辑（二）

相关推荐

缪斯乐园

陶者碎文录

异兽笔记

久柉神识述世间百态

翔霖：旧爱拾起

余妄—春篇