计算语言学(四)
复数,例如
(3.8)
人们聚集在城镇广场,
提出了一个问题,即谓词的论元可以是由多个基本个体(我们通常对其进行量化并赋予属性的个体)组成的实体。大多数解决此问题的方法都使用复数运算符,例如 plur,这样我们就可以将单数谓词 P 映射到复数谓词 plur(P),适用于集合实体。这些集合实体通常被假设与作为普通个体的原子元素(单数实体)形成一个连接半格(例如,Scha 1981;Link 1983;Landman 1989, 2000)。当假设存在重叠关系,并且假设半格的所有元素都具有上确界(完备性)时,结果是一个完备的布尔代数,除了缺少底元素(因为不存在作为所有其他实体一部分的空实体)。一个理论问题是复数实体的半格与构成实体的物质部分的半格之间的关系。尽管在理论细节上存在差异(例如,Link 1983;Bunt 1985),但人们一致认为这些半格应该在以下意义上对齐:当我们取构成多个单数或复数实体的物质部分的连接时,我们应该获得这些单数或复数实体的连接物质部分。注意,虽然某些动词谓词(例如(不及物动词)gather)仅适用于集合,但其他一些谓词(例如ate a pizza)则以各种方式适用于个体或集合。因此,像
(3.9)
这样的句子,
孩子们吃了披萨,
既可以集体解读,即孩子们作为一个群体吃一个披萨,也可以分散解读,即每个孩子吃一个披萨(大概是不同的!)。在实践中处理此类歧义的一种方法是,将复数名词短语视为在表示集合的解读和“集合中的每个成员”的解读之间存在歧义。例如,(3.9) 中的 children 在表示 children 的集合(这是该短语的基本含义)和表示 each of the children 之间会产生歧义。这意味着 each of the people 类型的解读也应该出现在 (3.8) 中——但我们可以假设这被排除了,因为(不及物动词)gather 需要集体论元。在诸如
(3.10)
Two poachers caught three aracaris,
这样的句子中,我们基于对每个名词短语的两种解释得到了四种解读。没有排除任何解读,因为抓捕和被抓捕都可以是单独发生或集体发生的事件。一些理论家会假设其他解读,但如果存在这些解读,它们可以被视为衍生自至少有一个术语被集体解释的解读。但毫无争议的是,复数需要丰富语义表示语言,以允许使用集合作为参数。在诸如 plur(child) 之类的表达式中,将谓词转换为另一个谓词的复数运算符和由此产生的集合谓词都是非标准类型。
修饰是所有语言中普遍存在的现象,如以下句子所示:
(3.11)
玛丽非常聪明。
(3.12)
玛丽是国际名人。
(3.13)
叛乱彻底失败了。
在 (3.11) 中,very 充当谓词修饰语,尤其是子类修饰语,因为 very(P) 的集合是 P 的子集。我们的逻辑形式需要这样的修饰语吗?在这种情况下,我们可以避免使用修饰语,假设 smart 有一个关于聪明程度的默认参数,其中 smart(x, d) 表示 x 的聪明程度为 d;对于某个阈值 T,添加 d > T 表示 x 非常聪明。其他程度形容词可以类似处理。然而,在 (3.12) 中,这种策略不适用于国际名人。国际又是子类的(而不是相交的——国际名人不是既是国际又是名人的东西),虽然人们可以想象特定组合的定义,但在普通的 FOL 框架中,要求在构建初始逻辑形式时提供此类定义,可能会给广义解释造成巨大的障碍。 (3.13)说明了第三种谓词修饰,即副词的VP修饰。注意,修饰语不能被合理地视为关于戴维森事件论证fail的隐式谓词utter(E)。综上所述,这些例子表明,在语义表示中允许使用单子谓词修饰语是可取的。接下来的讨论将提供佐证。
内涵性已经在蒙塔古语法中被提及,毫无疑问,自然语言的语义表示需要以某种方式捕捉内涵性。句子
(3.14)
约翰相信我们的宇宙是无限的。
(3.15)
约翰看起来很高兴。
(3.16)
约翰设计了一艘星际飞船。
(3.17)
约翰戴着假胡子。
都涉及内涵性。态度句 (3.14) 的含义(从而其真值)取决于从句的含义(内涵),而不仅仅是其真值(外延)。(3.15) 的含义取决于 happy 的含义,但并不要求 happy 是 John 或其他任何东西的属性。(3.16) 的含义并不取决于星际飞船的实际存在,而是取决于该短语的含义。(3.17) 中的假胡子 (fake beard) 指的是除实际胡子以外的东西,尽管它的含义自然取决于胡子的含义。蒙塔戈式的分析当然可以轻松处理此类句子。但是,我们再次要问,蒙塔戈类型理论的表达丰富性有多少对于计算语言学来说是真正必要的。首先,像 (3.14) 这样的句子可以在经典模态逻辑中表达,而无需涉及更高级的类型。另一方面,(3.16) 抵制古典模态分析,甚至比蒙塔古的“约翰寻找独角兽”更为坚定,对此可以进行近似的古典释义:“约翰试图(为他)找到一只独角兽”。对蒙塔古做出的适度让步,足以处理(3.15)-(3.17),就是将内涵谓词修饰语纳入我们的表征词汇。这样,我们就可以将“look”视为谓词修饰语,因此“look(happy)”是一个源自“happy”含义的新谓词。类似地,如果我们愿意将“starship”视为谓词短语,就像在“企业号是一艘星舰”中所做的那样,我们也可以将“design”视为谓词修饰语。最后,“fake”很自然地被视为谓词修饰语,尽管与大多数名词性修饰语不同,它不是交叉性的(#约翰戴了假胡子),甚至不是子项性的(#约翰戴了一种特殊的胡子)。请注意,这种内涵性形式并不要求我们采用高阶逻辑——到目前为止,我们还没有对谓词外延或内涵进行量化,而只是对个体进行量化(除了如上所述,需要允许复数实体的情况)。相反,我们语义词汇中内涵谓词修饰语的有力例证强化了上面(基于外延例子)提出的允许谓词修饰的例证。
与已经列举的现象一样,物化在自然语言中也很普遍。以下句子中可以看到例子。
(3.18)
人类可能正走在自我毁灭的道路上。
(3.19)
雪是白的。
(3.20)
礼貌是一种美德。
(3.21)
鲁莽驾驶很危险。
(3.22)
约翰生闷气是不寻常的。
(3.23)
我们的宇宙是无限的,这是一个不可信的概念。
(3.18)-(3.21)都是谓词物化的例子。(3.18)中的人类可以被视为源自来自名词性谓词“人类”,即词汇意义为 K(human) 的谓词内涵,其中 K 将谓词内涵映射到个体。谓词“走上自我毁灭之路”既适用于普通个体,也适用于类型,这一事实证明了抽象类型作为个体的地位。该术语的名称性特征显而易见,因为它不能轻易地被形容词预先修饰。(3.19) 和 (3.20) 中的主语可以用类型 K(snow) 和 K(-ness(polite)) 进行类似分析。(这里 -ness 是一个谓词修饰词,它将适用于普通(通常是人类)个体的谓词“polite”转换为对抽象事物数量的谓词,即礼貌。)但在这些情况下,K 运算符并非源自词典,而是源自“NP → N, NP′ = K(N′)”类型的规则对。这允许在具体化之前对名词性谓词进行修饰,例如诸如蓬松的雪或过分的礼貌之类的短语。(3.21) 的主语在逻辑上可以表示为 Ka(-ly(reckless)(drive)),其中 Ka 将动作谓词具体化,而 -ly 将单子谓词内涵转化为子项谓词修饰语。最后,(3.22) 说明了一种句子意义的具体化,同样产生了一种类型;但在这种情况下,它是一种情境——其实例以约翰生闷气为特征的类型。在这里,我们可以假设一个具体化算子 Ke,它将句子内涵映射到各种情境中。这种句子具体化需要与 that-clause 具体化区分开来,例如 (3.14) 中似乎涉及的 that-clause 具体化。我们提到了对 (3.14) 进行模态逻辑分析的可能性,但谓词分析(其中谓词应用于具体化的句子内涵(一个命题))实际上更合理,因为它允许对 that-clause 进行统一处理。像 (3.14) 和 (3.23) 这样的语境。具体化算子的使用背离了严格的蒙特戈维亚方法,但如果我们试图通过将谓词视为个体而非任意高类型的对象的真或假来限制语义表征的表达能力,并且同样地将量化视为在所有情况下都适用于个体,即一阶的,那么使用具体化算子是合理的。
一些计算语言学家和人工智能研究人员希望更进一步,避免使用标准一阶逻辑之外的表达手段。一种可用于处理 FOL 中内涵性的策略是将所有谓词函数化,保留一两个谓词。例如,我们可以将诸如“罗密欧爱朱丽叶”之类的谓词视为在特定时间“成立”的函数值:Holds(loves(Romeo, Juliet), t)。在这里,loves 被视为一个产生具体化属性的函数,而 Holds(在某些提议中为 True),以及也许相等性,是表示语言中仅有的谓词。然后,我们可以将(3.14)形式化,而无需借助内涵语义,例如,
Holds(believes(John, infinite(Universe)), t)
(其中 t 是某个特定时间)。(3.18)中的人类或许可以表示为所有人类的集合,作为时间的函数:
∀x∀t)Holds(member(x, Humankind), t) ↔ Holds(human(x), t)),
(假设朴素集合论的某种公理化);再举一个例子,(4.22)可以表示为
Holds(unusual(sulk(John)), t)
(对于某个特定时间 t)。然而,这种策略在内涵语境中的量化中会遇到困难,例如在句子“约翰相信每个星系都隐藏着某种生命形式。”虽然我们可以使用 Holds 策略来表示(难以置信的)宽范围解读“对于每个星系,都存在某种生命形式,使得约翰相信该星系蕴藏着该生命形式”,但我们无法轻易地表示自然的窄范围解读,因为 FOL 不允许在函数式中使用变量绑定运算符(但参见 McCarthy 1990)。一种完全不同的方法是将“事件性”论元引入所有谓词,并且只有当与该谓词对应的事件性被断言“发生”时,才将谓词视为提供了关于现实世界的事实(Hobbs 2003)。这种方法背后的主要实践动力是能够利用现有的 FOL 推理技巧和技术。然而,目前没有理由相信,在 FOL 中很容易进行的任何推理,在更接近自然语言结构的意义表征中会变得困难;相反,最近在实现自然逻辑方面的工作(MacCartney & Manning 2009)表明,一大类显而易见的推理可以在经过句法分析的自然语言中(模数化一些调整)最容易实现——该框架更接近蒙塔戈维亚语义学,而非基于 FOL 的方法。
规范化、主题角色(再次)和基元
另一个重要问题是规范化(或规范化):为了最大限度地减少利用语言衍生信息的困难,应该对初始逻辑形式应用哪些转换?规范化表示的选择应该促进以下用途:在先前解释的文本(和常识)的背景下解释后续文本,以及推理问答和其他推理任务。
我们可以区分两种类型的规范化:逻辑规范化和概念规范化。句子逻辑和 FOL 中逻辑规范化的一个例子是转换为子句形式(Skolemized、无量词的连接范式)。其基本原理是,将多个逻辑等价的公式简化为单一形式可以降低推理的组合复杂性。然而,完整的在语义“细粒度”的内涵逻辑中,规范化可能无法实现。例如,尽管“地球是圆的”这一信念在逻辑上等价,但在语义上可能与“地球是圆的且月球是平的或非平的”这一信念有所不同。
。概念规范化涉及更彻底的变化:我们用来自较小库的规范术语替换表面谓词(或许还有表征词汇的其他元素),和/或使用主题角色或框架槽对其进行分解。例如,在地理领域,我们可以用一个单一的规范关系(例如“边界”)替换(国家之间的)“毗邻”、“相邻”、“接壤”、“是邻居”、“与……共享边界”等关系。在物理、交流和心理事件领域,我们可以更进一步,将谓词分解为原始谓词的配置。例如,我们可以用 Schank 的方式将“x 行走”表示为
。 ∃e, e′(ptrans(e, x, x) ∧ move(e′, x, feet-of(x)) ∧ by-means-of(e′, e)),
其中 ptrans(e, x, y) 是一个原始谓词,表示事件 e 是主体 x 对对象 y 的物理移动,move 表示主体的身体运动,by-means-of 表示 move 事件和 ptrans 事件之间的工具动作关系。如前所述,这些多参数谓词可以进一步分解,ptrans(e, x, y) 可以重写为 ptrans(e) ∧ agent(e, x) ∧ theme(e, y),依此类推。与逻辑规范化一样,概念规范化旨在简化推理,并最大限度地减少对推理所依据的公理的需求。
规范化,尤其是那些涉及简化为基元的更强版本的规范化,引发的一个问题是,在这个过程中,重要的意义是否会丢失。例如,“邻国”的概念与单纯的“相邻”不同,它暗示着国家人口并存的概念,类似于当地社区中邻居的并存。更明显的是,将“行走”的概念简化为通过移动双脚来运输,就无法区分行走与跑步、跳跃、滑冰,甚至骑自行车。因此,或许更应该将概念规范化视为重要蕴涵的推论,而不是用词汇更有限的等效形式替换肤浅的逻辑形式。支持后一种观点的另一个论据是计算性的:如果我们将复杂的动作(例如在餐厅用餐)分解为一系列基元谓词,那么即使在回答“约翰在餐厅用餐了吗?”这样的简单问题时,我们也需要匹配这些基元谓词中的许多基元部分。我们将在下一节中进一步讨论基元。
3.2 受心理驱动的意义理解方法
虽然许多人工智能研究人员对语义表征和推理感兴趣,将其作为实现机器语言和推理能力的实用手段,但也有人从人类认知建模的角度来探讨这些问题。20 世纪 80 年代之前,自然语言处理和认知的计算建模几乎完全是在表征主义范式中进行的,该范式认为所有智能行为都可以归结为符号操作(Newell 和 Simon 的物理符号系统假说)。20 世纪 80 年代,联结主义(或神经)模型复兴,并被许多人视为与表征主义方法相媲美的模型。我们将在下面的两个小标题下简要总结这些发展。
表征主义方法
“物理符号系统具备实现一般智能行为的必要和充分手段。” ——艾伦·纽厄尔和赫伯特·西蒙(1976:116)
。
一些在表征主义范式下工作的认知动机研究者尤其关注认知架构,包括概念之间的联想联系、记忆类型和表征类型之间的区别(例如,情景记忆与语义记忆、短期记忆与长期记忆、陈述性知识与程序性知识),以及此类架构可观察到的处理后果,例如语义消歧、相似性判断以及反映在处理延迟中的认知负荷。另一些人则更关注揭示语言和思维背后实际存在的内在概念词汇和推理规则。 M. Ross Quillian 的语义记忆模型,以及 Rumelhart、Norman 和 Lindsay(Rumelhart 等人 1972 年;Norman 等人 1975 年)和 Anderson 和 Bower(1973 年)开发的模型代表了前一种观点,而 Schank 和他的合作者(Schank 和 Colby 1973 年;Schank 和 Abelson 1977 年;Schank 和 Riesbeck 1981 年;Dyer 1983 年)则代表了后一种观点。在认知动机的语义表征理论中,一个共同点是使用图形语义记忆模型,旨在捕捉概念之间的直接关系以及更间接的关联,如图 3 所示:
)两棵树,所有父级都通过实心箭头线将
连接到它们的节点,除非另有说明。
首先,在左边,带有单词
的带框父级。 ‘plant’ 和 ‘plant1’ 的节点(其本身
具有 ‘structure’ 节点)通过标记为
的线连接,‘isa’)、‘living’)通过标记为
的线连接,‘prop’)、‘animal’)通过标记为
的线连接,‘with3’)通过标记为
的线和一个节点 ‘leaf’)、
‘get2’)通过标记为 ‘prop’ 的线连接
以及一条标记为 ‘subj’ 的反向线,它有两个节点,
‘food’ 通过标记为 ‘obj’ 的线连接,
‘from’,后者还有节点 ‘air’、
‘earth’ 和虚线框中的 ‘water’ {
这三个节点的连接线也通过虚线
标记为“or”的弧}))、‘plant2’(其本身
具有一个由标记为
‘isa’ 的线段连接的‘apparatus’节点和两条指向无处的虚线),以及
‘plant3’(其本身有三条指向
无处的虚线);三个植物节点的连接线也
通过标记为“or”的实线弧段连接。第二棵树
单词‘water’的带框父节点具有两条指向无处的虚线
和一个节点‘supply5’(其本身有
三个节点,‘person’ 通过标记为
‘subj’的线段连接,第一个
树中带框的‘water’ 通过标记为‘obj’的线段连接,以及
‘To2’ )其本身有一个节点‘object’));顶部父节点下的
三条线通过标记为
‘or’ 的虚线弧段连接)
图 3
这个特定的例子大致基于 Quillian (1968)。Quillian 认为,以这种图形方式构想的语义记忆的功能之一是通过扩散激活来实现词义消歧。例如,处理“他给植物浇水”这句话会涉及到对“水”和“植物”这两个词的激活,这种激活会扩散到与这些词直接相关(即直接联系)的概念,进而扩散到这些概念的邻近概念,依此类推。最初被激活的词义的首选是那些能够导致来自不同词义的激活信号早期“交汇”的词义。具体来说,从“植物”的义项 1(活植物义项)传播的激活信号会经过四步(沿着与植物可以从水中获取食物的信息相对应的路径)到达表示物质的“水”的概念,而从用作动词的“水”一词,其语义表征表达的是向某个目标物体供水的想法,则只需两步即可到达相同的概念。虽然植物作为制造装置的意义最终可能也会导致水的概念,但相应的激活路径会更长,因此植物作为生命体的意义会“胜出”。