计算语言学(六)

在无作用域量词方法中,通过对动词进行关系解释,图 4 中叶节点(单词)的相应解释将变为 Thetis、λyλx(loves(x, y)、λP <⟨∃P⟩>) 和 mortal,而根处的 S′ 将变为 loves(Thetis, ⟨∃mortal⟩),其作用域唯一地限定为 (∃x: mortal(x) loves(Thetis, x))。不难看出,当量词被带到句子级别时,多个无作用域量词将导致量词顺序的多种排列。因此,在诸如“每个男人都爱某个女人”这样的句子中,我们会有多种读法。

4.2 使语法的作用从属

在这一点上,我们应该停下来考虑一些不符合上述非常常见但并非普遍使用的语法驱动方法的解释方法。首先,Schank 和他的同事强调了词汇知识(尤其是动词分解中使用的原始动作)以及关于刻板行为模式的知识在解释过程中的作用,几乎完全忽略了语法。例如,一个以“John went …”开头的句子会生成一个 ptrans 概念化(因为 go 的词汇解释是基于 ptrans 的),其中 John 充当了主体角色,并且预期会出现一个可解释为位置的短语,这是与 ptrans 动作相关的角色配置的一部分。如果句子继续以“… to the restaurant”结尾,则预期得到确认,此时触发餐厅脚本的实例化,从而创建了对 John 和其他主体在餐厅中可能采取的行动顺序的预期(例如,Schank 和 Abelson 1977)。这些想法具有相当大的吸引力,并使得机器在理解某些段落长度的故事方面取得了前所未有的成功。另一种将语法置于语义之下的解释方法是采用领域特定语义语法(Brown and Burton 1975)。虽然这些语法类似于上下文无关句法语法(或许以类似ATN的方式进行程序化实现),但它们的组成部分的选择在所选应用领域中是有意义的。例如,电子教学系统可能会使用测量、假设或晶体管等类别来代替名词短语(NP),使用故障规范或电压规范来代替副词(VP)。这些方法的重要性在于它们认识到知识强有力地塑造了我们对文本和对话的最终解读,即使在存在噪声、缺陷和不完整的语言输入的情况下,也能帮助我们理解。尽管如此,自 1970 年代以来,大多数 NL 理解社区都将句法分析视为理解过程的一个重要方面,部分原因是人们认为将这个复杂的过程模块化对于可扩展性至关重要,部分原因是乔姆斯基提出了一个非常合理的论点,即即使在缺乏明确含义的情况下,人类的句法直觉也能可靠地运作,就像他那句名言“无色的绿色思想沉睡得很厉害”一样。

。统计 NLP 只是最近才开始关注推导可用于推理和问答的解释(并且如上一节所指出的,该领域的一些文献假设 NL 文本本身可以而且应该用作推理的基础)。然而,已经有一些值得关注的努力构建了统计语义解析器,这些解析器在经过 LF 标注的句子语料库或问答(或其他交流)语料库的训练后,学会生成 LF,其中学习的“基础”在于数据库或其他补充模型。我们将在第 8 节中提到这类工作的例子,并评论其前景。

4.3 应对语义歧义和欠规范

我们之前指出,语言在句法结构的所有层面都可能存在歧义,语义内容也是如此,即使是句法上无歧义的单词、短语和句子也是如此。例如,像 bank、recover 和 cool 这样的词即使属于同一词汇类别也有多重含义;像 ice bucket、ice carving、olive oil 或 baby oil 这样的名词性复合词没有明确名词之间的潜在关系(例如成分或目的)。在句子层面,即使对于确定性解析,也可能存在量词范围歧义(“每个男人都钦佩某个女人”——罗莎·帕克斯与他的母亲);习惯句和普通句经常涉及时间/非时间歧义(“赛马(通常)容易受惊”)等等。

已经提出了许多技术来处理各种语义歧义,从心理驱动的原理到基于知识的方法、启发式方法和统计方法。

心理上动力的原则是Quillian的传播激活模型(前面描述的)和在词感歧义中使用的选择偏好。 例如,在“工作花了五个小时”中可能会消除令人沮丧的时间,因为动词的感觉更喜欢时间补充,并且作业可能会消除任务(而不是说,职业),因为所以概念之间的直接关联链接任务及其时间需求。 基于知识的歧义的例子是基于雕塑可以从固体材料雕刻或构造的知识,或者基于知识的佩戴关系的人的歧义来歧义冰雕塑对本构造的歧义。帽子通常在头上磨损。 (可能首先使用有关通常由名义复合或通过修改的有限类型的关系的启发式缩小可能的含义。)范围消歧的启发式原理包括岛限制(如每一个,最多不能扩大它们的量子超出其本地条款的范围)和不同量子的宽范围趋势(例如,每个都是易于假设比某些更广泛的范围)。 统计方法通常在被认为影响所做选择的模糊的单词或短语附近提取各种特征,然后用已经在注释的文本语料库中训练的分类器进行选择。 所使用的特征可能是附近的语音或语音关系,句法依赖关系,形态特征等的特点。这种技术具有可读性和鲁棒性的优势,但最终将需要补充基于知识的技术。 例如,对比句子对形成诸如的句子对的正确范围

(4.1)

野餐的每个孩子都烧烤了一名维纳。

(4.2)

野餐的每个孩子都在看热气球开销,

似乎以不太可能被捕获为单词级别的统计规律性的方式依赖世界知识。

习惯性和通用句子呈现出特别具有挑战性的消歧问题,因为它们可能涉及时间/常规歧义(如上所述),此外可能需要增加量化副词和对表面形式缺失的量化结构域的约束。 例如,

(4.3)

赛马(通常)纯种时(通常)Skittish

没有量化的副词经常是明确的常规,嵌入了一般来说纯种赛马的纯种赛马。 (因此一般似乎是隐含的默认状语。)但是当量化副词存在时,句子承认,根据哪个纯种赛马在哪个纯种赛马在特征上进行了诸如效果的效果纯种赛马的常规遭受了频繁的Skitthish剧集。 如果我们通过在起始门上取代纯种,那么只有Skittish的episodic读数仍然可用,而通常可能对赛马进行量化,这意味着许多人在起始门上习惯性地进行了习惯性的方式,或者它可能会在起始门的情况下量化,暗示一般的赛马在这种情况下往往却闻到; 此外,在起跑门上的正式意识明显取决于关于赛马场景的知识。

这种判决提出的解释性挑战是(或应该是)在计算语言学中非常关注,因为人们对世界的一般知识最自然地以通用和惯常句子的形式表达。 系统的解释和消除此类判决的系统将立即提供一种汇集大量知识的方式,从诸如词典,百科全书和人群索赔的资料,例如开放思维中的通用索赔的资料来源汇集大量知识库常识(例如,Singh等人2002; Lieberman等人2004; Havasi等,2007)。 许多理论家假设这种句子的逻辑形式应该是三方结构,其中量化是定量对象或情况,限制量化域的restrictor,以及对域元素进行断言的核范围(主条款)。(例如,见Carlson 2011;科恩2002;或Carlson&Pelletier 1995)。 挑战在于指定从表面结构到这种逻辑形式的映射。 虽然上面所示的含糊不清的许多原则是合理的理解,但是仍然缺乏一般的解释性算法。 看来,这种算法将涉及逐步阐述最初不完整的,模棱两可的逻辑形式,而不是直接的语法语义转换,因为正确的形式化取决于超越语法:它们包括诸如卡尔森的个人级别/舞台层面区别在动词短语和他的物体级/善良层面区别在动词论证中(Carlson 1977,1982)以及诸如给定/新区分的务实特征(受短语影响重音),词汇预设,语言背景和背景知识。

5.发表意义

语义解释(计算和消除逻辑表格)之间的分界线和话语理解文本感 - 是一个相当任意的。 然而,对理解过程的严重情境和知识依赖性方面,例如解析视力解答,解释上下文依赖的名义化合物,填充“缺失”的材料,确定隐含的时间和因果关系(以及其他“一致性关系”),解释松散或比喻语言,当然,与预先存在的知识集成了语言上导出的信息,通常被称为话语处理的方面。

5.1处理参考和各种形式的“缺失材料”

语言已经进化以尽可能高效地传达信息,结果避免了冗长的识别描述和其他冗长的措辞,其中较短的描述。 这种趋势的一个方面是在阿帕拉看到的,在较早,潜在的更具描述性NP和后来的apaphoric代词或明确的NP之间的辛芯片的现象(具有类似的决定员)。 (偶尔也会看到反向测序,偶尔也可以看到。瓦解“),但机器有问题。

确定视力的(CO)指数可以以各种方式接近,如语义歧义的情况。 已提出的语言和精神语言学原则包括“经历术语”C“原则的性别和数量协议(例如,如果其指指的是解析树中的一个祖先的兄弟姐妹,则这一原则必须是代名词)(非)反身约束(例如,主题和对象不能在一个简单的条款中是经济的,例如”约翰指责他发生事故“),新神分/显着性(更近期/突出的引用是首选),并居中(最有可能的术语话语中的代理化是”关注中心“)。 一种早期启发式算法,采用这种类型的若干特征来解释一个兴趣者是霍布斯(1979)。 但是选择偏好也很重要。 例如,在句子中,“他撞到了含有覆盆子糖浆的酱船,溢出它”,“代词可以确定与覆盆子糖浆而不是酱船,因为溢出更喜欢液体(或松散的骨料)作为它的对象。 随着替代的延续,“......敲门,”科技的选择将被逆转,因为敲门优先雄厚的东西和直立作为它的物体。 也可能涉及更微妙的世界知识,如在特里Winograd的众所周知的例子中,“市议会拒绝了妇女游行许可,因为他们担心/倡导的暴力,”他们可以参考市议会或妇女,具体取决于动词的选择以及由此引发的相应刻板印象。另一个复杂因素涉及对实体、相关实体(例如部分)、命题和事件集合的指称,这些实体、相关实体(例如部分)、命题和事件可以成为代词(例如它们、这个和那个)或有定名词短语(例如这种情况或(房子的)门)的指称,而无需明确地以名词短语的形式出现。与其他类型的歧义一样,共指歧义已通过统计技术得到解决。这些技术通常会考虑上述因素,以及先行词的生命性和先前出现的频率等附加特征,并将其用作选择先行词的概率证据(例如,Haghighi & Klein 2010)。该模型的参数是从标注有共指关系和必要句法分析的语料库中学习而来的。

。简要回顾 N N 形式的名词性复合词,需要注意的是,与冰桶或冰雕等传统复合词(这些复合词可以通过丰富的词汇、启发式规则或统计技术来理解)不同,一些复合词可以根据语境获得多种含义。例如,rabbit guy 在关于穿兔子服的人的故事、关于兔子饲养员的故事或关于来自外太空的大型智能兔科动物的故事中可能指代完全不同的东西。这些例子揭示了复合名词解释和首语重复消解之间的某些相似之处:至少在更困难的情况下,N N 解释依赖于先前看到的材料,以及对先前材料关键方面的理解(在当前例子中,是穿兔子服、兔子饲养员或兔子类生物的概念)。换句话说,N N 解释,就像首语重复消解一样,最终依赖于知识,无论这些知识来自先前的文本,还是来自预先存在的背景知识储备。Fan 等人的著作中对此观点进行了有力的阐释。 (2009)假设在技术背景下,即使许多看似常规的化合物也需要基于知识的细化。例如,在化学背景下,假设HCL溶液需要细化成类似这样的东西:以HCL分子为基本结构成分的化学物质为基础的溶液。提供了算法(并经过实证测试),用于搜索从修饰词N到修饰词N的关系路径(受某些一般约束),并选择这样的关系路径作为N N化合物的含义。正如作者所指出的,这本质上是一种扩散激活算法,他们建议将此方法应用于更广泛的领域(参见5.3节关于综合解释方法的内容)。

。虽然可以将首语照应和某些名词性复合词视为语义内容的缩写编码,但其他形式的“速记”则完全省略了语义上必不可少的材料,需要读者或听者自己去填充。这种类型的一种普遍现象当然是省略号,如前面的句子 (2.5) 和 (2.6) 所示,或以下例子所示。

(5.1)

莎士比亚会编造词语,你也能。

(5.2)

菲利克斯承受的压力比我大。

在 (5.1) 中,so 是 VP 组成词的占位符(在倒装句中),并且 (5.2) 默认包含一个最终谓语,类似于在 x 的压力下,其中 x 的压力需要与菲利克斯承受的(更大)压力量相关联。解释省略号需要填写缺失的材料;这通常可以在表面层面以连续词序列的形式出现(如在间隙和裸省略号示例 2.5 和 2.6 中所示),但如在 (5.1) 和 (5.2) 中所示,可能反而(或另外)需要调整引入的材料以在语义上适应新的语境。当引入的材料包含指称表达式时,情况会变得更加复杂,如 (5.2) 的以下变体所示:

(5.2′)

Felix is under more pressure from his boss than I am.

这里缺失的材料可能指的是 Felix 的老板或我的老板(分别称为严格和随意的解读),这种区别可以通过将先行词 VP 的逻辑形式视为仅包含一个或两个 lambda 抽象的主语变量来捕捉,即,示意性地为

λx)x is under more pressure from Felix's boss),

λx)x 受到 x 老板的更多压力)。

这两种解读可以被认为是先界定他的老板,然后填充省略的内容,以及将这些操作的顺序反过来(Dalrymple 等人,1991;另见 Crouch,1995;Gregory 和 Lappin,1997)。其他具有挑战性的省略形式是事件省略,如 (5.3)(其中 forgot 代表忘记带),完全无动词的句子,如 (5.4) 和 (5.5),以及无主语、无动词的句子,如 (5.6) 和 (5.7):

(5.3)

我忘了钥匙

(5.4)

因此有此建议

(5.5)

5 月 28 日从罗切斯特飞往奥兰多的航班?

(5.6)

真可惜。

(5.7)

。那达美航空的航班怎么样?

。在实际应用中,这类省略以及其他一些形式的省略,尽可能通过以下方式处理:(a)充分利用领域相关的预期,这些预期指的是话语中可能出现的信息类型和言语行为,例如航空旅行顾问询问航班信息;(b)将话语解释为对迄今为止构建的特定领域知识表征的扩充或修改。基于语料库的省略方法迄今为止主要侧重于识别文本中的VP省略实例,并找到相应的先行材料,这些问题与计算正确的逻辑形式无关(例如,参见Hardt 1997;Nielsen 2004)。

。另一个难以处理的缺失材料现象是隐式论元。例如,在句子

。(5.8)

。一些一氧化碳从尾气中泄漏到车内,但其浓度太低,不会构成任何危害,

。读者需要从概念上将其浓度扩展为车内空气中的浓度,并将危害扩展为对车内乘员的危害。在这个例子中,词汇知识“浓度(化学意义上的)是指某种物质在某种介质中的浓度”至少可以提供需要填充的“槽”,类似的评论也适用于危害的情况。然而,文本并未明确提供所有这些槽的填充物——提到的一氧化碳提供了一种填充物,但车内空气和车内潜在乘员(并且他们而不是车内装饰将面临风险)是从世界知识推断出来的。

。最后,另一种在某些情况下很常见的速记形式是转喻,即用与预期指称对象有显著相关的术语来代表该指称对象。例如,在机场语境中,

(5.9)

这是 574 航班吗?

可能代表“这是 574 航班的候机室吗?”同样,在适当的语境中,cherry 可以代表樱桃冰淇淋,BMW 可以代表宝马的股票市场指数:

(5.10)

我想要两勺樱桃。

(5.11)

宝马上涨了 4 点。

与其他类型的欠指定一样,转喻也可以从基于知识和基于语料库的角度进行研究。可以运用的知识包括选择偏好(例如,公司通常不会从字面上上升)、词汇概念层次结构(例如,WordNet 提供的层次结构)、关于常见转喻关系类型的一般知识,例如部分对整体、地点对事件、对象对用户、生产者对产品等(Lakoff 和 Johnson 1980)、何时推测此类关系的规则(例如,Weischedel 和 Sondheimer 1983)、命名实体知识以及有关相关实体的知识(例如,一家公司可能有一个股票市场指数,并且该指数可能上升或下降)(例如,Bouaud 等人 1996;Onyshkevych 1998)。基于语料库的方法(例如,参见 Markert 和 Nissim 2007)通常会运用这些知识资源,以及诸如词性标记、依存路径和潜在转喻附近的搭配等语言学和统计特征。至于解释过程的其他方面(包括句法分析),在足够狭窄的领域中,利用深层领域知识进行转喻处理可能非常有效,而基于语料库的浅层方法虽然可以更好地扩展到更广泛的领域,但容易陷入性能瓶颈,远远达不到人类的标准。

(本章完)

相关推荐