计算语言学（七）_数学联邦政治世界观

5.2 建立联系

。文本和口语并非由孤立的句子组成，而是由相互关联、相互关联的话语组成，形成一个连贯的整体——通常是一个在时间和因果关系上结构化的叙述、一个系统的描述或解释、一系列的指示或一个结构化的结论论证（或者在对话中，如后面所述，问答式的交流、先请求后确认、混合主动性计划等）。

。

。这种结构在连续小句的层面上已经很明显，例如

。

。（5.12）

。约翰望着天空。天空因雷雨云而变得黑暗。

。（5.13）

。约翰望着天空，决定带上他的伞。

。在(5.12)中，我们理解约翰望着天空的动作在时间上与天空中乌云的存在重叠（即，乌云的情景至少包含了望着天空事件的结束）。在更深层次上，我们还理解约翰察觉到天空因雷雨云而变得黑暗，并自然而然地认为约翰像我们一样将这些云视为暴风雨即将来临的预兆。在 (5.13) 中，两个子句似乎报告了连续的事件，而且，第一个事件被理解为导致第二个事件的因果关系——约翰的决定是由他看着天空时所看到的东西驱动的；并且基于我们对天气和雨伞功能的了解，以及“每个人”都拥有这些知识的事实，我们进一步推断约翰察觉到潜在的雨云，并打算在即将到来的出游中用雨伞挡雨。

这些例子表明，解释扩展的多子句话语既取决于叙述惯例，也取决于世界知识；（描述性、指导性或议论文文类似）。具体来说，像 (5.12) 中的动作句后跟静态观察，通常暗示了我们注意到的那种动作-情境重叠；而像 (5.13) 中连续报道的动作或事件，通常暗示了时间顺序，或许还暗示了因果关系，尤其是当两个分句中有一个不是自愿行为时。这些暗示性推论大概反映了叙述者对格莱斯有序性原则的遵循，尽管从计算的角度来看，这样的观察并没有什么帮助。具体任务是制定叙述和其他形式话语的连贯性原则，并以可用的形式阐明有助于连贯的不同粒度级别的特定句法语义属性。

。因此，文献中提出了各种类型的修辞或连贯关系（在小句或较大的话语片段之间），例如 Hobbs (1979)、Grosz & Sidner (1986) 和 Mann & Thompson (1988)。提出的连贯关系包括阐述、举例、平行和对比。我们将在第 6 节（关于语言生成）中进一步讨论修辞结构。

5.3 处理比喻性语言

“)我)处于劣势，却又领先于形势，顺势而为，躲避子弹，突破极限。我正点，在执行任务，传递信息，并且戒掉了毒品……我活在当下，处于边缘，超越自我，却又不被人注意。我是一个高概念、低调、中程弹道的传教士。” ——乔治·卡林（《生命值得失去》，HBO 首播，2005 年 11 月 5 日）

。

。我们已经讨论过转喻的处理，它通常被视为一种修辞手法——一个词或短语代表其字面含义以外的其他含义。然而，虽然转喻本质上是一种缩略手法，但其他修辞手法，例如隐喻、明喻、习语、反讽、拟人或夸张（夸大）也能传达意义，尤其是内涵意义，而这些意义不易通过其他方式传达。我们在这里重点讨论隐喻，因为从某种意义上说，它是其他几种修辞手法的更普遍形式。此外，隐喻也受到了计算语言学家的极大关注，因为可以说隐喻渗透于语言之中，字面用法和隐喻用法之间没有截然的界限 (例如，Wilks 1978；Carbonell 1980；Lakoff and Johnson 1980；Barnden 2006)。例如，“气温下降”虽然可以理解为与“下降”同义的“下降”的含义，但它也可以被视为一个传统的隐喻，将下降的气温比作下落的物体。为了提供这类例子，Wilks 提出了一种处理范式，其中选择约束（例如对“下降”主语的物理对象约束）被视为单纯的偏好，而非硬性要求。

然而，处理隐喻需要的不仅仅是放宽偏好；它既依赖于语境，也深刻地依赖于知识。例如，

(5.14)

他认输了

可以是自助洗衣店场景中日常行为的字面描述，拳击手训导员象征性行为的字面描述，或在任何艰难努力中承认失败的常用比喻。但要完全理解隐喻的含义，包括惩罚性、注定失败的斗争的内涵，需要对拳击比赛有一个生动的概念。

。

。在计算隐喻中，一些作者，例如 Dedre Gentner（参见 Falkenhainer 等人，1989），认为它取决于共享属性和关系结构（同时允许不一致的属性），直接与被比较的概念相关。例如，在将原子与太阳系进行比较时，我们观察到一方面电子和原子核之间存在旋转关系，另一方面行星和太阳之间存在旋转关系。但其他人指出，隐含的比较可能取决于仅间接获得的属性。按照这种观点，寻找一个概念的隐喻是一个在知识网络中通过一系列步骤脱离原始概念的过程，每一步都会将一些现有特征转化为相关特征。霍夫施塔特等人（1995）将此过程称为“滑移”。其他学者（例如，马丁，1990，借鉴了拉科夫和约翰逊，1980）则强调先前存在的知识，即用隐喻的方式将一个概念连接到另一个概念，例如将无生命的东西转化为生命的东西。

。

。鉴于隐喻对语境和广泛知识的依赖，以及语言理解各个方面仍然面临的无数困难，因此，不存在一个通用的系统来处理语境中的隐喻也就不足为奇了，更不用说创造性地使用隐喻了。尽管如此，马丁的 MIDAS 程序能够在基于语言的 Unix 顾问程序环境中解读各种隐喻，这依赖于关于领域和隐喻映射的知识，这些知识是用 KODIAK 知识表示语言手工编码的。此外，其他一些程序也展现出了分析或生成各种隐喻示例的能力，包括结构映射引擎 (SME)（Falkenhainer 等人，1989 年）、Met*（Fass，1991 年）、ATT-Meta（Barnden，2001 年）、KARMA（Narayanan，1997 年）等。最近，Veale 和 Hao（2008 年）利用从 WordNet 和网络收集的属性，对基于滑移的隐喻方法进行了实证研究。本着类似的精神，但受到SME的启发，Turney (2008) 实现了一个“潜在关系映射引擎”(LRME)，以找到两个潜在可比描述（大小相等）元素之间的最佳映射；其思想是使用基于网络的共现统计数据来衡量不仅是任意两个给定概念（如电子和行星）的属性相似性，而且是任意两个给定概念对（如电子：原子核和行星：太阳）的关系相似性，并以此作为优化映射的指标。

5.4 集成方法

显然，前面几节列举的多种形式的句法、语义和语用歧义和欠规范是相互作用的，并且与世界知识相互作用。例如，在句子

(5.15)

中，词义消歧、指称消解和隐喻解释是相互依存的。内布拉斯加州最高法院将椅子扔了出去，因为它认为电刑是一种残酷的死刑形式。

首先要注意的是，它在句法上可以指内布拉斯加州最高法院或椅子，但世俗知识排除了中性椅子表现出心理态度的可能性。还要注意，如果用“他”代替，“椅子”就会被重新解释为人，并成为代词的指称；同时，“扔出去”就会被重新理解为一个隐喻，意为被免职（暗示着冷酷无情）。

...

因此，找到一个统一的框架来共同解决所有形式的歧义和欠规范问题似乎至关重要，至少在解决这些问题影响推理的范围内。目前已提出的一些框架包括加权溯因推理、约束求解和“松散式”解释。加权溯因推理（Hobbs 等人，1993）基于这样的理念：听者或读者的任务是解释构成句子的词序列，方法是将句子的含义视为一般知识、语境知识以及一些假设的逻辑结果，并尽可能保持“轻量级”。约束求解方法将句法、语义、语用、语境和世界知识视为对解释的约束，这些约束需要同时满足。约束通常被视为可废止的或经过排序的，在这种情况下，目标是最大限度地减少约束违规，尤其是相对较强的约束。（这与认知语言模型中的优选理论有关。）松散言语解释（Fan 等人，2009，先前在与名词性复合词解释相关时引用）忽略了句法歧义，但试图处理名词性复合词、转喻和其他语言手段含义中普遍存在的语义松散性。它通过将类型为⟨Class1, relationship, Class2⟩的语义三元组（来自初步逻辑形式）扩展为包含该关系并终止于这些类的更长链来实现这一点。寻找这样的链取决于关于感兴趣领域中可能存在关系的背景知识。

。

。前景

。刚才提到的方法已经应用于受限任务，但尚未解决全面的语言解释问题。它们都面临效率问题，而且——由于它们都依赖于丰富的语言和世界知识基础——知识获取瓶颈。我们在此评论效率问题，但将知识获取的讨论留到第 8 节。

鉴于人们消除歧义和理解语言的速度，人们可以推测，这些过程更像是将观察到的文本或话语与熟悉的模式相匹配，而不是解决复杂的推理或约束满足问题。例如，在这样的句子中

(5.16)

他把砧板掉在玻璃上，玻璃没有碎，

代词被理解为指玻璃，即使世界知识会预测玻璃会碎，而砧板不会碎。（沟通侧重于意外的想法在这里毫无帮助，因为如果我们将“没碎”改为“碎”，指称对象保持不变。）如果解释过程只是在易碎物体破碎的概念和玻璃破碎之间找到匹配（无论确切的逻辑结构如何），并在选择指称对象时使用该匹配，那么这种情况是可以预料的。在第 5.1 节中，Winograd 举了一个例子，拒绝向一群妇女发放游行许可证，其处理方式可能部分取决于人们对“试图游行的人可能主张某种事业”这一想法的熟悉程度。请注意

。

。（5.17）

。市议会向这些妇女发放了游行许可证，因为她们不主张暴力。

。人们仍然倾向于用“the women”来指代“they”，尽管像市议员这样的社会中坚力量通常不主张暴力。

。

。如果语言理解中的消歧和（至少是初步的）解释更多地是由学习模式而不是形式化知识引导的过程，那么类似于基于特征的统计 NLP 中使用的方法可能适用于它们的有效机械化。

。

。6. 语言生成

。由于语言生成是一种由内在目标驱动的有目的的活动，因此很难在目标导向的思维与随之而来的语言输出之间划清界限。该过程通常分为内容规划、微观规划、表面实现和实际呈现。虽然后三个阶段可以被认为是（按所述顺序）对相对较小的信息块进行操作（例如，生成一两句话或其他话语类型），但内容规划通常被视为一个持续的目标导向沟通规划过程，该过程在适当的时候将小块的思想观念依次移交给其余阶段进行实际生成。我们首先讨论后者的传导，以强调其与理解的关系。

。

。将一小组内部表征的思想观念转化为书面或口头文本，显然是理解过程的逆过程，正如我们在前面第2-5节中概述的那样。换句话说，我们需要从一些需要传达的内部表征的思想出发，对这些思想进行有序的线性排列，进而形成一种简洁、不重复且具有适当指示性的面向表面的逻辑形式（例如，在使用“我”、“你”、“这里”、“现在”和指称性表达方式时），最终实现实际的表面化，并将其物理呈现为口头或书面文本。理解所涉及的大部分或所有知识自然也会在生成中发挥作用——无论这些知识是关于词语和短语的结构、结构与意义表征之间的关系、传统的（或创造性的）表达思想的方式、话语结构和关系，还是关于世界。

尽管存在这种相反的关系，但语言生成传统上受到计算语言学家的关注少于语言理解，因为如果要言语化的内容具有明确的形式化表示，则通常可以使用标准输出模板进行生成，至少在足够狭窄的领域中是如此。即使在不受限制的领域，从明确、无歧义的内部语义表征到词序列的转换也比从歧义词序列重构明确的语义表征的问题少得多。类似的不对称性也存在于语音识别和生成层面，这解释了为什么可用的语音生成器（例如，盲人阅读机）的出现时间（约自1976年）比可用的语音识别器（约于1999年出现）要长得多。

从一些内部概念到面向表层的指示性表征的微观规划过程通常始于识别预期被动词化为特定类型句法成分的“词块”，例如名词短语、副词或副词。随后，通常会选择更面向表层的概念（或直接称为词汇中心），以此来表达这些词块。这些过程的性质在很大程度上取决于内部表征。例如，如果表征以非常抽象的基元、主题关系和实体的属性值描述为框架，那么组块可能是围绕某个动作的主题关系集合，以及待引用实体的显著属性集合。如果内部表征更像语言，那么组块相对较小，通常为单个命题，词汇选择过程类似于逻辑形式的内部释义。如果要表达多个想法，则需要进行顺序判断。例如，报道“一名强盗挥舞着枪进入了当地一家酒铺”可以按该顺序报道，或者写成“一名强盗挥舞着枪进入了当地一家酒铺”。在对话中，如果一个贡献同时涉及提供和请求信息，则请求应该放在最后。在其他情况下，可能需要转换为更简洁的形式，以使所表征的想法在风格上更接近表面形式。例如，从表达“约翰吃了鸡肉卷饼”和“玛丽吃了鸡肉卷饼”的逻辑形式出发，可以生成一个更紧凑的、面向表面的逻辑语言模型，即约翰和玛丽各吃了一个鸡肉卷饼。此外，还可以进行更微妙的风格选择——例如，在随意的话语中，吃饭可能被描述为“吃完”（假设内部表征允许这种面向表面的区分）。此外，如前所述，面向表面的逻辑语言模型需要引入语境中合适的指称表达，例如明确的描写和代词，并遵守语用学对此类表达的使用限制。

...

简化了上述轮廓，因为它忽略了话语和上下文的某些微妙之处。句子或其他话语类型通常涉及新的和旧（给定，预设）信息，而且还有一些涉及的概念可能比其他概念更强烈地聚焦。例如，在“您订购的项目中，您订购的项目成本九十美元，而不是九，”物品的存在和身份以及它被命令的事实被认为是当前背景（旧）中的共同之处的一部分，也是收件人的信念所在物品的成本为9美元; 只有90美元的校正成本是新信息。强调九十大提请注意正在纠正的假定信念。因此，不仅需要对微孔阶段提供的概念内容，而且迹象表明是新的和旧的，以及什么是要强调或专注的方面。规划师至少需要了解关于新和旧信息的措辞的知识（例如，使用无限期与明确NPS的使用），关于使用的物品的词汇预设和突出物（例如，成功的物品预先尝试，后悔认为φ预先假定φ，或者一些含义并非全部意识到，关于应力模式的预设，以及关于聚焦装置（例如压力和主题化）。应用这些务实知识的效果是适当地将被切除到表面识别器的面向面向表面的LFS，或者对于不能掺入LFS的语用特征，以向LFS注释这些特征（例如，压力标记）。

倒数第二步是表面实现，使用关于语法语法接口的知识。在限制域的系统中，此知识可能包括启发式规则和模板（可能的树模式），用于言语化LFS。更广泛的发电机可能利用可逆的语法，以规则为规则的方式配制，并允许从逻辑形式转换到表面形式，与从表面短语结构到逻辑形式的“向前”转导。复杂的发电机还需要考虑上面提到的务实注释，例如压力。最后，语言表达的内容需要以阐述或书面文本进行物理呈现，以适当关注铰接，压力和语调，或者对于书面文本，标点符号，资本化，选择A或作为无限素的文章，斜体，斜线休息等等。

现在返回内容规划，这个过程可能是广泛的或非常有限的范围; 例如，它可以旨在提供复杂对象的细节，一组事件或参数，或者它可能会寻求不超过一个事实，问候语或确认。我们讨论对话所需的强烈交互式的内容规划，以便我们在此处评论在此处更广泛的文本生成。在这种情况下，要呈现的信息的组织是核心问题。例如，叙述的事件或过程的步骤通常会按时间顺序排列; 可以安排结论的参数，以便旨在阻止该步骤（立即）的任何子内容在它之前; 对象的描述可能会从主要特征和零件进行详细信息。

在McKeown（1985）的文本系统中，在McKeown（1985）的文本系统中提出了一种生成井组织，段长描述和比较的早期方法，它使用了ATN的组织模式来序列部分对象的描述，例如对象的更常规类型，其主要零件和独特的属性，以及说明性的例子。以后通过Hovy（1988）和摩尔和巴黎（1988年）通过依靠修辞结构理论（RST）（Mann和Thompson 1987）来更加密切地绑定到交际目标的内容规划。 RST Posits超过20个可能的文本之间可能的连贯性关系（通常是相邻的）。例如，索赔的指定证据可以遵循索赔的规定证据，从而建立索赔之间的证据（称为核，因为它是主要点）和引用的证据（因为其子公司而被称为卫星）。另一个例子是激情结果关系，其中核文本跨度描述了感兴趣的情况或事件，卫星描述了造型的造型行动，导致这种情况或事件。通常，这些关系由话语标记（CUE单词和短语）发出信号，例如，但是，当所有或之后，并且在文本生成中很重要，以适当地使用这些标记。例如，使用以下句子的使用增强了一致性，

（6.1）

当呼叫者询问他的社会安全号码时，约翰挂了电话，

通过发信号通知可能的激动结果关系。由修辞关系链接的文本跨度可能包括单个或多个句子，可能导致递归（尽管不一定严格嵌套）结构。修辞关系可以提供概念理解的交际目标（例如，通过阐述定义），信念（通过陈述证据），或因果理解（例如，通过加权结果关系，如（6.1）），以及这种方式收紧内容规划与交际目标之间的联系。

7.了解和参与，对话

“我们可以询问那种言论自题的言论方式......亚里士多德在寻求而不是纯粹正式的财产中寻找的根本中的修辞事业的基本性。” -Daniel N. Robinson，意识和心理生活，（2007：171-2）

对话是互动的目标导向（有目的）行为，并且在那种感知最自然的语言形式。超过叙述或描述性语言，表面话语和扬声器交替的流动反映了底层扬声器目标和意图的相互作用。然而，通过自己，对话中的话语是暧昧的目的，并且了解话语背景和话语领域需要制定或理解它们。例如，

（7.1）

你知道这是什么日子吗？

可以被理解为答案，如“星期四，6月24日”，提醒当天的重要性，或者作为对收件人的心理警觉的考验。

（本章完）