计算语言学(七)

5.4综合方法

显然,前面部分中列举了许多形式的句法,语义和语用歧义和强调彼此互动,并与世界知识相互作用。 例如,词感歧义,参考分辨率和隐喻解释是在句子中的相互依赖的

(5.15)

内布拉斯加州最高法院召开椅子,因为它被视为触电成为一种残酷的死刑。

首先,首先,它可以遵守内布拉斯加州最高法院或担任主席,但世界知识规定了表现出心理态度的中性学椅的可能性。 请注意,如果它被他替换,那么椅子被重新解释为一个人,并成为代词的指代指代所指的; 与此同时,然后将抛出抛出作为从办公室移除的隐喻(具有无情的含义)。

因此,对于共同解析所有形式的模糊性和缺点来说,似乎是必须的一个统一框架,至少在其分辨率影响推断的程度上。 已经提出的一些框架是加权绑架,约束解决和“散对”解释。 加权绑架(Hobbs等人1993)是基于主人或读者的任务来解释包括句子的单词序列,通过将该句子视为一般和上下文知识以及一些假设的逻辑后果,并保持为“轻量级”尽可能。 约束解决方法将语法,语义,语用学,上下文和世界知识视为提供对需要同时满足的解释的限制。 通常约束被视为侵害或排名,在这种情况下,目标是最小化约束违规,特别是具有相对强烈的限制。 (这里有一个关于认知语言建模的最优理论的联系。)松散的解释(FAN等人,先前与标称复合解释有关的CAN等人)搁置了句法模糊,但试图处理普遍的语义松动名义化合物,转喻和其他语言设备的含义。 它通过扩展⟨class1类型的语义三元组(从初步逻辑形式),关系,Class2‖,其中关系不能正确地将指定的类相关联,进入更长的链接,其中包含该关系并终止这些类。 寻找这些链取决于关于感兴趣领域可能的关系的背景知识。

前景

刚才提到的方法已应用于限制任务,但尚未解决综合语言解释问题。 他们都面临效率问题,而且 - 因为他们都取决于语言和世界知识的丰富基地 - 知识获取瓶颈。 我们在此评论了效率问题,但讨论了知识获取给第8节。

鉴于人们消除和理解语言的速度,可能会推出这些过程更紧密地与观察到的文本或话语拟合到熟悉的模式,而不是解决复杂的推论或约束满足问题。 例如,在诸如此类的句子中

(5.16)

他把切板放在玻璃上,它没有破坏,

代词被理解为指玻璃,即使世界知识将预测玻璃破裂,而切菜板没有。 (这个想法在意外的侧重于意想不到的内容在这里没有帮助,因为如果我们改变没有破裂,那么该指示者保持不变。逻辑结构),并使用该匹配选择参考。 从Winograd的处理有关一组妇女的游行许可的第5.1节的处理可能类似地依赖于(寻求)游行可能倡导一些原因的人们的熟悉程度。 请注意

(5.17)

市议会授予妇女游行许可,因为他们没有倡导暴力

妇女仍然愿意作为他们的指称,即使这通常是真实的社会,如城市议员,不倡导暴力。

如果歧义和(至少初步初步)语言理解的解释结果将通过学习模式引导更多,而不是通过形式化的知识,然后类似于基于特征的统计NLP中使用的方法,可以适用于其有效的机械化。

6.语言生成

因为语言生成是内部目标的有目的的活动,因此难以在目标导向思维和随后的语言输出生产之间造成边界。 通常,该过程分为内容规划,微孔,表面实现和物理呈现。 虽然这些阶段中的最后三个可以被认为是在相对小的信息中的操作(如下所述)(例如,导致一两句话或其他话语类型),但是通常被视为目标定向的交际规划的持续过程,在适当时连续地递给小集群到实际一代的剩余阶段。 我们首先讨论后一种转移,以突出其与理解的关系。

将一小组内部代表的想法转换为书面或口语文本是一个明显的感觉,即理解过程的反向,因为我们在前面的第2-5节中概述了它。 换句话说,从一些内部代表的想法开始,我们需要前进到这些想法的有序线性排列,以面向面向面向的逻辑形式,这简明和非重复和适当的索引(例如,在使用中,您在这里,现在和引用表达式),最后是作为说明或书面文本的实际表面实现和物理呈现。 关于理解所涉及的大多数或所有类型的知识以及在一代中发挥作用,以及知识是关于单词和短语的结构,关于结构和意义代表之间的关系,关于言论思想的传统(或创意)方式,关于话语结构和关系,或关于世界。

尽管这一反向关系,但语言生成传统上从计算语言学家那样不受语言理解的关注,因为如果要进行语言的内容在明确的,正式表示中可用,则可以至少用于生成标准输出模板,至少在足够窄的域中。 即使对于不受限制的域,对于单词序列的显式,明确的内部语义表示的转换也远使来自模糊字序列的显式语义表示的重建不那么问题。 类似的不对称性在语音识别和生成的水平上保持,占可维修语音发生器(例如,盲目的读取机器)的事实已经比可维修的语音识别器更长的(大约1976年)(从1999年出现左右)。

从少数内部思想引导到面向面向面向物体的分子表示的微孔过程通常通过识别预期的“块”作为特定类型的句法成分(如NPS,VPS或PPS)进行语言。 这通常是在将表达块的表达块的概念(或直接,词汇头)的选择。 这些过程的性质在内部代表上非常取决于内部代表性。 例如,如果在非常抽象的基元,主题关系和实体的属性价值描述方面,则块可能是围绕动作围绕动作的主题关系的集合,以及要引用的实体的突出属性集合的集合。 如果内部表示更换了更多的语言,则块将相对较小,通常是单一命题,并且词汇选择过程将类似于逻辑形式的内部释义。 如果有多个想法是言语化的,则需要进行订购决定。 例如,报告称挥舞着枪支进入当地酒商店的强盗,或者可以按此顺序报告,或者作为“匪徒进入当地酒商店,挥舞着枪”。 在对话中,如果贡献涉及提供和请求信息,请求应该持续。 在其他情况下,可能需要更简洁的形式的转换来使所代表的想法变得更接近表面形式。 例如,从逻辑形式表达John吃了一个含鸡肉和玛丽吃含鸡肉的卷饼,可能会产生更紧凑的面向面向的LF,因为约翰和玛丽每个人都有一个鸡肉卷饼的影响。 例如,在随意的话语中,可以制作更微妙的风格选择,可以将进食描述为抛光(假设内部表示允许这种面向面向的区别)。 此外,如上所述,面向表面的LF需要在符合对这些表达式的使用的实际限制的务实限制之外地引入诸如明确的描述和代词的上下文上的参考表达式。

简化了上述轮廓,因为它忽略了话语和上下文的某些微妙之处。 句子或其他话语类型通常涉及新的和旧(给定,预设)信息,而且还有一些涉及的概念可能比其他概念更强烈地聚焦。 例如,在“您订购的项目中,您订购的项目成本九十美元,而不是九,”物品的存在和身份以及它被命令的事实被认为是当前背景(旧)中的共同之处的一部分,也是收件人的信念所在物品的成本为9美元; 只有90美元的校正成本是新信息。 强调九十大提请注意正在纠正的假定信念。 因此,不仅需要对微孔阶段提供的概念内容,而且迹象表明是新的和旧的,以及什么是要强调或专注的方面。 规划师至少需要了解关于新和旧信息的措辞的知识(例如,使用无限期与明确NPS的使用),关于使用的物品的词汇预设和突出物(例如,成功的物品预先尝试,后悔认为φ预先假定φ,或者一些含义并非全部意识到,关于应力模式的预设,以及关于聚焦装置(例如压力和主题化)。 应用这些务实知识的效果是适当地将被切除到表面识别器的面向面向表面的LFS,或者对于不能掺入LFS的语用特征,以向LFS注释这些特征(例如,压力标记)。

倒数第二步是表面实现,使用关于语法语法接口的知识。 在限制域的系统中,此知识可能包括启发式规则和模板(可能的树模式),用于言语化LFS。 更广泛的发电机可能利用可逆的语法,以规则为规则的方式配制,并允许从逻辑形式转换到表面形式,与从表面短语结构到逻辑形式的“向前”转导。 复杂的发电机还需要考虑上面提到的务实注释,例如压力。 最后,语言表达的内容需要以阐述或书面文本进行物理呈现,以适当关注铰接,压力和语调,或者对于书面文本,标点符号,资本化,选择A或作为无限素的文章,斜体,斜线休息等等。

现在返回内容规划,这个过程可能是广泛的或非常有限的范围; 例如,它可以旨在提供复杂对象的细节,一组事件或参数,或者它可能会寻求不超过一个事实,问候语或确认。 我们讨论对话所需的强烈交互式的内容规划,以便我们在此处评论在此处更广泛的文本生成。 在这种情况下,要呈现的信息的组织是核心问题。 例如,叙述的事件或过程的步骤通常会按时间顺序排列; 可以安排结论的参数,以便旨在阻止该步骤(立即)的任何子内容在它之前; 对象的描述可能会从主要特征和零件进行详细信息。

在McKeown(1985)的文本系统中,在McKeown(1985)的文本系统中提出了一种生成井组织,段长描述和比较的早期方法,它使用了ATN的组织模式来序列部分对象的描述,例如对象的更常规类型,其主要零件和独特的属性,以及说明性的例子。 以后通过Hovy(1988)和摩尔和巴黎(1988年)通过依靠修辞结构理论(RST)(Mann和Thompson 1987)来更加密切地绑定到交际目标的内容规划。 RST Posits超过20个可能的文本之间可能的连贯性关系(通常是相邻的)。 例如,索赔的指定证据可以遵循索赔的规定证据,从而建立索赔之间的证据(称为核,因为它是主要点)和引用的证据(因为其子公司而被称为卫星)。 另一个例子是激情结果关系,其中核文本跨度描述了感兴趣的情况或事件,卫星描述了造型的造型行动,导致这种情况或事件。 通常,这些关系由话语标记(CUE单词和短语)发出信号,例如,但是,当所有或之后,并且在文本生成中很重要,以适当地使用这些标记。 例如,使用以下句子的使用增强了一致性,

(6.1)

当呼叫者询问他的社会安全号码时,约翰挂了电话,

通过发信号通知可能的激动结果关系。 由修辞关系链接的文本跨度可能包括单个或多个句子,可能导致递归(尽管不一定严格嵌套)结构。 修辞关系可以提供概念理解的交际目标(例如,通过阐述定义),信念(通过陈述证据),或因果理解(例如,通过加权结果关系,如(6.1)),以及这种方式收紧内容规划与交际目标之间的联系。

7.了解和参与,对话

“我们可以询问那种言论自题的言论方式......亚里士多德在寻求而不是纯粹正式的财产中寻找的根本中的修辞事业的基本性。” -Daniel N. Robinson,意识和心理生活,(2007:171-2)

对话是互动的目标导向(有目的)行为,并且在那种感知最自然的语言形式。 超过叙述或描述性语言,表面话语和扬声器交替的流动反映了底层扬声器目标和意图的相互作用。 然而,通过自己,对话中的话语是暧昧的目的,并且了解话语背景和话语领域需要制定或理解它们。 例如,

(7.1)

你知道这是什么日子吗?

可以被理解为答案,如“星期四,6月24日”,提醒当天的重要性,或者作为对收件人的心理警觉的考验。

这种话语的直接目的是改变听众的精神状态(特别是信仰,欲望和意图),而言语法案理论关注特定类型的语音作用直接或间接影响这种变化(奥斯汀1962; 1968年; Searle 1969)。 为了选择言语的行为,每个参与者还需要考虑另一个人的心理状态; 特别是,每个人都需要认识到另一个人的信仰,欲望和意图。 合作谈话中的话语惯例适用于促进此过程:发言者采用揭示其预期效果的区域,以及他们的致谢和转向巩固相互了解。 在这种方式,达到了混合倡议的对话和潜在的合作领域行动。

在先前对语言生成的内容规划讨论中,我们对此过程中的交际意图的形成毫无疑楚。 但在目的的对话的背景下,必须考虑对话代理人如何到达意图传达某些想法,例如episodic,教学或描述性信息,请求,确认和/或接受请求,一个问题的答案,支持结论等的一个论点

如在生成扩展描述,叙述,参数等的情况下,使用RST,这里的自然观点是围绕目标定向规划的一个。 事实上,这种观点在历史上的应用程序在延长了秘密的申请之前。 特别是,科恩和理由(1979年)提出了代表其先决条件和效应的推理,规划和计划表彰框架,即代表言论行为。 例如,一个简单的Inform语音动作可能具有以下先决条件(从第一人称扬声器的角度来配制可辨证性):

听众(我的对话伙伴)不知道某个命题x是否为真;

听众想要被我告知我是否是真的; 和

我事实上知道x是否为真。

实施通知作为话语的效果是听者知道x是否为真。 这种框架的一个重要特征是它可以考虑间接语音行为(艾伦和遗忘1980)。 例如,作为一周日期或日期的间接请求,可以被视为表明扬声器的认识,因为只有在满足该行为的知识 - 前提时,听者才能执行所请求的信息传达行为。 此外,由于听者认识到质疑潜在行为的前提是请求该法案的一个间接方式,然后(除非上下文提供相反的证据),听众会推断发言者希望听者能够执行信息传达的语音行为。 请注意,推理和规划框架必须允许迭代的方式,例如“我相信你想让我告诉你今天的日期”,或者“我相信(因为我刚刚制作的请求),你知道我希望你把盐摇摇者传给我”。 重要的是,还必须有额外的相互信仰和意图,因此可以作为上下文的一部分保持共同的地面,并且可以发生合作。 如果每个参与者持有这种信念,那么与会者相互相互相互遵守他们相互持有信仰的信念。 可以假设对话中参与者的相互知识包括出言权的公开内容和普通的一般知识,包括话语公约的知识。

由于对话的最终目的可能是在世界上实现某些事情,而不仅仅是在参与者的思想中,也需要在域级别发生的推理,目标定向的规划和行动。 言语行为的目标在于不是本身,而是对域中的其他目的意味着,也许是通过物理动作(例如设备修复)来实现。 结果,面向任务的对话恰好以遵循或“回声”域实体的结构的方式构造,以及它们可以故意行动的方式。 这些考虑因素导致了Groxz和Sidner在面向的任务对话中的对话结构理论(格罗斯和Sidner 1986)。 他们的理论中心周围围绕着堆叠“焦点空间”推动和弹出“焦点空间”介绍的关注的思想。 焦点空间搁置在其所考虑的域行动的结构化表示。 例如,设置将零件连接到某些设备的协作目标将将相应的焦距推向堆叠上。 正如关于物理任务的知识所示,参与者接下来会口头向使用螺丝刀和一些螺钉的步骤致力于实现目标的步骤,并且通过将相应的子空间推到焦点堆叠上,将进行介导的对话的这一部分。 当实现子任务时,从堆栈中弹出相应的焦点空间。

涵盖基于计划的对话行为所需的推理和规划框架的推理和规划框架已经证明了限制域中的受限对话的可行性(例如,Smith等,1995),但迅速提出来语言覆盖和话语领域的范围的复杂性屏障被扩大。 规划总的来说,即使在命题规划形式主义(BAYLAND 1994)中,也是PSPACE-TEMPLED,并计划承认可以在要认可的目标数量中指数,即使所有可用于实现目标的计划都是提前已知的(杰布2004)。

为了响应这种困难,努力建立可用系统的研究人员已经尝试了各种策略。 一个是用适用于要处理的对话类型的精心设计的计划(如辅导,维修,旅行计划或安排维护)进行预先装备对话系统,并选择NLU / NLG中使用的逻辑词汇它与规划运算符和瞄准目标域的表面实现模式相同地网格。 (作为这种类型的值得注意的例子,参见Moore&Paris 1993.)通过这种方式,域名和文本规划和表面实现变得相对简单,至少与企图从划痕综合计划的系统或广泛地理解世界的系统相比,对话者,上下文,以及在表面级表达一个想法的最佳方式。 但是,虽然这种方法完全可取的实验系统旨在说明专门领域的计划和意图的作用,但它留下了开放的语言知识和世界知识可以纳入对话系统,并在规划中推断出来交际(和其他)行动。

另一种实现更近乎实际表现的策略已经预见(以及某种程度地学习)更多“反应性”(而不是审议)参与对话的方式。 反应性技术包括(i)公式理学,基于模式的反应(使埃丽莎联想),其中这些反应可能是合适的; (ii)基于规则的意图和计划承认; 例如,面对椭圆输入“飞往奥兰多航班”的自动旅行代理通常可以假设用户希望在可能已经建立的时间框架中向奥兰多提供从用户当前城市的航班选择; (iii)基于概率建模的统计域计划识别通常以追求域的目标特征的步骤序列; (iv)通过将言语行为(或话语行为)和对话状态分类为相对少量的类型,并将对话状态之间的转型作为由当前状态和当前的语音行为确定的事件来观察对话状态之间的过渡。 例如,在对话系统没有立即义务的状态下,用户询问问题,系统假定回答问题的义务,并转换到它将尝试履行该义务的国家。

然而,依赖于反应技术的系统倾向于缺乏深入的理解和行为灵活性。 基本上,基于知识的推断和规划被死记硬背行为所取代,通过当前话语状态的杂项特征和世界上观察的杂项特征来取代。 此外,故意推理和计划综合似乎是可以自主获取有效目标的计划和行为的代理人所必需的。 虽然随机试验和错误(如加强学习),监督学习和通过模仿的学习是其他学习选项,但它们的潜力是有限的。 随机试验和错误在语言和致辞行为的极大状态空间中是不切实际的; 监督学习(基于语境特征的适当选择)似乎最能诱导死记规范识别和话语状态转换(上文类型(III)和(IV)的反应行为); 只有在相关时才可以展示易于观察的示例性行为,而是可以向学习者呈现 - 而且自身,它只能引导到死记硬背而不是推理的行为。

通过将未来通过处理意图和暂定到目暂定来实现,将在将来实现与刻意推理和规划的反应方法可以通过更加刻意的推理来验证和潜在地修改,如果时间允许,可以通过更加刻意的推理进行验证和可能修改。 对于迭代方式的过度推理,也可以避免对相互信仰的效率更强的假设。 例如,我们可能会假设两个发言者和听众都自发地对世界和彼此的心理状态自发地进行向前推断,基于话语事件和共同的知识,并且这种前进的推论直接成为相互知识(在“主持”的“假设上),从而缩短许多模式嵌套推论。

8.获取语言知识

我们已经注意到语言理解和对世界关于词汇和短语意义的大量浅层和深度知识,以及关于话语和对话结构和公约的依赖。 如果机器要成为语言学胜任,我们需要向他们赋予这些知识。

(本章完)

相关推荐