计算语言学(三)
我们本可以使用该二阶谓词的原子符号,但是上述扩展方法显示广泛的量化与普通存在量化的关系。 虽然这是一个相当不言而喻的物质,但我们将在第4.1节中表明句子“θthis喜欢凡人”如何在一些λ转换后产生以下代表性:
(∃x[致命(x)∧loves(x)(x))。
(英语句子也有一个通用或习惯性的阅读,“Thetis喜欢凡人一般”,我们忽略了这里。)这种解释对它来说是一种古典的外观,而且因为我们已经建造在词汇中的普通量词的概括在上述规则中无限期A的语义,而不是使用原子符号。 蒙特拉尤对令人满意的地区令人满意的地方尤其感兴趣,例如“约翰寻求独角兽” 这不需要为其真相的unicorn存在 - 约翰与独角兽性有关,而不是现有的独角兽。 因此,Montague将所有谓词的论据视为强烈; 即,他认为“约翰寻求一个独角兽”
寻求(λq[unicorn(∧x)∧(∧x)])(∧john),
这可以减少到Unicorn被扩展到Unicorn *的版本:
寻求(λq[unicorn *(x)∧(∧x)])(∧john)。
但最终蒙塔梅对NPS的治疗,尽管它是一种感觉他提出的语言逻辑概念的核心,但在计算语言学中没有被广泛采用。 这部分原因是后一界不相信NL语义需要欧米茄秩序逻辑,发现在各种论点职位中对NPS有所复杂,特别是在多种句法方面处理范围歧义分析,没有吸引力,并专注于其他语义问题,例如充分代表事件及其关系,以及为广泛的NL分析开发系统名义和动词“本体”。 尽管如此,语言作为逻辑的构建留下了对计算语义的强烈印记,通常会引导现场朝向组成方法,以及在某些方法(如CCG),为语法紧密地耦合到理论上的语义(Bach等人1987; Carpenter 1997)。
Montague基于语法的量化方法的替代方案是歧义的含义,以便以初始化的逻辑形式初始未提升的高阶谓词形式的DET + N(或严格,DER + N-BAR)的NPS。随后“提出”,以便申请通过腾空术语位置的Lambda抽象获得的一阶谓词。 例如,在“每个人都知道一首诗”的句子中,对于存在的对象,我们将拥有欠指定的LF
knows⟨a(诗)⟩⟨every(人)⟩
(没有将决定者减少到古典量子),我们现在可以“提升”⟨a(诗)⟩屈服
a(诗)(λy知道(y)⟨every然而(人)⟩,
然后“提高”⟨every“(人)⟩
A(诗)(每个(人)(λx知道(y)(x))),
要么
每个(人)(λx(诗)(λy知道(y)(x)))))。
因此,我们根据哪些诗歌获得了一首诗歌,每个人都知道,另一个人根据每个人都知道一些诗(不一定是同一个)。 (更多关于范围消费者将在第4节中遵循)。 这种方法的系统版本,称为Cooper存储(参见BarWise&Cooper 1981)表示短语中的短语的含义,即一系列NP-解释(作为高阶谓词)和NP-解释的逻辑矩阵提取了。
但是,也可以采取更传统的方法,其中首先,在预测语义中使用“咖喱”(schönfinkel-church-curry)功能,以支持关系解释,使用如loves'=的词汇语义公式λyλx(Loves(x,y))和第二,未提出的np-解释被视为未备p的限制量词(Schubert和Pelletier 1982)。 因此,上面未经备注的LF是知道(⟨∃poem⟩,⟨∀person⟩氏)和量子的范围以及其限制器,现在涉及“培养”量词,以同时介绍介绍变量。 然后,对应于两个替代范围的两个结果
(∃y:诗(Y))(∀x:人(x))知道(x,y),
和
(∀x:人(x))(∃y:诗歌(y))知道(x,y)。
虽然这一策略从蒙塔古语法的严格的成分中脱离,但它达到了往往令人满意的结果,而且具有最小的计算大惊小怪。 逻辑形式和范围歧义的相关方法是享受一些当前人气的额外流行性是最小的递归语义(COPESTAKE等,2005),其进一步进一步分散了表达的有意义的部分,其目标是允许增量约束 - 基于这些部分的组装成明确的句子LFS。 另一个有趣的开发是一种基于持续的方法,这是一种从编程语言理论采取的概念(其中延续是由仍然在当前指令之后执行的步骤确定的步骤确定的程序执行状态)。 这也允许统一叙述量化器的含义,并为“错位修饰符”提供了这种现象的手柄,如“他有一杯咖啡”(Barker 2004)。
逻辑语义中的重要创新是话语代表理论(DRT)(kamp 1981; Heim 1982),旨在安息日的系统叙述。 部分地,目标是为NPS的(IN)提供的语义解释,作为视网膜代词的指数,例如,在诸如“John不会驾驶汽车的对比示例中 *他拥有它,“与”约翰驾驶汽车; 他拥有它“。 更重要的是,目标是考虑涉及驴Anaphora的令人费解的语义,例如,“如果约翰拥有驴子,他会击败它。” 不仅是NP驴,IF-zherage的目的,可以作为提到的药物,与传统的语法结合理论相反(基于C-command的概念),但此外,我们似乎获得了“约翰”的类型的解释。击败他拥有的每一个驴子“,它无法通过”筹集“嵌入式无限期的驴来获得整个句子的范围。 读取类型较弱,“如果约翰拥有一个驴子,他击败了他拥有的驴子”,而且这种阅读也无法通过任何范围分析获得。 Kamp和Heim提出了一种句子解释的动态过程,其中逐步建立了话语代表结构(DRS)。 DRS由一组话语引用(变量)和一系列条件组成,其中这些条件可能是简单的预测或方程式对话语指令,或DRS(不属于条件)的某些逻辑组合。 正在考虑的句子的DRS可以作为线性编写
[:[x,y:约翰(x),驴(y)]⇒[u,v:他(u),它(v),beats(u,v),u = x,v = y]]
或图为
[一个带水平线的盒子
把它分成两个。 上半部分占据了大约六分之一
空间,是空的。 下半部分包含另外两个盒子
侧面,双右箭头连接它们。 左侧盒子也是如此
水平分成两部分; 上半部分有'x,y';
下半部分有三条含有'John(x)'的行,
'驴(y)'和“拥有(x,y)”分别为'。
右箱也水平分为两部分; 上半部分
有'你,v'; 下半部分有五条线
“他(你)','它(你)','击败(你,v)',
'u = x'和'v = y'。]
图2:“如果约翰拥有驴子,他会击败它”
在这里x,y,v是由约翰,驴,他和它引入的话语指称,并且等式u = x,v = y代表他和它的参考分辨率的结果。 在整个条件的前所未有的内容中可以在嵌入的DRS中访问嵌入式DRS中的嵌入式DRS中的话语。 语义上,最重要的想法是动态评估话语指令。 我们将一个变量分配视为一个状态,而这种状态会发生变化,因为我们评估到内部的DRS,左右。 例如(简化一位),如果使用使前所true的域{x,y}的每个分配可以扩展到具有域{x,y,u,v}的域{x,y}的每个分配,则图4中的条件DRS是真的(在给定的模型中)使结果变得如此。
在它的脸上,DRT是非匹配的(尽管DRS建设规则系统地与短语结构规则有关); 但它可以重新循环成分形式,当然还有动态语义。 一种密切相关的方法,动态谓词逻辑(DPL)保留了经典的量化语法,但实际上将存在量化为非叛徒的分配,并为DRT提供了一个明显的组成替代品(Groenendijk&Stokhof 1991)。 也许令人惊讶的是,DRT对实际计算语言学的影响非常有限,尽管它肯定是并继续积极地在各种项目中受雇。 一个原因可能是Donkey Apaphora很少发生在迄今为止的计算语言学家最集中调查的文本Corpora(尽管它在通用句子和通用段落中可以说是普遍性的,并且非常重要,包括在词典中发现的那些诸如常识开放思维等来源,参见第4.3和8.3节)。 另一个原因是,非驴代词(和明确NPS)的参考分辨率被存在的技术容易地处理,例如存在的Skolemization,从而可以用早先引入的Sklem常数来识别出现的存在的阴影。 事实证明,即使对于驴Anaphora(例如,如果每个人都有枪,许多人将使用它)即使对于驴Anaphora(例如“,其中许多人将使用它),也可以甚至可能是甚至可能的肌肉吞噬,包括功能性的吞噬,包括功能性的Skolemization Schubert 2007)。 最后,DRT和其他动态语义理论影响有限的另一个原因可能是动态的:通常的公式的评估需要其前面和嵌入的上下文,这干扰了知识模块的那种(在a中使用任何给定知识项目的能力各种不同的上下文)可取的推理目的。 在这里,应该注意的是,来自DRT,DPL和其他动态理论的直接转换过程存在于静态逻辑的情况(例如,对于动态方法的非负压版本),但是如果这种转换是为了实际目的,则问题出现了是否以动态表示开始是有利的。
主题角色和(新)戴维森表示
语言语义中的一个长期问题一直是动词的论证结构中主题作用的理论状态和语言的其他论点(例如,DOWTY 1991)。 许多语言中发现的句法标记案例直观地对应于代理,主题,患者,仪器,收件人,目标等,以及英语,以及句子主题和对象通常分别对应于动作的代理和主题或患者,以及其他角色可以作为间接对象添加,或者更常用为介词短语互补和附属物。 为了向这些直觉提供正式的表达,许多计算语言学家将从语言衍生的口头(和其他)谓词分解为与表示主题角色的显式二进制关系增强的核心谓词。 例如,句子
(3.1)
约翰踢球到篱笆上
可能会代表(经过具体实施后)
∃e(踢(e)∧(e,now1)∧代理(e,John)∧主题(e,ball2)∧射门-coc(e,fence3)),
其中E被认为是作为踢的活动。 这样的代表被称为Neo-Davidsonian,承认唐纳德戴维森的宣传,该观点的倡导意见默认引入存在量化的事件(Davidson 1967a)。 前缀neo-表明所有参数和附属物都以主题角色表示,这些角色不是Davidson的建议的一部分,而是例如开发的(帕斯顿1990)。 (Parsons将主题角色的想法归因于4世纪BCE Sanskrit Grammarianpāṇini。)这种代表风格的一个优势在于它绝对从区分动词补果的烦恼任务中解释规则的作者纳入动词的Argument结构,从附件,用于添加修改信息。 例如,在(3.1)中尚不清楚围栏是否应该被视为提供踢的争论,或者它是否仅修改约翰踢球的行动。 也许大多数语言学家会判断后者的答案是正确的(因为没有推动目标位置的意图可以被踢的后一种答案,但直觉恰好是至少一个动词,如运球,踢,踢操纵,移动和运输。
但是,主题角色也引入了新的困难。 正如Dowty(1991)所指出的那样,主题角色缺乏明确定义的语义。 例如,虽然(3.1)清楚地涉及物理对象的任何动画代理,但PP明显地提供目标位置,这就不太清楚角色应该在(Web派生)句子(如3.2-3.4)中的句子他们将携带的语义内容:
(3.2)
冲浪将松散的石头折叠在脚下。
(3.3)
他面前的一辆大型卡车阻止了他对红绿灯的看法。
(3.4)
警察用嗅探狗闻到嫌疑人的行李。
同样,在主题关系方面的统一处理和辅助的统一处理并不能免除从识别动词短语的子类别成分的任务的计算语言学家(以及类似NPS和AP),以指导句法和解析和解释中的语义期望。 这些子类别的成分密切对应于动词的补充,与任何附属物不同。 尽管如此,主要使用主题角色表示,部分原因是与域知识的基于帧的知识表示良好。 这些是在其类型(将此与继承层次结构中的SuperTypes和子类型相关)中表征概念的表示,以及一组插槽(也称为属性或角色)和对应值,具有值的类型约束。 例如,在购买域中,我们可能有购买谓词,也许是SuperType获取,像购买,购买的亚型,购买信用卡或购买 - 用现金,以及诸如(买方(一个人)的类型的值(买方(一个人)-Group)),(卖方(一个人或群体)),(项目(物品或服务)),(价格(货币金额)),也许是时间,地方和其他属性。 与动词和名词相关感应相关的主题角色,如购买,销售,购买,获取,收购,接管,拾取,投资,挥发等等,可以轻松映射到上面的标准插槽。 这导致了规范化问题,我们在单独的标题下简要介绍下面。
表达问题
计算语义中的一种更加相应的问题是在诸如事件和时间参考的现象,非标准的量词等现象中使用的语义表示的表达性,例如大多数,复数,修改,模态和其他形式的形式,并重新化。 完全讨论这些现象将在此处不合适,但是每一个评论都是有保证的,因为语义解释和理解的过程显然取决于语义表示中可用的富有表现力的装置。
鉴于许多句子似乎描述了事件或情况,以及资格和提及他们,事件和情况参考是必不可少的。 例如,在句子中
(3.5)
昨晚莫莉咆哮了几分钟。 这醒来了邻居。
吠叫事件有效地提出昨晚发生了几分钟,并且证明代词这显然是直接指的; 此外,过去的时态在演讲时间之前的某些时候会在某些时候放置这一事件(并且即使没有时间状语也会这样做)。 这些时间和因果关系易于在上面提到的Davidsonian(或Neo-Davidsonian)框架内:
(3.5')
树皮(莫莉,e)∧尾夜(e,s)∧(e,s)∧持续时间(e)=几分钟(n)∧几(n)。 之前(e',s)之前的原因叫醒(e,邻居,e')∧。
但是,例子(3.6)和(3.7)表明,事件可以通过否定或量化的公式来引入,如Reichenbach(1947)所提出的那样:
(3.6)
没有下雨一个月,这导致了广泛的作物失败。
(3.7)
每个超级大国都有其核武库危机。 这种情况持续了几十年。
Barwake和Perry(1983)在他们的情况语义中恢复了这个想法,尽管这缺乏句子与事件之间的紧张耦合,可以说是捕获语言表达的因果关系。 Schubert(2000)提出了解决该问题的解决方案,其中包含一个与表征它们的句子连接的操作员的操作员。
关于非标准的量词,如大多数,我们已经勾勒出了蒙图语法的广义量化方法,并指出了使用限制量子的替代方案; 一个例子可能是(大多数x:狗(x))友好(x)。 我们可以使用经典量化器(Classifics)(在给定的解释下)来指定其语义,而不是以二阶谓词以二阶谓词进行分类,而是在满足狗(x)的大多数人(当用作x的价值时)真实(在给定的解释下)。(x)。 量化的决定员可以类似地对待少数,许多,几乎所有的等,虽然最终需要解决含量的问题(当然,这当然延伸超过量词以谓词,并且实际上是正式语义表示的所有方面)。 模糊的量词,而不是设置刚性定量界面,而是传达概率信息,好像已经应用了在制定量化的索赔中应用了某种不可靠的测量仪器,并且信息的接收者需要在更新时考虑这种不可靠性信仰。 除了他们的模糊性,讨论的量词不是一流的可定义(例如,Landman 1991),因此他们不能完全公开。 但这并不能防止实际推理,无论是通过直接使用这种量子在句子的逻辑表征中(一种自然逻辑精神的方法),还是通过将它们减少到框架内设定理论或信息化关系。
复数,例如
(3.8)
人们聚集在镇广场,
提出了一个问题,其中谓词的参数可以是由多个基本单独组成的实体(我们通常量化的那些,并归于属性。 对于该问题的大多数方法采用多个操作员,例如,PLUD,允许我们将奇异谓词P映射到适用于集体实体的多个谓词PLUR(P)中。 这些集体实体通常假设形成具有普通个人的原子元素(例如Scha 1981; Link 1983; Landman 1989,2000)的原子元素(例如,Scha 1989,2000)。 当假设重叠关系时,假设半统一的所有元素具有超级(完整性)时,结果是除了缺少底部元素之外的完整布尔代数(因为没有所有其他元素都没有空实体)。 一个理论问题是多个实体半统一对实体构成的材料部件的半理解的关系。 虽然理论细节存在差异(例如,Link 1983; Bunt 1985),但同意这些半晶片应在这种意义上对齐:当我们采取几个单数或复数实体的材料部分加入时,我们应该获得这些奇异或多个实体的连接的材料部分。 请注意,虽然一些口头谓词(例如(不及物)聚集)仅适用于收藏,但其他人,例如吃披萨,可根据个人或收藏品种。 因此,诸如
(3.9)
孩子们吃了一个披萨,
允许一个集体阅读,孩子们作为群体吃了一个披萨,以及一个分布式阅读,其中每个孩子都吃披萨(大概是一个不同的人!)在实践中处理这种歧义的一种方式是将多元NPS治疗集合表示读数和“集合的每个成员”之间模糊。 例如,(3.9)中的孩子将被视为儿童的收集(这是短语的基本意义)和每个孩子之间的暧昧。 这需要阅读类型的读数(3.8),但我们可以假设这一点是因为(不及物)收集需要一个集体论点。 在诸如此类的句子中
(3.10)
两个偷猎者抓到了三个aracaris,
然后,我们根据每个NP的两个解释获得四次读数。 没有读出来,因为捕获和被捕获都可以是个人或集体的事件。 一些理论家将提供额外的读数,但如果存在,它们可以被视为来自读数的衍生品,其中至少一个术语被共同解释。 但是,难以诉讼是复数呼吁在语义表示语言中进行丰富,以允许集合作为参数。 在诸如PLUR(子)的表达式中,将谓词转换为另一个谓词的PLUP运算符以及所产生的集体谓词是非标准类型。