计算语言学(四)

修改是所有语言的普遍存存现象,如以下句子所示:

(3.11)

玛丽非常聪明。

(3.12)

玛丽是一个国际名人。

(3.13)

叛乱完全失败了。

在(3.11)中,非常函数作为谓词修饰符,特别是一个缩小的修饰符,因为它的一组非常(p)是p的东西。我们是否需要在我们的逻辑表单中需要这样的修饰符? 在这种情况下,我们可以避免使用修饰符,通过假设智能对智能程度的拼接参数,智能(x,d)意味着x智能到程度d; 添加那个阈值t的d>t会表示x非常聪明。 可以类似地处理其他学位形容词。 但是,(3.12)的国际名人不可用。 国际被戏罚(而不是相交的国际名人并不是国际和一个名人),而人们则可以想象特定组合,国际名人在普通的对方框架中的定义,要求这些定义可以为构建初始逻辑表格提供这些定义为广泛覆盖的解释创造强大的障碍。 (3.13)示出了第三种类型的谓词修改,即副词的VP修改。 请注意,修改器不能被统一被视为关于Davidsonian事件参数的隐式预测完全预测,而不是失败。 在一起,实施例表示允许在语义表示中允许Monadic-Demicatifer的可取性。 在讨论后立即提供了核状证据。

与蒙塔古语法有关的重征已经提到,毫无疑问,对自然语言的语义表示需要以某种方式捕捉重征性。 句子

(3.14)

约翰认为我们的宇宙是无限的。

(3.15)

约翰看起来很开心。

(3.16)

约翰设计了一个星舰。

(3.17)

约翰穿着假胡子。

都涉及重征。 态度句(3.14)的含义(以及由此值)取决于从属条款的含义(内涵),而不仅仅是其真实值(扩展)。 (3.15)的含义取决于快乐的意义,但不需要幸福成为约翰的财产或其他任何东西。 (3.16)的含义不依赖于星舰的实际存在,但取决于该短语的含义。 (3.17)中的假胡子是指除了实际胡须之外的东西,尽管其意义自然取决于胡须的含义。 蒙塔哥维亚分析肯定会用这些句子一般地处理。 但再次,我们可能会问蒙塔古的类型理论的表现丰富程度是多少对计算语言学至关重要。 首先,诸如(3.14)之类的句子在古典模态逻辑中是表示的,而不用于更高的类型。 另一方面, 蒙特拉圭的适度让步足以处理(3.15) - (3.17),是向我们的代表性词汇承认强烈谓词修饰。 然后,我们可以将外观视为谓词修饰符,所以看起来(快乐)是一种从快乐的意义派生的新谓词。 同样,我们可以将设计视为谓词修饰符,如果我们愿意将星舰视为令人遗程的短语,我们将在“企业是星舰”中。 最后,假装是非常自然地被视为谓词修饰符,尽管与大多数名义修饰符不同,但它没有相交(#John穿着胡子的东西,是假的)甚至是钟声(#John穿着特定的胡须)。 请注意,这种形式的重征不致力于高阶逻辑 - 到目前为止,我们不会量化谓词扩展或强度,仅限于个人(除了需要允许多个实体,如上所述)。 在我们的语义词汇中的密集谓词修饰符的相当引人注目的情况强化了上面制造的情况(基于延伸示例的基础),以允许谓词修改。

更新,就像已经列举的现象一样,也普遍存在于自然语言。 示例在以下句子中看到。

(3.18)

人类可能是自我毁灭的途径。

(3.19)

雪是白色的。

(3.20)

礼貌是一种美德。

(3.21)

鲁莽地驾驶是危险的。

(3.22)

对于约翰福克是不寻常的。

(3.23)

我们的宇宙是无限的是一个众所绝应的概念。

(3.18) - (3.21)是谓词雷则的例子。 (3.18)中的人类可以被视为从名义上谓词人,即,具有词汇意义k(人类),其中k将谓词强化映射到个人。 作为个人的抽象状态是通过谓词“在自我毁灭之路”中的事实中证明了普通人的种类。 术语的名称相同的特征是明显的,因为它不能被形容词更容易被更新。 (3.19)和(3.20)中的受试者可以类似地分析K(雪)和K(对齐(Pirite))。 (这里是一个改变谓词礼貌的谓词修饰符,它适用于普通(通常是人类)个人,进入普通的(通常是人类)的人,以追踪抽象的东西,礼貌的数量。)但是在这些情况下,K算子不会源于lexicon,但在规则中一对类型“NP→N,NP'= K(n')”。 这允许在冻结诸如蓬松的雪或过度礼貌之类的短语中进行修改。 (3.21)的主题可能会逻辑地呈现,如Ka(鲁莽)(驱动器)),其中ka重新refies谓词,并且最重要地将Monadic谓词强度转换为初期的谓词修饰符。 最后(3.22)说明了一种类型的句子意义叙述,再次产生一种; 但在这种情况下,它是一种情况 - 这种情况的实际特征在于John Sulking。 在这里,我们可以分配一个纠正函数ke,将句子加重映射到各种情况下。 这种类型的句子reedization需要与该条款的纠正区别,例如似乎参与(3.14)。 我们提到了(3.14)的模态逻辑分析的可能性,但谓词适用于雷则句子的预测分析(一个命题)实际上是更合理的,因为它允许在语境中均匀地治疗那个 - 3.14)和(3.23)。 利用澄清算子是一项偏离严格的蒙特盖夫方法,但如果我们试图通过采取谓词是真实的或虚假的个人,而不是任意高类型的物体,并且同样需要采取令人遗憾的是在所有情况下,量化是在所有情况下的个人,即是一阶。

一些计算语言学家和AI研究人员希望在避免外面的标准一阶逻辑之外的富有表现力的设备进一步。 可以用来处理FOL中的重征的一个策略是使所有谓词,保存一两个谓词。 例如,我们可以治疗掠夺性,例如罗密欧喜欢朱丽叶,因为特定时间“持有”的功能的价值观:持有(爱(罗密欧,朱丽叶),T)。 这里喜欢被视为一个函数,产生了redification属性,而持有(或某些提议,真实)和暂时的平等,是表示语言中唯一的谓词。 然后我们可以正式化(3.14),例如,没有求助于密集语义

持有(相信(约翰,无限(宇宙)),t)

(其中T是一些特定的时间)。 人类在(3.18)中可能会被认为是所有人类的集合:

∀x∀t[持有(成员(x,人类),t)↔持有(人(x),t)],

(预先展现了Naïve集合理论的一些公理化); 并且,另一个例子,可能会呈现(4.22)

持有(不寻常(Sulk(John)),T)

(对于某些特定的时间t)。 然而,在密仰的环境中遇到这种策略的困难,如在句子中,“约翰认为每个星系都是一些生命形式。” 虽然我们可以代表(难以置信的)宽范围阅读“对于每个星系,有一些生命形式,使得约翰认为,John认为生命形式”使用持有策略,我们不能容易地代表自然狭窄的范围读数,因为人们不允许功能术语中的可变绑定运算符(但请参阅McCarthy 1990)。 一种完全不同的方法是将“最终性”参数引入所有谓词,并将预测视为才能为实际世界提供关于实际世界的事件,只有在对应于该预测的最终被断言“发生”(Hobbs 2003)时才提供关于实际世界的事实。 这些方法背后的主要实际推动力是能够利用现有的FOL推理技术和技术。 然而,目前没有理由相信在任何易于在与自然语言结构的含义差别表示的意义代表中难以困难的任何推论; 相反,近期实施自然逻辑(MacCartney&Manning 2009)表明,大类明显推论可以在句法分析的自然语言中最容易地实施(Modulo一些调整)-A框架更接近蒙塔戈维亚语义比基于FOL的方法。

Canonicalization,主题角色(再次)和基元

另一个重要问题一直是CANONICALICAILION(或归一化):应对初始逻辑表格应用哪种转换,以最大限度地利用语言派生信息的困难? 通过选择规范表示应该促进的用途包括在以前解释的文本(以及一般知识)的背景下的进一步文本的解释,以及推论问题应答和其他推理任务。

我们可以区分两种类型的规范化:逻辑归一化和概念规范化。 呈信逻辑和字样的逻辑归一化的示例是转换为条款表单(Skolemized,无量词的联合正常形式)。 基本原理是将多个逻辑上等效式减少到单个形式降低了推理的组合复杂性。 然而,在具有“细粒度”语义的密集逻辑中可能无法进行全归一化,例如,相信地球是圆形的,可以从语义上从地球是圆形而且月亮是平坦的或不平坦的,尽管逻辑等价那些信仰。

概念规范化涉及更自主派的变化:我们用来自较小的曲目的规范术语替换表面谓词(以及可能的代表词汇的其他元素),以及使用主题角色或帧槽来分解它们。 例如,在地理域中,我们可以替换关系(在国家之间)旁边,与边界相邻,是一个邻居,与单个规范关系共享边界,与单一的典型关系说明。 在物理,通信和心理事件的域中,我们可能会进一步和分解成原始谓词的配置。 例如,我们可能以Schank的方式表达“X Walks”

∃e,e'(ptrans(e,x,x)∧移动(e',x,英尺(x))∧逐个(e',e)),

其中ptrans(e,x,y)是表示事件E是由对象y的代理x的物理传输的原始谓词,移动通过代理的体动词,并且逐个表示移动事件和ptrans事件之间的仪器 - 动作关系。 如前所述,这些多参数谓词可能进一步分解,用PTRANS(e,x,y)被重写为ptrans(e)∧代理(e,x)∧主题(e,y),等等。 如在逻辑归一化的情况下,概念规范化旨在简化推断,并最小化对哪些推理是基于的公理的需求。

Canonicalization提出的一个问题,特别是由涉及减少对原语的强大版本,是在这个过程中丢失了重要意义。 例如,与仅仅是邻居不同,邻国的概念表明,这种国家的人口并行存在的想法,这种方式是一种类似于当地社区中邻居的并排存在的方式。 更加严峻,通过移动一只脚来减少走路以运送自己的概念无法区分步行,跳跃,滑冰,也许甚至是骑自行车。 因此,可能优选地将概念规范化视为重要征集的推理,而不是在更限制的词汇表中通过等同物中更换浅表形式。 后期职位的另一个论点是计算:如果我们将复杂的行动分解,例如在餐馆的用餐,进入原始掠夺性的星座,即使在回答“在餐馆约翰用餐”等简单的问题时,我们也需要匹配这些星座的许多原始部分。 我们将在以下小节的上下文中进一步发表原始人。

3.2心理上的意义方法

虽然许多AI研究人员一直对语义表示和推断感兴趣,作为在机器上实现语言和推理能力的实用手段,其他人从建模人类认知的角度来看了这些问题。 在20世纪80年代之前,几乎完全在代表性范式范围内更广泛地追求NLP和认知的计算建模,即将所有智能行为所重复于符号操作(Newell和Simon的物理符号系统)假设)。 在20世纪80年代,连接人士(或神经)模型享有重新疗效,并且许多人认为是对竞争的代表性的方法。 我们简要概述了下面的两个副标题下的这些发展。

代表性的方法

“物理符号系统具有普通智能行动的必要和充分手段。” -Allen Newell和Herbert Simon(1976:116)

在代表性范式范式内工作的一些认知动机研究人员特别关注认知架构,包括概念之间的联合联系,记忆类型与表示类型之间的区别(例如,episodic与语义。内存,短期与长期记忆,声明性与程序知识),以及这种架构的可观察处理后果,例如感知消歧,相似度判断和处理延迟中反映的认知负载。 其他人更关注揭示似乎强弱语言和思想的实际内部概念词汇和推理规则。 M. Ross Quillian的语义记忆模型,以及由Rumelhart,Normelhart,Lindsay开发的模型(Rumelhart等,1972; Norman等,1975)和Anderson和Bower(1973)是前者的代表透视,而Schank和他的合作者(Schank和Colby 1973; Schank和Abelson 1977; Schank和Riesbeck 1981; Dyer 1983)是后者的代表。 关于语义表示的认识性激励理论上的一个共同线程已经利用了图形语义记忆模型,旨在捕获直接关系以及概念之间的间接关联,如图3所示:

[两棵树,所有父母连接

除非另有说明,否则通过固态箭头线向其节点。 这

首先,在左侧,有一个单词的盒装父母

'plant1'的'植物'和节点(它本身

有'结构'的节点[由标记的线连接

'ISA'],'生活'[用标有一行连接

'prop'],'动物'[用标有一行连接

'-prop'],'with3'[连接线

标记为“prop”和一个节点'叶子'],

'get2'[连接与标有'prop'的线

而且标记为“subj”的反向线,它有两个节点,

'食物'与标有'obj'的一行连接

“来自”,后者也有节点的“空气”,

'地球'和一个破折号盒装'水'{the

这三个节点的连接线也与虚线连接

arc标有'或'}]),'plant2'(它本身

有一个标有一行连接的“设备”的节点

'ISA'和两个虚线的线路无处可去),和

'plant3'(它本身有三条虚线

无处); 三个植物节点的连接线也是

与标记为“或”的实体弧连接。 第二棵树

用“水”这个词的盒装父母有两个虚线

线路无处可去,节点'supply5'(它本身有

三个节点,'人'与标有一行连接

'subj',短口从第一个盒装'水'

与标有'obj'的线连接的树,

'to2'[它本身有一个节点'对象']; 这

顶部父级下方的三条线通过标记的虚线连接

“或”]

图3

这个特殊的例子是基于Quillian(1968)的松散。 Quillian表明,语义记忆的一个功能之一,以这种图形方式构思,是通过传播激活来实现词语感歧义。 例如,句子的处理“他浇水植物”将涉及术语水和植物的激活,并且这种激活将传播到与这些概念的那些术语直接相关的(即,直接联系到)的概念。 最初激活的术语的优选感官是导致源自不同术语的激活信号的早期“交叉点”的感官。 特别地,从感测1(起生气工厂意义)传播的激活信号将达到东西的概念,其中四个步骤(沿着对应于植物可能从水中获取食物的信息的途径),并且将从术语水中的两个步骤中达到相同的概念,用作动词,其语义表示将表达向某些目标对象提供水的想法。 尽管作为制造设备的植物感可能最终可能导致水概念,但相应的激活路径将更长,因此生活植物的植物感会“赢”。

这种概念性表现趋于几个方面的逻辑方面不同。 如已经讨论的,一直是Schank和各种其他研究人员的重点,(例如,Wilk 1978; Caprendoff 1990)就“深处”(规范)表示和原语。 经常引用基元的心理论证是人们相当迅速忘记他们所阅读或被告知的确切措辞,只回顾“GIST”; 这是原始分解旨在派生的主旨。 然而,这涉及一个问题的假设微妙的区别,说,步行到公园,闲逛到公园,或traipsing到公园是简单地忽略的解释过程中,和如上早期它忽略的可能性看似微不足道的语义详细信息是修剪从内存后有很短的时间,而主要entailments保持不变为一个较长的时间。

关于概念表示的大部分理论上的另一个共同应变是有关逻辑表示和指示语义的一定的困难。 据说有关语言的相关语义是从语言话语转移到内部陈述,并且据说内部陈述的相关语义是他们在理解和思想中部署的方式。 对于外部语言和内部(Mentalese)表示,据说语义框架是否为它们提供了正式的真理条件,因此可以无关紧要。 拒绝逻辑语义有时已经概述了一个不能与可能的世界计算的标题。

然而,似乎可以通过注意到这两个品牌的语义是相当不同的目的,因此可以解决概念语义和逻辑语义之间的任何感知冲突。 当然,它完全适合于概念语义,专注于从语言到象征结构的映射(在头部,最终实现某种类型的神经组装或电路),以及这些结构在理解和思想中的运作。 但是,逻辑语义也具有合法的作用,同时考虑如何与世界有关单词(和更大的语言表达)以及内部语义表示的符号和表达方式与世界有何相关。 这种作用是传言法的,因为目标不是在可以计算地操纵的认知实体,而是提供一种理论上的框架,以了解人们使用的符号与语言和内部的思想内部的关系,以及他们生活的世界。 肯定是不可否认的,话语至少有时旨在被理解为世界上的事物,属性和关系的权利要求,因此至少有时是真或假的。 如果他们无法捕捉到它的真实性,难以理解语言和思想如何发展成为与世界的有用手段。

此外,逻辑语义表明,无论这些操纵中涉及的符号的具体含义(以及这些概念都可以扩展到不确定推断,虽然这仍然只是非常恰当地理解,但逻辑语义如何从真理到真理。 因此,逻辑语义为评估推理规则的声音(或其他方式)提供了基础。 虽然人类推理以及在实际的AI系统中的推理通常需要采取不健全的方法(绑架,默认推理,贝叶斯推理,类比等),但逻辑语义仍然提供了对这些方法的性质进行分类和研究的基本观点。 强烈迹象表明,认知激励语言的概念表达与逻辑动机可与逻辑动机和解是事实上,所有提出的概念表现都是故意从逻辑借来的(在他们使用预测,连接,集理中的使用时尽管正在认知动机,但概念,有时可以将逻辑表达转换为逻辑表现,而不会困难。

连接主义方法

如前所述,20世纪80年代看到了主流认知科学理论内的连接主义计算模型的重新出现(例如,费尔德曼和巴拉德1982; Rumelhart和McClelland 1986; Gluck和Rumelhart 1990)。 在我们对连接主义解析的讨论中,我们已经简要表明了连接主义模型。 但是,连接主义范式不仅适用于专业职能,而且可以广泛地进行专业职能,而是广泛的认知任务,包括识别图像中的对象,识别语音,理解语言,制定推论和指导物理行为。 通过调整分层神经网络中的单位与单元连接的权重,通常由分层的神经网络中的单位连接的权重,通常通过向涉及产生输出的单位来调整分层神经网络中的单位到单位连接的权重Rumelhart和McClelland 1986)。

从一个角度来看,对联合主义和神经建模的兴趣更新是努力制定认知内容的抽象概念并运作与脑理论和神经科学的可测试接触的自然迈出的自然步骤。 但它也可以被视为范式转变,到焦点对亚马逊加工开始与越来越多的怀疑主义与较高级别的象征性作为思想的态度相关联,与基于早期的语义网络和规则的规则相关的排序建筑。 例如,Ramsay等人。

(本章完)

相关推荐