思想的联想主义理论(三)
空间位置的学习通常需要单一的体验。 然而,若干试验可能需要说服该主题,即该地点是从审判试验中可预测的。 (Gallistel等,2004:13130)
Gallistel认为,小组学习曲线看起来是平稳的,渐进的原因是受试者之间存在很大的个人差异,当时阶梯曲线的开始延迟开始(Gallistel等,2004:13125); 换句话说,不同的动物采取不同的时间来开始学习。 当步骤开始而不是单独的动物的学习过程的速度开始时,个人受试者的学习曲线之间的差异是预测的。 所有人似乎都表现出在学习中迅速上升,但由于每个人开始在不同的时间开始学习,当我们平均过来时,迅速的逐步学习看起来像缓慢,渐进的学习(Gallistel等,2004:13124)。
9.2预测问题
预测问题是在其核心,联想机制如何导致获取主题/谓词结构的问题,许多理论家认为在语言,思想和判断中出现的结构。 对该问题的第一次重大讨论出现在康德(1781/1787)中,但在当代文学中可以看到基本的凯丽批评的变体(例如,参见,例如,乔姆斯基1959; FODOR和Pylyshyn 1988; FODOR 2003; Mandelbaum 2013a;对于凯丽争论的细节,请参阅康德的超越论证的条目)。
对于纯粹的联语人,关联是“语义透明的”(见Fodor 2003),因为它声称不增加额外的结构来思考。 当一个简单的概念x和一个简单的概念y时,成为关联一个,获取关联结构x / y。 但X / Y在其内容之上没有额外的结构。 知道x和y是关联的量,以了解因果关系:激活xs将带来ys的激活,反之亦然。 然而,所以争论似乎有些思想似乎具有比这更多的结构:思想鸟飞谓的飞往鸟类的财产。 联邦主义者的任务是解释关联结构如何区分一只单一(复杂)思想鸟类的思想家从一个在一个思想,鸟类的联想结构中连任两个简单的想法,鸟儿立即接下来,飞行。 只要这两个简单的想法是可靠的因果关系,所以对于思想家来说,鸟类的激活经常带来飞行,然后思想家拥有联想的结构鸟类/飞。 然而,思想家尚未遇到思想鸟类飞行。 预测的问题是说明纯粹联想机制如何发生复杂的思想。 在FODOR的条款中,问题归结为如何协会,心理陈述之间的因果关系,可能会影响预测,有意内容(福尔2003)之间的关系。
对联邦主义的一个相关异议可以被解释为这一主题的变化。 例如,用于联结主义理论的生产力,合成性和系统性问题似乎是预测问题的变体(关于这些具体问题,看到了思想假设和合成性语言的条目)。 如果关联不向相关联的心理表达添加任何额外的结构,那么很难看出它如何解释思想的组成性,这依赖于指定有意内容之间关系的结构。 合成性要求,复杂思想的含义由其简单成分的含义以及它们的句法排列来决定。 对联邦主义的挑战是解释联想机制如何引起区分复杂思想所必需的句法结构,就像鸟类一样从两种简单的思想鸟类飞行中飞翔。 由于思想的组成性被定位为暗逆思想的生产力(思想家的能力,以思考任意长度的新句子,例如绿鸟飞,巨型绿鸟飞,可爱的巨绿绿鸟飞行等),联邦主义有问题解释生产力。
系统数据是本论文,其中有可预测的模式中的想法是能够娱乐的想法。 可以招待某些结构思想的思想家可以随时招待具有相关结构的独特思想。 例如,任何可以认为复杂思想表单“x传递动词Y”的思想家都可以认为“y传递动词X”。[30] Systematicite需要我们不会找到任何只能思考这两个想法中的任何思想家,在这种情况下,我们找不到一个可以认为奥黛丽冤枉最大的人,但不是最大的奥黛丽。 当然,这两种思想在一个人的认知经济中有很大不同。 联合作用主义者的挑战是解释联想结构如何与结构最大/禁止/奥黛丽的结构区别,同时捕捉这些思想的效果的差异。
联想者对这个问题产生了不同的回应。 有些人否认人类思想实际上是组成,生产力和系统的,而其他非联赛主义者已经同意这种批评。 例如,Prinz和Clark声明“概念没有大部分时间编写”(2002:62),约翰逊(2004)辩称,系统性标准是错误的(见addye 1997,用于扩展这些问题的讨论)。 Rumelhart等人。 提供“架构”的连接主义解释,旨在涵盖本节中提到的一些现象(Rumelhart等,1986)。 其他人曾表明古典调理确实可以产生复杂的联想结构(Rescorla 1988)。 在捍卫复杂关联的联结主义教育,Rescorla写道,
显然,在与其元素的平行关联方面,这些动物并不简单地编码RH [复合]化合物。 相反,他们已经从事了一些更多的分层结构,形成了化合物的表示并将其作为助理。 (Rescorla 1988:156)
无论是联邦主义是否具有解释这些复杂化合物的理论工具仍然辩论(参见,例如,2003年福林2009; Gallistel和2009; Quilty-Dunn和Mandelbaum 2019; Quilty- Dunn等人。2023)。 值得注意的是,最近在深度学习的工作表明,连接主义模型可能能够表现出系统的组成概括。 例如,湖泊和巴拿尼(2023年)发现,通过元学习培训的神经网络 - 一个过程学习如何通过培训相关任务的分销培训 - 可以获得人类的系统概括能力,使他们能够正确地解释新颖熟悉元素的组合。 虽然这些模型是否真正捕捉人体构成性的性质的辩论,但这些发现挑战了连接主义架构无法系统地概括的长期假设。
9.3词学习
收购词典中的多个问题似乎导致联机主义问题。 下面审查了一些最知名的例子(用于进一步讨论Word Learning和Association,请参阅Bloom 2000)。
9.3.1快速映射
孩子们以令人难以置信的速度学习单词,按6岁以下的6,000个单词获得(凯瑞2010:184)。 如果逐步学习是规则,那么言语也应该在这段时间逐渐学习。 但是,这种情况似乎不是这种情况。 苏珊凯蒂发现了“快速映射”的现象,这是一个单词的一次性学习(1978A,1978B; Carey和Bartlett 1978)。 她最具影响力的例子调查了儿童的收购“铬”(指的是橄榄绿色的颜色字)。 孩子们被示出了两个违背的物体中的一个,它只有颜色不同,并问道,“你能告诉我铬托盘,而不是红色的杂音,铬一碟”(在2010年的凯号上召开)。 所有的孩子当时都有正确的托盘。 当孩子稍后在不同的背景下进行测试时,超过一半的记住了“铬”的指称。 这些调查结果已经延长 - 例如,Markson和Bloom(1997)表明他们并不特定于新颖的单词的记忆,而且还具有新颖的事实。
快速映射为联结主义带来了两个问题。 首先是新词的学习并没有缓慢发展,正如逐步学习的支持者所预说的那样。 第二是为了让这个词学习继续,思想必须通过环境而非额外的原则辅助。 其中一些原则,如Markman(1989)分类,整个对象和互动性约束,以及Gleitman的句法引导(Gleitman等,2005),意味着心灵确实为学到的内容添加了结构。 因此,联结主义者声称,学习只是在不添加结构的情况下映射外部突发事件。
最近的研究使联想主义模型不能占快速绘图的批评。 例如,Wang等人。 (2025)表明,神经网络通过在许多示例中通过元学习练习练习词学习,可以开发一次性的单词学习能力。 他们的模型在没有显式结构约束的情况下实现有效的词学习,只使用人类规模的儿童定向语言。 然而,这种方法仍然需要培训Word学习本身的特定任务,暗示中间地面:虽然纯粹的联系论可能不足,但通过元学习的结构化联想学习可能支持快速映射,而无需先进的限制。
9.3.2句法类别学习
“母亲”,婴儿一般听到的语言类型的名称,包括简单的句子,如“诺拉想要一个瓶子?” 和“你累了吗?” 这些句子几乎总是包含名词和动词。 然而,婴儿的词汇量大规模超出了前100个单词左右的名词,而代表动词的大量不足(从不介意形容词或副词,这几乎从未出现在前100个单词婴幼儿产生;例如,Goldin-草地,塞尔格曼和凝胶1976年)。 甚至更令人惊讶的是,即使是名词的过度表示
动词的每个单词的发射(即令牌频率)比母亲使用的共同集合中的名词更高。 (Snedeker和Gleitman 2004:259,引用Sandhoffer,Smith和Luo 2000的数据
此外,孩子们听到了决心者的优势(“”和“A”),但不生产它们(Bloom 2000)。 这些事实并不特定于英语,但在文化上举行(参见,例如,Caselli等,1995)。 句法类别婴儿的变化之间的差异接收为输入并产生作为输出的对联论是麻烦的,因为联结主义致力于学习的结构(以及从中遵循的行为)只是图案化了经验中给出的内容。
9.4抵抗联邦主义的恒星分析
自英国统金者以来一直是联想主义分析的核心部分。 在实验文献中,弄清出由于其Relata的邻接而获取关联所需的参数的问题有时被称为“关联窗口”(例如Gallistel和2009)的问题。 每个联语主义理论都必须指定两个属性必须实例化的时间窗口,以便为这些属性相关联。[31] 恒星理论家的相关问题是,如果需要关联学习的域世代,则窗口需要在内容域中具有同质。 20世纪60年代后期看到有说服力的攻击领域一般性,以及普遍性标准的必要性和充分性。
9.4.1违背恒星的必要性
关于“味道”和“诱饵羞怯”的研究为古典调理的联想学习传统中具有各种问题。 加西亚观察到一种味觉刺激(例如,饮用水或吃热狗),但不是视听刺激(轻盈和声音)自然会与感到恶心的感觉相关。 例如,Garcia和Koelling(1966)将有视听刺激(光和声光)与味觉刺激(调味水)配对。 然后将两种刺激与接受辐射的大鼠配对,这使得大鼠恶心。 大鼠与水无味的感觉,而不是用声音,即使声音与水呈现。 此外,摄取料理刺激和感觉恶心之间的延迟可能是很长的,感觉在12小时后(滚动和史密斯1972年),当消极的感觉出现时,生物不需要意识。 (有关审查,请参阅Seligman 1970; Garcia等,1974)。 时间延迟表明,Cs(调味水)不需要与美国(恶心的感觉)呈邻接,以便学习发生,从而表明关联学习是必需的。
加西亚的工作也阐述了联邦主义的领域一般方面的问题。 在上述研究中,大鼠准备将恶心与味觉刺激相关联,但不会与视听刺激相关联。 但是,如果一个人从感到令人生意地改变我们的感觉令人惊讶地接受与视听刺激刺激的完美性恒定的冲击,那么大鼠将与视听刺激相比,但没有燃料刺激。 也就是说,准备大鼠以将视听刺激与休克联系起来,而是与令人满意的刺激刺激相互关联。 因此,学习似乎并不完全是域名一般(对于人类的类似内容特异性效应,见Baeyens等人。1990)。[32]
最后,“Garcia效应”也被用来展示学习曲线中的问题(见第9.1节)。 “味道厌恶”是生物体因摄取刺激和刺激而生病(或气味,Garcia等,1974)的现象,其中刺激与疾病的感觉相关。 由于任何有食物中毒的人可以证明,这一学习可以以一次性的方式进行,并且不需要逐渐上升,在许多试验中(味道厌恶也已经观察到人类,参见,例如伯尔尼斯坦和韦伯斯特1980;伯恩斯汀1985; Logue等人。1981; Rozin 1986)。
9.4.2。 违背恒星的充分性
Kamin的着名阻塞实验(1969)表明并非所有连续的结构都导致古典调理。 已经了解到CS1预测美国的大鼠,如果CS2总是与CS1配对,则不会知道随后的CS2预测美国。 假设RAT已经了解到,由于光和震动的恒定性邻接,光预测震动。 在学习此之后,RAT具有介绍的声音,该声音仅与光和震动结合起来。 只要老鼠先前了解到光线预测震动,它就不会得知声音(如可以看到声音的后期试验)。 总之,了解到,CS1预测美国阻止生物体学习CS2预测美国。[33] 因此,即使CS2与美国完全连续,CS2和美国之间的关联也是未解决的,从而用作对邻接充分的反例。[34]
类似地,Rescorla(1968)表明,只有在美国出现时,才能出现CS,但仍然仍然具有它们之间的关联。 如果一个音调只是在有冲击时才能击球,但是当没有音调时仍然存在震动(即,CS只出现在美国,但美国有时会出现在没有CS的情况下),因此在CS和美国之间没有关联学习。 相反,受试者(在Rescorla 1968中,大鼠)只会学习冲击与实验情况之间的连接 - 例如,进行实验的房间。
大部分原因是9.4中讨论的问题,许多古典调理理论家都放弃了传统的程序。 像Garcia一样,似乎完全放弃了古典理论框架(Garcia等,1974),其他,如Rescorla和Wagner,试图将框架迎来了现代时代(参见,Rescorla和Wagner 1972; Rescorla 1988),其中调理被视为对基本速率敏感,并由信息拾取驱动。[35] 例如,Rescorla-Wagner模型提出了在预期的差异和实际被称为预测误差之间的差异时发生的学习(Rescorla&Wagner,1972)。 该模型解释如下:一旦CS1完全预测美国,当添加CS2时,不会发生预测误差,防止新学习。 它还考虑了恒小内的不足,表明仅仅相同的共同不如信息刺激提供了关于结果的重要性。 该模型对预测误差的强调是有影响力的超越关联学习,通知多巴胺功能的计算模型(Schultz等,1997)和当代强化学习算法(Sutton&Barto,1998;见第10节)。 从简单的轮廓到预测误差的转变说明了联结主义演变中的张力:耻辱和Gallistel等批评者认为,添加了纠错等机制,有效地剥夺了联结主义对分布的核心承诺,而捍卫者认为这样的添加保护联想解释精神的必要细化。 这种运动是否被解释为古典调理的实质性修订(Rescorla 1988; Heyes 2012)或批发放弃它(Gallistel和2009)是值得不值得的。
9.5共同延伸性
Rescorla实验还展示了联合理论中的另一个问题:为什么某些财产的问题是CS而不是不同,同等同系的实例化性质。 提出不同的方式,一个人需要一个原则来说,在思维等概括中的概括是什么。 例如,如果一个CS和A我们说出音调和震动,则完全配对,以便它们都存在或两者都没有,有机体不会将其接受冲击的位置与变震相称(例如,实验设置)。它只会将基调与之相关联冲击。 但是在美国没有CS发生的情况下,如果没有美国,CS不会发生CS,生物将获得冲击与位置之间的关联。 但是,在两种情况下,每个试验都存在位置。[36] 与冲击相比,当用作美国时,X射线辐射永远不会与位置相关联,即使它们始终完全配对(Garcia等,1972)。[37]
当唱歌时唱歌时,有时会出现一个属性的问题有时是“信用分配问题”的名称(例如,参见,例如Gallistel和2009年,以及第10.2.3节)。[38] 有些人争辩说这个问题是一个较大问题的症状:试图使用扩展标准来指定故意内容(参见,例如,FODOR 2003)。 联语是需要一个标准来指定实际上将学习哪个共同延迟属性,而不是。
额外的担心源于观察结果,有时缺乏所缺乏的财产是所学的内容组成部分。 为了应对缺少财产的问题,当代联想者介绍了理论的重要因素:抑制。 例如,如果只有在缺席的时候出现美国和CS,那么有机体将学习它们之间的负面关系; 也就是说,有机体将得知缺乏CS预测美国。[39] 这里CS成为美国的“条件抑制剂”。 抑制,使用关联作为调节剂而不是激活因子,是当前联想者思维的中央部分。 例如,在连接人物网络中,通过禁止激活其他节点的某些节点来实现禁止的禁止实现。 连接重量可以是正的或负的,具有负重,用于抑制关联的抑制强度。
联合会提出了各种助长问题的解决方案。 MackintoSh(1975)开发了一种选择性注意模型,其中有机体通过经验学习,刺激最重要的结果,并对这些提示动态地关注这些线索。 对刺激的注意力增加,这些刺激比其他可用刺激更好,并且减少到较差的预测因子。 这种选择性关注过程有助于解释显然突然学习(注意迅速换档),以及为什么只有某些共同的特性成为关联的(因为关注最重要的提示)。 Pearce(1987)配置理论提供了另一种联合主义解决方案。 而不是将刺激表达为与结果独立关联的单独元素,而是Pearce提出了生物体形式的整个刺激配置的表示。 然后,这些配置表示可以与结果相关联,并且类似的配置将产生与其相似性成比例的响应的概括。 该方法解决了通过将刺激组合视为独特的代表惠士而变得相关的问题。
10.联邦主义和强化学习
强化学习(RL)是一种计算代理商如何通过与其环境的互动学习最佳行为的计算方法。 在其核心,RL可以看出,正式形成学习的联想主义理论的核心问题:代理人如何通过将刺激和响应基于经验的后果联系起来选择有益的行动。 与其他机器学习框架(如监督学习)不同,依赖于标记的示例,或者在未标记数据中找到模式的无监督学习,RL涉及通过与环境的直接交互和关于所选操作的反馈来学习。 这种试验和错误方法允许代理商发现随着时间的推移最大化累积奖励的行为,即使行动与长期后果之间的关系最初是未知的。
联想主义学习理论与现代RL的发展之间存在直接血统。 如第3节所述,Thorndike的效果定律提出了通过重复行为学习,然后通过阳性成果进行积极成果来学习,并避免刺激响应联系的强度取决于响应的感知结果。 这种强调成功刺激 - 反应协会的试验和错误学习和逐步加强直接影响了早期人工智能研究人员。 1948年,Alan TING描述了最早的设计之一,用于在计算机上实施试用和错误学习的设计之一 - 当面对未确定的选择时,其最初随机决策将被“痛苦”的刺激取消,并使“快乐”成为永久性的刺激(图灵1948)。 几种早期机械学习设备受到类似想法的启发。