认知科学(一)
认知科学是一门研究心智和智力的跨学科学科,涵盖哲学、心理学、人工智能、神经科学、语言学和人类学。其思想起源于 20 世纪 50 年代中期,当时多个领域的研究人员开始基于复杂的表征和计算过程发展心智理论。其组织起源于 20 世纪 70 年代中期,当时认知科学学会成立,期刊《认知科学》创刊。此后,北美、欧洲、亚洲和澳大利亚的一百多所大学设立了认知科学项目,许多其他大学也开设了认知科学课程。
1. 历史
2. 方法
3. 表征与计算
4. 理论方法
4.1 形式逻辑
4.2 规则
4.3 概念
4.4 类比
4.5 图像
4.6 联结主义
4.7 理论神经科学
4.8 贝叶斯
4.9 深度学习
4.10 预测处理与主动推理
5. 哲学意义
5.1 哲学应用
5.2 认知科学批判
5.3 认知科学哲学
参考文献
学术工具
其他网络资源
相关条目
1. 历史
理解心智及其运作的尝试至少可以追溯到古希腊时期,当时柏拉图和亚里士多德等哲学家试图解释人类知识的本质。直到19世纪实验心理学兴起之前,心智研究一直是哲学的领域。威廉·冯特和他的学生们开创了更系统地研究心理运作的实验室方法。然而,几十年后,行为主义主导了实验心理学,这种观点实际上否定了心智的存在。根据J. B. Watson等行为主义者的观点,心理学应该局限于考察可观察刺激与可观察行为反应之间的关系。关于意识和心理表征的讨论被排除在了重要的科学讨论之外。尤其是在北美,行为主义在20世纪50年代主导了心理学界。
大约在1956年,知识界的格局开始发生巨变。乔治·米勒总结了大量研究,这些研究表明人类思维能力有限,例如短期记忆仅限于七项内容。他提出,可以通过将信息重新编码成块来克服记忆限制,而块状记忆是一种心理表征,需要通过心理程序对信息进行编码和解码。当时,原始计算机才刚刚出现几年,但约翰·麦卡锡、马文·明斯基、艾伦·纽厄尔和赫伯特·西蒙等先驱者正在开创人工智能领域。此外,诺姆·乔姆斯基驳斥了行为主义关于语言是一种习得习惯的假设,转而提出用由规则组成的心理语法来解释语言理解。本段提到的六位思想家可以被视为认知科学的奠基人。
2. 方法
认知科学拥有统一的理论思想,但我们必须认识到不同领域的研究人员在心智和智力研究中所带来的观点和方法的多样性。尽管当今的认知心理学家经常从事理论构建和计算建模,但他们的主要方法是以人类参与者为对象进行实验。通常是满足课程要求的本科生被带入实验室,以便在受控条件下研究不同类型的思维。例如,心理学家通过实验考察了人们在演绎推理中常犯的错误类型、人们形成和应用概念的方式、人们运用心理意象思考的速度以及人们运用类比解决问题的表现。我们关于心智运作方式的结论必须建立在“常识”和内省之上,因为这些可能会误导人们对心理运作的理解,而其中许多心理运作并非意识所能感知的。越来越多的心理学家从亚马逊的Mechanical Turk和多元文化背景中招募实验参与者。因此,从不同角度仔细探究心理运作的心理实验对于认知科学的科学性至关重要。实验也是实验哲学所采用的一种方法论。
没有实验的理论是空洞的,而没有理论的实验则是盲目的。为了解答关于心智本质的关键问题,心理实验需要在一个假设了心理表征和程序的理论框架内进行解释。构建和测试旨在模拟心理操作的计算模型是开发理论框架的最佳方法之一。为了补充关于演绎推理、概念形成、心理意象和类比问题解决的心理学实验,研究人员开发了模拟人类行为的计算模型。设计、构建和实验计算模型是人工智能 (AI) 的核心方法。计算机科学的一个分支,研究智能系统。理想情况下,在认知科学中,计算模型和心理实验是齐头并进的,但人工智能领域的许多重要研究都相对独立于实验心理学,考察了不同知识表征方法的威力。
虽然一些语言学家进行心理实验或开发计算模型,但目前大多数语言学家使用不同的方法。对于遵循乔姆斯基传统的语言学家来说,主要的理论任务是识别构成人类语言基本结构的语法原则。识别是通过注意符合语法和非语法的话语之间的细微差别来实现的。例如,在英语中,“她击中了球”和“你喜欢什么?”这两个句子符合语法,但“她击中了球”和“你喜欢什么?”不符合语法。英语语法可以解释为什么前者可以接受,而后者则不可接受。另一种方法是认知语言学,它较少强调句法,而更多地强调语义和概念。
与认知心理学家一样,神经科学家也经常进行对照实验,但他们的观察结果截然不同,因为他们直接关注的是大脑的本质。对于非人类受试者,研究人员可以插入电极并记录单个神经元的放电。对于人类受试者,由于这种技术侵入性过强,现在通常使用磁扫描和正电子扫描设备来观察人们在进行各种心理任务时大脑不同部位的活动。例如,脑部扫描已经识别出与心理意象和词语解读相关的大脑区域。通过观察大脑受损(可识别损伤方式)的人的表现,可以收集有关大脑功能的更多证据。例如,大脑中负责语言的区域发生中风,会导致诸如无法造句等缺陷。与认知心理学类似,神经科学通常既是理论性的,也是实验性的,而理论发展通常需要通过开发神经元群行为的计算模型来辅助。
认知人类学扩展了对人类思维的考察,以思考思维在不同文化背景下如何运作。对心智的研究显然不应局限于英语使用者的思维方式,而应考虑不同文化中思维模式可能存在的差异。认知科学越来越意识到需要在特定的物理和社会环境中观察心智的运作。对于文化人类学家来说,主要方法是民族志,这需要与某一文化的成员生活和互动,并充分了解他们的社会和认知系统。例如,认知人类学家已经研究了不同文化中颜色词汇的异同。
传统上,哲学家不会进行系统的经验观察或构建计算模型,尽管实验哲学的研究有所增加。但哲学对认知科学仍然很重要,因为它处理的是构成实验和计算思维方法基础的根本问题。诸如表征和计算的本质之类的抽象问题,在心理学或人工智能的日常实践中并不需要解决。但当研究人员深入思考他们正在做的事情时,它们不可避免地会出现。哲学也涉及诸如身心关系等一般性问题,以及诸如认知科学中解释的性质等方法论问题。此外,哲学关注人们应该如何思考的规范性问题,以及关于人们如何思考的描述性问题。除了理解人类思维的理论目标之外,认知科学还可以有改进思维的实践目标,这需要对我们期望的思维进行规范性反思。心灵哲学没有独特的方法,但应该与其他领域的最佳理论著作一样,关注经验结果。
在其最弱的形式中,认知科学只是上述领域的总和:心理学、人工智能、语言学、神经科学、人类学和哲学。当关于心灵本质的结论在理论和实验上趋于一致时,跨学科研究就会变得更加有趣。例如,可以通过计算模型来描述人们在实验中的行为,将心理学和人工智能结合起来。掌握人类思维复杂性的最佳途径是运用多种方法,尤其是心理学和神经学实验以及计算模型。理论上,最富有成果的方法是从表征和计算的角度来理解思维。
3. 表征与计算
认知科学的核心假设是,理解思维的最佳途径是理解心智中的表征结构以及作用于这些结构的计算过程。虽然关于构成思维的表征和计算的本质存在诸多分歧,但其核心假设足够普遍,足以涵盖认知科学中当前的思维范围,包括使用人工神经网络建模思维的联结主义理论。
认知科学中的大多数研究假设,心智具有类似于计算机数据结构的心理表征,以及类似于计算算法的计算程序。认知理论家认为,心智包含逻辑命题、规则、概念、图像和类比等心理表征,并且使用诸如推理、搜索、匹配、旋转和检索等心理程序。认知科学中占主导地位的心智-计算机类比理论,由于使用了另一个类似物——大脑——而发生了新的转变。
联结主义者提出了关于表征和计算的新观点,他们以神经元及其连接作为数据结构的灵感,以神经元的激发和扩散激活作为算法的灵感。认知科学由此开始研究心智、大脑和计算机之间复杂的三向类比。心智、大脑和计算都可以被用来对彼此提出新的见解。不存在单一的心智计算模型,因为不同类型的计算机和编程方法暗示了心智可能以不同的方式运作。我们今天使用的大多数人使用的计算机是串行处理器,一次执行一条指令,但大脑和一些最近开发的计算机是并行处理器,能够同时执行多项操作。
当前认知科学的一个主要趋势是将神经科学与心理学的多个领域相结合,包括认知、社会、发展和临床。这种整合部分是实验性的,源于研究大脑的新仪器的激增,例如功能性磁共振成像、经颅磁刺激和光遗传学。这种整合也是理论性的,因为人们对大量神经元如何执行通常用认知规则和概念理论来解释的任务的理解有所进步。
4. 理论方法
以下是关于表征和计算本质的当前理论的概要,这些理论解释了心智的运作方式。
4.1 形式逻辑
形式逻辑为探究表征和计算的本质提供了一些强大的工具。命题演算和谓词演算用于表达许多复杂的知识,许多推理可以用逻辑推理来理解,推理规则包括肯定前件式。逻辑方法的解释图式如下:
解释目标:
人们为什么会做出这样的推理?
解释模式:
人们的心理表征类似于谓词逻辑中的句子。
人们拥有对这些句子进行操作的演绎和归纳程序。
这些演绎和归纳程序应用于这些句子,产生推论。
然而,逻辑是否提供了认知科学所需的关于表征和计算的核心思想尚不确定,因为可能需要更高效、更符合心理学规律的计算方法来解释人类思维。(参见“逻辑与人工智能”条目。)
4.2 规则
许多人类知识自然地用“如果……那么……”形式的规则来描述。许多类型的思维,例如规划,都可以用基于规则的系统来建模。所使用的解释模式如下:
解释目标:
为什么人们会有某种特定的智能行为?
解释模式:
人们有心理规则。
人们有运用这些规则搜索可能解空间的程序,也有生成新规则的程序。
使用和形成规则的程序产生了行为。
基于规则的计算模型已经对各种心理学实验进行了详细的模拟,从密码算术问题求解到技能习得再到语言使用。基于规则的系统在如何改进学习和开发智能机器系统方面也具有重要的实际意义。
4.3 概念
概念部分对应于口语和书面语中的词语,是一种重要的心理表征。出于计算和心理学的原因,我们不应该放弃概念具有严格定义的传统观点。相反,概念可以被看作是典型特征的集合。因此,概念的应用就是在概念和世界之间建立近似匹配的问题。图式和脚本比与词语对应的概念更复杂,但它们的相似之处在于,它们都由一系列可以匹配并应用于新情境的特征组成。基于概念的系统中使用的解释图式是:
解释目标:
为什么人们会表现出某种特定的智能行为?
解释模式:
人们拥有一套概念,这些概念通过种类和部分的层次结构以及其他关联来组织。
人们拥有一套概念应用程序,包括扩散激活、匹配和继承。应用于概念的程序产生行为。
概念可以转化为规则,但它们捆绑信息的方式与规则集不同,这使得不同的计算程序成为可能。
(参见概念条目。)
4.4 类比
类比在人类思维中扮演着重要的角色,涉及问题解决、决策、解释和语言交流等诸多领域。计算模型模拟人们如何检索和映射源类比,以便将其应用于目标情境。类比的解释图式如下:
解释目标:
为什么人们会有某种特定的智能行为?
解释模式:
人们对情境有口头和视觉表征,可以用作案例或类比。
人们有对这些类比进行检索、映射和适应的过程。
应用于类比表征的类比过程产生了行为。
相似性、结构和目的的约束克服了如何发现并利用先前经验来解决新问题的难题。并非所有思维都是类比的,使用不恰当的类比可能会阻碍思维,但类比在教育和设计等应用中可能非常有效。
4.5 图像
视觉图像和其他类型的图像在人类思维中发挥着重要作用。图形表征能够以比冗长的文字描述更易用的形式捕捉视觉和空间信息。非常适合视觉表征的计算过程包括检查、查找、缩放、旋转和变换。这些操作对于在图形表征适用的领域生成计划和解释非常有用。视觉表征的解释图式如下:
解释目标:
为什么人们会有某种特定的智能行为?
解释模式:
人们拥有情境的视觉图像。
人们会对这些图像进行扫描和旋转等操作。
构建和操作图像的过程产生了智能行为。
图像有助于学习,语言的某些隐喻方面可能源于图像。心理学实验表明,诸如扫描和旋转之类的视觉过程会运用图像,神经生理学结果也证实了基于心理图像的推理与感知之间存在密切的物理联系。图像不仅仅是视觉的,还可以与其他感官体验(例如听觉、触觉、嗅觉、味觉、疼痛、平衡感、恶心、饱腹感和情绪)共同作用。
4.6 联结主义
由简单节点和链接组成的联结主义网络对于理解涉及并行约束满足的心理过程非常有用。这些过程包括语言理解中的视觉、决策、解释选择和意义构建等方面。联结主义模型可以通过赫布学习和反向传播等方法模拟学习。联结主义方法的解释图式如下:
解释目标:
为什么人类会表现出某种特定的智能行为?
解释模式:
人类的表征包含一些简单的处理单元,这些单元通过兴奋性和抑制性连接相互连接。
人类既有通过单元间的连接在单元之间传播激活的过程,也有修改连接的过程。
对单元应用激活扩散和学习,就能产生行为。各种心理学实验的模拟表明了联结主义模型的心理学相关性,然而,这些模型仅仅是对实际神经网络的非常粗略的近似。(更多信息,请参阅联结主义条目。)
4.7 理论神经科学
理论神经科学试图发展关于人类和其他动物大脑结构和过程的数学和计算理论及模型。它与联结主义的不同之处在于,它试图通过模拟大量现实神经元的行为来提高生物学准确性,这些神经元被组织成功能重要的大脑区域。大脑的计算模型在生物学上变得更加丰富,既包括使用更现实的神经元(例如具有脉冲和化学通路的神经元),也包括模拟大脑不同区域(例如海马体和皮层)之间的相互作用。这些模型并非严格意义上的逻辑、规则、概念、类比、图像和连接方面的计算解释的替代品,而应该与它们相融合,并展示如何在神经层面上实现心理功能。理论神经科学的解释图式如下:
解释目标:
大脑如何执行认知任务等功能?
解释模式:
大脑中的神经元通过突触连接组织成不同的群体和脑区。
神经群体具有通过感觉输入和其他神经群体的脉冲模式进行转换的脉冲模式。
神经群体之间的相互作用执行包括认知任务在内的功能。
从理论神经科学的角度来看,心理表征是神经活动的模式,推理就是对这些模式的转化。(参见神经科学和意识神经科学的条目。)
4.8 贝叶斯
贝叶斯模型在认知科学中占有重要地位,可应用于学习、视觉、运动控制、语言和社会认知等心理现象。它们在机器人技术领域也得到了有效的应用。贝叶斯方法假设认知近似最优,这与概率论(尤其是贝叶斯定理)一致。该定理认为,给定证据时,假设的概率等于假设的先验概率乘以给定假设时证据的条件概率,再除以证据的概率。贝叶斯认知的解释图式如下:
解释目标:
心智如何进行推理等功能?
解释模式:
心智具有统计相关性和条件概率的表征。
心智具有进行概率计算的能力,例如应用贝叶斯定理。
将概率计算应用于统计表征可以完成诸如推理之类的心理任务。
尽管贝叶斯方法在广泛的现象中有着令人印象深刻的应用,但由于对最优性的假设以及基于概率论的计算,其心理合理性仍存在争议。
4.9 深度学习
自 20 世纪 50 年代以来,人工智能一直是认知领域的核心组成部分,而人工智能领域最近最引人注目的进展源于深度学习方法,该方法在游戏、物体识别和翻译等领域取得了重大突破。深度学习建立在联结主义和理论神经科学的思想之上,但得益于更快的计算机速度和庞大的样本数据库,它使用了更多层级和改进算法的神经网络。另一项重要创新是将样本学习与强化学习相结合,并在2016年催生了世界领先的围棋选手AlphaGo。深度学习的理念正在回流到神经科学领域,并开始影响认知心理学的研究。深度学习的解释图式如下:
解释目标:
大脑如何执行认知任务等功能?
解释模式:
大脑拥有大量的神经元,分为6到20层。
大脑拥有强大的机制,可以从样本中学习,并学习那些通过成功得到强化的行动。
将学习机制应用于分层神经网络,使其能够达到人类甚至超越人类的表现。
尽管深度学习在某些人工智能系统中取得了显著的进步,但它如何应用于人类思维的各个方面(包括因果推理、想象、情感和类比)尚不清楚。更多讨论,请参阅“联结主义”条目的第11节(关于深度学习)。
4.10 预测处理和主动推理
预测处理是一种理论神经科学方法,它认为大脑会不断生成和更新环境模型,以预测感知和行动的结果。主动推理是预测处理的一种形式,它假设大脑使用贝叶斯计算来最小化由预期和实际观察之间的差异组成的“自由能”。当大脑通过改变环境模型或通过行动改变环境来减少预测误差时,生物体就能生存下来。
主动推理的解释图式如下:
解释目标:
大脑如何运作以支持感知和行动?
解释模式:
大脑是一个预测引擎,它使用概率模型来预测感知和行动的结果。
为了减少预测误差,大脑使用贝叶斯更新来改变其模型,并使用行动来改变其环境,例如通过移动。
有效的推理、感知和行动源于预测误差的减少。
主动推理面临着诸多挑战。大脑功能真的是贝叶斯更新,而不是联结主义的约束满足或深度强化学习吗?预测处理能否包含其他大脑功能,包括模式识别、解释、情绪评估、记忆和沟通?主动推理能否解释因果推理、语言和创造力等高级认知操作?