分子遗传学(三)
基因怀疑论者忽视分子基因概念的原因或许在于,他们寻找的是错误的概念。该概念并非纯粹的物理化学概念,它也没有将DNA单一划分成独立的基因。相反,它是一个功能性概念,提供了一种统一的基因思考方式,可用于在不同的调查或解释情境中识别不同的DNA片段。根据此分析,基本的分子概念是DNA表达产物中线性序列的基因概念:
在细胞环境c中合成的产物p中线性序列l的基因g,是一个潜在的复制核苷酸序列n,通常包含在DNA中,它决定了DNA表达某个阶段产物p中的线性序列l (Waters 2000)。
分子基因的概念可以表示为一个四元组:。此分析表明,遗传学家如何在一种认知环境中始终将内含子作为基因的一部分,而在另一个认知环境中则不将其作为基因的一部分。如果该环境涉及识别初级预加工RNA分子的基因,则该基因包含内含子和外显子。如果该环境涉及识别最终多肽的基因,则该基因仅包含外显子。因此,在最终导致特定多肽合成的DNA表达中,遗传学家在谈论“该”基因时,可能会认为“该”基因包含内含子(在这种情况下,他们指的是编码初级RNA的基因),但也可能认为“该”基因不包含内含子(在这种情况下,他们指的是编码成熟RNA或多肽的基因)。分子基因概念的应用并无歧义;事实上,只要明确“在细胞环境c中合成的产物p中线性序列l的基因”这一表达式中变量的值,它就非常精确。
基因怀疑论者认为,关于基因的讨论缺乏连贯性,因为生物学家经常将基因描述为编码多肽,但随后又转过头来谈论不翻译成多肽的RNA分子的基因(包括编码RNA [tRNA]、核糖体RNA [rRNA] 和干扰RNA [iRNA] 的基因)。这表明,构思rRNA基因与构思多肽基因涉及相同的概念。在这两种情况下,基因都是DNA片段(无论是否分裂),它决定了目标分子的线性序列。
这种分析的优势在于,它强调了以基因为中心的解释的局限性,同时阐明了基因在RNA和多肽合成中独特的因果作用:基因决定了初级RNA转录物的线性序列,并且通常在决定多肽中氨基酸序列方面发挥着独特的作用,尽管并非唯一。
4.3 实践中的指称分析:分子化如何改变指称
Weber(2005)通过追溯“基因”一词在遗传学历史中指称的变化,考察了基因概念的演变。一个术语的指称或外延是它所指称的一组对象。韦伯采用了一种混合指称理论。根据混合理论,一个术语的指称取决于相关语言群体如何与潜在指称物进行因果互动,以及他们如何描述潜在指称物。这一理论促使韦伯不仅密切关注遗传学家如何构建基因理论或运用基因概念解释现象,还关注他们如何进行实验室研究。他沿袭了基彻(Kitcher,1978,1982)的观点,探究了指称模式随时间的变化。
韦伯确定了六个不同的基因概念,从达尔文的泛基因概念(1868)开始,到当代的分子遗传学概念结束。他根据遗传学家对基因功能作用的描述方式(RNA/蛋白质编码 vs. 一般功能单位)、物质基础(RNA/DNA vs. 染色体)和结构(不连续线性——包含内含子和外显子 vs. 连续线性)以及实验者用于鉴定基因的标准(通过基因产物 vs. 互补测试)来区分当代分子概念与古典(或“新古典”)分子概念。
韦伯考察了随着遗传学的发展,对几种特定果蝇基因的研究是如何变化的。他的研究表明,分子遗传学方法为鉴定最初通过古典技术鉴定的基因提供了新的途径。该术语的含义发生变化,不仅是理论发展的结果,也是新基因鉴定方法应用的结果。他得出结论,与哲学家们分析过的物理科学概念不同,基因概念具有“非本质主义的特征,这使得生物学家能够根据现有的研究方法和理论兴趣,制定不同的自然分类”(Weber 2005,第228页)。Weber将此特征称为“浮动引用”。
4.4 提出一个新概念——过程分子基因概念
Neumann-Held(2001)提出了一种在发育遗传学背景下思考基因的新方法。她指出,在这种背景下,对基因的兴趣主要集中在多肽的受调控表达上。她指出,教科书中对基因的定义通常也承认了这种兴趣,并引用了科学教科书中的以下定义:
DNA片段的组合,共同构成一个可表达的单位,表达导致形成一种或多种特定的功能性基因产物,这些产物可能形成RNA分子或多肽。基因片段包括:(1) 转录单位……以及转录单位中包含的任何调控片段;(2) 位于转录单位两侧且为特异性表达所必需的调控序列。(Singer and Berg 1991, p. 41)。
该定义强调调控序列和编码区都是“特异性表达”所必需的。在特定时间,特定细胞中只有一小部分编码序列会被转录,而特定序列是否被转录部分取决于编码区外部的调控区。
Neumann-Held 指出,如果目标是明确多肽合成调控所必需的物质,那么必须涵盖的内容甚至比 DNA 中的内容还要多。这是因为诸如差异剪接(以及我在本文中未讨论的RNA编辑过程,例如甲基化)等过程涉及DNA之外的实体,例如剪接剂。她认为,至少在发育遗传学的背景下,将基因重新构想为过程是恰当的。她提出了以下“过程-分子-基因”概念。
“基因”是指在特定多肽的产生过程中,将DNA和所有其他相关的非DNA实体结合在一起的过程(即事件的进程)。在此意义上,“基因”一词代表由以下因素指定的过程:(1)特定DNA片段与特定非DNA实体之间的特定相互作用,(2)所产生的mRNA与其他非DNA实体相互作用的特定加工机制。(Neumann-Held 2001, p. 74)。
Neumann-Held认为,这一概念为理解DNA序列如何“用于多肽生产过程”提供了最清晰的基础。她指出,过程分子基因概念允许包含DNA中的编码序列、DNA中的调控序列以及不在DNA中的实体,所有这些实体都与多肽的产生有因果关系。诺伊曼-赫尔德的概念排除了转录过程和DNA编码区,这些转录过程和编码区会导致产生不翻译成多肽的功能性RNA分子。因此,根据她的解释,tRNA(转移RNA)、rRNA(核糖体RNA)或snRNA(小核RNA)不存在过程分子基因。诺伊曼-赫尔德定义的这一特征与她用来支持其解释(如上所述)的教科书定义不符。此外,排除这些编码区与最近关于非编码RNA分子(例如snRNA)所发挥的重要作用的发现不符。她的定义很容易修改,以适应这些区域和过程。无论如何,诺伊曼-赫尔德认为,在发育遗传学中使用这一概念,而不是以DNA为中心的基因概念,将有助于避免“基因因其独特的因果能力而成为生物学中最重要的解释因素”的观点(诺伊曼-赫尔德,2001,第80页)。
4.5 使用基于调查的方法识别基因概念
Stotz和Griffiths(2004)认为,生物科学中使用的基因概念种类繁多,需要一种更系统、更明确的实证方法。他们指出,个体哲学家无法掌握基因概念在广泛生物科学领域中所使用的不同背景的所有复杂性。他们已着手开展一项雄心勃勃的项目,调查实践科学家,试图帮助了解科学家实际上是如何理解基因的。他们的兴趣远不止理解“分子遗传学”。他们希望通过观察不同领域的生物学家(以及不同年龄段、性别等的生物学家)在回答复杂问卷时的方式差异,来了解这些概念在生物学的众多不同领域和语境中的具体运用。
斯托茨和格里菲斯开展该项目的初衷是检验基因概念的哲学解释。正如格里菲斯所问,如果他们基于调查的研究表明,科学家们实际上并不按照哲学解释所设定的方式思考基因,那么这种解释还有什么价值呢?然而,存在一些令人畏惧的……使用问卷调查来了解一个人的思维方式存在实际困难,尤其是在一个人的思维涉及使用多个概念,并且/或者有时或多或少有些混乱的情况下(Waters 2004b)。调查合适且具有代表性的科学家样本也很困难。Griffiths 和 Stotz 意识到了这些困难,并通过连续的调查完善了他们的项目。
即使 Stotz 和 Griffith 的调查成功地确定了不同生物学领域的科学家在不同情境下如何思考基因,也并不意味着他们的发现能够对经典基因、分子基因或过程分子基因概念进行适当的检验。这些概念的支持者的目标是通过用基于精确概念的更严谨的思维取代基于不清晰概念的草率思维来重新诠释当代遗传学的知识。表明科学家的实际思维与这些概念的精确应用不一致,并不会反驳支持经典基因或分子基因概念的分析,也不会削弱提出新的过程分子基因概念的论证。
尽管基于调查的研究结果似乎无法对基因概念的哲学分析提供合适的检验,但正如斯托茨和格里菲斯所言,它们或许能为那些从事基因概念哲学研究的人提供重要的信息。例如,如果这类调查发现进化生物学家和发育遗传学家在回答“什么算作基因”的问题时存在显著差异,那么哲学家们或许可以审视这些生物学家的实践背景是否需要不同的基因概念。调查结果可以为概念分析提供有用的启发。
4.6 对基因怀疑论的务实回应
布里安、波廷和福格尔等基因怀疑论者声称,“基因”一词已失去其作用。他们认为,该术语既过于模糊,又过于局限。他们认为,它过于模糊,是因为它无法提供对基因组的独特解析。基因之间的界限相互重叠,据称也显得模棱两可。他们认为,基因是否包含或排除内含子、调控区等等尚不清楚。据称,该术语过于局限,是因为它掩盖了在DNA表达和调控中发挥不同作用的分子元素的多样性。此外,这些怀疑论者认为,任何试图解决这些模糊之处的尝试都会使该术语更加局限。
凯勒对二十世纪遗传学史的描述似乎强化了基因怀疑论。例如,她认为基因的作用问题越来越难以回答(Keller 2000)。她指出,到20世纪末,生物学发现揭示了发育动力学的复杂性,使得将基因视为发育中独特的因果因素变得不可能。Keller强调语言的力量,并投入大量精力关注关于基因的不严谨的讨论如何影响生物学研究,这种讨论强化了基因是“解释生物结构和功能的核心概念”的假设(Keller 2000,第9页),而她强烈反对这一假设。然而,凯勒并不赞同基因怀疑论者的观点,他们认为,如果生物学家不再谈论“基因”,而只使用指代核苷酸、密码子、编码区、启动子区等分子单位的术语,生物学将会得到改进。凯勒坚持认为,“基因”一词仍然具有“显而易见且不可否认的用途”。
凯勒认为,“基因”一词的用途之一是其模糊性——正是这种模糊性让哲学家们感到困扰——使得生物学家能够灵活运用,跨越学科界限进行交流,并以新的方式思考:
一个实验效应的意义取决于它与其他效应的关系,而使用与特定实验实践过于紧密相关的语言,由于其特殊性,会导致跨不同实验情境的交流变得几乎不可能。(凯勒 2000,第140页)。
凯勒指出了基因对话有用的第二个原因。 “基因”一词指的是那些可以通过实验操控以产生确定且可重复效应的实体(尽管鉴于凯勒对基因概念的批评,她认为该术语指的是哪些实体尚不明确)。她认为基因是短期原因。然而,她指出,这并不意味着基因是长期原因,也不意味着基因是发育的根本因果。相反,它意味着(凯勒认为这是基因话题将继续存在的一个重要原因)基因可以被用来作为操控生物过程的手段(另见Waters 2000)。凯勒总结道,基于这两个原因,基因话题将会并且应该继续在生物学话语中发挥重要作用。
5.基因和DNA起什么作用?
分子遗传学这门科学与一项基本理论相关,该理论认为基因和DNA通过提供决定生物体发育和功能的信息来指导所有基本生命过程。基因组被认为指定了发育的“发展计划”、“总体规划”或“蓝图”,而其他元素则提供材料(例如,Bonner 1965、Jacob and Monod 1961、Mayr 1961、Maynard Smith 2000、Rosenberg 2006)。尽管在分子遗传学时代之前,薛定谔(1944)就曾提出染色体包含生物体发育和功能的“密码脚本”这一著名观点,但如今这一观点通常以明确的分子术语来表达。据称,代代相传的发育和功能信息被编码在构成基因和DNA的核苷酸序列中。这种所谓的“遗传信息”首先被“转录”成RNA,然后“翻译”成蛋白质,最终在生物体的发育和功能中“表达”。
遗传信息的概念在分子遗传学史上占有重要地位,始于沃森和克里克的观察:由于任何核苷酸碱基对序列都能适应任何DNA分子的结构,“因此在一个长分子中,可能存在许多不同的排列组合,因此碱基的精确序列很可能就是携带遗传信息的密码。”(沃森和克里克,1953年)。正如唐斯(2005年)所述,遗传学家雅各布和莫诺德以及那些试图破解“遗传密码”的人强化了信息语言的使用。到20世纪60年代初,信息语言在分子遗传学领域根深蒂固。
哲学家们普遍批评基因和DNA提供所有信息的理论,并质疑使用诸如“总体规划”和“程序”等笼统的隐喻来暗示基因和DNA包含所有发育信息。批评者持有许多不同的立场。大多数人似乎接受生物系统或过程包含信息的观点,但他们否认DNA在提供信息方面发挥着特殊作用。一些人乐于认为,在各种现有的信息理论(例如因果理论或标准的目的语义理论)下,信息并不局限于DNA。但另一些人则认为,理解基因的作用需要一个新的生物信息概念。一种方法是回归到狭义的编码概念,旨在明确DNA为多肽合成提供信息的意义,而不是为更高级的性状提供信息的意义(例如Godfrey-Smith 2000)。另一种方法是构建一个新的、更广泛的生物信息概念,并以此来表明基因的信息作用并非唯一(Jablonka 2002)。另一种方法是完全抛弃信息论,用纯粹的因果关系来解释与遗传学和分子生物学相关的调查和解释推理。
5.1 对基因和DNA提供信息观点的批判
DNA的作用是提供发育信息这一基本理论受到了多方面的批判。Keller(2000)指出,该观点因含糊不清而存在缺陷。DNA提供的是“程序”还是“数据”?另一些人则认为,发展所需的“信息”源自大量的“资源”,而不仅仅是遗传资源。Oyama(1985)认为,认为信息包含在DNA等静态实体中是错误的。她认为信息存在于生命周期中。其他批评则挑战了特定信息概念或理论的应用,包括因果概念和目的语义概念的应用。
Griffiths(2001)区分了两种理解信息的方式:因果信息和意向信息,并指出在这两种概念下,信息并不局限于DNA。基于Dretske(1981)的因果信息理论与Shannon(1948)的数学信息理论相关。Dretske区分了源变量和背景或通道条件。根据格里菲斯 (Griffiths, 2001) 对德雷茨克 (Dretske) 理论的解读,如果源变量 X 的值与 Y 的值相关,则该源变量 X 携带关于变量 Y 的信息。格里菲斯 (Griffiths) 对此理论的因果解释如下:
当两个系统的状态之间存在系统性的因果关系时,两个系统之间存在通道,因此可以通过观察接收者的状态来发现发送者的状态。因果信息仅仅是与通道另一端的状态可靠相关的状态。因此,烟雾携带关于火的信息,疾病表型携带关于疾病基因的信息。(Griffiths, 2001, 第 397 页)
为了捕捉该理论中关于遗传信息的传统观念,基因被视为源变量,环境被视为通道条件。由此可见,基因携带有关表型的信息,因为表型值与基因型值可靠地相关。但正如格里菲斯指出的那样,没有什么可以阻止人们将环境条件视为源变量,将基因视为通道。在因果理论的这种应用下,环境条件携带有关表型的信息。格里菲斯等人得出结论,认为基因提供信息而其他因果因素仅提供材料的观点在因果信息理论下站不住脚。
格里菲斯认为,基因和DNA提供所有信息的观点在意向性信息理论下也站不住脚。意向性理论旨在捕捉人类思想和言语中据称包含的“语义信息”(Godfrey-Smith 1999)。生物哲学家们青睐的意向性理论版本是目的论的。根据目的论理论,一个信号代表着它在进化过程中被选择代表的一切。根据这一观点,人们可能会说DNA包含有关发育的信息,因为DNA对发育的影响是在进化过程中被选择的。但正如格里菲斯和格雷(1997)指出的那样,这一观点适用于参与发育的广泛实体,而不仅仅是DNA。
韦伯(2005)挑战了梅纳德·史密斯(2000)的目的语义学解释。梅纳德·史密斯将编程计算机中的信息与DNA中的信息进行了类比。计算机执行人类编写的算法,而生物体表达的DNA则是由自然选择编程的。计算机中编程的信息是有意为之的,因为人们可以通过分析算法来确定人类程序员的意图。梅纳德·史密斯认为,自然选择在 DNA 中编程的信息在相同意义上也是有意为之的。韦伯提出了两个反驳这种观点的论点。首先,他指出 DNA 可能包含由偶然突变产生的核苷酸序列,这些突变恰好是有益的。如果自然选择还没有对它们进行操作,那么梅纳德·史密斯的目的语义理论意味着它们不包含信息。然而,从因果关系上讲,这样的核苷酸序列会以与被选择的序列相同的方式影响发展。韦伯对梅纳德·史密斯解释的第二个批评源于对与计算机程序相关的意向性的更仔细的研究。韦伯声称,与计算机相关的意向状态实际上是编写程序的人类工程师的状态,而非计算机本身的状态:“计算机程序是一串符号,只有在理解程序功能及其用途的工程师群体的背景下,它才具有意义”(Weber 2005,第252页)。在梅纳德·史密斯的论述中,与人类程序员类似的是自然选择。但自然选择并不具有意向状态。因此,韦伯得出结论,目的论方法无法挽救DNA包含意向性信息的观点。
人们很容易认为,在这种语境下,信息论毫无意义,事实上,一些哲学家认为这种论调具有误导性,应该被摒弃(例如,Sarkar 1996,Weber 2005,或许还有Rosenberg 2006)。但其他人则认为,更深入地思考信息概念可能会带来重要的洞见(参见下一节)。
5.2 使用广义的生物学信息概念来解释基因的作用
Jablonka 的目标是构建一个信息的通用定义,该定义能够识别与获取、复制和通过空间和时间传输信息的不同方式相关的不同类型的信息(Jablonka 2002)。她担心的一个问题是,关于生物学中信息话语的意义(或无意义)的讨论,受到遗传系统应作为思考生物信息的原型这一假设的偏见。她认为,一个旨在捕捉环境线索、人为指令和进化生物信号中所体现的信息含义以及遗传物质中的信息含义的信息通用定义,将带来更有用的概括和视角。
(本章完)