分子生物学(二)
尽管一些作者对20世纪大部分时间里分子生物学和进化生物学之间的脱节表示惋惜(Mayr 1985),但过去三十年,跨学科合作日益增多,这对生物学的两个分支都大有裨益。分子基因组学为比较DNA序列和全基因组提供了新的系统发育方法,而分子系统学则试图通过比较分子间的相似性和差异性来研究遗传密码的进化及其进化过程的速率(Dietrich 1998;另见“进化”、“进化与发展”[此处链接至“进化与发展”]、遗传性和适应性等条目)。反过来,比较系统发育研究证实了指导分子生物学研究的一个关键假设,即尽管生物体表型多样性惊人,但在分子层面上是相似的。因此,通过研究进化“生命之树”主要分支上的少数模式生物,就有可能获得普遍适用的知识。支持生命分子统一性假设的进化证据,回应了早期对基于“许多物种本质上相似”这一信念的外推实践的一些批评(Logan 2002;Würbel 2002)。进化生物学也对癌症研究产生了重要影响,促使研究范式从“癌症作为一种遗传疾病”(这主要源于致癌基因和抑癌基因的发现)转变为更广泛的“癌症作为一种微进化过程”的概念框架 (Okasha 2021; Plutynski 2018; Pradeu et al. 2023;另见关于癌症的条目[此处链接到“癌症”条目]。
因此,这种“分子化”过程通常意味着使用分子生物学的实验方法在分子水平上研究复杂现象(无论是基因调控、行为还是进化)。许多领域的分子化引发了一系列哲学家感兴趣的问题。将模型生物的发现概括化的实践引发了关于基础科学和临床研究中外推推理的验证、局限性和潜在陷阱的问题(参见第 3.3 节)。分子生物学的还原技术引发了关于科学研究是否应该始终努力将其简化到越来越低的水平的问题。 (参见 3.1 节)。
1.4 走向基因组学和后基因组学
20 世纪 70 年代,随着许多顶尖分子生物学家转向其他领域,分子生物学本身也开始走向基因组学(参见“基因组学和后基因组学”条目)。基因组是生物体细胞内核酸碱基对的集合(腺嘌呤 (A) 与胸腺嘧啶 (T) 配对,胞嘧啶 (C) 与鸟嘌呤 (G) 配对)。不同物种的碱基对数量差异很大。例如,引起感染的流感嗜血杆菌(第一个被测序的细菌基因组)的基因组中大约有 190 万个碱基对 (Fleischmann 等人,1995),而感染性智人的基因组中则有超过 30 亿个碱基对 (国际人类基因组测序联盟,2001;Venter 等人,2001)。基因组学的历史就是开发和使用新的实验和计算方法生成、存储和解释此类序列数据的历史 (Ankeny,2003;Stevens,2013)。
弗雷德里克·桑格 (Frederick Sanger) 在启动这些发展过程中发挥了开创性的作用,在 20 世纪 50 年代和 60 年代创造了具有影响力的 DNA 测序技术(Saiki 等人,1985 年;有关历史论述,请参见 Sanger,1988 年;Judson,1992 年;Culp,1995 年;Rabinow,1996 年;Morange,1998 年;de Chadarevian,2002 年;Little,2003 年;Garcia-Sancho,2012 年;其他互联网资源中的 Sanger DNA 测序方法)。同样重要的是埃德温·萨瑟恩 (Edwin Southern) 开发了一种检测 DNA 样本中特定 DNA 序列的方法(Southern,1975 年)。后来被称为 Southern 印迹法,首先将 DNA 链消化成许多小的 DNA 片段;然后,这些片段会根据大小进行分离(在一种称为凝胶电泳的过程中),并被放置在滤纸上,滤纸会将 DNA 片段“印迹”到新的培养基上,然后用 DNA 探针进行化学标记;这些探针可以用来识别和可视化 DNA 片段(另见其他网络资源中的“南方印迹法”)。利用“南方”的谐音,随后出现的用于检测RNA和蛋白质的印迹技术被称为北方印迹法和蛋白质印迹法。
20世纪80年代中期,随着测序技术的发展,美国能源部(DoE)启动了一项人类基因组测序项目(最初是作为一项更大计划的一部分,旨在确定广岛和长崎原子弹爆炸对人类基因组的影响)。由此产生的人类基因组计划(HGP)由美国能源部和美国国立卫生研究院(NIH)联合管理,既利用了现有的测序方法,也引入了新的方法(Kevles和Hood,1992,另见人类基因组计划条目)。虽然人类基因组计划吸引了大部分公众的关注,但迄今为止,已有数千个基因组被测序,包括猫(Pontius 等人,2007 年)、小鼠(Waterson 等人,2002 年)、水稻(Goff 等人,2002 年)以及一群鸟类基因组(Zhang 等人,2014 年)。人们对基因组测序的日益关注促使多个学科“走向基因组学”,包括行为遗传学(Plomin 等人,2003 年)、发育生物学(Srinivasan 和 Sommer,2002 年)、细胞生物学(Taniguchi 等人,2002 年)和进化生物学(Ohta 和 Kuroiwa,2002 年)。此外,基因组学已通过教科书(Cantor 和 Smith,1999 年)和期刊(例如《基因组生物学》和《基因组研究》)制度化。人类基因组计划本身也将注意力从标准化的人类基因组转向了基因组之间的变异,例如人类基因组多样性计划(Gannett 2003)、单体型图计划(国际单体型图联盟 2003)和千人基因组计划(Siva 2008)。基因组测序项目最令人惊讶的结果之一是生物体中发现的基因总数(在此语境中定义为编码蛋白质产物的DNA片段)。人类基因组包含20,000到25,000个基因,猫包含20,285个基因,小鼠包含24,174个基因,水稻包含32,000到50,000个基因。与早期假设相反,事实证明,无论是生物体的复杂性还是其在食物链中的位置都无法预测基因数量(Baedke 2018;Brigandt、Green和O’Malley 2017;Green 2017)(参见“基因组学和后基因组学”条目)。一个相关的挑战是如何理解遗传相似性的说法。例如,如何解释人类和南瓜基因组有75%相似度的发现?这一发现是否揭示了我们与南瓜整体相似性的任何实质性信息(Piotrowska 2009)?这些挑战促使许多研究人员更加关注非编码调控序列和基因组表达调控,将其作为生物体复杂性的另一种解释(Morange,2006)。这种“后基因组学”方法利用基因组学提供的序列信息,并将其置于对转录(转录组学)、调控(调控组学)、代谢(代谢组学)和表达(蛋白质组学)机制中所涉及的所有其他实体和活动的分析之中。(参见 ENCODE 项目联盟,2012;Germain 等人,2014;(另见“系统哲学与合成生物学”条目)。
除了 DNA 结合蛋白外,未转录成蛋白质产物的 RNA 分子在调控蛋白质编码基因以及保护基因组免受病毒和转座子侵害方面也发挥着重要作用。RNA干扰(RNAi)是一类短链单链RNA,它选择性地与其他RNA分子结合,抑制其翻译成蛋白质。类似的小型非编码RNA是CRISPR(基因编辑技术)的一部分,该技术保护细菌免受病毒入侵。非编码RNA已成为一种极其强大的实验工具,使研究人员能够特异性地、可逆地抑制任何目标基因。尤其是CRISPR系统已被应用于真核细胞,并成为基因组操作的首选方法(Doudna和Charpentier,2014)。从概念层面来看,发育复杂性与非编码序列(而非蛋白质编码序列)的增加相关,这一事实促使一些作者得出结论:“遗传信息的最初概念存在缺陷,复杂生物体中的大多数基因都指定调控RNA”(Mattick,2023)。
基因组学的进步很大程度上依赖于新技术的发展,其中一些技术利用了分子生物学领域的发现,而另一些则借鉴了其他学科的知识。20世纪70年代,Howard M. Temin、Renato Dulbecco和David Baltimore发现了病毒逆转录酶可以将RNA转化为DNA,这为互补DNA(或称cDNA)文库的开发铺平了道路。cDNA文库仅包含转录成mRNA的DNA序列。这项技术不仅彻底改变了基因组学的研究,还为后来成为RNomics(细胞整体转录谱研究)的学科提供了初步的见解。1983年,Kary B. Mullis开发了聚合酶链式反应(PCR),利用来自嗜热菌的耐热DNA聚合酶在体外克隆DNA。大大简化并加速了克隆过程。逆转录聚合酶链式反应 (RT-PCR) 结合了这两种技术,目前用于监测基因表达、克隆、诊断和法医学。第二代测序技术将荧光标记与传统的双脱氧测序相结合,同样促进了基因组项目的蓬勃发展。这些新技术显著降低了成本和时间,推动分子生物学进入“大数据”领域 (Leonelli 2016)。最后,随着测序基因组数量的增加,人们对生物信息学以及基因组注释技术的发展的需求和兴趣也随之增加 (Griffiths and Stotz 2013)。
基因组学和后基因组学的发展引发了许多关于分子生物学的哲学问题。既然基因组需要大量其他机制来促进蛋白质产物的生成,那么 DNA 真的能够被因果优先排序吗(参见 2.3 节)?同样,面对转录、调控和表达中如此相互依存的机制,DNA 是否是唯一拥有遗传信息承载权的载体,还是信息分布于所有这些实体和活动中(参见 2.2 节)?根据其他物种基因组的信息推断人类基因组的运作方式是否合适(参见 3.3 节)?
1.5 近期实验和概念发展
除了使大规模“组学”项目成为可能的实验和计算技术外,许多其他创新也塑造了近期分子生物学的研究。与需要晶体样品的 X 射线晶体学不同,新开发的核磁共振波谱 (NMR) 和低温电子显微镜 (cryo-EM) 技术使研究人员能够阐明溶液中分子的三维结构。用于研究生物分子结构的方法多种多样,不同方法所得结果之间偶尔也会出现分歧,这为探索科学中的多元论与一元论问题提供了一个有趣的案例研究 (Mitchell 和 Gronenborn 2017;Mitchell 2009;Bolinska 2022;Vallejos-Baccelliere 和 Vecchi 2024;另见关于多元论的条目 [链接至此处的“多元论”条目]。这些新技术还揭示出许多蛋白质含有相对较大的非结构化或低复杂度结构域。许多此类结构域在进化上保守的事实表明它们具有生物学相关的功能,例如为结合和聚集细胞特定区域的生物分子提供灵活的支架。一些支架结构可以形成无膜细胞器,或生物分子凝聚体。与具有固定化学计量和几何构形的大分子机器(Alberts,1998)不同,它们的行为更像具有动态可变组成和几何构形的液体(Banani 等人,2017)。
干细胞研究取得了重大突破,并得到了媒体的广泛报道。1958年,约翰·格登利用核移植技术成功克隆了一只青蛙。从分化细胞中提取的细胞核移植到去核卵子中后,发育成看似正常的生物体,这一事实促使科学家们得出结论:细胞分化并非像曾经认为的那样不可逆,分化细胞可以被“重编程”为全能干细胞和多能干细胞。与“基因编程”不同,“细胞编程”并非涉及编码序列的改变,而是负责激活胚胎干细胞关键基因的转录因子的过度表达 (Fagan 2013, 2021)。
尽管长期以来人们一直怀疑细胞行为必然具有概率性,因为其背后的分子机制具有随机性,但人们普遍认为,细胞能够尽量减少分子噪声,从而可靠地产生通常在研究大量细胞群体时观察到的确定性行为。然而,越来越多的研究表明,即使是在相同环境中生长的同基因细胞群体,也可能表现出表型差异,这挑战了这一假设。例如,同类型神经元中离子通道基因的表达水平在不同细胞和个体之间可能存在显著差异,导致突触和膜电导值出现可测量的差异 (Marder and Taylor 2011)。这一现象以及其他类似现象与外推问题相关,尽管它涉及的是在已知群体层面统计数据的情况下,对个体或单一行为进行推断。例如,虽然对细胞群体的研究支持细胞对刺激以分级方式响应的结论,但实际上,每个细胞可能都具有分类的“开启”或“关闭”反应表型。
最后,虽然许多生物学分支已经“分子化”,但分子生物学本身也包含数学建模。数学建模在许多生物学分支中都很常见,包括经典遗传学和临床遗传学、生态学、流行病学、系统生物学,以及化学和生物化学。相比之下,分子生物学传统上依赖于定性描述,这些描述启发了各种机制的哲学表征(参见2.1节)。这种情况在过去二十年中发生了变化,广为使用的《细胞分子生物学》教科书的最新版本(Alberts等人,2022年,第8章)专门设立了一个章节,用于对生物功能进行数学分析,以补充生化和分子分析方法。分子机制的动态特性通常通过借鉴化学、控制论、机械工程和计算机科学的数学建模方法来研究。同样,体外重建实验[关于体外重建实验的讨论,参见(Weber 2005; Matlin 2022)]也得到了计算机模拟实验的补充,这些实验用于生成证据,证明所提出的机制原则上足以产生感兴趣的现象(Bechtel 2011; Braillard & Malaterre 2015)[尽管此类模拟无法证明所提出的机制实际上是导致该现象的原因(Craver 2006)]。
分子生物学及相关领域解释方法的数学化和微妙转变、新实验技术的发展以及与生物学内外其他学科的实验和理论交流,为科学和生物学哲学家带来了新的问题。这些问题包括:机制的本质(第 2.1 节)、机制解释的完整性(第 3.2 节)、归约与积分(第 3.1 节)、对单个生物系统的外推(第 3.3 节)以及实验(第 3.4 节)。
2. 分子生物学概念
机制的概念信息和基因在分子生物学史上都占有相当重要的地位。反过来,哲学家们也对这些概念投入了大量的关注,以理解它们过去、现在以及未来应该如何被运用。
2.1 机制
传统上,科学哲学家认为成功的科学解释源于对自然法则的推导(Hempel 和 Oppenheim 1948;参见自然法则和科学解释条目)。生物哲学家批评这种传统的分析方法不适用于生物学,尤其是分子生物学。(更多讨论,参见 Beatty 1995;Brandon 1997;Lange 2000;Mitchell 1997;Smart 1963;Sober 1997;Waters 1998;Weber 2005)。
秉承韦斯利·萨蒙(Wesley Salmon,1984,1998)开创的因果-机械论传统,哲学家们将理解机制阐释作为生物学科学解释的途径(Bechtel and Abrahamsen,2005;Bechtel and Richardson,1993;Craver,2007;Darden,2006a;Glennan,2017;Machamer、Darden和Craver,2000;Sarkar,1998;Schaffner,1993;Woodward,2002,2010)。多年来,关于机制的若干表征逐渐涌现(Bechtel and Abrahamsen,2005;Glennan,2002;Machamer、Darden和Craver,2000)。 Stuart Glannan 将机制的基本特征总结如下:
一种现象的机制由实体(或部分)组成,这些实体的活动和相互作用被组织起来,以对现象负责。(Glennan 2017: 17) [类似特征参见 (Illari and Williamson 2012: 120)]
以 DNA 复制现象为例。DNA双螺旋结构(一个具有组织的实体)解旋(一种活动),新的组成部分(实体)与解旋的DNA螺旋结构的两个部分结合(一种活动)。DNA是一种核酸,由几个部分组成:糖磷酸骨架和核酸碱基。DNA解旋时,碱基会带上弱电荷,这是由于分子内部存在轻微的不对称性造成的。这些弱电荷使DNA碱基及其互补碱基能够参与形成氢键(弱极性)化学键的活动;这种活动的特异性源于碱基各部分中弱极性电荷的拓扑排列。最终,带极性电荷的实体能够形成氢键。互补碱基对齐后,骨架通过更强的共价键形成。该机制继续进行解旋和结合(活动)新的部分,从而产生两个螺旋(新形成的实体),它们(或多或少)是母体螺旋的复制品。 (这一“半保留复制”过程以及证实该过程的梅塞尔森-斯塔尔实验将在第 3.4 节中更详细地讨论。)
用因果-机械方法理解分子生物学中的科学解释有几个优点。首先,它最忠实于分子生物学家进行生物学解释时的语言。分子生物学家很少将他们的实践和成就描述为新理论的发展;相反,他们将他们的实践和成就描述为对分子机制的阐明 (Baetu 2019; Craver 2001; Machamer, Darden, Craver 2000; [此处链接至“科学中的机制”条目]。其次,对机制的了解揭示了事物的运作方式:阐明的机制有助于理解。第三,因果-机械方法能够捕捉到规律性和变异性的生物学解释。与物理学中科学家假设电子就是电子不同,生物学家通常更感兴趣的是究竟是什么让一个个体、一个种群或一个物种彼此不同(Calcott 2009;Tabery 2009, 2014)。最后,对机制的了解可能使人们能够干预机制的产生,操纵其部件以构建实验工具,或修复损坏的、有病的机制。简而言之,对已阐明机制的了解有助于理解、预测和控制。