量子理论与数学严谨性(一)
在量子物理学的基础领域,数学严谨性的作用一直备受争议。冯·诺依曼和狄拉克的对立观点为这场争论的双方提供了有趣且富有启发性的见解。冯·诺依曼的贡献往往强调数学严谨性,而狄拉克的贡献则强调实用性。下面的讨论首先评估他们对量子力学基础的贡献。然后,我们将探讨他们对量子力学之外的数学物理的贡献,并重点关注这些贡献对量子理论后续发展的影响,尤其是在量子场论及其基础方面。条目“量子场论”概述了发展量子场论的各种方法。本文旨在更详细地讨论量子场论的数学严谨方法,这与拉格朗日量子场论等传统方法不同,后者通常被认为更具启发性。本文还将讨论当前关于拉格朗日量子场论还是公理化量子场论应作为解释性分析基础的争论。
1. 引言
2. 冯·诺依曼与量子理论基础
2.1 量子力学的可分希尔伯特空间公式
2.2 算子环、量子逻辑和连续几何
3. 狄拉克与量子理论基础
3.1 狄拉克δ函数、原理、和 Bra-Ket 符号
3.2 量子力学的带约束希尔伯特空间公式
3.3 哥伦布代数
4 数学严谨性:两条路径
4.1 代数量子场论
4.2 Wightman 的公理化量子场论
5 哲学问题
5.1 实用主义与公理化
5.2 中间立场
参考文献
学术工具
其他网络资源
相关文章
1. 引言
在物理理论中,存在两种相互竞争的数学策略:一种强调严谨性,另一种强调实用主义。实用主义方法通常会牺牲数学严谨性,但却提供了计算的便利性和表达的优雅性。一个典型的例子是无穷小的概念,即小于任何有限量的非零量。开普勒、伽利略、牛顿、莱布尼茨等许多人在发展和运用各自的物理理论时,都使用了无穷小,尽管这些无穷小缺乏严谨的数学基础,正如贝克莱在其1734年发表的著名论文《分析家》中对无穷小的批判一样。这些批判并没有阻止18世纪的众多数学家、科学家和工程师,例如欧拉和拉格朗日,使用无穷小来获得精确的计算结果。然而,对严谨性的追求促使柯西等人在19世纪提出了极限的概念,该概念提供了一个严谨的数学框架,有效地取代了无穷小理论。罗宾逊最终在20世纪下半叶为无穷小奠定了严谨的基础,但无穷小在当代物理学中很少使用。有关无穷小的历史,请参阅“连续性和无穷小”的条目。这些相互竞争的数学策略在近期关于量子力学数学基础的讨论中有所体现。在冯·诺依曼(1955)关于该主题的论文的前言中,他指出狄拉克为量子力学提供了一个非常优雅且强大的形式框架,但他也抱怨该框架中一个“具有自相矛盾性质的不恰当函数”的核心作用,他也将其描述为“数学虚构”。他指的是狄拉克δ函数,该函数具有以下不相容的性质:它定义在实线上,除一个无穷大点外处处为零,并且在实线上积分时为1。冯·诺依曼提出了一个替代框架,他将其描述为“同样清晰统一,但没有数学上的异议”。他强调,他的框架不仅仅是对狄拉克框架的改进;相反,它是一个基于希尔伯特算子理论的完全不同的框架。
狄拉克当然完全清楚δ函数并非一个定义明确的表达式。但他并不为此感到困扰,原因有二。首先,只要遵循δ函数的规则(例如,仅在积分符号下使用δ函数,这意味着不询问δ函数在给定点的值),就不会出现不一致的情况。其次,δ函数可以被消除,这意味着可以用一个定义明确的数学表达式来代替它。然而,根据狄拉克的说法,这种情况下的一个缺点是,这种替代会导致更繁琐的表达式,从而掩盖论证。简而言之,当实用主义和严谨性得出相同的结论时,实用主义胜过严谨性,因为它会带来简单性、效率和……并加深了理解。
与无穷小量的概念一样,狄拉克δ函数最终也得到了数学上严谨的基础。这在施瓦茨的分布理论中得以实现,该理论后来被用于发展“操纵希尔伯特空间”(rigged Hilbert space)的概念。分布理论被用来为量子场论提供数学框架(Wightman,1964)。操纵希尔伯特空间则被用于量子力学(Böhm,1966),随后又被用于量子场论(Bogoliubov et al.,1975)。
量子力学发展中所展现的互补方法——严谨性和实用性——后来在量子电动力学(QED)以及更普遍的量子场论(QFT)的发展中以更显著的方式得以体现。对严谨性的强调体现在两个框架中:代数量子场论(algebraic QFT)和怀特曼的公理化量子场论(Wightman's axiomatic QFT)。代数量子场论 (QFT) 源于冯·诺依曼在算子代数方面的工作,他试图推广希尔伯特空间框架,并发展了算子代数。怀特曼的公理量子场论 (AQFT) 源于施瓦茨的分布理论,后来在操纵的希尔伯特空间框架中发展起来。粗略地说,这两种方法之间的基本区别在于:算子代数是代数量子场论中的基本数学概念,而算子值分布(场量的量子类似物)是怀特曼公理量子场论的基础。值得注意的是,代数量子场论通常是公理化的,因此它同样配得上“公理”量子场论 (QFT) 的名称。然而,该术语通常被用来特指基于算子值分布的方法。为了避免任何可能的混淆,该方法在此被称为“怀特曼公理化”量子场论。对实用性的强调最显著地体现在拉格朗日量子场论中,它运用了微扰论、路径积分和重正化技术。尽管该理论的某些元素最终被建立在更坚实的数学基础之上,但人们仍然严重质疑它是否是一种与代数和怀特曼公理化量子场论相媲美的完全严格的方法。尽管如此,它在提供与实验确定的量相关的极其精确的数值结果,以及实现其他方法无法比拟的便捷计算方面取得了惊人的成功。
这两种量子场论方法继续并行发展。弗莱明(2002,第135-136页)在讨论哈格的《局域量子物理学》(1996年)和温伯格的《量子场论》(1995年)之间的差异时,重点阐述了这一点; Haag 的书介绍了代数量子场论,而 Weinberg 的书介绍了拉格朗日量子场论。虽然两本书表面上讲的是同一主题,但 Haag 给出了量子场论的精确公式及其数学结构,但没有提供任何与实验确定的物理量(例如散射截面)联系起来的技巧。Weinberg 给出了一个实用的公式,它符合物理直觉,并提供了对计算很重要的启发式方法;然而,它在数学上并不那么严谨。此外,一本书探讨了许多重要主题,而另一本书却只字未提。例如,Haag 讨论了酉不等价表示,而 Weinberg 却没有。相比之下,Weinberg 讨论了费曼路径积分规则,而 Haag 对此只字未提。还有人口统计学的问题。大多数粒子物理学家和实验物理学家都会阅读和研究温伯格的书,但很少有人会读哈格的书。由于这些差异,弗莱明(2002,第136页)认为,人们可能会质疑这两本书是否真的探讨同一主题。这引发了一个问题:量子场论的任何表述是否值得对其基础进行哲学关注。特别是,华莱士(2006,2011)和弗雷泽(2009,2011)之间就量子场论的解释应该基于标准教科书对量子场论的处理还是基于量子场论的公理化表述展开了争论。
2. 冯·诺依曼与量子理论基础
20世纪20年代末,冯·诺依曼发展了量子力学的可分离希尔伯特空间表述,该表述后来成为权威的(至少从数学严谨性的角度来看)。 20世纪30年代中期,他广泛研究了格理论(参见量子逻辑条目)、算子环和连续几何。他发展这些数学理论的部分动机是为了发展一个合适的量子场论框架,并为量子力学奠定更坚实的基础。在此期间,他注意到两种密切相关的结构:模格和有限II型因子(一种特殊的算子环),它们具备他认为量子理论所期望的特征。这些观察促使他为量子理论发展了一个更通用的框架——连续几何。然而,事情的发展并不像冯·诺依曼预期的那样。他很快意识到,如果要用这样的几何来描述量子力学现象,它们必须具有一个转移概率函数。并且由此产生的结构根本不是对已有算子环的推广。此外,很晚才确定第三类因子是量子理论中最重要的算子环类型。此外,关于他对格理论的预期,他在很久以后也得出了类似的结论。适用于量子理论的格是正交模的——只有当格是模的时,格才是正交模的,反之则不正确。在三大数学理论中,算子环已被证明是量子理论最重要的框架。可以使用算子环在纯抽象的代数环境中模拟物理系统的关键特征(这将在4.1节中讨论)。一个相关的问题是,是否有必要在希尔伯特空间中选择环的表示;有关此问题的进一步讨论,请参阅Haag和Kastler(1964)、Ruetsche(2003)以及Kronz和Lupher(2005)。无论如何,可分离希尔伯特空间仍然是量子理论的关键框架。可分离希尔伯特空间最简单的例子是有限维空间,在这种情况下,算符的代数是一个类型因子(n 为正整数)。算符是 n×n 复矩阵,通常用于描述内部自由度,例如自旋。想要熟悉这些基本例子的读者可以查阅量子力学的条目。
2.1 量子力学的可分离希尔伯特空间公式
矩阵力学和波动力学大约在 1925 年至 1926 年之间同时形成。1925 年 7 月,海森堡完成了他开创性的论文《论运动学和力学关系的量子理论诠释》。两个月后,玻恩和约尔当完成了他们的论文《论量子力学》,这是矩阵力学的第一个严格表述。再过两个月,玻恩、海森堡和约尔当完成了《论量子力学 II》,这是对早期玻恩和约尔当论文的进一步阐述;该论文于1926年初发表。这三篇论文转载于范德华登(1967)。与此同时,薛定谔正在撰写他后来著名的四篇波动力学论文。第一篇于1926年1月被《物理学年鉴》收录,第二篇于2月收录,第三篇于5月收录,第四篇于6月收录。这四篇论文均转载于《薛定谔》(1928)。
薛定谔在《薛定谔》(1926)一文中首次提出了矩阵力学与波动力学之间关系的问题。该文发表于1926年春季的《年鉴》(Annalen),发表于他著名的四篇论文中的第二篇和第三篇之间。这篇论文也转载于《薛定谔》(1928)一文中。它包含了数学等价性证明的萌芽,但并未包含严格的等价性证明:薛定谔与波动力学相关的数学框架是一个连续且可归一化函数的空间,这个空间太小,无法与矩阵力学建立适当的关系。此后不久,狄拉克和若尔当分别独立地统一了这两个框架。但他们各自的方法都需要使用δ函数,而这从数学严谨性的角度来看是值得怀疑的。1927年,冯·诺依曼在《哥廷根新闻报》上发表了三篇论文,将量子力学置于严谨的数学基础之上,并包含矩阵力学与波动力学等价性的严格证明(即不使用δ函数)。这些论文被冯·诺依曼(1961-1963,第一卷,第8-10期)重印。在他著名的1932年量子力学论文(冯·诺依曼,1955)的前言中,他优雅地总结了他在早期论文中提出的量子力学可分离希尔伯特空间表述。他承认狄拉克量子力学表述的简洁性和实用性,但最终认为它并不可接受。他表示,他无法容忍使用当时只能被视为数学虚构的东西。这些虚构的例子包括狄拉克假设每个自伴算子都可以写成对角形式,以及他对δ函数的使用,冯·诺依曼将其描述为“具有自相矛盾性质的不恰当函数”。他声称他的目的是构建一个数学上严谨的量子力学框架。
以下是冯·诺依曼策略的简要概述。首先,他将矩阵力学的数学框架视为现在被描述为无限维可分希尔伯特空间的东西。这里的“希尔伯特空间”指的是具有内积的完全向量空间;冯·诺依曼在希尔伯特空间的定义中附加了可分性(具有可数基)的要求。然后,他尝试指定一组函数来实例化一个(无限维)可分希尔伯特空间,并且可以将其与薛定谔的波动力学等同起来。他从实数轴上的平方可积函数空间入手。为了满足完备性条件,即所有柯西函数序列(均值)收敛于该空间中的某个函数,他规定积分必须以勒贝格的方式定义。为了定义内积运算,他规定勒贝格平方可积函数集必须以在测度为零的集合上不同的关系模分解为等价类。空间元素是函数的等价类而非函数的等价类这一事实有时会被忽视,而这对于解释性研究有着有趣的影响。例如,Kronz (1999) 指出,在玻姆的本体论解释(也称为玻姆力学)下,可分离的希尔伯特空间并不适合量子力学的框架。
2.2 算子环、量子逻辑和连续几何
冯·诺依曼在1935年写给伯克霍夫的一封信中写道:“我想坦白一件看似不道德的事:我不再相信希尔伯特空间了。” 这封信发表在《冯·诺依曼》(2005)一书中。这份坦白确实令人震惊,因为它出自量子力学可分离希尔伯特空间表述的拥护者之口,而且是在他那篇关于该主题的权威著作——著名的论文发表三年后发表的。讽刺的是,在他向伯克霍夫坦白后不到两年,他关于将取代可分离希尔伯特空间的抽象数学结构——具有转移概率的连续几何——的数学理论,竟然未能提供可分离希尔伯特空间框架的推广。更令人感兴趣的是,冯·诺依曼在数学物理学领域发起和发展的后续发展最终巩固了可分离希尔伯特空间框架在数学物理学(尤其是在量子理论领域)中的地位。这些内容将在第4.1节中详细解释。
在1932年之后的七年里,冯·诺依曼在其连续几何理论中融合了三大理论发展:量子力学的代数方法、量子逻辑和算子环。到1934年,在约当和维格纳的帮助下,冯·诺依曼已经在量子力学的代数方法方面取得了实质性进展——他们的文章《论量子力学形式主义的代数推广》被转载于《冯·诺依曼》(1961-1963,第二卷,第21期)。 1936 年,他发表了第二篇关于该主题的论文《论量子力学形式主义的代数推广(上)》,该论文被冯·诺依曼(1961-1963 年,第三卷,第 9 期)重印。后来发现,这两部作品都没有特别大的影响力。冯·诺依曼和伯克霍夫的相关论文《量子力学的逻辑》也发表于 1936 年,该论文被冯·诺依曼(1961-1963 年,第四卷,第 7 期)重印。这篇论文对大量量子逻辑文献的发展具有开创性意义。然而,值得注意的是,这只有在模块化(冯·诺依曼的关键假设)被正交模块化(一个较弱的条件)取代之后才会发生。 Holland (1970) 清楚地解释了这种转变的本质:模块化实际上是分配律的弱化(将其有效性限制在某些选定的格元素三元组中),正交模性是模性的弱化(将分配律的有效性限制在更小的格元三元组集合中)。从模性到正交模性的转变最早出现在(Loomis 1955)。随后,关于正交模格和量子力学基础的文献迅速增长。例如,参见Pavičić (1992) 提供的截至1990年的量子逻辑的详尽参考书目,其中有超过1800条条目。
对于量子理论的基础而言,冯·诺依曼的六篇关于算子环的论文(其中三篇与Murray合作发表)更为引人注目,这些论文被转载于冯·诺依曼(1961-1963,第III卷,第2-7期)。前两部著作《算子环》及其续集《算子环 II》分别出版于 1936 年和 1937 年,对后四部著作的发展具有开创性意义。第三部著作《算子环:约化理论》写于 1937-1938 年间,但直到 1949 年才出版。第四部著作《论无限直积》出版于 1938 年。后两部著作《算子环 III》和《算子环 IV》分别出版于 1941 年和 1943 年。这部关于算子环的巨著影响深远,至今仍对纯数学、数学物理和物理学基础产生深远影响。算子环现在被称为“冯·诺依曼代数”,这是 Dixmier (1981) 在其 1957 年关于算子代数的论文 (Dixmier 1981) 的引言中首次使用这个名称来称呼它们(他表示这样做是听从了 Dieudonné 的建议)。
冯·诺依曼代数是希尔伯特空间 H 上有界算子集 B(H) 的 ∗-子代数,该空间在弱算子拓扑中闭合。通常假设冯·诺依曼代数包含恒等算子。∗-子代数包含代数中每个算子的伴随,其中“∗”表示伴随。冯·诺依曼代数有一些特殊类型,称为“因子”。如果冯·诺依曼代数的中心(与代数中所有元素交换的元素集合)是平凡的,即它只包含恒等元素的标量倍数,则该冯·诺依曼代数是一个因子。此外,冯·诺依曼在其约化理论论文中表明,所有非因子的冯·诺依曼代数都可以分解为因子的直和(或积分)。因子类型有三种互斥且详尽的类型:I 型、II 型和 III 型。每种类型都被划分为(互斥且详尽的)子类型:In 型(n=1,2,…,∞)、IIn 型(n=1,∞)、IIIz 型(0≤z≤1)。如上所述,In 型对应于有限维希尔伯特空间,而 I∞ 型对应于无限维可分希尔伯特空间,该空间为波动力学和矩阵力学提供了严格的框架。冯·诺依曼和默里区分了 I 型和 II 型因子的子类型,但未能区分 III 型因子。直到 20 世纪 60 年代和 70 年代,这些因子才被区分为子类型——详情请参阅 Sunder (1987) 的第三章或 Connes (1994) 的第五章。
由于他早期对量子力学基础的研究以及与伯克霍夫在量子逻辑方面的工作,冯·诺依曼认为 II1 型因素可能是与物理学最相关的因素。这是一个重大的转变,因为当时量子力学中最重要的可观测量代数被认为是无限维可分希尔伯特空间上的有界算子集,它是一个I∞型因子。下文将简要解释这一转变。关于冯·诺依曼关于量子逻辑、算子环(尤其是II1型因子)、概率论基础和量子物理之间基本联系的观点的更全面讨论,请参阅(Rédei 1998)中详尽而清晰的阐述。值得注意的是,冯·诺依曼将III型因子视为“病态”算子代数的统称;事实上,在分类方案引入数年后,人们才证明了此类因子的存在。具有讽刺意味的是,现在的主流观点似乎是III型因子是与物理学(尤其是量子场论和量子统计力学)最相关的类别。这一点将在下文第 4.1 节中进一步阐述,在此之前,先解释冯·诺依曼的计划为何未能实现。
在题为“论算符环”的四篇系列论文的第一篇的引言中,默里和冯·诺依曼列举了他们不满意量子力学可分希尔伯特空间表述的两个原因。一个原因与迹运算的性质有关,迹运算是出现在测量结果概率定义(玻恩规则)中的运算;另一个原因与无界可观测量算符所引起的域问题有关。当可分希尔伯特空间为无限维时,恒等式的迹为无限。这意味着不可能为实验结果(即可观测量)定义一个正确的标准化先验概率。根据定义,实验的先验概率是任意两个不同结果发生的可能性相等的概率。因此,当存在无数个这样的结果时,每个不同结果的概率必定为零,而这当且仅当空间是无限维的。