量子理论与数学严谨性(二)
不清楚为什么冯·诺依曼认为每个实验都需要有先验概率,尤其是考虑到冯·米塞斯明确认为先验概率(用他的术语来说就是“均匀分布”)并不总是存在(von Mises 1981,第 68 页及后续页),并且冯·诺依曼在概率基础方面深受冯·米塞斯的影响(von Neumann 1955,第 198 页及后续页)。后来,冯·诺依曼将他对无限维希尔伯特空间不满的原因从概率论转变为代数论(Birkhoff and von Neumann 1936,第118页);即它违反了汉克尔的形式律保持原理,这导致人们试图保持模块性——该条件在有限维希尔伯特空间中成立,但在无限维希尔伯特空间中不成立。无界算子的问题在于它们只能定义在空间集合元素的稠密子集上。这意味着无界算子的代数运算(和与积)无法被普遍定义;例如,两个无界算子A和B可能使得B的值域与A的定义域不相交,在这种情况下,乘积AB毫无意义。
如果n<∞,则上述问题对于In型因子不会出现。对于II1型,它们也不会出现。也就是说,这些因子类型具有有限的迹运算,并且不受无界算子的定义域问题的困扰。特别值得注意的是,这些因子类型(n<∞的In型和II1型)的投影格都是模的。相比之下,无限维可分希尔伯特空间上的有界算子集,即I∞型因子,不是模的;相反,它只是正交模的。这些考虑有助于解释为什么冯·诺依曼认为II1型因子而不是I∞型因子是In型(n<∞)在量子物理中的恰当推广。文献中从模格到正交模格的转变,正如上文所述,实际上是回到了冯·诺依曼早期(坦白之前)的立场。但是,正如前面提到的,现在看来,这也不是最好的选择。
冯·诺依曼希望,他推广量子理论的方案能够源于一种名为“连续几何”的全新数学结构。他希望利用这一结构将上述三个关键要素整合在一起:量子力学的代数方法、量子逻辑和算子环。他力图在这些要素之间建立起牢固的概念联系,从而为推广量子力学奠定一个合适的基础,而无需像算子环那样大量使用希尔伯特空间。然而,事实证明,连续几何这一类别对于量子力学的公理化而言过于宽泛。必须将这一类别适当地限制为具有转移概率的类别。由此可见,在可分离的希尔伯特空间框架之外,并不存在任何实质性的推广。冯·诺依曼于1937年完成的一份未发表的手稿,由以色列·哈尔佩林(Israel Halperin)整理和编辑,并最终以《冯·诺依曼》(1981)为名出版。哈尔佩林对该手稿的评论发表在《冯·诺依曼》(1961-1963,第IV卷,第16期)一书中,这比手稿本身的出版早了几年。在那篇评论中,哈尔佩林指出:
经过200页的深入推导,最终结论(本质上)是:所有具有转移概率的几何都可以等同于某个有限维或无限维希尔伯特空间(Im或II1)中有限因子的投影几何。这一结果表明,连续几何并不能提供除算子环已有描述之外的新的、有用的量子力学现象的数学描述。
然而,这一不幸的进展并没有完全削弱冯·诺依曼推广量子力学的努力。相反,他在算子环方面的工作确实为未来的发展提供了重要的启示。后续发展的结果是,冯·诺依曼选择了错误的因子类型作为物理学的基础。
3. 狄拉克与量子理论的基础
尽管狄拉克的量子力学形式框架缺乏数学严谨性,但它仍然非常有用且影响深远。它被物理学家广泛使用,并启发了泛函分析领域一些重要的数学发展。最终,数学家们开发了一个合适的框架,将狄拉克的形式框架置于坚实的数学基础之上,这个基础被称为“操纵希尔伯特空间”(也称为盖尔凡德三重态)。其发展如下:在分布理论中,δ函数的严格定义成为可能,由施瓦茨在 20 世纪 40 年代中期至 50 年代初发展起来的。分布理论启发了盖尔凡德及其合作者在 20 世纪 50 年代中后期提出操纵希尔伯特空间的概念,这为狄拉克的形式框架奠定了坚实的基础。格罗滕迪克在 20 世纪 50 年代中期提出的核空间概念促进了这一发展。随后,玻姆和罗伯茨于 1966 年独立发展了量子力学的操纵希尔伯特空间表述。此后,它被扩展到量子领域的各种不同情境,包括衰变现象和时间箭头。施瓦茨、盖尔凡德和其他人的数学发展也对量子场论产生了重大影响。怀特曼在 20 世纪 50 年代中期至 60 年代中期发展了分布理论,发展了量子场论的公理化方法。 20世纪60年代末,博格柳波夫(Bogoliubov)及其同事将公理化方法明确地纳入了操纵希尔伯特空间框架。
尽管这些发展仅仅通过与狄拉克形式化量子力学方法相关的数学发展间接地受到了他的研究影响,但他的其他工作元素对量子场论(QFT)的发展产生了更直接、更实质性的影响。20世纪30年代,狄拉克(1933年)发展了量子力学的拉格朗日公式,并将其应用于量子场论,后者启发了费曼(1948年)发展量子场论的路径积分方法。尽管路径积分泛函已经取得了实质性进展(DeWitt-Morette等人,1979年),但其数学基础仍然缺乏(Rivers,1987年,第109-134页)。尽管存在这些缺陷,它仍然是迄今为止最有用、最具影响力的量子场论方法。 20世纪40年代,狄拉克 (1943) 发展了一种涉及不定度量的量子电动力学形式——另见泡利 (1943) 的相关论述。这对后来的发展产生了重大影响,首先是 20 世纪 50 年代初古普塔-布鲁尔 (Gupta-Bluer) 形式体系在量子电动力学中的应用,以及 20 世纪 50 年代末各种量子场论 (QFT) 模型,例如矢量介子场和量子引力场——参见纳吉 (1966) 著作第二章中的示例和参考文献。
3.1 狄拉克的δ函数、原理和 Bra-Ket 符号
如上所述,狄拉克在证明矩阵力学和波动力学等价性的尝试中,δ函数发挥了重要作用。在狄拉克之前,物理学家们就已经开始使用δ函数,但直到狄拉克将其有效地应用于量子力学之后,它才成为许多物理学领域的标准工具。后来,狄拉克的量子力学因他的教科书(Dirac 1930)而广为人知。该教科书基于狄拉克在剑桥大学的一系列量子力学讲座。这本教科书后来又出版了三个版本:1935年出版的第二版、1947年出版的第三版和1958年出版的第四版。第四版已多次重印。它的持久影响力部分归功于狄拉克在第三版中引入的另一项创新,即他的bra-ket形式体系。他最早在(Dirac 1939)中发表了这种形式体系,但直到第三版出版后,这种形式体系才得到广泛应用。毫无疑问,这些工具(首先是δ函数,然后是bra-ket符号)对于物理学家在实践和教授量子力学时,无论是在建立方程还是进行计算方面,都极其有效。大多数量子力学教科书都使用δ函数和平面波,它们是狄拉克形式框架的关键元素。但它们并未被纳入冯·诺依曼为量子力学所构建的严格数学框架。物理学家以及量子力学的教师和学生经常使用狄拉克框架,因为它简洁、优雅、强大且相对易用。因此,从实用主义的角度来看,狄拉克框架比冯·诺依曼框架更受青睐。“操纵希尔伯特空间”(riged Hilbert space)的概念为狄拉克框架奠定了坚实的数学基础。
3.2 量子力学的“操纵希尔伯特空间”公式
数学家们为狄拉克的形式框架奠定了严格的基础付出了巨大的努力。其中一个关键要素是施瓦茨(1945;1950-1951)的分布理论。另一个关键要素,即核空间的概念,由格罗滕迪克(1955)发展而来。这一概念使得在装配希尔伯特空间中自伴算子的广义特征向量分解定理成为可能——有关该定理,请参见 Gelfand 和 Vilenken (1964, pp. 119–127),有关通向该定理的复杂路径的简要历史叙述,请参见 Berezanskii (1968, pp. 756–760)。分解原理提供了一种严格的方法来处理位置和动量等可观测量,就像狄拉克形式框架中呈现的那样。这些数学发展在 20 世纪 60 年代初达到顶峰,当时 Gelfand 和 Vilenkin 刻画了一种他们称之为装配希尔伯特空间的结构 (Gelfand and Vilenkin 1964, pp. 103–127)。不幸的是,他们为这种数学结构选择的名称具有双重误导性。首先,人们自然倾向于认为它表示一种希尔伯特空间,某种意义上是被操纵的,但这种倾向必须被抵制。其次,“操纵”一词带有一种令人遗憾的不合法含义,就像“操纵选举”或“操纵轮盘赌桌”之类的术语一样,这种含义必须被视为偏见而予以驳斥。从数学严谨性(或任何其他相关角度)的角度来看,操纵希尔伯特空间本身并无不妥。更恰当的类比是“操纵船”的概念:此处“操纵”的意思是装备齐全。但这种类比有其局限性,因为“操纵船”是装备齐全的船,而(正如第一点所示)操纵希尔伯特空间并非希尔伯特空间,尽管它是以现在将要描述的方式从希尔伯特空间生成的。
操纵希尔伯特空间是一对对偶空间 (Φ,Φx),它们可以通过范数(或半范数)序列从可分希尔伯特空间 H 生成;范数序列是使用核算子生成的(一个较好的近似含义是迹类的算子,即算子模的迹是有限的)。在拓扑向量空间的数学理论中,空间 Φ 在技术术语中被刻画为核 Fréchet 空间。说 Φ 是 Fréchet 空间意味着它是一个完备度量空间;说它是核意味着它是希尔伯特空间序列的射影极限,其中相关的拓扑随着 n 的增加而迅速变得更精细(即收敛条件越来越严格);使用核这个术语是因为希尔伯特空间拓扑是使用核算子生成的。在分布理论中,空间 Φ 被刻画为测试函数空间,其中测试函数被认为是一个行为非常良好的函数(连续、n 次可微、有有界域或至少在某个有限范围之外呈指数下降等)。Φx 是一个分布空间,它是 Φ 的拓扑对偶,这意味着它对应于 Φ 上连续线性泛函的完备空间。它也是希尔伯特空间序列的归纳极限,其中拓扑结构随着 n 的增加而迅速变得粗糙。由于 Φ 的元素行为良好,因此 Φx 可能包含行为不那么良好的元素,其中一些是奇异函数或非真函数(例如狄拉克的 δ 函数)。Φ 是 Φx 的拓扑反对偶,这意味着它是 Φx 上连续反线性泛函的完备集;它是反线性的而非线性的,因为与标量的乘法是根据标量的复共轭定义的。
值得注意的是,Φ和Φx都不是希尔伯特空间,因为它们都缺少一个内积,该内积可以导出一个度量,使空间完备,尽管每个空间都有一个拓扑,使空间完备。然而,它们都与生成它们的希尔伯特空间H紧密相关:Φ稠密地嵌入在H中,而H又稠密地嵌入在Φx中。另外两点值得注意。首先,这种对偶对也可以从预希尔伯特空间生成,预希尔伯特空间具有希尔伯特空间的所有特征,只是它不是完备的,这样做的明显优势在于避免将函数划分为等价类(在函数空间的情况下)。术语“装配希尔伯特空间”通常广泛用于包括从希尔伯特空间或预希尔伯特空间生成的对偶对。其次,有时使用 Gelfand 三重态来代替装配希尔伯特空间,尽管它指的是有序集 (Φ,H,Φx),其中 H 是用于生成 Φ 和 Φx 的希尔伯特空间。
对偶对 (Φ,Φx) 能够表示在可分希尔伯特空间中存在问题的量子力学重要算符,尤其是那些与可观测量的位置和动量对应的无界算符,并且它能够以一种特别有效且不成问题的方式表示这些算符。如前所述,这些算符在可分希尔伯特空间中没有特征值或特征向量;此外,它们仅定义在空间元素的稠密子集上,这会导致域问题。正如上文所述,这些不良特性也促使冯·诺依曼寻求一种替代可分希尔伯特空间框架的量子力学框架。在经过调整的希尔伯特空间中,与位置和动量对应的算符可以具有一组完整的特征泛函(即广义特征函数)。其关键结果被称为核谱定理(也称为盖尔凡德-莫林定理)。该定理的一个版本是:若 A 是定义在空间 Φ 上的对称线性算子,并且它自伴随扩展到希尔伯特空间 H,则 A 拥有一个属于对偶空间 Φx 的完备特征泛函系统(Gelfand and Shilov 1977,第 4 章)。也就是说,只要满足所述条件,A 可以通过对偶扩展到 Φx,其扩展 Ax 在 Φx 上连续(在 Φx 的算子拓扑中),并且 Ax 满足完备关系(即它可以根据其特征泛函及其对应的特征值进行分解)。将 A 扩展到 Φx 的对偶公式为 ⟨ϕ∣Axκ⟩=⟨Aϕ∣κ⟩,其中 ϕ∈Φ 和 κ∈Φx 均为正值。完备关系表明,对于所有 ϕ,θ∈Φ:
⟨Aϕ∣θ⟩=∫v(A)λ⟨ϕ∣λ⟩⟨λ∣θ⟩∗dμ(λ)其中 v(A) 是 Ax 所有广义特征值的集合(即所有标量 λ 的集合,其中存在 λ∈Φx,并且对于所有 ϕ∈Φ,⟨ϕ∣Axλ⟩=λ⟨ϕ∣λ⟩)。
这些可观测量的操纵希尔伯特空间表示与狄拉克优雅且极其实用的形式表示最为接近,并且还具有被置于数学上严谨的框架中的特点。然而,需要注意的是,从某种意义上来说,它是狄拉克框架的恰当推广。操纵(基于对确定测试函数空间的核算子的选择)可能导致与一个算子相关联的不同广义特征值集。例如,如果试函数空间是 x 的无限可微函数集 S,且这些函数及其所有导数在 x 趋于无穷大时消失得比 x 的任何逆幂更快,则动量算子的(一维)广义特征值集对应于实数直线;如果试函数空间是具有紧支撑的无限可微函数集 D(即,在实数直线的有界区域之外消失),则其对应的特征值集对应于复平面。如果不想要复特征值,那么 S 比 D 更合适——参见 Nagel (1989) 的简要讨论。但在某些情况下,算子需要具有复特征值。例如,当系统表现出共振散射(一种衰减现象)时,人们希望哈密顿量具有复特征值——参见 Böhm & Gadella (1989)。 (当然,自伴随算子在希尔伯特空间中不可能有复特征值。)
在盖尔凡德(Gelfand)及其同事发展出操纵希尔伯特空间理论后不久,该理论就被用于发展一种新的量子力学公式。这项工作由玻姆(Böhm,1966)和罗伯茨(Roberts,1966)独立完成。后来,他们证明了操纵希尔伯特空间的量子力学公式能够处理比可分离希尔伯特空间公式更广泛的现象。正如前文所述,这一更广泛的范围包括散射共振和衰变现象(玻姆和加德拉,1989)。玻姆(Böhm,1997)后来扩展了这一范围,将时间之箭的量子力学表征纳入其中。普里戈金学派利用操纵希尔伯特空间的量子力学公式发展了另一种时间之箭的表征方法(安东尼奥和普里戈金,1993)。克朗兹(Kronz,1998,2000)使用该公式表征开放量子系统中的量子混沌。 Castagnino 和 Gadella (2003) 用它来表征封闭量子系统中的退相干。
3.3 哥伦布代数
狄拉克δ函数在量子力学和量子场论中无处不在。然而,它们的使用存在一些标准限制,限制了它们的应用。在量子力学中,被限制在一维盒子中的自由粒子的位置本征态是“δ函数归一化的”:⟨x′|x⟩=δ(x−x′)。但是,引入第三个位置和另一个内积,例如⟨x′|x⟩⟨x|x″⟩=δ(x−x′)δ(x−x″),会得到狄拉克δ函数的乘积(在本例中,是共享一个变量的分布的乘积),这是一个定义不明确的表达式。在量子场论中,自相互作用项可能会出现在计算中,例如δ2(x),这些项的定义也并不明确。在装配希尔伯特空间中,这一限制的特征在于,Φx(分布空间)上没有定义内积(参见上文3.2节)。
鉴于Schwartz(1954)证明了不可能定义一个包含分布空间并保留连续函数乘积的微分代数,找到一种严格定义分布乘法的方法的前景显得尤为渺茫。然而,有一些方法可以绕过Schwartz的不可能性结果,从而允许分布乘法。其中一种方法涉及哥伦布代数,这将在3.3.2节中讨论;其他方法将在3.3.1.3节末尾简要讨论。
3.3.1 分布理论的非正式概述
为了非正式地构建分布的定义,将分布视为从函数到数的映射会很有帮助。例如,狄拉克δ函数的标准表示方法是:
∫f(x)δ(x−a)dx=f(a)。
从这个角度来看,δ是将函数f映射到数值f(a)。换句话说,δ是一个泛函。为了使分布得到良好的定义,必须指定它要映射的函数集,即测试函数空间。为此,需要指定测试函数的定义域。在分布论中,测试函数通常定义在实数的非空固定开子集Ω或n维实向量空间Rn上。当然,开子集Ω可以简单地定义为Rn,因为Rn是其自身的子集,但不是真子集。[1]
3.3.1.1 测试函数
指定测试函数空间还有其他与导数相关的要求。狄拉克δ函数δ(x−a)的一阶导数δ′(x−a)定义为:
∫f(x)δ′(x−a)dx=−f′(a)。
高阶导数的定义类似,在f的导数前交替添加±1,例如:
∫f(x)δ″(x−a)dx=f″(a)。
这表明函数f应该可微至任意阶k,或者无限可微。关键在于狄拉克δ函数的导数个数取决于f的导数个数。为简单起见,我们假设试函数是无限可微的,通常表示为C∞(Ω)。需要注意的是,选择可微至k阶的试函数Ck(Ω)与选择无限可微的试函数C∞(Ω)所给出的分布概念不同。选择一类测试函数定义了一种特定的分布。分布的可微性取决于测试函数的可微性。看似不可微的分布实际上可能是可微的,正是因为它们继承了测试函数的可微性。因此,如果测试函数是无限可微的 C∞(Ω),那么我们可以对像 δ(x−a) 这样的分布进行任意多次的微分。
测试函数还需要在 Ω 内具有紧支撑集。这意味着存在一个紧集 K⊂Ω,使得每当 x∉K 时,测试函数 ϕ(x)=0。虽然这似乎是一个非常严格的条件,但它会生成更大的分布空间(见下文)。[2] 综合这些性质,我们现在可以将测试函数定义为:(1) 无限可微函数 C∞(Ω),并且 (2) 在 Ω 内具有紧支撑集。测试函数集合具有向量空间的结构,或者更准确地说,是一个拓扑向量空间,记作 D(Ω) 或 C
∞
c
(Ω),其中下标 c 表示无限可微函数在 Ω 中具有紧支撑。由此可知 C
∞
c
(Ω)⊂C∞(Ω)。
与其要求测试函数在 Ω 中具有紧支撑,不如对测试函数施加更弱的要求。例如,我们可以用要求 C
∞
(Ω) 中的测试函数及其导数在 |x|→∞ 时足够快地衰减来代替紧支撑要求。这些测试函数被称为 Schwartz 测试函数,具有优异的渐近性质。Schwartz 测试函数空间记作 S(Ω)。任何紧支撑的测试函数都遵循 Schwartz 条件。暂且忽略可微性要求,紧支撑测试函数集 D(Ω) 将是 S(Ω) 的真子集,即 D(Ω)⊂S(Ω)。