“Quantum phenomena do not occur in a Hilbert space. They occur in a laboratory.”
“量子现象发生在我们的实验室中,而不是在希尔伯特空间中。”
- Asher Peres
薛定谔猫,是量子论战中所有那些有趣的思想实验中最著名的一个,但是它绝不是唯一一个,并且也不是最尖锐的一个。我们后面讲陆续看到各学派在“量子现实”这个领域中你方唱罢我登场,煞是热闹。你可能会感到疑惑,这样一个有着这么多争议的理论,它是如何成为物理学中公认的基础的呢?这是因为,人们虽然对量子力学中的关键概念诸如波函数、叠加性等等的诠释有着不同看法,但是并不否认它的变化规律本身。也就是说,人们对“是什么”这个问题是可以达成一致的,但是对“意味着什么”众说纷纭。如果我们不断地把这些不同的诠释剥离开来,搁置起来不去争论,那么我们就会取得越来越多的共识。如果最终我们剥离了全部的诠释,就只剩下单纯的数学意义上的量子力学体系 – 一个裸奔的量子力学,“裸量子力学”(bare theory),也就是它的形式理论,我们就可以获得最大的共识,在这一点上,它是确定的,而且几乎是毫无疑义的。
当然,不可能存在一个绝无诠释的纯数学体系可以完成一个物理理论。因为说到底,物理科学是一门实证科学,它所研究的对象最终要靠我们可以直接观察的现象来判定。因而,一个理论的数学体系究竟如何与可实证的现象相对应,这个并非数学体系本身可以回答,而必须求诸诠释:我们的数学中的变量(或其中的一部分变量)对应于何种可实证现象?诸如“看,这个公式里有一个变量a,它对应着物体的加速度”等等。我们前面在第?章曾经提到过数学柏拉图主义中的结构主义观点,它认为数学现实即结构图样,由此Tegmark提出了他的数学宇宙假说,认为终极的物理理论所描述的就是这样一种图样,而不附带任何诠释。我个人虽然非常欣赏结构主义的观点,但是对这种数学宇宙假说仍然持有不同看法。这种假说事实上最终将不可避免地物理理论蜕化为数学理论,从而剥夺掉物理的实证基础。从哲学上这是一种探究终极真理的思路,但是它必然要超出物理学的范围。而从物理理论自身而言,不论它的形式理论描述和何种抽象图样,我们都要将这种图样与可观测的现象对应起来:最理想的情况,就是抽象图样与观测现象形成拓扑同胚的联系(即一一对应)。这种对应关系,就需要物理诠释来指明。在量子力学中,我们所能够将诠释压缩到的最小范围,就是数学概念与可实证现象之间的联系 – 这是物理上的诠释。而理论中往往还包含这例如“这个数学概念对应着何种实在?”这种问题。这是一个哲学上的本体论问题,但是并非一个纯物理问题,因为本体论概念往往都是不可实证的。我们如何把形式理论与这种本体论概念建立联系?这可以划归为哲学诠释。从这个角度上讲,一个完备的量子力学体系的最小范围包括了它的形式理论和物理诠释,但不包括哲学诠释。对于这样一个最小范围,科学家们的认知是基本上没有分歧的 – 当然,所有的分歧早就已经被实证证据统一了。
我们现在就先来大致看看这个大家共识的裸量子力学:包括了它的形式理论和最基本的物理诠释。在量子力学的形式理论中,最核心的部分就是波函数和波函数的演化 – 薛定谔方程。波函数代表了量子系统的状态 – 所谓的“量子态”(quantum state)。这是量子力学中关于演化的部分:
形式理论:公理体系、数学形式、逻辑框架 ⇔可实证现象如果我们观察系统,我们会看到什么?
形式理论:公理体系、数学形式、逻辑框架 ⇔ 本体论概念:理论描述的是何种实在?
我们现在就先来大致看看这个大家共识的裸量子力学:包括了它的形式理论和最基本的物理诠释。在量子力学的形式理论中,最核心的部分就是波函数和波函数的演化 – 薛定谔方程。波函数代表了量子系统的状态 – 所谓的“量子态”(quantum state)。这是量子力学中关于演化的部分:
“给定初始状态,我们如何预言未来某一时刻的系统量子态?”
关于这个量子态具体是何含义,它是不是包含了一个量子系统状态的全部信息 - 也即是完备的,这是一个有争论的问题,然而,量子态虽然是描述量子系统的工具,但是它却不是可实证的概念。我们没有任何办法直接观察一个完整的量子态,我们所能观察的,是那些所谓的“可观测量”(observerables),例如粒子的位置、动量、能量、角动量等,也就是我们在经典世界中可以直接测量的东西。因而,在作为物理理论的量子力学中,波函数或量子态的含义本身并不重要,重要的是它能够准确地描述那些可实证的东西 - 可观测量。也就是说,从量子态到可观测量之间应该有一个映射关系,这样我们才能把理论计算中得到的量子态输出为可观测的东西。这种映射关系,是量子力学中关于观察的部分,是波恩规则来完成的:
“已知一个系统的量子态,我们对其进行一个特定的观察,我们会得到何种可能的观测结果,以及获得这种结果的概率是多少?”
于是,关于演化的部分和关于观察的部分在一起,就形成了一个完整的、前面提到的裸量子力学。然而,我们看到,这个系统当中,并没有回答这样的问题,
• “量子态是什么?它是真实的,还是只是一个方便的计算工具?”
• “观察是什么?它真正把量子态坍缩了吗?”
无数个“尖峰”叠加而成一个连续的波动
结合了演化的规则和观察的规则,它所回答的,是这样一种问题:
• “在一个演化的系统中,在某一特定时刻我们对其进行特定的观察,会看到何种现象?”
如果我们用薛定谔猫来说这两种问题的区别,那么第一种问题就是:
• “薛定谔猫在箱子里究竟是死的还是活的,抑或是既死又活的?”
而第二种问题则是这样的:
• “当我们打开箱子时,我们会看到薛定谔猫是死的还是活的?”
上面的第二种问题,问的是可以实证的问题,对量子力学的有效性可以做出直接判定,因而它就是一种纯粹的物理问题。而第一种问题虽然本身至关重要,但是它却不是可以实证的问题,除非我们能够提出一种能够对量子态进行直接观察的方法,或者对观察过程的直接描述。因为无法实证,所以它就是一种超越了物理范围的问题 – 当然,后面我们会看到,很多科学家正在努力地将其纳入物理范围之内,因而就产生了各种不同的诠释。我们在本章暂且把这些问题抛开,来看看裸量子力学的大致逻辑。
我们不妨先来看看单纯从数学上讲,波函数有何种性质。
第一个性质,就像我们反复提及的,波函数是可以叠加的。也就是说,空间中任意一点的波函数,等于所有传播至此的波函数的相加。
更加严格地讲,波函数的演化是线性的。何为“线性”呢?线性可以说是数学中最简单的一种运算规则,这个名字本身就暗示了它类似于一种正比例的关系:正比例函数就是一条直线。从数学形式上线性有着严格的定义,我这里不打算深入讨论。用简单的话说,就是任意波函数的加权相加(数学上叫做线性组合)仍然是一个有效的波函数。也就是说量子系统中可能存在的任意两个(或多个)波函数,它们各自乘以某个常数后加权相加,得到的波函数仍然是这个量子系统的一个可能状态。比如说,对于一个量子系统,有两个波函数
ψ(x),ф(x)
都是满足它的一个解,也就是说,都是它的一个可能量子态,那么,这样一个由上面两个波函数的任意加权叠加,都是它的可能量子态:
Ψ(x)=αψ(x)+bф(x)
其中,a、b为两个任意常数。
总而言之,抛去一切严谨性,你暂时可以把这种线性理解为一种加法规则。波函数的一切变化都满足这种加权加法:如果一个波函数是可能的系统量子态,那么它的随意倍数也都是;如果几个波函数都是可能的系统量子态,那么它们的任意加和也都是。
好了,这个就是量子力学中的一个非常奇怪的原理:态叠加原理(superposition principle)。
现在我们继续来看态叠加原理有什么含义。比如说,我们现在有一个粒子,这个粒子的波函数是这样的:
根据我们前面讲的,根据玻恩规则我们看到这个波函数,就大概知道这个粒子的大致情况。比如说,我们知道,如果我们观察一下这个粒子,我们最有可能在中间的位置发现它,而不大可能在边上发现它。事实上,这个波函数的图像以及这里对玻恩规则的表述并不严格,波函数是一个复函数,而作为一个复数本身并没有大小。我这里无意涉及复数的性质,这可以留到你们高二时学习。在不影响基本原理的情况下,我们可以忽略掉波函数中关于复数的部分[1]。但是你应该知道玻恩规则实际上说的是波函数的模的平方代表了该处粒子出现的概率,在这里我们只谈论它振幅的平方。另外,因为本文的这种模糊处理,事实上后面的表述并非严格的量子理论,如果你以后有幸学习量子力学,你将会发现其中的不同之处。但是在这里我们并不追求严谨,而是要能够向你传达它的一些基本思想。
根据态叠加原理,这个波函数我们可以看做是一组其它的波函数叠加构成的。我们可以任意选择这样的叠加形式。一个比较常见的选择方法就是,我们可以把这个波函数看做是无数个高度不同的“尖峰” 波(称做δ波),叠加在一起组成的,当这些尖峰的“密度”趋向于无穷时,它们的叠加就形成了上述的连续的波动:
无数个“尖峰”叠加而成一个连续的波动
而上述的每一个“尖峰”所代表的,就是一个确定的位置,因为它们只在一个确定的位置有一个概率,而在其它任何地方的取值都是零 - 也就是说不可能出现在那儿。在波动强的地方,这个尖峰的振幅 – “高度” - 就更大,而在波动弱的地方,这个尖峰的振幅就越小。这在数学上非常简单,你只要把这些波乘以一个系数然后加在一起就可以了 - 它们叠加在一起,就是无数个确定的位置的加权相加。如果是无数个波的叠加,只要做个积分就可以了。
这个在数学上毫无出奇之处,甚至可以算作trivial,但是在物理上怎么理解?这恰恰就是我们所说的波函数的概率诠释:一个粒子的波函数是多个确定的位置的叠加态 – 每个确定位置所代表的波函数就是这样一个δ波。而当我们观察粒子时,会使得粒子从它所有这些叠加分量中随机选取一个,从而“坍缩”到这上面去,而我们看到的相应的概率,就正比于该叠加波(δ波)在整个波函数中的叠加权重(它的叠加分量)的平方。
这是一个连续的波函数,在没有学习微积分的你看起来可能会有一些麻烦,我们可以转而举一个离散的例子。在双缝干涉实验中,粒子的某个波函数,我们可以把它写作穿过左缝的波函数与穿过右缝的波函数的叠加:
ψ(x)=αψʟ(x)+bψʀ(x)
我们知道,当我们观察这个粒子的时候,我们会看到它“要么在左缝,要么在右缝”。玻恩规则说,看到“左缝”状态的概率就正比于a的平方,而看到“右缝”状态的概率就正比于b的平方:
P(“ ”) ∝α²;P(“ ”) ∝b²
这里我们还有一个限制就是,缝隙后面的粒子要么是穿过左缝过来的,要么是穿过右缝过来的,而没有其它任何的可能性,因而这两个概率相加必须等于1。因而,任何一个有实际物理含义的波函数必须要满足所谓的“归一化条件”:
α²+b²=1
这种归一化的性质像极了几何中的勾股定理。如果我们把所有的波函数都定义一个“长度” – 这个波函数所代表的全部概率,那么这个长度必须是1。我们可以把这个长度记做:
|ψ|=1
这个很好理解,因为一个量子态是确定的,不存在概率性,它的总的概率必须是1。那么我们来看这个总的波函数的两个分量,左缝波和右缝波的分量分别算作三角形的两个直角边,那么叠加的波函数就是它的斜边:
α²+b²=1
量子态被观察时得到某个状态的概率取决于该状态与整体波函数的夹角余弦
很自然地,左缝波函数和右缝波函数是互相“垂直”的,它们在对方上的投影都为零,这是因为左缝和右缝是两个非此即彼的不相容状态,它们不可能同时被观察到。也就是说它们之间没有任何重叠(overlap),左缝的量子态永远不可能产生右缝的观察结果。这种垂直又叫做“正交”,它是一种抽象的垂直。而总的波函数ψ和ψL以及ψR都不垂直,它们之间有重叠的部分,角度越小,重叠得就越严重 – 如果角度为零,则完全重合。我们可以看到,两个叠加分量a和b就分别是它们夹角的余弦函数,夹角越小,重叠越严重,那么观察到的概率就越高,相应地观察导致波函数的“坍缩”就越容易得到它的结果。反之,夹角越大,观察得到它的结果就越小,坍缩到它的概率也就越小。这就是玻恩规则的一个很直观的表示。
这样一来,就引出了波函数的第二个性质,就是波函数有“长度”的定义,以及波函数之间有“夹角”的定义。在数学上,前者叫做“模(norm)”,而后者叫做“内积(inner product)”。正如我们前面提到的,波函数无论如何演化,它的全部概率必须保持归一性,也就是说波函数的长度必须永远等于1。这恰恰是薛定谔方程的直接结果,这种性质被称作“幺正性”。
因而观察过程中发生的事情,就可以用波函数向着它的叠加分量投影并坍缩这种直观的几何形式来描述。
这,就是波函数的基本性质,“线性”和“幺正性”。
这里,我们要引入一点点数学的抽象语言。就像是在第一部分中我们引入相空间的概念一样,这种抽象数学语言虽然在刚刚引入时由于它比较不同于你所熟悉的常规思维方法而显得有些晦涩,但是很快你就会看到它其实有一种独特的魅力,能够把极其复杂的问题变得明晰起来。并且,这些数学语言一旦习惯,你就会感到它其实很简单,并且再也离不开它了。在这里我们想引入的语言,叫做“希尔伯特空间”和线性代数。如果说,可观测量全部居住在我们日常熟悉的三维空间加一维时间这个空间中,那么这个希尔伯特空间,就是量子态的居所。
我们可以从几何中的欧几里得空间 – 也就是我们所熟知的我们周围的三维平直空间 - 说起。说到底从数学上讲,我们周围的三维空间其实不外乎是一种集合:空间中所有点的集合。在这个集合中,除了它包含的每个点的定义以外,我们还需要一些规则来定义这些点之间的相互关系,例如这些规则包括:
空间中的每个元素 – 也就是每个点 – 都有定义。有一种最直观有效的度量方法就是通过三维的笛卡尔坐标系,在笛卡尔坐标系中,我们用三个相互两两垂直的方向(x轴、y轴、z轴)就可以覆盖所有的平面空间。其中的何一个点,都可以用它在这三个坐标轴上的投影来表示,这就是这个点的坐标。空间中的任意一点W,可以用一个从原点出发向其引出的一个“箭头”来表示,这个“箭头”有方向,也有长短,在数学上叫做“矢量”或“向量”。对任意一个点,都有这样唯一的一个矢量,反之任意一个矢量,都对应着这样一个点。因而平面中所有的点都可以用一个矢量来表示。因而这种空间也可以叫做“矢量空间”。
这样一来,表示空间中任意一点的矢量V,则可以看做是沿X轴、Y轴、Z轴三个方向上的单位矢量(即长度为1的矢量)按照他们坐标作为加权的叠加:
ˉV=xˉeₓ+yˉey+zˉeᴢ
我们知道,任何一个矢量都可以看做几个方向上的矢量的叠加。例如,向东北方向的一个速度,可以看做向东的速度和向北的速度两个分量的叠加。总之,在一个平面中,我们只需要两个坐标轴,就能表示所有的矢量。相应地,在三维空间中,我们需要三个方向。一旦这三个方向确定了,整个空间的所有的点就确定了。
因而,我们就可以用三个相互垂直的坐标轴方向上的单位矢量,配合各方向上坐标值的加权叠加,表示出空间中任意一个矢量。我们可以任意选取这样三个坐标轴,而整个三维空间,就是这三个坐标轴撑起来 - “张成”的。同样,我们也可以任意选两个互相垂直的坐标轴,它可以张成一个平面,这个平面就是三维空间的一个子集。
在空间中,除了各个点的定义,还存在着长度的定义。一个矢量的长度可以由勾股定理来计算。同样地,还存在着角度的定义 – 日后你会知道,这种角度是由矢量的内积定义的。
于是,我们可以说我们所熟悉的三维空间,欧氏空间,就是这样一个定义了方向、长度、角度的矢量的集合。
那么现在,我们就可以把我们这个熟悉的、三维空间中的点居住在其间的欧几里得空间推广到一个抽象的、波函数居住在其间的希尔伯特空间[2]。
我们可以来看看欧氏空间中的矢量和波函数之间的异同:
1、欧氏空间中的矢量满足线性可叠加性,波函数满足线性可叠加性;
2、欧氏空间中的所有矢量都可以由任选的三个两两正交的坐标轴配合坐标值来表示,波函数根据情况,可以由多个其它波函数配合其叠加分量来表示;
3、欧氏空间中的矢量有长度,波函数需要“归一化”,即长度为1;
4、欧氏空间中的矢量之间有角度,波函数与其叠加分量之间也有角度。
由此可见,波函数的行为,跟三维空间中的矢量非常相似,因而它就可以看做是是一种广义的矢量。只不过这个矢量是一种抽象的矢量:它的整个法则与我们熟知的矢量并无不同。只不过它在实数域中的,而是在复数域中,并且它的维度并不一定是三维,而是多维甚至无穷维的。波函数作为这样一种矢量,就被称为“态矢量”。
我们可以进一步来看看这种相似性,我们继续来做一个一个类比:经典的速度矢量。
数学联邦政治世界观提示您:看后求收藏(笔尖小说网http://www.bjxsw.cc),接着再看更方便。