Posted by Mike Shulman
John 正在为 Elaine Landry 的书《为在职哲学家准备的范畴论》(Category Theory for the Working Philosopher)撰写关于“同一性概念”的文章,并一直在发布他的一些想法和草稿。我也在为同一本书撰写关于同伦类型论 / 泛等基础(HoTT/UF)的文章;但由于 HoTT/UF 也将在John 和 David Corfield 的章节中客串出场,而且它的一个方面(泛等)是 Steve Awodey 章节的核心,所以我必须决定在我的章节中强调它的哪个方面。
我目前的计划是把重点放在 HoTT/UF 作为一个无穷群胚的综合理论。但为了说明这意味着什么,我觉得我需要从一个简短的介绍开始,介绍一下“综合理论”这个词,它可能不是很常见。目前,我的“介绍”草稿的篇幅已经超过了我的章节分配篇幅的一半;所以显然它需要被压缩!但我想我还是先把它的一些部分以目前的形式发布出来;那么就开始吧。
总的来说,数学理论可以分为分析理论和综合理论两类。分析理论是对研究对象进行分析(或者说“拆解”),揭示它们是由更简单的事物组成的,就像复杂分子是由质子、中子和电子组成一样。例如,解析[1]几何用实数来分析点和直线的平面几何性质:点是实数的有序对,直线是点的集合,等等。从数学上讲,分析理论的基本对象是用某些其他理论中的对象来定义的。
相比之下,综合理论是根据基本对象的预期关系和行为来综合(或者说“组成”)对它们的概念。例如,综合几何更像是欧几里得几何学:点和直线基本上是未定义的术语,通过“规定我们可以用它们做什么”的公理(例如两点确定一条唯一的直线)来赋予它们意义。(尽管欧几里得本人试图定义“点”和“线”,但现代数学家普遍认为这是一个错误,并认为欧几里得的“定义”(如“点是没有部分的东西”)基本上是没有意义的。)从数学上讲,综合理论是一个由规则或公理支配的形式系统。综合数学可以看作是类似于基础物理学,在那里像电磁场这样的概念不是由任何更简单的东西“组成”的:它只是存在,并以某种方式运作。
分析和综合之间的区别至少可以追溯到希尔伯特,他分别使用了“遗传”和“公理”这两个词。在某种程度上,我们可以说现代数学的特征正是分析和综合之间丰富的相互作用——尽管大多数数学家会说的是定义和例子。例如,一个现代几何学家可能会定义“一个几何学”来满足欧几里得的公理,然后用这些公理综合地工作;但她也会分析地构建这些“几何学“的例子,比如用实数的有序对。这种方法是由希尔伯特本人开创的,他特别强调,构造一个分析的例子(或模型),就证明了综合理论的一致性。
然而,在更深层次上,几乎所有的现代数学都是分析性的,因为它都被分析到集合论中。我们的现代几何学家实际上不会像欧几里得那样陈述她的公理;相反,她会将一个几何定义为一个点集 P 和一个线集 L,以及 P × L 的子集代表“重合”关系,等等。从这个角度来看,数学中唯一真正未定义的术语是“集合”,唯一真正的综合理论是策梅洛-弗兰克尔集合论(ZFC)。
这种将集合论作为数学的共同基础的做法,当然是20世纪的产物,总的来说,这是向前迈出的一大步。实际上,它为所有数学家提供了一种共同的语言和强大的基本工具集。从基础上说,它确保了所有的数学相对于集合论都是一致的。(希尔伯特的证明绝对一致性的梦想一般认为已经被哥德尔的不完备定理所粉碎。)从哲学上讲,它为数学提供了一致的本体论,并提供了一个提出元数学问题的背景。
然而,ZFC并不是唯一可以这样使用的理论。虽然不是每一个综合理论都足够丰富,可以让所有的数学都在其中被编码,但集合论绝不是唯一拥有这种丰富性的理论。一个可能的变化是使用不同类型的集合论,如ETCS,其中一个集合的元素是“无特征的点”,它们只是相互区分,而不像ZFC那样由精密的分层成员结构标记每个个体。无论哪种“集合”都足以用于基础目的,而且每种集合都可以解释为另一种集合。
然而,我们现在关注的是更激进的可能性。一个典型的例子是拓扑学。在现代“分析拓扑学”中,“空间”被定义为一个点集,配备了一组称为开集的子集,它们描述了点如何连续地变化到彼此。(大多数分析拓扑学家,由于不了解综合拓扑学,会简单地把他们的研究对象称为“拓扑学”。)相比之下,在综合拓扑学中,我们假设了一个公理化的理论,与ZFC处于同一本体论层次,其基本对象是空间而不是集合。
当然,我们说基本对象“是”空间,并不意味着它们是配备有开子集的集合。相反,我们的意思是“空间”是一个未定义的词,理论的规则使这些“空间”或多或少地具有我们期望空间所具有的行为。特别是,综合空间有开子集(或者更准确地说,开子空间),但它们不是通过指定一个集合以及一组开子集来定义的。
事实证明,像综合集合论(ZFC)一样,综合拓扑学也足以编码所有的数学。这是真的,在一个平凡的意义上:我们从所有解析空间中找出那些非离散的子类,其中唯一的开子集是空集和整个空间。综合拓扑学中也可以定义“非离散空间”的概念,这样的空间的集合形成了一个类似ETCS的集合宇宙。因此,我们可以用它们来编码数学,完全忽略综合空间理论的其余部分。(关于离散空间也可以说同样的话,在离散空间中每个子集都是开的;但从综合的角度来定义和处理这些空间更难(虽然不是不可能)。离散空间和非离散空间之间的关系,以及它们如何立足于综合空间理论中,是综合内聚(cohesion)理论的核心,我相信 David 将在他关于几何哲学的章节中提到这一点)。
然而,一个不那么无聊的方法是直接将数学对象构建为空间。这是如何实现的?事实证明,我们用来构建(比如说)实数集合的基本构造,与作用于空间的构造有着高度的相似性。因此,在综合拓扑学中,我们可以使用这些构造直接构建实数空间。如果我们的综合拓扑学系统设置得足够好,那么产生的空间将表现得像分析实数空间(先构造实数的单纯集合,然后以开区间的并集作为其拓扑)。
下一个问题是,我们为什么要以这种方式做数学?有很多原因,但现在我认为它们可以分为三类:模块化、哲学和实用主义。(如果你能想到我忘记的其他原因,请在评论中提出!)
所谓“模块化”,我指的是程序员所说的那个:即使我们相信空间最终是从集合中分析性地构建出来的,隔离它们的基本属性并抽象地处理这些属性通常也是有用的。这样做的一个好处是通用性。例如,在欧几里得的“中性几何”(即不使用平行公设)中证明的任何定理,不仅在实数的有序对模型中是正确的,而且在各种非欧几何中也是正确的。同样,在综合拓扑学中证明的定理可能不仅对普通的拓扑空间是正确的,而且对其他变体理论如拓扑层、光滑空间等也是正确的。就像数学中经常发生的那样,如果我们只陈述我们需要的假设,我们的定理就会变得更加通用。
即使我们只关心综合理论的一个模型,模块化仍然可以使我们的生活更轻松,因为综合理论可以形式地封装常见的引理或论证风格,而在分析理论中,我们必须不断地手工证明这些引理或论证风格。例如,正如综合拓扑学中的每一个对象都是“拓扑的”一样,它们之间的每一个“函数”都自动保持这种拓扑(是“连续的”)。因此,在综合拓扑学中,每个 ℝ → ℝ 的函数都自动是连续的;所有的连续性证明都被“打包”到分析拓扑学是综合拓扑学的模型这个单一证明中。(如果我们想的话,我们仍然可以谈论不连续的函数;我们只需要非离散地重新拓扑化 ℝ。因此,综合拓扑学颠倒了分析拓扑学的情况:不连续函数比连续函数更难谈论)。
与模块化的论点相反,哲学论点则认为数学的基本对象实际上是,或者应该是,某个特定综合理论的对象。如今很难找到持这种观点的数学家(集合论除外),但从历史上看,我们可以发现很多持这种观点的数学家参与了20世纪早期的伟大基础论战。诚然,用现代数学语言对100年前数学家的信仰做任何精确的断言都是很危险的,但我认为回顾过去,可以说伟大的基础论战的争论点之一是应该用哪种综合理论作为数学的基础,或者换句话说,数学的基本对象应该是什么样的。当然,这对于参与者来说是不明显的,除其他原因外,许多人对他们理论的基本对象都使用了相同的词(如“集合”)。(另一个原因是,争论的问题之一是数学基础应该建立在精确定义的规则或公理之上的观点,今天大多数数学家认为这是理所当然的)。但从现代的角度来看,我们可以看到(例如)布劳威尔的直觉主义实际上是一种综合拓扑学,而马尔可夫的构造主义递归数学是一种“综合可计算性理论”。
在这些情况下,选择这种综合理论的动机显然在很大程度上是哲学的。俄罗斯构造主义者之所以以他们的方式设计他们的理论,是因为他们认为一切都应该是可计算的。同样,布劳威尔的直觉主义可以说是受到一种哲学信念的驱动,即数学中的一切都应该是连续的。
(我希望我能写更多关于后者的内容,因为它真的很有趣。直觉主义之所以是非经典的,主要是因为选择序列:无限序列的每个元素可以由某个“创造主体”“自由选择”,而不是由规则提供。布劳威尔从中得出的具体结论是,这样的序列上的任何操作都必须至少在阶段上是可计算的,只使用有限的初始段,因为我们不能要求创造主体一次性做出无限次的选择。但这正好意味着,对于序列空间上的适当拓扑,任何这样的操作都必须是连续的。这也与开集作为“观察”或“可验证陈述”的观点很好地联系起来,这在另一个帖子中提到过。然而,从我为这本书写的章节的角度来看,这个介绍的目的是为讨论HoTT/UF作为无穷群胚的综合理论奠定基础,而布劳威尔直觉主义将是一个实质性的题外话。)
最后,还有实用主义的观点。虽然模块主义者认为数学的基本对象实际上是集合,哲学家认为它们实际上是空间(或其他东西),但实用主义者说它们可以是任何东西:没有必要承诺一个单一的选择。我们做数学究竟是为了什么?一个原因是我们发现它有趣或美丽。但所有的综合理论可能都同样有趣和美丽(至少对某些人来说),所以只要我们喜欢,我们不妨研究它们。
我们研究数学的另一个原因是因为它在自身之外有一些应用,例如对物理世界的理论。现在可能会发生这样的情况,某个应用中出现的所有数学对象恰好都是(比如说)空间。(这可以说是基础物理学的真理。类似地,在计算机科学的应用中,出现的所有对象都可能恰好是可计算的。)在这种情况下,为什么不直接基于一个足够好的综合理论来应用,从而获得模块化的许多优势,而不关心我们的理论如何或是否可以在集合论中建模?
将这种观点应用于其他应用领域是很有趣的。例如,在纯数学框架之外,我们也会谈到集合,来描述物理对象的集合或分类心理行为;我们能以同样的方式使用空间吗?对象和思想的集合是如何构建的,它们是否自动具有拓扑结构,就像实数一样?我认为当我们想象拓扑学是“观察”或“可验证陈述”时,这也开始变得很自然。再说一次,在我的章节中对此进行更多的阐述将是一个实质性的题外话;但我有兴趣在这里的评论中听到任何关于它的想法!
参考
1. 译注:这里的分析和解析对应的原文都是analytic
数学联邦政治世界观提示您:看后求收藏(笔尖小说网http://www.bjxsw.cc),接着再看更方便。