自动推理(八)

MIZAR的目标是协助从业者在证明的形式化中,并帮助检查他们的正确性; 其他系统旨在找到证明自己。 几何是早期自动化证明努力的目标。 Chou(1987)通过代理方法和GRÖBNER基础方法通过代表假设和结论作为多项式方程来证明超过500个几何定理。 Quaife(1992)提供了另一项早期努力在一阶数学中寻找证据:在Neumann-Bernays-Gödel集合中超过400个定理,算术中有超过1000个定理,其中一些定理欧几里德几何,和哥德尔的不完整定理。 该方法最好被描述为半自动或“互动”,用户提供大量输入以指导定理证明的工作。 这毫不奇怪,因为一个将自动推理系统应用于富裕的数学领域,系统比定理助理的作用更加挑剔。 这是因为在富裕的数学域中,系统需要推理有关理论和高阶对象,通常将它们更深入地进入不可裁定的。 互动定理证明可以说是“杀手”在数学中的应用应用和努力的应用正在越来越多的努力,这是可以充当专业数学家助理的推理系统。 验证助理Isabelle / HOL为用户提供了一种环境,其中通过结构化但人类可读的高阶逻辑语言表达的证据,并包含一些增加用户生产力的设施,自动化验证和验证解决任务,并为用户建立和管理理论层次结构的模块化方式(Ballarin 2014)。 最近,使用自动化和交互式定理证明技术,Quafie在Tarskian几何中的工作已经延长了额外定理(其中一些所需的博士学位证明),包括留下了四个挑战问题Quaife,以及塔尔伯特1899公理的衍生来自Tarski的公理(Beeson和WOS 2017)的几何形状。 不同的证明助手提供不同的功能,通过其电源以自动化推理任务,支持的逻辑,对象键入,数学库的大小和输入和输出的可读性提供不同的功能。 一个“规范”证据不是太琐碎但不太复杂的证据可以用作系统比较的基线,如(Wiedijk 2006)所做的那样,第十七个推理系统的作者是由建立非理性的任务 √ 2.讨论的系统肯定能够比这更有能力,有些人被用来协助更高的先进证据的形式化,例如Erdös-Selberg的素数定理证明(约有30,000线在Isabelle中),四种颜色定理的形式化(COQ的60,000条线)和Jordan曲线定理(75,000线在Hol Light中)。 在2012年达到互动定理证明的里程碑何时达到六年努力和使用COQ探险助理,乔治·戈尼尔和他的团队完成了255页证明的255页证明,又称作为奇数订单定理,有限简单组分类的重要步骤。 其他,最近的成功包括凯勒猜想的分辨率(Brakensiek等,2022),公制空间的形式化(Maggesi 2018),以及有限田的形式化和分类(陈和纳尔希尔2019)。 至于以上介绍,自动推理对执行数学的实践产生了很小的影响,并且有许多原因给出了这一点。 一个原因是自动定理普通的普罗维者对尝试数学家通常处理的问题不够强大; 他们目前的权力是最多的,在一年级本科数学水平上,仍远远远非领先的数学研究。 虽然当前系统无法完全证明自己在这种困难水平上的问题,但我们应该记住,目标是建立推理系统,以便“最终机器是对数学研究的辅助,而不是替代它”(王1960)。 With this in mind, and while the automated reasoning community continues to try to meet the grand challenge of building increasingly powerful theorem provers, mathematicians can draw now some of the benefits offered by current systems, including assistance in completing proof gaps or formalizing and checking the correctness of proposed证明。 实际上,后者可能是一个可能有助于解决当前面临的一些实际问题的应用程序。 考虑到Daniel Goldston和CEM Yildrim的宣布,虽然专家最初同意证明是正确的,但在不久之后发现了不可逾越的错误。 或者,思考关键者猜想的Hales证明的情况,这声明了欧几里德3空间中的一致球包装的密度大于面为中心的立方包装。 Hales证明包含约300页的文字和大量的计算机计算。 经过四年的努力工作,由数学年鉴分配到验证证据的任务的12人面板仍然是真正的疑虑,对其正确性有所怀疑。 对于一个人来说,托马斯·哈尔斯拿到自己的证据,并通过自动证明助理来检查他的证据,目的是说服他人的正确性(在其他互联网资源中的Hales 2005b)。 他的任务是沉重的,但结果可能对数学和自动化的界面都非常重要。 他宣布完成Flyspeck项目(在其他互联网资源中的Hales 2014年)时,所有的眼睛都在Hales和他的正式证据; 2015年的Hales 2015)使用Isabelle和Hol轻型自动证明助手构成了猜想的正式证明:“在真理中,我的该项目的动机比简单希望从少数裁判中删除剩余疑问的简单希望更复杂。 实际上,我认为正式方法是数学长期增长的基础。“ (Hales 2006)。 1936年教堂,1936年和图灵1936暗示了最短证明的定理存在的定理,以及(Appel&Haken 1977)的四种颜色定理证明,简单群体(Gorenstein)的分类1982年),并识别(Hales 2005a)的猜测证明可能只是尚未到来的样本。 AS(Bundy 2011)将其提出:“作为需要更大和更大的证据的重要定理,数学面临困境:必须忽略这些定理,或者必须使用计算机来协助其证明。” 上述备注还对不使用自动定理普通的另一个论点:数学家喜欢证明定理,为什么让机器带走乐趣? 当然,答案就是通过让机器做得更繁琐和卑微的任务,“数学家可以更有趣:”这是不值得优秀的男人在计算的劳动中失去几个小时,如果机器使用“(G. W. Leibniz,关于人类理解的新论文)。 如果仍然不相信,只需考虑起步前景,必须手动检查Hales证明中使用的23,000个不等式! 在数学社区释放自动推理的弱接受的另一个原因是,由于它们可能包含错误 - 软件缺陷,因此不能信任这些程序 - 因此可能会产生错误的结果。 正式验证自动化推理计划将有助于改善此项,特别是在证明检查员的情况下。 证明程序正确并不容易任务,但是关于先进数学的定理也是如此:甘塔尔证明了他对四种颜色定理证明的形式化中使用的计划,但他花了更多的努力正式地形成了证据的一部分的图表理论。 如此讽刺地,事实证明,至少在这种情况下,肯定还有其他人,“实际上更容易验证程序的正确性,而不是验证笔和纸数学的正确性”(Wiedijk 2006)。 对于定理普通和模型发现者,互补策略是验证计划的结果,而不是程序本身。 释义(Slaney 1994):数学家并不重要,程序程序可能具有多少缺陷,只要其输出的证明(或型号)是正确的。 因此,ONU是在验证结果的情况下,无论是由机器或人类生产的,并由独立方检查它们(当然努力也可以使用自动检查者)应该增加对证明的有效性的信心。 通常认为自动证明过长,细致。 证据可以以更基本的步骤表达原则上是非常有益的,因为这允许数学家要求证明助手证明其步骤在更简单的方面。 但校正助理也应该允许相反,即抽象细节和现在的结果以及使用更高级别的概念,语言和符号数学家的理由习惯。 利用(Denney 2006)所做的证据的分层结构是沿着这个方向的一步,但需要更多的工作。 在验证粒度水平的证明助手工作提供了越来越多的洞察力在证明发现过程中的机会。 这是一个重要的考虑因素,因为数学家对从他们的证据中获得了解的理解同样感兴趣,就在下面的情况下更多。 (Bundy 2011)暗示了僵局,防止数学界宽更广泛地通过定理普通的普通:一方面,数学家需要使用证明助手建立一个大型的数学结果图书馆。 但是,另一方面,由于没有先前证明的结果,他们不想使用普通的普通人,他们可以建立起来。 为了打破僵局,提出了许多申请,其中有助于在搜索先前被证明的定理中寻求数学家特别承诺。 实际上,图书馆结果的周到重用可以提高非普通数学问题的简明证明,示出了确定线性代数的一些基本定理(aransay和Divansón2017)和概率理论(Avigad,Hölzl和Serafin 2017)。 在其历史中,数学已经积累了大量定理,数学结果的数量持续大幅增加。 2010年,Zentralblatt数学涵盖了约120,000个新出版物(Wegner 2011)。 显然,没有个人研究人员可以熟悉所有这些数学知识,并越来越难以应对一个不断增长的专业领域,除非有助于可以以智能方式搜索以前证明的兴趣结果的自动化定理的工具。 此问题的替代方法是为数学家提供在PolyAth和Mathoverflow等计算社交系统中启用的彼此的知识。 自动推理工具进入这种社会系统的整合将通过支持“在数学实践中的精确正式扣除和更加非正式的宽松相互作用”(Martin&Pease 2013,在其他互联网资源中)来提高其集体智能的有效性。 由于行业的真正压迫需求,纯粹和应用数学的自动推理的一些应用比选择更需要。 在验证了一些基于基于硬件的浮点三角函数之后,(Harrison 2006,Harrison 2000)提到了更加需要形式化更多纯数学的斜体是他 - 延长他的形式化功率系列用于三角函数和关于辅助近似的基本定理。 哈里森发现它令人惊讶的是,“如此广泛的数学发展只是为了验证浮点切线函数满足某个错误界限”,从本评论中,人们希望需要更多的工业应用程序,这需要更广泛的形式化。 尽管不是最初预期的速度,自动推理是在数学中寻找应用。 其中,正式验证证据具有特殊意义,因为它不仅提供了一种可行的机制来检查人类的人类不能但它也具有副作用,因此可以重新定义一个可被接受的证据所需的潜力。 随着自动推理辅助助手的使用变得更加广泛,可以通过某种方法顺序设想它们的使用:首先,自动推理工具用于理论勘探和发现。 然后,已经确定了一些目标问题,从业者与自动助理交互方式,以查找证明和建立事实。 最后,自动证明检查器用于检查所有最终证明的正确性,在提交出版物之前,通过在形式化数学的存储库中创建新条目,通过创建新的条目来提供给其他数学社区的其余部分。 在自动证明助理的应用成为数学家生活中的日常活动之前,这确实是时间问题; 它是自动推理社区的大挑战,使其更早地发生。 除了正式的验证或认证外,证据的另一个重要方面是它提供的解释; 也就是说,它给出给定陈述的原因实际上是真的。 这是毋庸置疑的,是洞察力的重要来源,并且对于许多数学家来说,这可能是证据的最有价值的方面,因为它允许他们更好地了解所建立的声明的性质以及所涉及的数学理论和物体的性质; 此外,证据中使用的方法具有适用于证明其他数学结果的可能性。 因此,当谈到数学界建立定理普通的普通时,也许应该不太强调普通作为证书,即证明检查员,并更加强调普通作为证明求解器,即作为帮助数学家完整的证明并解释这样做的步骤的助手。 假设箴言足够强大,可以在数学家的研究领域成功攻击证明,如果该箴言也使用相同的符号,方法和使用的证明求解技术,这将是非常挑战的。数学家自己。 可以安全地打赌,数学家将更容易接受这种类型的以人为本的定理箴言,因为这些报道将与数学家的方式相同。 更多的数学家可能最初可以从纯粹的好奇心方面接近这样的箴言; 也就是说,只是为了了解如何证明先前建立的结果是如何解决的。 这肯定对数学的学生们很感兴趣,因为他们可能需要看一个给定的问题(从他们的教科书)是如何解决的,并且通过检查证明,想学习如何自己做。 现在几乎所有自动定理普通普通的普通普遍就是以多样性的方式构建他们的证据,而不是对人类(例如,分辨率驱动,连接方法)。 有一些系统,在建立事实之后,可以以更适合的形式呈现证明的更高级别步骤,并通过将机器导向的步骤转换为人类可读的格式。 这种方法有优点,但它有一个重大限制:在翻译中断之前,证明如何继续询问解释? 另一种方法可以尝试解决情况头:为什么不建立一个直接证明定理的系统,就像数学家实际做的方式? 这确实是一个非常高的秩序,但问题并不是新的,它已经通过少数少数研究人员恢复了自动定理的早期,包括Bledsoe 1977(调查了非决议方法),博伊德和摩尔1979年(递归术语重写归档),Bundy等人。 1991年(自动归纳定理证明),克拉克和赵1994(与象征性代数系统的定理普通集成),Portoraro 1994(对学生建立象征性逻辑证明的自动建议),Portoraro 1998(战略证明施工象征逻辑的教师做和教它),1998年的颗粒状(建筑物证明在人类的方式DOMANS的方式),Beeson 2001(使用数学方法的证明),Buchberger等。 2016年(计算机辅助自然式数学)等。 最近,Ganesalingam和Gowers 2017描述了定理箴言,解决并提出了公制空间理论中的基本问题的证据,程序的方法很难区分数学家可能会证明和写作。 为了说明,下面是程序的证明,公制空间的两个开放子集本身都是打开的,并且它被给出它所解决和由程序编写: 证明。 让x成为Aïb的一个元素。 然后x∈a和xīb。 因此,由于A打开,存在η> 0,使得每当D(x,u)<η和自b打开时,u∈A时,就存在θ> 0,使得d(x,v)<θ。 我们想找到δ> 0 S.T. y∈a∩b,每当d(x,y)<δ。 但y∈a∩b如果只是y∈a和yīb。 我们知道y∩a,每当D(x,y)<η时,每当d(x,y)<θ时。 现在假设d(x,y)<δ。 然后d(x,y)<η如果Δ≤η和d(x,y)<θ,则Δ≤θ。 因此,我们可能需要Δ= min {η,θ}。 作者令人印象深刻,提交人承认建筑物的许多缺点和许多突出的挑战,即使是数学中的基本问题也是如此证明,读者被提交给他们的文章以了解详情。 正如我们已经提到的那样,建立越来越强大的普通的普通能够攻击数学研究的先进领域的问题,以人以人为本的方式做出如此,这也是非常具有挑战性的,但我们需要添加,一个非常有价值的,有前途,有前途和有益的研究。 通过数学家拥抱这种普通人在研究和教育中都会有明确的实际应用。 会有哲学的影响,特别是当普遍赋予额外的援助能力时,当困扰着证据时赋予援助的额外能力,当发生这种情况时,我们将被迫询问:谁与谁交互,机器的人类或反之亦然? 与定理箴言互动的经验将扩展到一个新的领域,成为真正的双面,更亲密和更丰富,更多的合作,而不是互动:协作定理所证明的曙光。 4.8人工智能 自成立以来,自动定理证明的领域在人工智能(AI)的较大领域具有重要应用。 自动扣除在AI应用的核心,如逻辑编程(参见第4.1节逻辑编程),其中计算等同于扣除; 机器人和问题解决(绿色1969),实现目标的步骤是从证据中提取的步骤; 演绎数据库(Minker等,2014),事实知识表示为原子条款和推理规则,扣除推断出新的事实; 专家系统(Giarratano&Riley 2004),在给定结构领域(例如血液感染)的人类专业知识被捕获为IF-DEL扣除规则的集合以及通过申请推理规则获得的结论(例如诊断); 还有许多人。 在AI中的应用程序应用于具有深层哲学意义的应用是增加了BDI计算逻辑的使用,以描述智能代理和多助理系统(Meyer 2014)的信仰,欲望和意图,特别是赋予未来的智能系统,例如决策支持系统或机器人,具有法律和道德行为。 故事可以自动化(Furbach等,2014)自动化(Furbach等,但鉴于伦理“代码设计师”普遍存在的普遍系统,需要一种方法来试验不同的文学系统(即,铺设公理和看看他们的结论是什么),帮助他们识别手头特定应用的所需伦理代码; (Benzmüller等,2018)讨论了这个环境。 如果实际,物理,机器人将被用于这些实验中,术语“文学实验室”虽然有点令人毛骨悚然是非常描述的。 限制证明搜索空间一直是在实施自动扣除的关键考虑因素,以及传统的搜索方法是定理普通的不可或缺的一部分。 主要思想是防止追求无人机推理路径的谚语。 搜索的双方面是试图寻找先前证明的结果,可以在完成当前证明的情况下有用。 自动识别这些结果并不容易任务,并且随着问题域的大小而变得不那么容易,并且已经成熟的结果数量增长。 这不是令人愉快的情况,尤其是鉴于构建大型图书馆的趋势,如MIZAR问题,如定理证明的MIZAR问题(URINO等,2010,BanceRek&Rudnicki 2003)或Isabelle / HOL [Meng&Paulson 2008),如(Kühlwein等,2012)中所讨论的,在大型正式数学图书馆中发现,评估和选择现有合适定义,场所和lemmas的发现技术一个重要的研究线。
(本章完)

相关推荐