自动推理(五)

伯恩斯坦近似定理。 让i = [0,1]是闭合单元间隔,f是I的真实连续功能,BN(x,f)f for f定义为f的n伯恩斯坦多项式 bn(x,f)= n σ k = 0 ( n k )f(k / n)xk(1-x)n-k 然后,在间隔I上,F的F用于F的伯恩斯坦多项式序列均匀地收敛于F. 坦率地说,该计划提供了关键信息,以建立导致本定理的lemmas,但该计划所做的减少工作量和类型肯定是不行性的。 (Clarke&Zhao 1994)提供了使用Ramanujan的笔记本(Berndt 1985)第2章中的问题的全自动证明的例子,包括以下示例,邀请读者尝试。 表明: AR σ k = n + 1 1 k = r + 2( r σ k = 1 (r-k)( ak σ j = ak-1 + 1 1 (3j)3-3j ))+2rφ(3,a0) 其中A0 = 1,AN + 1 = 3AN + 1和φ(x,n)是ramanujan的缩写 φ(x,n)= df n σ k1 1 - (kx)+ k3x3 Analytica通过简化平等的左手和右手侧,并表明两侧减小到相同的表达式,-hn + har。 简化使用之前提到的附加求和标识以及谐波数的一些基本属性, hn = n σ k = 1 1 k 由此产生的证据具有28个步骤(其中一些是非长vial)约2分钟才能找到。 Kerber,Kohlhase&Sorge 1998使用ωmega规划系统作为整合定理证明和象征性计算的整体方法。 在Harrison&Théry1998中,我们找到了使用计算机代数系统(MAPLE)的高阶逻辑定理证明系统(HOL)的集成的示例。 尽管如此,尽管符号代数系统不强制执行同一水平,这是自动扣除系统的本质。 事实上,大多数代数系统中一些知识规则的数学语义并不完全清楚,并且在逻辑上没有妥善(Harrison&Théry1998)。 这是一个过于攻击性,以便在任何成本上以及时的方式向用户提供答案,即使它意味着牺牲计算的声音,绕过所需的假设,即使检查所需的假设也是如此。 (这是强烈让人想起绕过所谓的“发生 - 检查”的大多数药物实现,也以效率的名义放弃逻辑声音。)这个严重的问题打开了扣除系统为计算机代数系统提供服务的机会:使用它验证计算机代数的计算步骤符合所需的假设。 然而,有一个捕获,但是:对于足够大的计算步骤,验证是传真,以证明,要检查这些步骤,扣除系统可能需要验证的相同系统的帮助! 然后,对声音问题的解决方案可以很好地需要对所选择的符号代数系统进行广泛修改以使其声音; 另一种方法是与自动定理先驱的开发一起完全从头开始开发新系统。 在任何一种情况下,由此产生的组合演绎计算机代数系统应显示有很大提高的自动化数学推理能力。 4.4硬件的正式验证 自动推理已达到定理的经济型系统和技术用于工业强度应用的程度。 一个这样的应用领域是硬件和软件系统的正式验证。 硬件缺陷的成本很容易遇到数百万。 1994年,奔腾处理器在其浮点单元的缺陷中发出缺陷,而英特尔的随后提出替代缺陷的芯片(仅通过所有奔腾业主的小数一小部分占用)成本,该公司越来越接近5亿美元。 为了防范这样的情况,测试芯片设计的实践现在被认为是不够的,更正式的验证方法在微处理器行业中不仅越来越大,但已成为必需品。 正式验证背后的想法是严格地证明了系统函数的数学确定性。 硬件设计的常见应用程序包括正式确定系统在所有输入上正确运行,或者两个不同的电路在功能上等同。 取决于手头的任务,可以从许多自动正式验证技术中绘制,包括坐姿逻辑,使用二进制决策图(BDD),在时间逻辑中的模型检查或在高阶逻辑中进行样张的符号仿真。 在后一种情况下,使用像HOL见第3.1节的自动定理箴言 - 在实践中显示出无价值。 像HOL的系统中的证明建设随着用户提供了相当数量的指导,以及证明应如何进行:用户试图找到一个证明,同时由定理箴言辅助,可以根据要求自动填写证明段或验证给出的证明步骤。 尽管上面提到的一些技术提供了更高阶逻辑缺乏的决策程序,但高阶逻辑具有非常富有表现力的优点。 权衡是合理的,因为证明了关于浮点算术的事实需要正式化的大量实体分析,包括许多基本陈述,如: | - (!x。a <= x / x <= b ==>(f diffl(f'x))x)/ \ f(a)<= k / \ f(b)<= k / \ (!x。a <= x / x <= b / \(f'(x)= 0)==> f(x)<= k)==> (!x。a <= x / x <= b ==> f(x)<= k) 从Harrison 2000写入HOR中的该声明说,如果函数f在间隔[a,b]中与导数f'有区分,则在整个间隔中的f(x)≤k的足够条件是终点A,B且B的F(x)≤k。零衍生点。 结果用于通过截断功率系列近似超越函数时确定误差界限。 在这种“绝对的基础系统”中进行证明(哈里森2006)具有一些显着的益处。 首先,达到高度保证,证明是有效的,因为它们由小无差错的演绎步骤组成。 其次,这些小学陈述的正式化和中间结果可以在其他任务或项目中重复使用。 例如,在证明浮点算法的其他结果时,可以重复使用正式陈述和经过验证的浮点划分的结果,以进行平方根或超越函数。 为了进一步说明,可以在微小的调整后,在算法中,不同版本的英特尔Itanium的平方根算法分享许多相似性和正确性的正确性证明。 当然,使用像HOL这样的箴言的第三个好处是机械地进行这种冗长的样张,并减少肯定; 如果他们手动进行,则引入人为错误的可能性就像某种程度上一样。 正式的验证框架已成为微处理器设计过程的不可或缺的一部分,例如通过在Centaur技术(Hunt,Kaufmann,Moore和Slobodova 2017)中使用ACL2定理箴言。 ACL2用作微处理器的正式规格,硬件设计的正式模型及其相关证明的集成编程和证明环境,并支持其他正式分析工具的设计。 ACL2的用途证明椭圆曲线的群体理论属性(Russinoff 2017)回应了抽象数学域中的Harrison 2000的上述工作,以满足言语微处理器设计的需求。 4.5软件的正式验证 社会越来越依赖于安全和安全等关键服务的软件系统。 故障软件的严重不利影响包括人类生命的损失,安全威胁,未经授权访问敏感信息,大型财务损失,否认关键服务以及安全风险。 提高关键软件质量的一种方法是通过正式验证的技术补充传统的测试和验证方法。 正式验证的基本方法是生成软件必须满足的许多条件,并通过数学证明验证它们。 与硬件一样,自动正式验证(简称正式验证,以下验证)涉及使用自动定理箴言进行这些证明义务。 安全协议的正式验证是工业中自动定理的几乎理想应用。 安全协议是小型分布式计划,旨在确保交易安全地掌握公共网络。 安全协议的规范相对较小,定义得很好,但其验证肯定是非微不足道的。 我们已经在上一节中提到了在U.S数据加密标准(DES)验证中使用基于SAT的定理普通的定理。 作为另一个例子,Mondex“电子钱包”是一款智能卡电子现金系统,最初由国家威斯敏斯特银行开发,随后销往万事达卡国际。 Schmitt&Tonin 2007描述了Mondex协议的Java Card实现,其在紧密的原始Z规范之后以Java建模语言(JML)在Java建模语言(JML)中进行了重新重新介绍了安全性。 使用关键工具(Beckert,Hanle&Schmitt 2007)进行了正确性的证明,这是一阶动态逻辑的交互式定理,允许用户证明势在必行和面向对象的顺序程序的属性。 这种自动推理的应用表明,以作者的话来说,“可以弥合规范和实现之间的差距,确保完全验证的结果”。 丹尼,Fischer&Schumann 2004描述了一种自动化NASA数据分析航空航天软件安全性能认证的系统。 使用HOARE式的程序验证技术,其系统产生了通过自动定理箴言处理的证明义务。 然而,该过程并未完全自动化,因为必须首先简化许多义务,以便提高定理证明解决证明任务的能力。 例如,一个这样的义务类别对矩阵R进行了陈述,该r,该判决r,它需要在沿其对角线的更新后保持对称,并且具有: 原始形式: symm(r)→symm(诊断-更新(r)) 简化表单(当R是2x2时): (∀i)(∀j)(0≤i,j≤1→选择素(r,我,j)=选择素(r,j,我))→ (∀k)(∀l)(0≤k,l≤1→ 选择素(欠电位沉积(欠电位沉积(r,1,1,r11),0,0,r00),k,l)=选择素(欠电位沉积(欠电位沉积(r,1,1,r11),0,0,r00),l,k))) 即使在简化之后,当前定理普通的普查也找到了挑战的证明任务。 该任务对于更大的矩阵和更新数量(例如,具有36个更新的6×6矩阵)并且需要进一步预处理和简化义务之前,任务最终落入最先进定理的定理定理普遍定理普遍定理普遍定理普遍的预处理和简化,则变得棘手。 但值得注意的是,在不使用定理普通的任何特定特征或配置参数的情况下发现了证明,这些参数将在完成证明时提高他们的机会。 这是重要的,因为定理普通在行业中的日常应用无法预先假定对用户的深刻知识。 软件的正式验证仍然是一个苛刻的任务,但是当一个人面临建立成千上万这些义务的人类不可能的任务时,难以了解如何在自动扣除的帮助下发生的财产认证。 在核工程领域,自动推理技术被视为成熟,以协助正式验证负责控制核电站反应堆预防系统(RPS)的安全关键软件。 使用NUSCR,指定了APR-1400核反应堆的数字控制系统的RPS成分,这是针对核应用定制的正式规格语言(Yoo,Jee&Cha 2009)。 计算树逻辑中的模型检查用于检查完整性和一致性的规范。 在此之后,核工程师通过自动合成过程生成功能块设计,并使用模型检查在线性时态逻辑的模型验证的设计; 该技术还用于验证设计多重修订和版本的等效性。 这些模型检查工具被实施为使其尽可能轻松直观地使用,以不需要深入了解技术,以及核工程师熟悉的符号。 自动推理工具的使用不仅有助于设计工程师建立所需的结果,而且还提高了政府监管人员在反应堆可以通过认证之前批准RPS软件的信心。 量子计算是物理与计算机科学交叉口的新兴领域。 该领域预计将带来非常重要的实际应用,鉴于量子世界的性质,我们可以放心,哲学意义不会有短缺。 这些应用需要坚实的基础,包括量子算法的形式化和验证并导致量子信息理论。 针对这一有价值的目标,许多结果已经在Isabelle / Hol中正式化,并添加到其图书馆中,因此可以提供进一步的工作。 在Quantum计算中的许多概念如Qubits,量子状态,量子门,缠结,测量,量子电路的矩阵表示之后,工作进入定理和算法的形式化(BORDG,Lachnitt&He 2021),包括: No-Clone定理,这使得不可能做出未知量子状态的确切副本(Wooters&Zurek 1982,Dieks 1982); Quantum传送协议,其形式化以前在COQ系统中完成(促销员,Kammüller和Nagarajan 2015),但现在它也是伊莎贝尔图书馆的一部分; 该协议允许仅使用缠绕的对和经典通道在不存在量子通道的情况下传输未知量子状态; 探测德国算法及其广义版本,Deutsch-jozsa算法(Deutsch 1985)。 Deutsch是第一个证明量子计算机可以比任何von-neumann-classical-computer更快地执行任务的Quantum计算机; 和, Quantum博弈论的一些结果,如量子囚犯的困境,即古典困境的量子版,以及不公平的量子囚犯的困境,其中一个囚犯遵守古典物理法的法律,而另一个囚犯遵守古典物理量子优势(Eisert,Wilkens&Lewenstein 1999)。 值得注意的是,不公平的量子囚犯将困境的形式化进入伊莎贝尔/霍尔的困境,在原来的“纸笔”出版物中发现了缺陷,并且多年来已经未被发现。 在Isabelle / Hol所需的框架上的更正式和严格的框架下,所谓的量子“奇迹搬迁”(如eisert,Wilkens&Lewenstein 1999)的普通队“(威尔肯斯和Lewenstein 1999)上被发现与古典战略没有任何优势。 此错误现已纠正(Eisert,Wilkens&Lewenstein 2020),从而重新建立量子策略的优势。 在量子计算中进一步使用isabelle / hol包括验证量子密码协议以及isabelle的图书馆的添加量将为更高级量子算法铺平的量子傅里叶变换的形式化。 4.6逻辑和哲学 本着WOS,Ovebeek,Lusk&Boyle 1992的精神,我们提出了这个问题:关于不同的正式逻辑和确切哲学的不同系统的陈述有什么共同之处? 多年来,模态逻辑S4和S5的伸展片段已经过广泛研究过。 作为一个开放的问题,最终显示了术语S4的单个公理,以及inclicational S5的几个新的最短公理(Ernst,Fitelon,Harris&WOS 2002)。 L组合器定义为(LX)y = x(YY)。 虽然已知L基组合器E12 =((L(L1))(L(L1)))((L(L1))(L(L1)))满足E12E12 = E12问题仍然是基于L的基于L的组合器满足此属性存在。 (GLICKFELD和UPLBEEK 1986)表明,e8 =((ll)(ll)))(l(ll))是这种情况。 已经发现了十千个最短的单一公理,用于经典等价的长度十一个,而XCB = e(x,e(e(e(x,y),e(z,y)),z)是该长度的唯一公式,其状态未确定 - 这是一个公理吗? 尽管各种研究人员的研究有着激烈的研究,但这个问题仍然开放。 它最终解决了XCB实际上是一个单一的公理,从而结束了对等等性微积分的最短单个公理的搜索(WOS,Ulrich&Fitelson 2002)。 坎特伯雷的圣安塞姆在他的前景中提供了一个着名上帝存在的着名论点。 但是,最近,已经发现了更简单的证据,即它更短并且使用较少的假设(Oppenheimer&Zalta 2011)。 在相同的传统中,哥德尔制作了上帝存在的证据,但(Benzmüller&Paleo 2014)最近经过使用较弱的逻辑系统证明了相同的结果,同时涉及对哥德尔证据的重大批评。 在定义罗宾斯代数的公理中,亨廷顿的等式 - ( - (x + y)+ - (x + -y))= x可以由更简单的一个,即罗宾斯方程式 - ( - x + y)+ - (-x + -y)= x。 这一猜想在50年来抵制了许多逻辑人员的攻击,直到最终被证明(Mccune 1997)。 我们再次问,这些结果有什么共同之处? 答案是在自动推理计划的帮助下证明了每个答案。 披露了这个问题的答案,提示一个新的:在没有应用这种自动推理工具的情况下解决这些公开问题需要多久? 模态逻辑 模态逻辑的逻辑系统S4和S5的严格伸展片段分别称为C4和C5,其希尔伯特式公务化预先假定凝结的脱离作为其唯一推理规则。 凭借克里普克的工作洞察力,Anderson&Belnap(1962)使用以下3-Axiom公布了C4的第一个公务化,其中波兰符号'CPQ'代表'P→Q'。 (1) cppccpqcrcpqccpcqrccpqcpr 在某些时候提出了一个问题:使用2公理基础甚至单一的公理等C4的这种公理化是较短的 使用自动推理程序水獭,作者恩斯特,Fitelson,Harris&WOS(2001)在肯定的情况下解决了这两个问题。 事实上,发现了几个2-Axiom基地,其中提出了最短的问题: (2) cpcqqccpcqrccpqcscpr 进一步的自动推理工作是针对C4的单一公理的发现奖励; 公理是21个符号,并且还证明了这是最短的公理: (3) ccpccqcrrcpsccstcucpt 为了表明(2)和(3)中的每一个是必要的并且足够的(1),使用自动化推理工具产生一种证据:(1)⇒(3)⇒(2)⇒(1)。 至于C5,其公务化最初通过LEMMON,A. Meredith,D. Meredith,先前&Thomas(1957)发表了纸张,给出了C5的几个4-,3-,2-和1-Axiom基础,包括以下内容3-Axiom基础: (4) cqcppccpqccqrcprccccpqrcpqcpq 该出版物还包括C5的最短已知的2-公理碱基(实际上是其中20个,每个符号),但C5的最短单一AxiOM被(Meredith及之前的1964年)并具有21个符号: (5) cccccppqrcstcctqcscsq 再次应用自动推理策略,Ernst,Fitelson,Harris&WOS 2001)发现了几个新的基础,包括匹配Meredith的长度的长度为18和六个公理基础的以下2-Axiom基础(其中只有其中一个以下): (6) cppccpqccccqrsrcpr (7) ccccpqrccuuqccqtcscpt 为了表明(6)和(7)中的每一个是必要的并且足够的(4),还通过定理箴言产生了一种证据:(6)⇒(4)⇒(7)⇒(6)。 组合逻辑 迷人的逻辑进入组合逻辑,介绍了1985年的麦芽糖和GLICKFELD&UPTBEEK 1986,在那里我们了解一只讨厌鸟类的迷人森林。 给出任何鸟类A和B,如果鸟类B的名称被鸟儿吹嘘A,那么A会以森林,AB的一些鸟的名称回复,并且这种对B的反应总是相同的。 以下是关于魔法鸟的一些定义:
(本章完)

相关推荐