PCA仅是一大批技术中的一个项目,旨在保持数据可管理并在其中找到模式,该集合还包括内核方法和支持向量机(例如Vapnik和Kotz 2006)。出于目前的目的,重要的是要强调,这种工具不应与统计分析相混淆:即使它们构建并评估了数据模型,它们也不涉及样品空间上分布的测试或评估。这使它们与众不同,例如确认性和探索性因素分析(Bartholomew 2008),有时将其视为PCA的亲戚,因为两组技术都使我们能够识别样品空间内的显着尺寸,数据显示了大量的数据。变化。
执业统计学家经常采用减少数据工具来得出对数据采样的分布的结论。在科学中,机器学习和数据挖掘技术已经广泛使用,我们可能希望将来这些技术的模式使用,因为现在有很多数据可用于科学分析。但是,在统计哲学中,关于通过这些技术得出的结论的认知地位的辩论尚未。统计学哲学家在这里将注意力引起一些关注。
5.2.2形式学习理论
正式学习理论提出了一种完全不同的统计方法。这再次是大量的研究领域,主要位于计算机科学和人工智能。此处简要提到了该学科,这是统计方法的另一个例子,该方法避免了完全选择统计模型的选择,并且仅识别数据中的模式。我们抛弃了神经网络的理论,该理论还涉及不依赖统计模型的预测系统,并关注学习算法的理论,因为他们看到了所有这些方法,他们已经看到了最哲学的关注。
Solomonoff(1964)完成了有关正规学习的开创性工作。和以前一样,设置是数据由0和1的字符串组成的设置,并且代理商正在尝试识别这些数据中的模式。因此,例如,数据可能是表单的字符串
010101011
……
,挑战是将此字符串确定为交替序列。所罗门诺夫的核心思想是,代理必须考虑所有可能的可计算模式,因此,对统计假设没有任何限制选择。 Solomonoff然后定义了一个形式的系统,在该系统中确实可以考虑所有模式,并使用贝叶斯分析有效地使用所有可计算假设的贝叶斯分析,并巧妙地构造。
在贝叶斯统计与机器学习相交的一个相当新的领域,贝叶斯非参数(例如Orbanz和Teh 2010; Hjort等人2010年)。与其从一开始就指定一组限制的分布集,应该根据数据进行统计分析选择,而是想法是,数据与可能的分布的潜在无限维度面对面。然后,考虑到相对于获得的数据,将考虑的一组分布:模型的复杂性随样品而增长。结果是一个预测系统,该系统可以在模型上执行在线模型选择。
当前的正式学习理论是一个生动的领域,统计学哲学家也为此做出了贡献(例如Kelly 1996; Kelly等,1997)。对于目前的关注,特别是建立正规学习的系统,以实现一些充分的普遍预测概念,而不仅限于一组特定的假设,因此通过对数据中可能的模式施加最小的约束来实现一组特定的假设。 。这是一个争论的问题,是否完全有可能,以及在何种程度上,正式学习理论的预测在何种程度上依赖,例如,对样本空间结构的隐式假设。对此的哲学反思仅在起步阶段。
6。相关主题
科学哲学中有许多主题与该引理中涵盖的主题有直接相关。这里提到了一些中心主题,以将读者引导到百科全书中的相关引理。
紧邻统计哲学的一个非常重要的话题是确认理论,这是描述和证明科学理论与经验证据之间关系的哲学理论。可以说,统计理论是确认理论的适当部分,因为它描述并证明了以样本形式获得统计理论和证据之间获得的关系。在证据与理论之间的这种更广泛的关系框架内,将统计程序放置在统计程序上是有见地的。进一步缩小,统计学的哲学是方法论哲学主题的一部分,即有关科学是否以及如何获得知识的一般理论。因此,构思是统计数据是大量科学方法中的一个组成部分,其中包括概念形成,实验设计,操纵和观察,确认,修订,修订和理论化。
从统计数据中或与之紧密相处的科学哲学哲学也有许多特定主题。这些主题之一是测量过程,尤其是根据明显变量的统计事实测量潜在变量。所谓的测量代表理论(Kranz等,1971)依赖于统计数据,尤其是因素分析,以阐明数学结构如何代表经验现象的概念澄清。另一个重要的话题形式是科学哲学是因果关系(请参阅有关概率因果关系的条目和Reichenbach的共同原因原则)。自从Reichenbach(1956)以来,哲学家就采用了概率理论来捕捉因果关系,但是因果关系和统计学方面的最新工作(例如Spirtes等人2001)使概率因果关系理论具有巨大的冲动。同样,统计数据为因果关系的概念分析提供了基础。
还有更多。几种特定的统计技术,例如因子分析和贝叶斯网络理论,邀请了他们自己的概念讨论。科学哲学中的许多主题都可以阐明统计,例如连贯性,信息性和惊喜。反过来,科学哲学哲学上有广泛的讨论,可以使人们对统计数据有适当的理解。其中包括有关实验和干预,机会概念,科学模型的本质和理论术语的辩论。邀请读者咨询有关这些主题的条目,以便进一步了解它们与统计哲学的关系。
数学联邦政治世界观提示您:看后求收藏(笔尖小说网http://www.bjxsw.cc),接着再看更方便。