科学测量(三)

此外,在其解释测量理论下,成为一种真正的科学理论,具有解释性假设和可测试的预测。 在这项工作中,Jo Wolff(2020A)最近提出了一种依赖于代表性的计量理论的数量的新颖现实账户。 根据Wolff的数量结构主义理论,定量属性是关系结构。 具体地,如果其结构具有形成ARCHIMEDEAN有序组的翻译,则属性是定量的。 Wolff对翻译的关注,而不是特定关系,例如连接和订购,意味着可以以多种方式实现定量性,并且不限于广泛的结构。 这也意味着,数量没有任何与数字有关的东西,因为数值和非数值结构都可以定量。

6.信息 - 测量的理论账户

测量的信息定理账户基于测量系统和通信系统之间的类比。 在简单的通信系统中,消息(输入)被编码为发送器端的信号,发送到接收器的端部,然后解码后(输出)。 传输的准确性取决于通信系统的特征以及环境的特征,即背景噪声水平。 类似地,测量仪器可以被认为是与给定状态(输入)中的对象相互作用的“信息机器”(Finkelstein 1977),将该状态对其进行编码到内部信号中,并将该信号转换为读取(输出)。 测量的准确性同样取决于仪器以及环境中的噪声水平。 作为一种特殊的信息传输,在信息理论(Hartley 1928; Shannon 1948; Shannon和Weaver 1949)方面可以分析测量。 例如,读取的信息

y

一世

传达出现一个国家的发生

x

k

物体可以量化为

登录

[

p

x

k

|

y

一世

p

x

k

]

登录

[

|

]

,即作为对象国家的不确定性减少的函数(Finkelstein 1975:222;对于替代制剂,参见Brillouin 1962:Ch。15; Kirpatovskii 1974;和Mari 1999:185)。

Ludwik Finkelstein(1975年,1977年)和Luca Mari(1999)建议制作Shannon-Weaver信息理论和测量理论之间的合成的可能性。 正如他们所说,这两个理论都呼吁映射的想法:信息理论涉及输入和输出消息中的符号之间的映射,而测量理论涉及对象和数字之间的映射。 如果拍摄测量比符号操纵类似,那么Shannon-Weaver理论可以提供测量语法的形式化,而测量理论可以提供其语义的形式化。 尽管如此,Mari(1999:185)还警告说,通信和测量系统之间的类比是有限的。 虽然可以独立于其传输,用任意精度知道发件人的消息,但是对物体的状态不能独立于其测量而以任意精度知道。

测量的信息理论账户最初由Metolologists - 物理测量和标准化的专家 - 哲学家缺乏参与。 独立于Metrology的发展,Bas Van Fraassen(2008:141-185)最近提出了一个衡量概念,其中信息发挥着关键作用。 他认为测量由两个级别组成:在物理水平上,测量装置与对象相互作用,并产生读数,例如指针位置。[16] 在抽象水平上,背景理论代表了对象在参数空间上的可能状态。 测量在该抽象参数空间的子区域上定位对象,从而减少可能状态的范围(2008:164和172)。 这种可能性降低了有关测量对象的信息集合。 Van Fraassen的测量分析与计量中明确的呼吁在Metrology中发展到背景理论的信息 - 理论账户的分析不同,并且在它没有调用Shannon和Weaver所开发的信息的象征性概念。

7.基于模型的测量帐户

早2000s一个新的波的哲学奖学金已经出现了这强调之间的关系测量和理论和统计模型(摩根2001; boumans 2005a,2015;马里2005b;马里和焦尔达尼2013;数字2016,2017;帕克2017;三宅2017)。 根据基于模型的账户,测量由两个级别组成:(i)涉及感兴趣对象,仪器和环境之间的相互作用的具体过程; (ii)该过程的理论和/或统计模型,其中“模型”表示从简化假设构建的抽象和本地表示。 根据该视图的测量的中心目标是以满足某些困境的探索图,特别是连贯和一致性的方式分配到模型中的一个或多个感兴趣的参数。

通过研究科学中的测量实践,特别是计量来制定了基于模型的账户。 计量,正式被定义为“衡量科学及其申请”(JCGM 2012:2.2),是一项研究,涉及自然科学和工程中测量仪器的设计,维护和改进。 衡算学家通常在标准化局或专业实验室工作,负责测量设备的校准,标准的比较和测量不确定性的评估以及其他任务。 唯一的唯一哲学家才开始与潜在的计量实践潜在的概念问题进行互动,特别是在评估和提高测量标准的准确性(Chang 2004; Boumans 2005a:Chap。5,2005b,2007A; Frigerio等人2010; Theerer 2013,2018; Riordan 2015; Schlaudt和Huber 2015; Tal 2016A,2018; Mitchell等,2017;Mößner和Nordmann 2017; De Courtenay et al。2019)。

基于模型的账户的发展的核心动机是企图澄清测量实践的基本方面的认识论原则。 例如,计量学家使用各种方法来校准测量仪器,单位的标准化和追踪以及对不确定性的评估(用于讨论计量学,参见上一部分)。 传统的哲学账户,例如测量的数学理论,不会详细阐述与此类方法相关的假设,推理模式,证据性地,证据或成功标准。 作为弗利奥替埃等。 (2010)争辩,测量理论不适合澄清这些测量方面,因为它摘要远离测量过程,并仅关注尺度的数学特性。 相比之下,基于模型的账户采取规模构造,仅仅是测量中涉及的几个任务之一,除了测量参数,仪器设计和校准,对象采样和准备,错误检测和不确定性评估,其他方面还有一个涉及的若干任务之一,其中(2010:145-7)。

7.1模型在测量中的角色

根据基于模型的账户,测量涉及感兴趣对象(测量下的“系统”)之间的相互作用,仪器(“测量系统”)和环境,包括测量对象。 其他,二次交互也可以与测量结果的确定相关,例如测量仪器之间的相互作用和用于其校准的参考标准,以及将参考标准追溯到主要测量标准的比较链条(Mari 2003:25)。 通过表示与一组参数的这些交互来进行测量,并基于交互的结果将值分配给那些参数的子集(称为“测量”)。 当测量的参数是数值时,它们被称为“数量”。 虽然被衡量不需要数量,但定量测量方案将被认为是如下所示。

两种测量输出由基于模型的账户来区分[JCGM 2012:2.9和4.1; Giordani和Mari 2012:2146; 2013]:

仪器指示(或“读数”):这些是测量过程完成后最终状态的测量仪器的性能。 示例是显示在显示器上的数字上的位数和存储在设备内存中的位数。 适应症可以由数字表示,但是这些数字描述了仪器的状态,不应与测量结果混淆,涉及正在测量的对象的状态。

测量结果(或“结果”):这些是关于归因于正在测量对象的一个或多个数量的值的知识声明,并且通常伴随测量单元和比例的规格以及测量不确定性的估计。 例如,测量结果可以通过句子表示“物体A的质量为20±1克,概率为68%”。

作为基于模型的账户应力的支持者,从仪器指示对测量结果的推论是非竞争的,取决于关于正在测量的物体,仪器,环境和校准过程的一系列理论和统计假设。 通常通过多种指示的统计分析获得测量结果,从而涉及关于适应症分布的形状和环境影响的随机性(BOGEN和WOODWAWE 1988:307-310)的假设。 测量结果也包含系统效应的校正,并且这种矫正基于有关仪器运作的理论假设及其与对象和环境的相互作用。 例如,需要校正长度测量以使测量杆的长度与温度的变化,校正从热膨胀的理论方程导出。 系统校正涉及自己的不确定性,例如在确定常数的值时,通过涉及进一步理论和统计假设的二次实验来评估这些不确定性。 此外,与测量结果相关的不确定性取决于用于校准仪器的方法。 校准涉及关于仪器,校准设备,测量的数量的额外假设以及测量标准的性质(Rothbart和Slayden 1994; Franklin 1997; Baird 2004:Ch。4; Soler等,2013)。 不确定性的另一个组成部分起源于幻象的定义,并且被称为“定义不确定性”(Mari和Giordani 2013;Grégis2015)。 最后,测量涉及关于所使用的刻度类型和单元系统的背景假设,并且这些假设通常被捆绑到更广泛地与尺度和单元的定义和实现有关的理论和技术考虑。

这些各种理论和统计假设构成了建造一个或多个模型的测量过程的基础。 与测量的数学理论不同,术语“模型”表示解释正式语言的设定理论结构,这里的术语“模型”表示由简化假设构成的目标系统的抽象和本地表示。[17] 在这种情况下,相关目标系统是测量过程,即由测量仪器,对象或事件组成的系统,要测量的环境(包括人类运营商),辅助仪器和参考标准,这些组分的时间演变以及它们的各种相互作用。 测量被视为一组程序,其目的是基于仪器指示将值连贯地分配给模型参数的值。 因此,模型被视为必要的前提条件,以便从仪器指示推断测量结果,并且对于确定测量结果的内容至关重要。 随着基于模型的账户的支持者强调,通过相同的测量过程产生的相同指示可以用于根据测量过程的建模,例如,根据所考虑的环境影响,统计假设的模拟方式,可以使用相同的测量过程来建立不同的测量结果。分析噪声,以及应用背景理论的近似值。 随着Luca Mari把它放了,

任何测量结果报告仅在计量模型的上下文中有意义的信息,这种模型需要包括明确或隐式地显示在测量结果的表达式中的所有实体的规范。 (2003年:25)

类似地,据说模型为评估了测量结果的善良的各个方面提供了必要的上下文,包括准确性,精确,误差和不确定性(Boumans 2006,2007a,2009,2012b; mari 2005b)。

基于模型的账户从经验主义的测量理论解释分歧,因为它们在测量物品中不需要测量结果之间的关系或具有可观察的关系(Mari 2000)的可观察关系的正常关系 实际上,根据基于模型的账户,在其测量之前,测量物体的关系不需要观察到(Frigerio等,2010:125)。 相反,基于模型的账户的关键规范性要求是以连贯的方式分配给模型参数的值。 相干标准可以被视为两个子标准的结合:(i)模型假设与相关背景理论或其他实质性预设的模型假设的相干性; (ii)客观性,即不同测量仪器,环境和型号的测量结果的相互一致性[18](Frigerio等,2010; Tal 2017a; Teller 2018)。 第一子标准旨在确保正在测量预期量,而第二子标准旨在确保测量结果可以合理地归因于测量的物体,而不是测量仪器,环境或模型的一些伪像。 总之,这两个要求确保测量结果独立于其生产所涉及的具体假设,因此测量结果的上下文依赖性并未威胁其一般适用性。

7.2经济学的型号和测量

除了他们对物理测量的适用性外,基于模型的分析还在经济学中阐明了光线。 与物理量一样,经济变量的值通常不能直接观察,并且必须从基于抽象和理想化模型的观察中推断出来。 例如,十九世纪经济学家威廉杰斯·杰尔顿通过假设黄金价值之间的某些因果关系来测量黄金的变化,黄金供应和一般价格水平(胡佛和嫁妆2001:155-159;摩根2001:239)。 正如Julian Reiss(2001)所示,使用两种模型 和数据的统计模型,基于价格的局部变化是相互独立的,因此在平均时互相抵消。 这些模型携带,允许jevons从有关各种商品历史价格的数据中推断黄金的价值。[19]

在经济测量中的模型功能导致一些哲学家在他们自己的权利中查看了某些经济模型,类似于统治者和平衡(Boumans 1999,2005c,2006,2007a,2009,2012a,2015;摩根2001)。 Marcel Boumans解释了宏观经济学家如何通过在宏观经济系统的模型中调整参数来隔离外部影响的感兴趣的变量。 这种技术从控制实际系统的不可能的任务中释放经济学家。 正如Boumans所说,宏观经济模型用作测量仪器,因为它们产生输入(指示)和输出之间的不变关系(结果),并且可以通过校准来测试这种不变性,以防止已知和稳定的事实来测试这种不变性。 当基于模型的程序与专家判断结合时,即使在受控实验室设置(Boumans 2015:Chap)中,它们也可以生产经济现象的可靠测量。

7.3心理模型和构建有效性

模型在测量中发挥核心作用的另一个领域是心理学。 大多数心理学属性的测量,例如智力,焦虑和抑郁,并不依赖于由代表性的计量理论所支持的均匀映射(Wilson 2013:3766)。 相反,心理学理论主要依赖于抽象模型的开发,这些模型将在某些任务中预测受试者的性能。 这些模型由关于所测量的心理属性的实质性和统计假设以及与每个测量任务的关系。 例如,项目响应理论是一种流行的心理测量方法,采用各种模型来评估问卷调查的可靠性和有效性。 考虑一个调查问卷,该调查是为了评估英语语言理解(“能力”),通过提出一系列是/否问题(“物品”)。 用于校准此类问卷的最简单模型之一是Rasch模型(Rasch 1960)。 该模型假设了一个直接的代数与称为“赔率的日志”, - 受试者将正确回答给定项目的概率,该特定项目的难度以及受试者的能力。 通过在其指示和Rasch模型的预测之间测试拟合并相应地将难度级别分配给每个物品的符合来校准新的问卷。 然后,该模型与调查问卷结合使用,从原始问卷分数(威尔逊2013; Mari和Wilson 2014)中推断出英语语言理解水平(结果)。

RASCH模型提供的统计校准(或“缩放”)的种类产生可重复的结果,但它通常只是朝着全面心理测量的第一步。 心理学家通常对措施的结果感兴趣,而不是自行享受的措施,而是为了评估一些潜在和潜在的心理属性,例如英语语言理解。 物品响应与统计模型之间的良好尚未确定调查问卷正在测量的内容。 建立程序测量预期心理属性的过程被称为“验证”。 验证心理学仪器的一种方法是测试旨在测量相同潜在属性的不同程序是否提供了一致的结果。 这种测试属于称为“构造验证”的验证技术系列。 构造是旨在测量的潜在属性的抽象表示,并且

反映一个假设[...... ...... ......]各种行为将在各个差异的研究中彼此相关,和/或将受到实验操纵的同样影响。 (Nunnally&Bernstein 1994:85)

构造是由模型中的变量表示,该模型预测,如果它们确实是相同属性的指标,则在不同措施的指示中观察到哪个相关性。 这些模型涉及关于该属性的实质性假设,包括其内部结构及其与其他属性的关系,以及关于不同措施相关性的统计假设(Campbell&Fiske 1959; Nunnally&Bernstein 1994:Ch。3;愤怒2008)。

近年来,科学哲学家对精神仪和有效性的概念越来越感兴趣。 一项辩论涉及潜在心理属性的本体学境。 Denny Borsboom对潜伏属性的操作态度争辩,并且有利于以拥抱现实主义的方式定义有效性:“测试是有效的用于测量属性,如果且仅当A)存在的属性,而B)因果关系中的变化产生测量程序结果的变化”(2005:150;另见2009,2020; FEEST 2020)。 伊利娜·船舶对心理学属性进行了适度的操作系统形式,并认为中等的业务主义与谨慎类型的现实主义相容(2019)。 另一个最近的讨论侧重于构建验证程序的理由。 根据Anna Alexandrova的说法,构造验证原则上是一个合理的方法,因为它建立了与理论假设的一致性和关于潜在属性的背景知识。 然而,Alexandrova指出,在实践中,旨在衡量幸福和幸福的心理学家往往避免了解这些构建,而是吸引受访者的民间信仰。 这会破坏构建验证的目的,并将其变成一个狭窄的技术练习(亚历山大罗娃和海滨2016;亚历山大罗娃2017;另见McClimans等,2017)。

对精神仪测量的更基本的批评是它是教控的,造成的是可以量化心理学属性。 Michell(2000,2004B)认为,心理计学家没有严重尝试测试他们旨在衡量的属性是否具有定量结构,而是通过了伪装这种忽视的衡量测量的过松概念。 作为响应,鲍尔斯泊贷和Mellenbergh(2004)认为项目响应理论提供了概率测试属性量性的概率测试。 构建统计模型的心理统计学家最初假设属性是定量的,然后将模型进行对本测试。 当成功时,这种测试提供了对初始假设的间接确认,例如, 通过表明该属性具有添加剂结合结构(参见船舶2020)。

(本章完)

相关推荐