科学测量(完结)
几位学者指出了模型用于标准自然和社会科学中可测量数量的方式之间的相似之处。 例如,Mark Wilson(2013)认为,可以将心理模型视为用于构建计量标准的工具,以在计量学家使用的“测量标准”的同一意义上。 其他人提出了关于在社会科学中标准化构建体时采用自然科学的例子的可行性和可取性的疑虑。 Nancy Cartwright和Rosa Runhardt(2014)讨论“Ballung”概念,这是他们从Otto Neurath借用的术语来表示具有模糊和上下文依赖范围的概念。 Ballung概念的例子是种族,贫困,社会排斥和博士计划的质量。 这些概念太过多进了,在没有含义的情况下在单个度量上测量,并且必须通过指数矩阵或通过几种不同的措施来表示,这取决于哪些目标和价值在游戏中(参见Bradburn,Cartwright,富勒2016,其他互联网资源)。 Alexandrova(2008)指出,道德考虑因素涉及关于福祉措施有效性的问题,而不仅仅是对可重复性的考虑。 这种道德考虑是上下文敏感性,只能零碎地应用。 在类似的静脉中,利亚麦克林斯(2010)辩称,均匀性并不总是为设计问卷设计的适当目标,因为问题的开放性既不是不可避免的,并且希望获得受试者的相关信息。[20] 当医学背景用于评估患者健康和心理健康时,换取道德和认识症考虑因素特别清楚尤为清楚。 在这种情况下,对调查问卷或分析结果的小变化可能导致患者的显着危害或益处(McClimans 2017; Stegenga 2018,Chap。8)。 这些见解突出了精神和社会现象测量的价值和上下文性质。
8.测量的认识论
上一节讨论的基于模型的账户的发展是在2000年代初发生的测量哲学中较大的“认知转向”的一部分。 近年来近年来哲学工作的哲学工作而不是强调数学基础,形而上学或语义,倾向于专注于参与具体测量实践的预设和推理模式,以及测量的历史,社会和材料维度。 这些主题的哲学研究已被称为“测量的认识论”(Mari 2003,2005a;Leplège2003; tal 2017a)。 在最广泛的意义上,测量的认识论是研究测量和知识之间的关系。 在测量认知学的范围内下降的中央话题包括测量产生知识的条件; 这些知识的内容,范围,理由和限制; 测量和标准化的特定方法成功或失败的原因是支持特定知识要求,以及测量和其他知识产生的关系,例如观察,理论,实验,建模和计算。 在追求这些目标时,哲学家正在借鉴历史学家和科学的社会学家的工作,他们一直在调查更长时期的测量实践(Wise和Smith 1986; Latour 1987:Ch。6; Schaffer 1992; Porter 1995 2007年;智者1995;桤木2002;加拉森2003;耶和华2004;折扣2011),以及科学实验的历史和哲学(Harré1981;黑客1983;富兰克林1986; 1999)。 以下小节调查了这一兴奋剂文学体系中讨论的一些主题。
8.1标准化和科学进步
近年来吸引了相当哲学关注的主题是测量标准的选择和改进。 一般而言,为了规范量的概念是规定,确定该概念将应用于具体的细节。[21] 为了标准化测量仪器,可以评估测量仪器的结果如何适合相关概念的规定的应用模式。 [22]术语“测量标准”相应地具有至少两个含义:一方面,通常用于指调节使用数量概念的抽象规则和定义,例如仪表的定义。 另一方面,术语“测量标准”也通常用于指被认为是应用数量概念的示例性的混凝土伪像和程序,例如作为标准仪表的金属棒,直到1960年。这种意义中的这种二元性反映了标准化的双重性质,涉及抽象和具体方面。
在第4节中,有人指出,标准化涉及非活动替代品之间的选择,例如不同的温度流体的选择或不同的标记相等持续时间的方式。 这些选择是非凡的,因为它们影响了相同的温度(或时间)间隔是否相等,因此影响含有术语“温度”(或“时间”)的自然法的陈述。 吸引理论决定哪种标准更准确是圆形的,因为该理论不能在测量标准选择之前确定于细节。 这种循环有各种称为“协调问题”(Van Fraassen 2008:Ch。5)和“Nomic测量问题”(Chang 2004:Ch。2)。 如上所述,常规人员试图通过向称为“协调定义”的先验陈述来逃避循环,该陈述应该将数量术语与特定的测量操作链接。 该解决方案的缺点是它假设测量标准的选择是任意的并且静态,而在实际实践中,趋于基于经验考虑的实际实践测量标准,并且最终得到改善或被认为更准确的标准。
近年来出现了一个关于协调问题的新书,其中包括哈霍昌的作品(2001,2004,2007; Barwich and Chang 2015)和Bas Van Fraassen(2008:Ch。5; 2009,2012;另见Padovani 2015,2017; Michel 2019)。 这些作品采取了历史和连贯的问题对问题的方法。 正如他们的前辈所做的那样,他们完全避免避免循环问题,而不是试图避免循环问题,而是表明圆形不恶毒。 Chang认为,构建数量概念和标准化其测量是共同相关的和迭代任务。 在标准化历史中,每个“认识迭代”在标准化历史上尊重现有的传统,同时纠正它们(Chang 2004:Ch。5)。 例如,温度的预科概念与从热到寒冷的物体排序物体的原油和模糊方法有关。 热镜,最终温度计,有助于修改原始概念并使其更加精确。 随着每个这样的迭代,数量概念重新协调,以更稳定的标准集,这反过来允许更精确地测试理论预测,促进后续发展理论和建设更稳定的标准,等等。
当我们看待它“从上面”时,这一过程如何避免恶性循环变得清晰,即,通过看着我们目前的科学知识,或“从内部”,通过看其原始背景下的历史发展(范弗拉索2008:122)。 从任何一个有利地位,协调成功,因为它会增加理论和仪器元素之间的一致性。 问题“如何计算数量X?” 和“数量x?”虽然彼此独立地不答易,但在相互细化的过程中被解决。 只有当一个人采用基础知识观点并尝试找到一个没有预设的协调的起点时,这种历史过程错误似乎缺乏认识性辩论(2008:137)。
关于协调的新文献将讨论的重点转变为这些定义的数量条款定义的重点。 在计量术语中,“实现”是一种物理仪器或程序,大致满足给定的定义(CF.JCGM 2012:5.1)。 计量性实现的例子是千克和铯喷泉时钟的官方原型,用于标准化第二个。 最近的研究表明,用于设计,维护和比较实现的方法对数量,单位和规模概念的实际应用直接轴承,不小于这些概念的定义(Riordan 2016; TAL 2016)。 当在理论术语中说明定义时,单位的定义和实现之间的关系变得尤其复杂。 国际系统(SI)的几个基本单位 - 包括仪表,千克,安培,开尔文和摩尔 - 不再通过参考任何特定的物理系统来定义,而是通过固定基本物理常数的数值。 例如,千克在2019年重新定义为质量单位,使得普朗克常数的数值恰好是6.62607015×10-34 kg M2 s-1(BIPM 2019:131)。 在这个定义下实现千克是一个高度理论的载荷任务。 对这些单位的实际实现的研究已经阐述了测量与理论之间的不断发展的新光线(TAL 2018; De Courtenay等,2019; Wolff 2020B)。
8.2测量理论载荷
如上所述(第7和8.1节),理论和测量在历史上和概念上是相互依赖的。 在历史方面,理论和测量的发展通过迭代和相互改进进行。 在概念方面,测量程序的规范塑造了理论概念的经验内容,而理论为测量仪器的指示提供了系统解释。 这种测量和理论的这种相互依存似乎可能对衡量标志在科学企业中发挥的证据作用的威胁。 毕竟,被认为能够测试理论假设的测量结果,这似乎需要一定程度的衡量标准的理论。 当测试的理论假设已经预先假定为测量仪器模型的一部分,这种威胁尤其清楚。 从弗兰克林等人引用一个例子。 (1989:230):
乍一看,似乎是一个恶性圆形,如果一个人使用汞温度计测量物体的温度,作为试验的一部分,以测试是否随着温度升高而导致物体膨胀。
尽管如此,Franklin等人。 得出结论,圆形不恶毒。 汞温度计可以针对另一个温度计进行校准,其操作原理不会预先假定热膨胀规律,例如恒定体积气体温度计,从而建立汞温度计的可靠性。 为了更普遍地说出,在局部假设的背景下,通常可以通过吸引其他类型的仪器和理论的其他部分来避免圆形的威胁。
当整个理论的测试时,对全球范围产生不同的担心测量的证据功能。 正如托马斯库恩(1961年)所说,在测试它们可用的定量方法之前,通常会接受科学理论。 新引入的测量方法的可靠性通常用于对理论的预测而不是其他方式测试。 在Kuhn的话语中,“从科学法向科学测量的道路很少在反向方向上行驶”(1961:189)。 例如,道尔顿的法律,其指出化合物中的元素的重量在全数比例中彼此相关,初始与这种比例的一些最着名的测量相冲突。 只有通过假设Dalton的定律,随后的实验化学家能够校正和改善它们的测量技术(1961:173)。 因此,Kuhn认为,物理科学中的测量功能不是测试理论,而是通过增加范围和精度来应用它,最终允许持续的异常,这会导致下一个危机和科学革命。 请注意,Kuhn并未声称测量在科学中没有证据表演。 相反,他认为测量不能以孤立地测试理论,而是仅通过与一些替代理论进行比较,以试图考虑因日益精确的测量而揭示的异常(用于Kuhn论文的照明讨论,因此才能考虑异常(对Kuhn的论文的照明讨论)1983年:243-5)。
像Kuhn那样的理论升值的传统讨论是以理论和观察语言之间的逻辑实证主义者区分的背景进行的。 衡量的理论升值被正确被认为是对两种语言之间明确划分的可能性的威胁。 相比之下,当代讨论,不再将理论提出作为认识论威胁,但是理所当然地认为某些程度的理论是衡量有任何证据能力的先决条件。 如果没有关于所测量的数量的一些最小实质性假设,例如其可操作性及其与其他数量的关系,则无法解释测量仪器的指示,因此不可能确定这些适应症的证据相关性。 这一点已经是Pierre Duhem(1906:153-6;另见1994:9-19)。 此外,当代作者强调理论假设在纠正测量误差和评估测量不确定性时起着至关重要的作用。 实际上,当它们的模型是解除理想化的模型时,物理测量程序变得更准确,这是一种涉及增加模型的理论丰富性的过程(TAL 2011)。
承认理论对保证测量的证据可靠性至关重要,从而注意“观察接地问题”,这是对传统理论威胁(TA1 2016B)的反比挑战。 挑战是指定在测量中扮演什么职位观察,特别是与观察的任何类型的连接是必要的和/或足以允许测量在科学中发挥证据作用。 当一个人试图考虑越来越多地使用用于执行传统通过测量仪器而完成的任务的计算方法时,此问题尤其清楚。 作为玛格丽特·莫里森(2009)和温迪帕克(2017)认为,还有情况下可靠的定量信息收集关于一个目标系统借助一个计算机仿真,但在一个地满足一些中央desiderata用于测量如被经验接地和向后寻找(另请参见拉斯克2016)。 此类信息不依赖于从特定感兴趣对象传输到仪器的信号,但是在使用理论和统计模型来处理关于相关对象的经验数据。 例如,数据同化方法通常用于估计温度计读数的区域中的过去的大气温度。 一些方法做到这一点的拟合一个计算模型的大气中的行为到一个组合可用的数据从附近地区和一个基于模型的预测的条件时观察(帕克2017)。 然后以各种方式使用这些估计,包括作为评估前瞻性气候模型的数据。 无论一个人是否呼叫这些估计“测量”,他们挑战了产生关于对象状态的可靠定量证据的想法需要观察该物体,然而,松散地理解“观察”术语。[23]
8.3精度和精度
测量结果可靠性的两个关键方面是准确性和精度。 考虑在具有相等臂平衡的特定对象上执行的一系列重复重量测量。 从现实主义者“基于错误”的角度来看,如果它们接近所测量的数量的真实值,则这些测量的结果是准确的,所以对象权重与所选单元的真正比率 - 并且如果它们彼此接近,则对象的权重和精确。 通常被引用的类比澄清基于误差的区别是箭头在目标上射击的箭头,精度类似于对牛眼的近距离的近距离和比较击中的差异性的精确度(参见JCGM 2012:2.13和2.15,柜员2013:192)。 虽然直观,但雕刻区别的基于错误的方式引发了认识论难度。 通常认为大多数对科学兴趣的确切的真实值是不可知的,至少当在连续尺度上测量这些数量时。 如果授予此假设,则不能精确地知道测量此类数量的准确性,而是仅通过比较彼此的不准确测量来估计。 然而,目前尚不清楚为什么应将不准确的测量的收敛作为真理的迹象。 毕竟,测量可以通过常见的偏差困扰,该偏差是防止各自不准确在平均时互相抵消。 在没有认知访问真实值的情况下,如何评估测量精度可能?
在回答这个问题时,哲学家已经利益,从练习科学家使用的是使用术语“测量准确性”术语“测量精度”的各种感官。 已经确定了至少五种不同的感官:形而上学,认知,操作,比较和务实(TAL 2011:1084-5)。 特别是,这个术语的认知或“不确定性”的感觉是形而错的中立的,并没有预先存在真实价值的存在。 相反,测量结果的准确性被认为是合理归因于可用的经验数据和背景知识(参见JCGM 2012:2.13注3; Giordani&Mari 2012; De Courtenay和Grégis2017)。 因此,通过建立代表不同测量过程的模型的后果(Basso 2017; Tal 2017b; Bokulich 2020; Staley 2020),可以通过建立鲁棒性来评估测量精度。
在基于不确定性的概念下,不精确是一种特殊类型的不准确性。 例如,重量测量的不准确性是对物体重量合理归因的值的广度,因为衡量平衡和可用背景知识的衡量标准和所用的标准权重的方式。 这些测量的不精确是因对重复试验的平衡指示而产生的不准确性的组成部分。 除了不精确之外的其他不准确的来源包括对系统误差,不准确的已知的物理常数和模糊尺寸定义的不完美校正(见第7.1节)。
Paul Teller(2018)提出了对基于误差的测量精度的反对意见。 他反对他称之为“测量精度现实主义”的假设,根据哪些可测量的数量具有明确的现实价值。 Teller认为,这种假设是错误的,因为它涉及物理学惯常测量的数量,因为这种数量的任何规范(或价值范围)都涉及理想化,因此不能指的是现实中的任何内容。 例如,通过短语“空气中的声音速度”通常理解的概念涉及关于空气化学成分,温度和压力的均匀性以及测量单位稳定性的隐含理想化。 完全删除这些理想化将需要向每个规范添加无限量的细节。 由于柜员所争辩,测量精度本身应该被理解为一个有用的理想化,即作为允许科学家评估测量结果之间的一致性和一致性的概念,仿佛这些结果的语言表达锁定在世界上的任何东西上。 精度类似地是一种理想化的概念,它基于在“相同”的情况下重复测量的开放式和无限的规范(Teller 2013:194)。