基于代理的科学哲学建模(三)
基本模型功能如下。 在仿真开始时(即时
t
=
0
�
=
0
)每个药剂
x
一世
�
�
在某个问题上被分配了意见,由实数表示
x
一世
(
0
)
∈
(
0
,
1
]
�
�
(
0
)
∈
(
0
,
1
]
。 然后,代理商与他人交换他们的意见(或信仰),并通过从他们自己的那些“不太遥远”的信仰的平均值来调整它们。 这些是落入大小的“置信区间”的意见
ε
�
,这是模型的参数。 通过这种方式,代理人对他人的意见有束缚的信心。 通过迭代此过程,模型模拟了意见形成的社会动态(见图5A)。
适用于科学探究的背景,科学家通常代表着寻求试图确定某个参数价值的代理人
τ
�
他们只知道它在于间隔
(
0
,
1
]
(
0
,
1
]
(Hegselmann&Kra @ 2006)。 在模拟开始时,每个代理被分配随机初始信念。 随着模型运行,代理通过接收(嘈杂)信号来调整它们的信仰
τ
�
并通过学习落在置信区间内的其他人的意见。 例如,代理人的信念可以在其他人的意见和来自世界的信号的加权平均值方面更新。[4] 这种动态代表科学家作为能够在方向方向产生证据的代理商
τ
�
虽然他们的更新也受到他们之前的信仰和同龄人的信念的影响(见图5B和图5C)。
没有真实的寻求者:沿着y轴传播的100个代理人的意见很快崩溃到8个意见,这些意见随着时间的推移而不会改变,并且只在事实附近偶然地偶然。
(一)
所有判守者:100个代理商的意见迅速崩溃到6,然后是2然后随着时间的推移变得更接近真相。
(b)
半决赛:100名代理商的意见也崩溃,但达到了一点才能达到1; 但是,1也在真理附近。
(c)
图5:Hegselmann和Krause模型的运行示例,x轴表示模拟中的时间步骤和100个代理的Y轴意见。 每个代理商意见的变化由彩色线代表。 价值
τ
�
(真实的真相的位置)表示为黑色虚线。 图(a)显示了一个没有任何寻求真实代理的社区中的观点动态,导致多个发散观点。 图(b)显示了一个社区中的舆论动态,其中所有代理人都是真实寻求者,这使得与真相恰当共识。 图(c)显示了一个社区中的意见动态,其中只有一半的人口是真实寻求者,这也实现了靠近真相的共识(改编自Hegselmann&Krause 2006;用于模拟中使用的其他参数,请参见原始文章)。
界限信心模型的早期应用是认知劳工分部(Hegselmann&Kraway 2006)的问题。 由于代理商可以在社会信息的基础上进行建模(即,通过平均对其置信区间的其他人的意见)或在来自世界的社会信息和信号的基础上,该模型可用于研究A的意见动态社区不是每个人都是“真实寻求者”。 然后,该模型审查了只接受社交信息的真实寻求者和代理商之间的劳动分工允许社区融合到真理。
后续申请社会认识论和科学哲学的申请侧重于科学分歧的研究和问题:不同规范指导对集体调查效率的不同规范的影响是什么?(Douven 2010; de langhe 2013)? 如果代理人鉴于自己的研究,鉴于他们自己的研究,鉴于其他代理人的意见,他们代表了通过“分裂差异”在自己的观点和同行的意见之间遵循调解规范的科学家(见上文第2.5节)。 相比之下,如果他们只鉴于自己的研究,他们只会更新他们的信仰,他们代表了遵循坚定标准的科学家。 此框架的其他应用主题包括嘈杂数据对意见动态的影响(Douven&Riegler 2010),关于复杂信仰国家的观点动态,如对科学理论的信念(Riegler&Douven 2009),通过推理更新社会环境中的最佳解释(Douven&Wenmackers 2017),欺骗和消除的欺骗和传播(Douven&Hegselmann 2021),科学社区的网络效应和理论多样性(Douven&Hegselmann 2022),等等。
3.4进化游戏 - 谈判的理论模型
博弈论研究的情况,其中一个人的行动的结果不仅取决于一个人的选择,而且取决于他人的行为。 这个意义上的“游戏”是代理(“玩家”)之间的战略互动的模型,每个人都有一套可用的行动或策略。 球员战略响应的每个组合都有指定结果或“支付”。 与传统的博弈论相比,侧重于代理人的理性决策,旨在在一次性相互作用中最大化其后的回报,进化方法侧重于人口中的反复互动。 假设游戏一遍又一遍地播放,球员随机从大群中汲取。 虽然代理人以某种战略行为开始,但他们根据称为“动态”的具体规则来学习并逐步调整他们的答复(例如,通过模仿其他玩家或考虑自己的过去的互动)。 因此,成功的策略将在整个社区中扩散。 通过这种方式,进化的游戏理论模型可用于解释在人口中的策略分布如何随着长期人口级过程的结果而变化。 虽然博弈论的标准方法主要集中在导致“稳定”状态的球员策略的组合中,例如纳什均衡 - 一个国家不能通过单方面改变战略来改善他们的支付的国家 - 进化方法已经过去研究社区中出现的均衡程度如何(参见博弈论和进化博弈论的条目)。
进化博弈论最初是在生物学中引入的(Lewontin 1961; Maynard Smith 1982)。 它随后获得了社会科学家和哲学家作为学习文化进化的工具,即调查信仰和规范如何随时间变化(Axelrod 1984; Skyrms 1996)。 可以使用基于微分方程的数学处理或使用基于代理的建模来实现模型。 虽然前一种方法采用了某些理想化,例如无限的人口大小或人口的完美混合,但是引入了ABMS,以研究放宽这种假设的学习情景(参见,例如,Adami,Schossau和Hintze 2016)。
进化博弈论对科学社会认识论的应用尤其受到讨价还价模型的启发,研究不同的讨价还价规范从个人的局部互动(Skyrms 1996; AXTELL,Epstein,Young 2001)。 由O'Connor和Bruner(2019)介绍了对认知社区的研究,建立在布鲁纳(2019)的文化互动模型上。[5]
讨价还价型号的基本思想如下:代理商讨价还价超过可用资源的股票,其中他们对其他人的需求和期望的需求鉴于他们以前的互动。 适用于科学的背景下,讨价还价的担忧不仅明确谈判对财政资源,而且还在科学家们认为如何在联合项目中划分工作量(O'Connor&Bruner 2019)。 例如,如果两名科学家正在合作联合论文,或者他们正在组织一次会议,他们将不得不达成每一个都会致力于它的时间和努力。 确定这样一个劳动力的规范可能不公平。 例如,如果科学家成为该项目的努力,而不是科学家B,但他们对其成功的同样承认,B将处于不利地位。 同样,如果他们同意一个合作论文的第一作者,而B最终会更加工作,但结果将再次不公平。 这些规范可能在科学界中根深蒂固,特别是在学术界多数和少数群体成员之间的相互作用的背景下。 但是这样的规范如何出现? 是否有利于某些群体的成员对他人出现这种歧视性模式所必需的群体,或者它们因其他人而变得根深蒂固,也许更令人惊讶的因素?
进化的游戏理论模型已被用于研究这些和相关问题。 讨价还价被认为是两个代理人之间的战略互动,其中每个代理商之间有关于手头的问题的需求(例如,一定数量的工作量,联合出版物中的作者名称的命令,等等)。 根据每个代理的需求,每个都获得一定的回报。 例如,假设A和B希望组织一次会议,他们首先谈判谁将涵盖哪些任务。 如果他们都在感觉中对每个人进行了高要求,这愿意在预计另一个涵盖其余任务的同时只能将最小的努力投入到项目中,他们将无法组织该活动。 另一方面,如果B,则达到低需求(通过乘坐较大的工作),而虽然达到了很高的需求,但他们将能够组织会议,尽管劳动力分裂将是不公平的(假设他们都获得平等的信誉,以便成功实现项目)。
游戏,源于John Nash(1950)的工作,被称为“NASH需求游戏”(或“迷你纳什需求比赛”)。 游戏中的每个玩家都会使他们的需求(低,MED或HIGH)。 如果需求不共同超过给定资源,每个玩家都会得到他们所要求的。 如果他们确实超过了可用的资源,没有人得到任何东西。 在上面的例子中,高度可以被解释为苛刻的工作,比其他会议组织的工作少,或者在联合论文中要求第一作者,同时将相对较低的努力投入到其中。 同样,低对应于愿意接受较大部分的工作(相对于接合纸的作者的顺序),而Med对应于要求公平分布的劳动力分配。 表1显示如此游戏中的收益。 任何提出的需求的组合都是纳什均衡,这意味着玩家的策略是对其他球员的策略是最佳反应。 虽然纳什均衡可以对应于资源的公平分配(如果两个玩家需求MED),但它也可能对应于不公平的(如果一个玩家要求低电平,另一个球员)。 这提出了这个问题:如果代理商从以前的互动中学到,社区将实现哪些均衡将实现? 特别是,如果个体被分成子组(可能是不同的大小),那么他们的成员资格可以通过其他代理人可见的标记来识别,他们可以在其共同球员的团体成员资格中制定策略条件。 哪个均衡状态将使社区发展到? 为研究这些问题,进化模型采用规则或动态,确定玩家如何更新他们的策略以及如何随着时间的推移改变社区的策略的分布方式。[6]
低大学学报高
低l,l l,5 l,h
医学杂志5,l 5,5 0,0
高h,l 0,0 0,0
表1:纳什需求游戏中的支付表。 行显示Player1的战略选项和Players Player2的选项。 每个单元格都显示了支付玩家1获取给定的选项组合,然后是玩家2的收益。 玩家可以提出三个要求:低,MED和高度,总资源为10.收益代表L,M和H,在哪里
是
=
5
是
=
5
,
l
<
5
<
h
l
<
5
<
h
和
l
+
h
=
10
l
+
h
=
10
。 (参见O'Connor&Bruner 2019; Rubin&O'Connor 2018)
基于讨价还价的建模框架已被用于研究科学合作的规范和可能会出现的科学合作和不平等。 例如,O'Connor和Bruner(2019)调查少数民族和多数成员之间学术互动中歧视规范的出现。 Rubin和O'Connor(2018)研究歧视性模式的出现及其对协作网络中多样性的影响,而文图拉(2023)则检查协作网络结构对鉴别规范的出现的影响如果代理人的会员资格没有可见标记,则为子组。 此外,Klein,Marx和Scheller(2020)使用类似的框架来研究理性和不平等之间的关系,即讨价还价的不同策略的成功(例如最大化预期效用)及其对不平等出现的影响。
3.5总结
除了上述框架外,还用于在社会认识论和科学哲学中建立模拟的许多额外方法。 上面未提及的一些突出框架包括由angere(2010年 - 其他互联网资源)和奥尔森(2011年)开发的贝叶斯框架“拉帕”,旨在研究信息和信任的社交网络,Betz(2013)的论证动态模式或在认知多样性研究中使用的洪和普(2004)的影响力框架(关于这些框架的更多信息,请参阅计算哲学的条目)。 Smaldino和Mcleath(2016年)提出了在科学哲学中使用的另一种演进框架(2016年)。 该模型代表了一个科学界,作为一种人口,由科学实验室组成,该实验室采用了文化传播的方法实践,这些惯例实践从一代科学家到下一代进行了自然选择,例如,研究了保守和风险的选择的选择(O'Connor 2019)。 在下一节中,我们通过上述和其他一些框架来看看ABMS在科学哲学中获得的一些中央结果。
4.中央结果
为了概述通过ABMS获得的主要调查结果,我们将重新审视第2节中讨论的研究问题,并查看如何通过特定模型回答。
4.1理论多样性和科学激励结构
在我们调查ABMS学习奖励科学的ABM之前,我们首先研究一些分析模型的结果,这激发了模拟的发展。 为了更精确地掌握单个激励形状的认识性协调和理论多样性,哲学家推出了正式的分析模型,灵感来自经济学研究。 来自这个文学体系的中央结果是,当科学家根据自己的自身利息而不是追随认知结束时,可以实现劳动力的最佳分布(例如,厨房1990; Brock&Durlauf 1999; Strevens 2003)。 更确切地说,模特表明,如果我们认为科学家们旨在最大化奖励从制作发现,他们将成功地将他们的研究努力最佳地分发他们的研究努力,如果考虑到每个研究线的成功以及目前有多少其他科学家追求的概率。 假设所有科学家都以同样的方式评估理论,他们对名利和财富的兴趣,而不是独自的认识目标,将导致其中一些选择最初出现不希望的途径。[7]
推出ABMS以解决类似的问题,但假设更复杂的情景。 例如,Muldoon和Weisberg(2011)开发了一个认知景观模型(见第3.1节),以检查Kicker和Strvens的稳健性,因为科学家们在科学家们改变了对社区和未来的追求的研究项目的信息的获取这些项目的成功。 他们的结果表明,一旦科学家们有关于其他人正在努力的信息,或者关于项目可能成功的程度,他们的自我组织分工就没有最佳。 另一个例子是De Langhe&Greiff(2010)的型号将Kitcher模型概括为具有多个认知标准的情况,确定科学家的背景假设,可接受的方法,可接受的谜题等。 模拟表明,一旦科学实践建模为基于多标准,竞争的激励就无法提供最佳分工。
密切相关的问题涉及“优先级规则”-A规范,即为第一个制定的科学发现(Strelvens 2003,1211)分配了学分的标准 - 它对劳动分工的影响。 虽然Kitcher和Strevens的模型表明,优先级规则在竞争研究计划中激励了科学家的最佳分布,因此开发了一系列正式模型,包括ABM,以重新审视这些结果并在这一规范上阐明额外的光。 例如,Rubin和Schneider(2021)检查如果个人分配信用,而不是整个科学界,如Strvens的模型,那么检查会发生什么。 他们进一步假设两个科学家通过联网社区传播的同时发现的消息。 模拟表明,更多连接的科学家更有可能获得信贷的信贷,这可能是在社区中的少数群体成员的缺点,另一方面,破坏优先级规则作为促进最佳分工的激励的作用。 除了优先级规则如何影响劳动力的问题外,ABM也已被用于研究优先级规则的其他影响。 例如,TIOKHIN,YAN和MORGAN(2021)开发了一个进化的ABM,表明优先级规则导致科学界基于较小的样本尺寸来发展研究,这反过来又降低了已发表的调查结果的可靠性。
在激励“利用”现有项目的激励方面也分析了激励对科学劳工分工的影响,与“探索”新颖思想相比,“利用”现有项目。 例如,De Langhe(2014B)开发了一种浅晶版的Kitcher和Strevens的模型,代理通过称重利用可用理论和探索新的理论来实现最佳分工。 在强盗模型和网络认识论框架内(参见第3.2节),Kumerfeld和Zollman(2016)提出了一项审查了科学家面临两个竞争对手假设的情景的ABM,其中一个人虽然代理商不知道哪个更好一个。 虽然代理商总是选择追求(或利用)一个似乎更有前途的假设,但它们也可能偶尔研究(从而探索)替代方案。 模拟表明,如果社区留下了自我组织的感觉,即每个科学家探讨他们认为单独最佳的程度,将被激励代理人向他人探索。 因此,科学家们将无法培养足够高的激励,探索新颖的思想,即从他们的社区的角度来看,这是一种激励,这是一个大的人。
4.2理论多样性和科学的通信结构
4.2.1“Zollman效应”
网络认识论方面的理论多样性研究导致了一个小说假设:科学界的通信结构可以促进或阻碍理论多样性的出现,从而影响认知劳动力的分裂。 首先是由Zollman开发的强盗模型首次展示了这个想法(2007年,2010年;见第3.2节)并被称为“Zollman效应”(Rosenstock,Bruner和O'Connor 2017)。 Grim(2009)Grim,Singer,Fisher和同事(2013)和Angere&Olsson(2017)的ABMS基于不同的建模框架制作了类似的结果。[8] 这些模型表明,在高度联系的社区中,早期错误的结果可能会在科学家之间迅速传播,导致他们调查次优询问线。 因此,科学家可能过早地放弃对不同假设的探索,而是利用劣等的假设。 鉴于这些调查结果,Zollman(2010)强调,对于成功的询问,它需要一个“瞬态多样性”的财产:一个社区与不同理论的平行探索的一个过程,这持续了足够长的以防止过早的遗弃最佳理论,但最终被对其的共识所取代。 除了连接性可能有害的结果,还表明,在较少连接的网络中学习较慢,表明社交学习背景下的准确性和速度之间的权衡(Zollman 2007; Grim,Singer,Fisher等,2013)。