生物信息(一)
信息的概念被广泛用于生物科学。 信息概念是分子生物学的核心,在那里它是谈论翻译,转录,校对,冗余,DNA库,遗传代码,遗传编辑或遗传程序的标准。 基因也意味着携带有关进化过去的信息。 信息是认知科学的关键概念; 据说认知系统对信息进行交易,这与谈论心理表现,神经信号,神经递质等等。 动物通信也是如此,其中信号通常被理解为信息载体; 呼叫,颜色,形状或气味携带有关捕食者,食物或身份的信息。 荷尔蒙也用作信号和触发细胞内的信令路径。 信息传输的变化也是宏观调度中的关键主题。 在生物学中,信息谈话的中心性和影响力很难夸大。
这种普遍使用信息概念提出了一系列有趣的问题。 所有这些表达式都指的是相同或不同的实体? 信息的性质是什么? 可以衡量吗? 是信息谈论纯粹的隐喻还是应该把它带到面值? 是信息概念照明,还是应该被分发? 信息是否发挥了实质性的解释作用? 是什么决定了信号的信息内容? 我们应该是关于信息的现实主义者吗? 它可以减少到其他一些财产吗? 此条目将解决其中一些问题。
这些问题通常在特定辩论的背景下解决,其中许多细节与不同的论据和职位有关。 尽管如此,还可以识别一些重复主题。 此条目始于一些一般问题(§1); 我们将讨论相关性(§1.1)和上网(§1.2)信息的感官,我们将简要考虑反现实主义和消除主义挑战(§1.3)。 然后,我们将搬到两项特定辩论,其中信息发挥了核心作用:分子生物学(§2)和动物通信(§3)。
1.信息的概念
1.1相关信息
1.2目的信息
1.3反现实主义和消除主义
2.遗传信息
2.1对信息模型的批评
2.2遗传学中的信息方法
3.动物沟通
3.1功能参考
3.2影响与信息方法
3.3动物通信研究中的信息
参考书目
学术工具
其他互联网资源
相关条目
1.信息的概念
与来自普通语言的许多其他表达一样,信息的概念以不同的方式在生物科学中使用。 有时,信息概念用于纯粹的外部物质,即,在某种意义上,揭示我们的认知使用而不是对象的任何财产。 例如,当据说等位基因频率的差异来携带有关进化过去的信息(例如,以推断出两个物种之间的系统发育距离),则不假设细胞或生物体使用或利用这些信息; 相反,建议是我们可以使用等位基因频率来发现某些事实。 这是一个推论而不是解释性的信息。 通过这种方式理解,基因携带信息以相同的方式携带有关灭绝物种的信息,树圈携带关于树的年龄的信息和红移提供关于扩展宇宙的信息。
然而,经常是信息谈判归于生物实体的一些特定财产,这不会捕获我们做法的认识性质。 神经尖峰携带信息的主张似乎将它们归因于某种作用; 当分子生物学家断言某些氨基酸的Codons代码时,它们似乎是归因于某种教学内容,以某种方式告诉转录和翻译机器应该如何进行。 该警报呼叫携带有关捕食者的信息似乎并不依赖于我们的认知实践。 Prima Facie,这些使用属性特定的目标属性,而不是仅仅揭示一些关于可以从中学习的东西。 这是最受关注所在的信息感,并且是此条目的重点。
作为第一近似,在这种意义上的信息可以表征为不对称,规范性和非普遍存在的。 动物通信提供了一个明确的例子:信息在某种意义上是不对称的,而一只猴子猴的报警携带有关接近蛇的信息,而蛇本身则不会携带有关呼叫的信息。 信息也通常是规范:它可以准确/不准确,真/假或满足/不满足。 如果没有蛇实际接近,则信号将是假或不准确的。 最后,信息在两个方面不是普遍存在的:首先,有些动物特征携带信息,而不是所有人都这样做; 其次,那些只携带有关限制事实集的信息。 当然,这只是生物学实践所建议的基线表征。 无论这分析是否准确无误,或者是否应该被扩展,减少或完全被遗弃,或者在具体情况下是股权的核心问题之一。
在开发适应这些特征的信息概念方面已经消耗了大量努力,并阐明了生物学中的信息概念的使用。 在本节中,我们将考虑理解这一概念的具体方式,这些概念来自香农的数学理论,以及灵感来自这种观点的富裕概念。 然后,我们将继续前进,寻求克服以前账户的一些困难,我们终于考虑了一些替代观点,这试图将不同方法的见解结合到一个连贯的整体中。
1.1相关信息
进一步表征生物科学中的信息的第一策略吸引了Shannon(1948)的信息的数学理论。 Shannon主要对设计问题感兴趣,即如何决定最佳编码以最小化通信中的错误。 他阐述了这个问题(图1):给定源的特定状态,发件人通过频道向接收器发送消息,这可能会引入一些噪声。 设计者必须设计最佳编码系统,该系统允许接收器正确地恢复源的状态,平均可能与可能的误差很小。
从左到右的一系列节点。 “信息源”带有箭头的“发射机”(Combo标记的消息),带有箭头标记为“信号”到未标记的节点,另一个箭头标记为“接收信号”,带有箭头的“接收器”向“目的地”(最后两个也标记为“消息”)。 标记为“噪声源”下方的节点对中间的未标记节点具有箭头。
图1
为了解决这个问题,香农恢复并改进了信息的概念,其他理论家(如奈奎斯特或哈特利)之前已经使用过:在Shannon的表征中,来源的信息量可以大致被理解为订单量(或更准确地说),它的熵)。 直观地,信息量反映了源的实际状态的不确定性给出了它的所有可能的状态。 具有许多的来源,同样可能的状态与高度的不确定性(信息)相关联。 从这个想法来看,可以定义互信息的概念:两个事件空间携带相互信息IFF其中一个的状态改变了另一个的概率分布。 换句话说,相互信息可以被理解为测量在多大程度上知道一个变量的实际状态降低了另一个变量的不确定性。 互信息越大,可以重建原始消息的更准确。 这些系统之间存在多少信息取决于平均值,概率是由系统的状态改变的。 因此,互信息捕获正在发送的平均信息量,并由它们之间的统计关联完全确定。 在数学上,在描述状态空间的联合概率分布方面定义了互信息。 这就是Shannon的互相信息的概念有时被称为“相关信息”的原因(但是,Shannon的方法包括一些措施,例如熵或惊喜,这不是关于相关的)。
毫无疑问,基因,报警信号或神经尖峰在这种意义上携带信息。 然而,许多人怀疑这一概念可以充分捕捉到实际科学实践中归属的相关财产。 正如我们所看到的,常见的方式来表征生物信息的概念,表明它是不对称的,规范性和非普遍的,而相关性(Shannon)信息没有这些功能。 首先,相关信息是对称的:如果A携带关于B的信息,则B携带关于A的信息。如果两个事件空间的状态在统计上相关,则相关性地沿两个方向进行。 其次,它不是规范性的,从此没有似乎具有真实或准确性条件; 关于B的信息是取决于它们之间的实际统计相关性,并且没有明确的意义,其中这种相关性可以是假或不准确的。 第三,信息也普遍存在:关于图1的通常解释,对可以发挥源,频道等角色的实体的类型没有限制,因此,几乎任何物理系统都携带信息,实际上它带来了大量的情况。 因此,许多人认为在香农的方法方面,无法明确地理解生物信息的相关概念。 这是如此多,因此与语义信息标准对比,相关信息(理解为La Shannon)。
然而,最近,已经采用了不同的策略来拯救香农信息理论的一些要素,并制定受这些想法的启发的账户。 一方面,一些作者质疑通常在香农和语义信息之间假设的清晰区别。 例如,曼(2020)认为香农的方法已经提供了语义信息理论(另见Isaac 2019;Martínez2019)。 其他研究人员制定了以不同方式超越香农的措施的相关方法(Pocheville 2018; Scarantino 2015)。 例如,Scarantino(2015年)开发了由香农信息和贝叶斯决策理论的启发的概率差异制造商账户,该理论是基于哪些州的概率发生了变化,概率有多大的变化以及后续概率是多少。 Pocheville(2018)提案将Shannon互信息与其效果相结合,捕获因果特异性和Kolmogorov复杂性,这反映了两个序列之间序列的复杂性和算法互信息。 在Pocheville的账户中,通过吸引干预来破坏相互信息的对称性(参见Capottot等,2020)。
另一种(虽然我们将看到,相关)通过采用进化博弈论提供的正式工具(如介绍,请参阅Skyrms 2010; O'Connor 2020),替代地研究信息和信号。 出于我们的目的,最相关的游戏是所谓的“信号游戏”(参见亚历山大2002 [2021])。 简而言之,这些游戏理论模型通常包括两个(或更多)的玩家,其中一些人发挥“发件人”和其他人的角色“接收者”的作用。 世界上可以处于不同的状态,发件人观察并发送信号。 接收器观察信号(它不能直接观察世界)并执行动作。 最后,发件人和接收器的回报取决于在给定的世界状态中执行的操作。 由于有不同的信号来选择,发件人和接收器可以遵循不同的策略来协调其行为。
这些高度理想的模型已被用于研究信令的许多属性。 例如,已经表明,在一个与两个玩家的游戏中,两个世界态,两个信号,两个动作和玩家之间的共同兴趣,信号系统不仅是纳什均衡(一组没有个人可以单方面偏离和改善其支付的策略),但构成唯一的吸引力,从某种意义上说,任何开始发挥任何其他策略的互动玩家都会倾向于接近这两个均衡之一(Huttegger 2007; Bruner等,2018)。 简而言之,这意味着,在这些模型中,沟通必然会发展。 因此,这些模型表明信令的出现不会在发件人或接收器的一部分中预先假定智能。 Huttegger(2007)还辩称,如果世界各州的概率不同,那么玩家可能会收敛到汇集均衡,在那里它们总是发送相同的信号(无论观察到的世界状态),始终执行相同的动作。 人们还可以以不同的方式修改游戏:更改状态,信号或动作的数量; 考虑连续,而不是离散的价值观(O'Connor 2014); 添加更多球员(斯基尔斯2009,2010); 考虑到部分或完全利益冲突的情况(Martínez&godfrey-Smith 2016)等等。 这些模型存在着一种不断增长的文献,这些模型已经被用来捍卫这些和相关领域的有趣索赔。
这些型号还提供了新的信息视图。 Skyrms(2010)为信号的信息内容提供了一种措施,这是一种指定信号改变世界状态的概率的矢量(在此上下文中,“更改概率”不应被理解为因果地影响世界的信号,但在技术意义上的差异给定信号发生的概率,而不是没有信号的相同世界状态)。 假设世界可能处于四种备用状态:S1,S2,S3和S4。 如果仅在S1和S3中发送信号M,则M的信息内容将是
⟨
1
,
∞
,
1
,
-
∞
⟩
⟨
1
,
∞
,
1
,
-
∞
⟩
,因为它增加了1位的S1和S3的概率(
-
∞
-
∞
正是由于采用了对数)。 如果相反,则仅在S3中发送,M的信息内容将是
⟨
-
∞
,
-
∞
,
2
,
-
∞
⟩
⟨
-
∞
,
-
∞
,
2
,
-
∞
⟩
。 Skyrms的方法是非常有影响力的,并产生了一系列沿着类似线条的建议(例如,ISAAC 2019)。 Capott,Pocheville和Griffiths(2020)认为Skryms的方法无法捕获信息流,并开发一种替代账户,将信令网络解释为因果图,根据哪种信息取决于任何因果的信号如何用于行为。 Shea,Godfrey-Smith和Cao(2018)采取多元的方法,并定义了两个信息概念:信息内容,鉴于信号和功能内容捕获了世界各州的概率,这取决于世界各州如何发挥作用信号稳定。 从某种意义上说,功能内容可以理解为一种建造信息的信息理论(见下文和Godfrey-Smith 2020)。
最后,Shannon的方法广泛启发了一些替代建议,从反事实方面分析了信息关系。 Birch(2014)将信号的命题内容定义为它将其携带最近分离平衡的信息,即,最接近的均衡,其中从世界状态到信号中的一对一映射。 类似地,为了容纳欺骗,Skryms和Barret(2019)的情况表明,信号的内容由发件人和接收器具有共同兴趣的子轨来确定。 从不同的角度来看,Cohen和meskin(2006)争辩说,x的是关于y的信息,如果y = y命中y不是g,则x将没有f“是非 - 真实的(对于经典版本反事实的内容理论,见福索1987)。
关于这种丰富的信息的信息概念,人们可以采取不同的态度。 一方面,可以认为其中一个是指定生物信息性质的正确方法。 或者,人们可以去多元化,接受不同的概念在不同的背景下是有用的,或者用于不同的解释性目的(例如,Shea,Godfrey-Smith,&Cao 2018)。 然而,不同的选择是持有它,而其中一些概念可能有一些认知效用,其中它们都没有捕获生物信息的性质。 激励这种观点的一种方法是坚持认为这些概念都没有捕获非对称,规范性和非普遍存器的信息感。 此外,随着这些方法在简化模型上定义,它们具有非常精确的,使预测和提供可测量的信息的概念,但它们与实际通信情况的连接变得不太直接和更具可疑。
尽管如此,两个索赔难以否认。 首先,相关信息的概念,以及这些模型的工作,在理解生物信息的不同方面非常有用。 其次,无论有什么人对生物信息的性质,概率关系对人类和非人动物都很重要,因此了解我们如何利用它是一个重要的研究项目(Millikan 2004; Stegmann 2015)。
1.2目的信息
用于分析超越相关信息的生物信息概念的最突出的替代框架,这些概念超越了与生物学功能的概念(Millikan 1984)的概念吸引力。 函数的概念提供了一个有前途的起点,因为它具有三个特征,表征语义信息:一方面,它是规范的; 特征的功能是特征所在的效果,并且未能携带它需要特性发生故障或运作错误。 然后,这个想法是,真实/准确性和虚假/不准确之间的区别最终可以解释为某种形式的故障。 此外,功能通常是不对称的:闪烁的基本函数正在眼睛穿过眼睛,但不反之亦然。 最后,职能主要(也许专门)归因于生物的某些特征,并且只有每个特征的一些效果都有资格作为其功能,因此它们不是普遍存在的。 因此,可以在具有功能(CF.Maynard-Smith 2000)方面寻求分析携带语义信息。 不幸的是,尽管这些美德,但这种简单的提议不太可能成功,因为许多功能性状未能在任何相关意义上具有语义信息。 心脏应该抽血,但他们不会发挥信息作用。 因此,需要添加其他东西。
一个策略求助于发件人和接收者。 有趣的是,发件人接收器框架的原始动机之一来自沟通理论,特别是Shannon的方法; 第二级经典来源是刘易斯(1969)的公约叙述。 简而言之,关键的想法是,两个(或更多)代理或机制之间的互动中的信息出现:发件人会感知世界的某些方面并发送信号,接收器在接收到世界上的作用。 整个生物体可以播放发件人和接收器的作用,也可以通过有机体或其他机制的部分来播放。 原则上,发件人和接收器可以以因果术语定义,因此分析不是圆形的。 “发件人”和“接收器”的角色通常在一个非常抽象的水平上描述,当然是试图在所有信息系统之间找到共享结构(如可能是,Shannon的原始动机)。
对发件人和接收者的呼吁提出了一系列有趣的问题。 哪种实体(生物除外)可以发挥发件人和接收者的作用? 例如,在遗传信息的背景下,这个问题的不同答案是重要的,因为我们将在下面看到,对发件人和接收者的性质的不同看法导致了对遗传信息的不同看法(在神经科学中的并行讨论,见2016年CAO 2016和Artiga 2016)。 一个不同的问题涉及始终需要发件人和接收器。 一些作者纯粹就发件人(例如,Neander 2017)而纯粹地发展了他们的观点,而其他作者则为其他人呼吁接受者(Fresco,Ginsburg,&Jablonka 2020; Jablonka 2002; Stegmann 2009)。 第三个问题是:什么决定了信息内容? 一些认为内容主要通过接收者的过去使用(Millikan 1984)确定,而其他人则拥抱一种基于生产者的方法(Neander 2017; Schulte 2018)。 然而,在发件人和接收者方面的框架信息关系并不是没有风险:Godfrey-Smith(2014)警告倾向于强迫发件人 - 接收者对似乎涉及信息关系的任何互动的倾向。
无论如何,尽管在辩论中扮演着重要的角色理论,但这种方法一直是重要反对的目标。 一般来说,生物信息的目的不仅继承了美德,而且还继承了神学方法的困难(参见生物学中的目录:上图)。 因此,在提供完全令人满意的生物信息理论方面,还应考虑到分析功能概念的不同(和不兼容)方式以及经典问题相关的问题。