机会与随机性(五)
自然反应 - 以及大多数频率的响应,具有von mises可能的例外[14] -was来缩小可用的参考课程。 (如补充A.3所指出的,许多频率都是明确的,即在重复的自然过程中的可能性是频率。)Salmon(1977)呼吁客观均匀的参考课程(不能被任何相关财产划分的人属性频率与原始参考类别不同的子类)。 实际上,三文鱼的提议是均匀参考类是随机序列,其明显的循环性几乎不会构成对目前异议的答复。 Reichenbach(1949:374)建议“通过考虑可以编制可靠统计数据的最窄阶层”继续进行,这不是循环,而是未能回应异议,因为它不能保证只有一个这样的课程。 可能是多个类同样“狭窄”,可以收集可靠的统计数据(吉利斯,2000:816)。 在本文中,这将达到足够长的序列,以便可靠地判断它们的随机性或缺乏。
这种反对意见需要发生对参考课程不敏感的事件的可能性。 最近,Hájek(2007)认为,没有足够的概率概念免于对参考课题问题,因此不能满足这一要求。 (对于相关机会的相关视图,虽然有着相当不同的考虑因素,请参见Glynn 2010.)然而,正如Hájek注意,这一结论使得很难看出机会如何引导信任,并且仍然是一个开放的问题,无论是相当的机会理论符合机会的陈词滥调。
4.3偏见
以前的两个问题,许多人发现了最引人注目的机会,没有随机性,是有偏见的机会过程的情况。 一系列不公平的硬币折叠将具有不平衡的头和尾部,并且这种序列不能随机。 但是这样的序列,以及该序列的任何特定结果,偶然发生。
通过使用Martin-Löf-和Kolmogorov风格的考虑,可以看到这种序列不是随机的。 在后一种情况下,正如我们已经看到的那样,如果序列足够长,则偏置序列比无偏序列更可压缩,因为序列足够长,因为有效的编码将利用偏置序列通常具有连续的序列更长的序列的事实,并且因此不会随机。 在前一种情况下,偏置序列将违反一个度量,在无限二进制序列上的标准Lebesgue测量上违反一个属性 - 特别是,唱片空间的一个小子将是Borel Normal(§2.1),但没有偏置序列博尔正常。 因此,在随机性的标准账户中,没有偏见的机会过程的结果序列是随机的,但当然当然发生了这些结果。
对这个问题的一个回应是尝试并提出随机性的表征,这将允许偏见的机会的结果随机。 值得注意的是,对于他来说,Von MIS的初始表征随机性明确构建,对于他来说,随机序列是没有从原始序列中的频率不同的频率差异的允许随后的允许序列。 此帐户能够处理频率的任何值,而不仅仅是两个结果的情况。 鉴于Martin-löf方法是Von Mises的泛化,它也不令人惊讶的是,它也可以适应允许偏见的序列随机。 考虑具有结果概率的二进制进程(P,1-P)。 总体形式的大数法律告诉我们,这种方法的一组独立试验序列将限制等于(P,1-P)的结果。 该措施不是标准的lebesgue措施,而是由有问题的机会函数定义的衡量标准。 我们可以类似地重新解释随机性的其他有效统计测试。 如我们上面的统计测试语言所做的那样,我们可以将随机序列表征为关于结果机会(p,1-p)的假设不显着的那些,因为它符合我们的先天期望基于潜在机会。
为了通过kolmogorov复杂性接近偏见序列的随机性主题,假设我们被给出 - 以某种可测量的任何可计算概率测量λ在无限二进制序列集上(即,给定序列的概率可以任意近似通过递归功能)。 序列σ是每个n的λ-不可压缩的IFF,σ(表示的σn)的长度n初始子序列的Kolmogorov复杂度大于或等于-log2(λ(σn))。 其中λ是lebesgue措施(补充B.2),所以
-log2(λ(σn))= - log2(1 / 2n)= n,
所以我们在那种特殊情况下回到Kolmogorov复杂性的原始定义。 随着Kolmogorov随机性的这种广义定义,事实证明,我们可以显示Schnorr的定理(§2.3)的概括:序列σ是λ-不可压缩的IFFσ是相对于λ的ml。[15] 在补充B.1.1的框架中,在该广义的读取IFF下,在第n个顺序显着性测试的任意可计算量λ下,序列在该广义读取的IFF中是不大于1 / 2n的。 (有一些潜在的缺陷,表明可能对任意可计算措施的概括是一个过度的化:见补充B.1.3了解一些细节。)
虽然上述方法,随着在船上的补充中的修改建议,确实允许偏置随机序列,但它以成本为本。 虽然Lebesgue测量是直接序列的唱片空间可定义的自然,但ML-随机性的概括需要在要提供的序列的空间上进行独立的可计算概率测量。 虽然这可以在我们对机会的情况下进行的情况下进行,但在不存在机会的情况下没有使用的情况,即在随机序列的存在,符合RCT - 对于每个序列,有一些机会测量值是随机的,这威胁要将推论从随机性差异到机会。 作为专家人(1986:145)也强调,这种对随机性的方法似乎基本上要求产生随机序列的过程的干燥在序列是随机的概念上。 这种过程的随机性方法有一些直观的支持,我们将返回以下(§6.2),但它会将RCT变成无表情性的琐事。 相比之下,Lebesgue措施具有从唱名空间的对称性的本质上可定义的优势,该特征是其他可计算措施缺乏的特征。
建议的偏向序列的主要困难在于偏置序列的简单事实,而它们可能反映产生它们的过程中的概率,在无序和不可压缩的意义上似乎根本不随意。 上面的概括表明,我们可以定义相对于序列下面的概率的无序性的概念,但这不是序列本身的内在,无论我们考虑的任何措施如何。 艾尔曼把它置于它(略有误导术语):
这里是一种随机性的概念和可分离的无序概念。 疾病的概念是一个内在的概念; 它采用面值序列,关心创世纪,并询问序列是否缺乏模式。......相比之下,随机性的概念涉及成因; 它不采用面值序列,但询问序列是否反映了它是产品的过程的概率。 这种随机性与病症概念之间存在联系,但这不是一个紧张的。 (议员1986:145)
正如我们所可能所说:Kolmogorov随机性在概念上与无障碍的概念性相关,而我们可以将Gerry-Rig概念成为“偏见的障碍”的概念,这并没有真正回答我们已经了解无序序列的不可压缩性。 虽然我们可能会很好地认为一个甚至是头部和尾部的序列,但是由于连续掷硬币而产生的,在某种意义上偏向于它背后的流程的潜在衡量标准,这仍然是这种不合格的该序列在任何有趣的意义上没有概念性地与紊乱相关联。 正如Dasgupta的这一评论所表明的那样,这是非常直观的,以便采取偏见 - 序列的秩序增加 - 与随机性相比:
如果对于序列x这个限制频率存在但不等于1/2,那么,考虑到我们的底层公平硬币模型,X会显然有偏见,而不是随机偏见。 ......因此,将这种“无偏异性的随机法”作为“随机性的随机法”是自然的。 (Dasgupta 2011:§3.2)
由于机会过程中的偏差接近极值值,因此拒绝观察结果随机的想法非常自然。 (例如,我们可能会考虑人类的行为 - 虽然人们并不完全可预测,但显然我们的行为并不遵守非概率的心理法律,但是说人们随机行动不正确。)此外,还有相对措施无关的疾病概念序列的不可压缩性,使得偏置序列真的无序。 我们只能通过忽略更好的压缩技术的可用性来定义偏置序列的尺寸依赖性概念,该序列的可用性真正的压缩技术比非偏见的偏差更好。 为了概括随机性的概念,如上所述,只要它们反映高度偏置过程的机会,允许随机调用高度无随机序列。 因此,至少有一些直观的朝着想法的想法,如果随机性与earman建议这样做,那么这个名称的最佳Deserver是kolmogorov在其原始意义上的随机性。 但这将是一种与ML-ACUNTSNENT的自然概括对比任意可计算概率措施的自然概括,并且与von MISES必须在他最早讨论基础上的随机性讨论中,与原始随机性相似地形成对比概率。
鉴于上述讨论,虽然在一般和理论上稳健的方式定义了对偏置序列的随机性进行了进展,但在使用偏见的任何非琐碎版本的RCT辩护中,仍然存在困难,以及偏离偏差的困难序列可能是真正无序的。 但这里调用的普遍性确实给了一些救生的vonmes,对于偏见序列的随机性的强大概念是他的频繁主义形式的关键因素。
4.4依赖性:随机性对历史无动于衷
与立即前一个的RCT进一步的反统计量是随机性对历史无动于衷,而机会不是。 历史依赖的机会。 历史依赖的最简单方法是当可能产生某个事件的条件随着时间的推移而变化:
假设您在上午11:00进入迷宫,计划通过折腾硬币来选择转弯。 当您在11:00进入时,您可能会在中午到达中心的机会42%。 但在上半小时,您可能会进入一个地区,从中抵达中心,所以在11:30到中午到达中心的机会跌至26%。 但是你会幸运; 11:45您离中心不远,中午到达您的机会是78%。 11:49你到达中心; 然后,永远莫尔的中午到达它的机会是100%。 (刘易斯,1980:91)
但是有更复杂的历史依赖性。 在Lewis'示例中,改变机会的改变的属性是代理到中心的关闭。 但有些情况发生变化是同一过程的先前结果。 实际上,任何一个过程中,重复试验的连续结果不是概率独立的。
没有随机性的机会的一个例子涉及一个没有替换的球被绘制的不偏不倚的URN。 每次抽奖(除了最后一个)是偶然发生的事件,但结果序列不会是随机的(因为序列的前半部分将携带关于下半部分的组成的重要信息,这可能有助于可压缩性)。 但是在随机过程中发现了更引人注目的例子,其中未来结果的机会取决于过去的结果。 一个着名的这种过程的这种过程是马尔可夫链,它产生了与结果的价值取决于立即先前结果的价值的分立结果(但在其余的历史中,立即浏览历史的其他结果)。 二元马尔可夫链可能是天气(盖茨和塘1976):如果两种可能的结果是“晴朗”和“雨水”,那么假设明天是下雨的,这是合理的,这取决于今天是多雨(下雨天更有可能是雨天在另一个雨天之前); 但知道今天是多雨,可以说昨天的天气无关紧要。
如果Markov链是一个过程的正确模型,那么即使在机会发生个别的审判结果时,我们也应该期望重复试验的整个序列是非随机的。 在天气案例中刚刚讨论过的情况下,我们应该期待阳光灿烂的日子,然后是一个晴朗的日子,而下雨的一天。 在我们的符号11和00中应该更频繁地超过10或01.但是所有随机序列服从的硼鲁正常的条件需要,即每个相应长度的每个有限序列应该在序列中具有相等的频率。 因此,没有硼鲁正常序列,因此没有随机序列,可以模拟马尔可夫链的结果序列,即使每个结果都是偶然的。
4.5伪随机序列
至少一些非随机序列满足许多测量随机序列所需的一个性能。 例如,由每个非负整数的所有二进制数字组成的倒数化序列(即0110111001011101111 ...)是硼鲁正常。 该序列不是随机的,因为合理长度的初始子序列是非常可压缩的。 但它看起来至少满足一些随机序列的探索。 该序列是产生伪随机序列的尝试,该序列可以通过至少一些随机性进行统计测试,但可以很容易地生产。 (伪随机数发电机的发展背后的主要动力是需要有效地生产随机的所有实用目的的数字,用于密码学或统计采样。)比倒数序列存在更好的示例,这与更严格的amppernowne序列存在随机性属性。[16] 用于产生伪随机序列的一种简单技术是符号移位算法(SMITH 1998:53)。 给定初始“种子”数字S1,S2,...,Sn,算法简单地吐出了数字顺序。 显然,如果种子是已知的,或者可以以某种方式可以与应用这些伪随机数量的事件相关联。 但在实际应用中,种子通常以我们预期的方式选择了,我们无法携带有关应用的信息(在简单的计算机伪随机发电机中,种子可以从调用种子的时间以某种方式导出)。 用有限的种子,这个序列在一段时间后显然会重复。 符号偏移是从种子到结果序列的最简单功能; 更好的算法使用种子更复杂但仍然有效地计算函数,以产生具有较长时期的结果序列,比种子的长度长(例如,Matsumoto和Nishimura 1998的“Mersenne Twister”的长度长期限为219937-1)。
如果种子未固定,但偶然选择,我们可以有机会没有随机性。 例如,假设计算机有一个表示外部时间的时钟; 启动算法的时间可以用作种子。 但是,如果启动算法时,它可能在许多情况下,那么通过有效的伪随机序列发生器算法产生的特定序列将是偶然的,但不是随机的(因为存在相同的程序明确给出的种子上的算法;由于种子是有限的,将存在这样的程序;由于算法有效,因此产生的重复序列之前的长度比程序的守则加上种子的长度,使得制作的序列是可压缩的。 无论种子是否由算法中的偶然或明确表示,结果序列都会相同 - 似乎序列的干燥似乎可以随机而变化,而不是随机仍然是恒定的。 (符号换档动态也允许对RCT的另一个方向允许对位示例 - 见§5.2。)
当然,可以参考任何可以馈送偶然选择的输入的任何算法,因此可以通过机会产生结果,但是在输出高度可压缩的情况下可能产生结果。 (在这方面伪随机序列发生器很好的一种方式是它们被设计成产生高可压缩的序列,但不明显高度可压缩的序列)。 关于产生伪随机序列的那些算法的另一个有趣的事情是它们为机会和随机性之间提供了另一种对象连接。 为了我们认为给定序列是随机的理由,将基于其仅限于许多测试; 我们可以在相信伪随机序列是随机的(在某种程度上的理由意义上,只要理由比真理弱),就是通过RCT推断推断。 但随后我们可能认为这对RCT发挥了问题,即使这是真的,RCT就会扮演正确的角色。 假设一个人看到了一种真正随机的序列,形成了随机的正当信念。 伪随机序列的存在需要,事情可能看起来正当似乎是正当的,但序列不是随机的。 但是,这样的情景可以说,我知道序列是随机的,从而击败了我的了解序列是通过机会产生的序列(并且可能会破坏从随机性到机会的推论的良好)。
5.随机性没有机会
§§4.3-4.4中提供的RCT的反例表明,RCT的吸引力取决于我们对采取独立相同的分布式试验的好奇倾向,如公平硬币折腾的Bernoulli进程,成为范式机会过程。 然而,当我们扩大我们的目光来包含更全面的机会过程时,RCT向右向左方向的吸引力非常减少。 现在是时候将潜在的反例检查到RCT的另一个方向。 存在许多可粘性的情况,其中随机序列可能存在而无需机会。 其中许多情况涉及古典物理的有趣特征,这显然不是Chancy,而且它导致了一系列明显随机的现象。 不幸的是,与物理细节有些接触在以下内容是不可避免的。
一个明显的潜在的反例涉及硬币折腾。 有些人坚持认为硬币折腾是一个确定性过程,并且完全没有机会,但它产生了我们作为随机序列范例的结果序列。 这将被搁置,直到§7,其中索赔确定主义妨碍了机会。
5.1短序列
对于许多短序列,即使是最有效的前缀代码也不会短于原始序列(由于前缀代码包含有关序列长度的信息以及其内容,如果序列非常短,则最有效的代码可能是序列本身以其长度为前缀的序列本身比序列长)。 所以所有短序列都将随机为kolmogorov。 这可能似乎是违反直观的,但如果随机性表示缺乏图案或重复,那么对于显示模式或重复的序列必须是随机的。 当然,说这些序列是无规的,通常是因为在非常短的序列中,我们不太可能谈论所有顺序,而不是直接对其组成结果进行谈话。
由于RCT的模态方面,对于大多数过程来说,由于结果序列的实际简洁起见,可能会克服任何“意外”的随机性,可能是足够长的结果。 但对于未重复或很少可重复的事件,即使仅仅可能的合适的参考类也会很小。 此类未重复的事件确实存在 - 考虑开始我们宇宙的大爆炸,或您的出生(您的出生,而不是定性无法区分的同行),或Ned Kelly的死亡。 这些事件都是结果序列的一部分,这些序列必须短,因此这些事件是Kolmogorov随机序列的一部分。 但是,可以说所有这些事件都发生在偶然的情况下; 不需要调用概率理论以预测或解释它们中的任何一个。 例如,在凯利的死亡的情况下,虽然当他碰巧死亡时可能是一个机会的问题,但他没有机会死亡,因为它是(物理上)他所做的必要条件。 因此,存在随机序列 - 那些基本上短的那些,每种结果都没有偶然发生。
自然反应是拒绝短序列易于随机的想法。 RCT的右侧为此为此进行了空间,因为我们可以简单地坚持不可重复的事件,通常足以产生足够的序列(其实际上的序列不充分序列是否导致随机)。 这里的问题是,如果有一个案例未重复的机会事件,我们现在可以没有随机性的可能性。 事实上的困难似乎是不可避免的。 如果我们单独考虑结果,任何短序列都是随机的,或者它们都不是; 在不同短序列之间的任何基于产品的概念的基础上没有办法。 但随着一些单一的未重复的事件是Chancy,有些不是,我们选择哪种方式与这些事件的单身序列的随机性相比,我们将发现对一个方向或另一个方向或另一个方向的一个方向或另一个方向。