注意:实际应用中大部分服从弱大数定律的随机变量序列也服从强大数定律,故本文所提“大数定律”均指强大数定律
今天想要讨论关于大数定律的另一个问题——大数定律告诉我们,对于独立同分布的随机变量序列,当变量个数趋于无穷时,它们的平均值将趋于定值,这个定值就是单个随机变量的期望。例如当我们抛一枚均匀的硬币无穷次时,正面朝上的频率将趋于50%. 这一性质很容易让人迷惑(包括我本人学概率论的时候也很迷惑)——既然随机变量之间是相互独立的,也就是每一次抛硬币的结果之间是不会互相“打照应”的,那么这些随机变量是如何做到在不互相打照应的情况下做到正面朝上的频率趋于50%的呢?我们抛1000次硬币,600次正面,400次反面,那么下一次抛硬币时反面的概率会更大吗?
其实,我们的问题的症结在于,当正面朝上与反面朝上的次数相差很大时,大数定律是否会对接下来的试验进行“调整”使其稳定在期望附近——如果不进行“调整”,我们眼睁睁看着正反面次数差距越来越大,似乎不太符合我们对大数定律的理解;而如果真的进行“调整”,显然就违背了每次试验相互独立这一条件。
理解这一问题的关键,就在于对大数定律本身的理解。我们很容易将大数定律简单地理解成“平均值收敛于期望”,却忽略了“变量个数趋于无穷”这一至关重要的条件。那么,变量个数到底要达到多少个才能成立“平均值收敛于期望”呢?答案是:
无论多少个也不能成立
因为定律中说的是“无穷”。个数再多,也不能称为“无穷”。无穷大在数学上是一个很特别的存在,也常常成为数学家的“拌脚石”。诸如芝诺悖论,希尔伯特旅馆悖论,所有自然数之和等于
1
–─ ,
12
等等这些著名悖论都在提醒我们不能用数的思维来理解无穷大。
回到前面的问题,这里涉及到无穷大的一个性质,那就是两个不同阶的无穷大相加,结果等于更高阶的那个无穷大。学过微积分的朋友应该不难理解这一点。为便于后面的叙述,我们先回顾一下微积分中关于无穷大的知识。
定义 设数列 {αₙ} , {bₙ} 满足
αₙ
lim ──=∞,
n→∞ bₙ
则称 {αₙ} 是比 {bₙ} 高阶的无穷大。
例如n² 比 n 高阶, n³+4n+5n+2 比 n²+2n+1 高阶, n 比 ln n 高阶。
定理 设 {αₙ} 比 {bₙ} 高阶,则
αₙ+bₙ αₙ
lim ───=lim ───
n→∞ cₙ n→∞ cₙ
(假设极限存在或为 ∞ 。证明略)
例如
1
─
3n²+2ln n+3n sin n
lim ────────── →↓
n→∞ n²
3n²
=lim ──=3
n→∞ n²
概率模型
在抛硬币的问题中,设抛了n 次后,正面朝上的次数为 αₙ ,反面朝上的次数为 bₙ ,显然有 αₙ+bₙ=n . 作为示例,我们不妨假设(忽略取整)
n²
αₙ=√─+n³/²
4
n²
bₙ=n – √─+n³/²
4
n
显然αₙ>─ ,
2
即正面朝上的次数是多于反面朝上的次数的;而且抛得越多, αₙ 与 bₙ 差距就越大,凭直觉似乎 αₙ 跟 bₙ 是不可能相等的。然而抛无穷次后,正面朝上的频率为
n²
─+n³/²
αₙ √4
lim ──=lim ────
n→∞ n n→∞ n
1 1
=lim √─+──
n→∞ 4 √n
1
=─
2
正面朝上与反面朝上的频率相等了!为什么会这样呢?因为在
n²
─+n³/²
αₙ=√4 中,造成其偏离
n
─
2
的项是 n³/² ;而这一项在 n → ∞ 时比
n²
─ 低阶,
4
因此这两项相加并取极限时
n²
─
4
为主要部分,n³/² 只是一个“小尾巴”,因此取极限时分母部分只剩下
n²
─
4
的贡献,而 n³/² 这一偏差消失了。
下表展示了这一变化过程。我们看到,αₙ – bₙ 确实越来越大,但这并不妨碍
αₙ
─
n
最终趋于0.5
n an bn an-bn an/n
1000 531 469 62 0.53100000
2000 1044 956 88 0.52200000
4000 2062 1938 124 0.51550000
8000 4088 3912 176 0.51100000
16000 8126 7874 252 0.50787500
32000 16178 15822 356 0.50556250
64000 32252 31748 504 0.50393750
128000 6435763643 714 0.50278906
因此,即使αₙ 与 bₙ 有很大差距,当 n → ∞ 时它们的频率是有可能相等的。所以大数定律并不是我们前面所说的那样对之后的试验结果进行“调整”使其稳定在期望附近,而是无穷大极限运算的特点天然地使其稳定在期望附近。再如我们在抛硬币的游戏中,即使前1000000000次都是正面朝上,我们也不能说第1000000001次反面朝上的概率大。虽然我们直观感觉1000000000这个数很大,感觉它已经严重违背大数定律了;但它在无穷大面前就是九牛一毛,沧海一粟,根本无法打破平衡。如表所示 αₙ 与 bₙ 相差1000000000,但当n足够大时,频率仍然接近0.5。
1000000000是与n无关的常数,常数可以看作最低阶的无穷大。
n an bn an-bn an/n
1000000000 1000000000 0 1000000000 1.00000000
2000000000 1500000000 500000000 1000000000 0.75000000
4000000000 2500000000 1500000000 1000000000 0.62500000
8000000000 4500000000 3500000000 1000000000 0.56250000
16000000000 8500000000 7500000000 1000000000 0.53125000
32000000000 16500000000 15500000000 1000000000 0.51562500
64000000000 3250000000031500000000 1000000000 0.50781250
128000000000 6450000000063500000000 1000000000 0.50390625
总结
无论αₙ 与 bₙ 差距多么大,只要满足大数定律的条件,就必然有
αₙ
lim ───=E[αₙ]
n→∞ αₙ+bₙ
因为αₙ 与 bₙ 的差距在 n → ∞ 时是低阶项,不造成影响。
大数定律的本质——即使试验结果与期望之间出现很大的偏差,这些偏差在 n → ∞ 时都不作数。
再直白一点——大数定律是正确的,大家不必操心。
数学联邦政治世界观提示您:看后求收藏(笔尖小说网http://www.bjxsw.cc),接着再看更方便。