第11讲切比雪夫不等式与大数定律
教学目的:1.使学生理解切比雪夫不等式与大数定律的内涵。2.使学生会用切比雪夫不等式及大数定律解决实际问题。 教学重点:使学生理解切比雪夫不等式与大数定律的内涵。 教学难点:使学生理解切比雪夫不等式与大数定律的统计意义。 教学学时:2学时 教学过程:
第三章随机变量的数字特征
§3.5切比雪夫不等式与大数定律
1.切比雪夫(Chebyshev)不等式
我们知道方差D(X)是用来描述随机变量X的取值在其数学期望E(X)附近的离散程度的,因此,对任意的正数,事件XE(X)发生的概率应该与D(X)有关,而这种关系用数学形式表示出来,就是下面我们要学习的切比雪夫不等式。
定理1设随机变量X的数学期望E(X)与方差D(X)存在 ,则对于任意正数,不等式
P [XE(X)]或
P [XE(X)]1
D(X)D(X)
2
(1)
2
(2)
都成立。不等式(1)和(2)称为切比雪夫不等式。
下面只对连续随机变量情形证明不等式(1)和(2)。 证设随机变量X的密度函数为f(x),则有
P [XE(X)]
xE(X)
f(x)dx
xE(X)
[xE(X)]2
2
f(x)dx
2
[xE(X)]2f(x)dx
D(X)
2
由于XE(X)与XE(X)是对立事件,故有
P [XE(X)]1P[XE(X)]1
D(X)
2
切比雪夫不等式给出了在随机变量X的分布未知的情况下,只利用X的数学期望和方差即可对X的概率分布进行估值的方法,这就是切比雪夫不等式的重要性所在。
例1 已知正常男性成人血液中,每毫升含白细胞数的平均值是7300,均方差是700,利用切比雪夫不等式估计每毫升血液含白细胞数在5200~9400之间的概率。
解 设X表示每毫升血液中含白细胞个数,则
E(X)7300,(X)D(X)700
而
}P{|X7300|2100}1P{|X7300|2100}P{5200X9400
又
70021
}P{|X7300|2100
210029
所以
P{5200X9400}
8 9
2.大数定律
利用切比雪夫不等式,我们可以证明概率论中一个重要的大数定律--切比雪夫定理。
定理2(切比雪夫定理) 设独立随机变量序列X1,X2,,Xn, 的数学期望
E(X1),E(X2),,E(Xn),
和方差
D(X1),D(X2),,D(Xn),
都存在,并且方差是一致有上界的,即存在常数C,使得
D(Xi)C,i1,2,,n,
则对于任意的正数,有
1n1n
limP(|XiE(Xi)|)1(3)
nni1ni1
证我们用切比雪夫不等式证明该定理。 因为
1n1n
E(Xi)E(Xi) ni1ni1
而X1,X2,,Xn相互独立性,所以
1n1D(Xi)2
ni1n
D(X)
i
i1
n
应用切比雪夫不等式得
1n1n1
P(|XiE(Xi)|)122
ni1ni1n
n
D(X)
i
i1
n
因为D(Xi)C (i1,2,,n),所以D(Xi)nC,由此得
i1
1n1nCP(|XiE(Xi)|)12 ni1ni1n
当n时,得
1n1n
limP(|XiE(Xi)|)1 nni1ni1
但是概率不能大于1,所以有
1n1n
limP(|XiE(Xi)|)1 nni1ni1
切比雪夫定理说明:独立随机变量序列X1,X2,,Xn,的数学期望与方差都存在,
1n
且方差一致有上界,则经过算术平均后得到的随机变量Xi,当n充分大时,
ni1
它的值将比较紧密地聚集在它的数学期望E的附近,这就是大数定律的统计意义。
切比雪夫定理的一个重要推论就是著名的伯努利定理。
定理3(伯努利定理) 在独立试验序列中,设事件A的概率P(A)=p,则对于任
意的正数,当试验的次数n时,有
limP(|fn(A)p|)1
n
其中fn(A)是事件A在n次试验中发生的频率。
证 设随机变量Xi表示事件A在第i次试验中发生的次数(i1,2,,n,),则这些随机变量相互独立,服从相同的“0-1”分布,并有数学期望与方差:
E(Xi)p,D(Xi)p(1p)
,i1,2,,n, 4
于是,由切比雪夫定理得
1n1n
limP(|Xip|)1 nni1ni1
易知Xi就是事件A在n次试验中发生的次数nA,由此可知
i1
n
nA1n
Xinfn(A) ni1
所以有
limP(|fn(A)p|)1
n
伯努利定理说明:当试验在相同的条件下重复进行很多次时,随机事件A的频率
fn(A)将稳定在事件A的概率P(A)附近,这个正确的论断曾经在一系列的科学试验以及大量的统计工作中得到证实,而伯努利定理从理论上对此给出了严格的证明。
例2从某工厂的产品中任取200件来检查,结果发现其中有6件次品,能否相信该工厂产品的次品率p1%?
解假设该工厂的次品率p1%,则检查200件产品其中次品率X6的概率应为
P(X6)C
x6200
x
200
(0.01)(0.99)
x200x
X
1C200(0.01)X(0.09)200X
x0
因为n200很大,且p0.01较小,故可按近似公式计算,并有2000.012,从而
2x2
P(X6)11(0.13530.27070.27070.18040.09020.0361)
x0x!
0.0166
在工业生产中一般把概率小于0.05的事件认为是小概率事件,由此可见上述事件
X6是小概率事件。按小概率事件的实际不可能性原理,小概率事件在个别试验中实际上是不可能发生的,而现在却发生了,所以不能相信该工厂产品的次品率p1%。