浙大概率论与数理统计课件——数理统计
数 理 统 计1
浙大概率论与数理统计课件——数理统计
第五章 大数定律和中心极限定理关键词: 契比雪夫不等式 大数定律 中心极限定理
浙大概率论与数理统计课件——数理统计
§1 大数定律
背景
本章的大数定律,对第一章中提出的 “频率稳定性”,给出理论上的论证
为了证明大数定理,先介绍一个重要不等式
浙大概率论与数理统计课件——数理统计
定理5.1 ( 契比雪夫不等式 ):设随机变量X 具有数学期望E ( X ) = µ , 方差D ( X ) = σ 2
σ2 则对于任意ε > 0, 都有:P { X E ( X ) ≥ ε } ≤ 2 ε σ2 定理的等价形式为:P { X E ( X ) < ε } ≥ 1 2 ε
证明: ( 仅就X为连续型时证之 ) 设X的概率密度为f ( x ) ,
则 P{ X µ ≥ ε} =f ( x)
x ≥
∫ ε f ( x ) dx µ∫ ∞ ( x µ )σ2 = 2 ε+∞ 2
≤
x ≥
∫ε µ
(x µ)ε2
2
f ( x ) dx
≤ 12
ε
f ( x ) dx
µ ε µ µ +ε
=
D( X )
ε2
浙大概率论与数理统计课件——数理统计
例1:在n重贝努里试验中,若已知每次试验事件A 出现的概率为0.75,试利用契比雪夫不等式估 计n,使A出现的频率在0.74至0.76之间的概率不 小于0.90。解:设在n重贝努里试验中,事件A出现的次数为X, 则X ~ b ( n, 0.75 ) , E ( X ) = np = 0.75n, D ( X ) = npq = 0.1875n, 又 f n ( A) = X n 而P 0.74 < X < 0.76 = P { X 0.75n < 0.01n} n ≥ 1 0.1875n = 1 1875 ≥ 0.90 2 n ( 0.01n )
{
}
n ≥ 18750
浙大概率论与数理统计课件——数理统计
随机变量序列依概率收敛的定义定义5.1 :设随机变量序列X1, X2 , X3 ,L, 若存在某常数µ, 使得 ε > 0, 均有: P{ Xn µ ≥ ε} = 0, lim 则称随机变量序列{ Xn} 依概率收敛于常数µ, p 记为:X µ。 → nn→+∞
浙大概率论与数理统计课件——数理统计
定 理 5 .2 ( 契 比 雪 夫 不 等 式 的 特 殊 情 形 ): 设 随 机 变 量 序 列 X 1 , X 2 ,L , X n ,L 相 互 独 立 , 且 具 有 相 同 的 数 学 期 望 µ 和 相 同 的 方 差 σ 2, 作 前 n个 随 机 变 量 的 算 术 平 均 : Yn = 1 ∑ X k n k =1 则 ε > 0, 有 : 1 n lim P { Y n µ < ε } = lim P ∑ X k µ < ε = 1 n→ ∞ n→ ∞ n k =1 1 n 证明:由于E (Yn ) = E ∑ X k = 1 nµ = µ , n k =1 nn
1 n D (Yn ) = D ∑ X k = 12 n k =1 n
1 nσ 2 = σ 2 ∑ D ( X k ) = n2 n k =1n
1 n σ2 n 由契比雪夫不等式得:P ∑ X k µ < ε ≥ 1 2 ε n k =1
1 n lim P ∑ X k µ < ε = 1 n →∞ n k =1
浙大概率论与数理统计课件——数理统计
定理5.3 (贝努里大数定理 ) 设事件A在每次试验中发生的概率为p,记nA为n次独立重复试验 n 中A发生的次数, 则 ε > 0, 有: P A p < ε = 1 lim n →+∞ n 证明:利用契比雪夫不等式,因nA ~ b ( n, p ) , 故: n E A = 1 E ( nA ) = 1 np = p, D nA = 1 D ( n ) = 1 npq = pq A n n2 n n n n n2 n pq 于是, ε > 0, 有P A p < ε ≥ 1 2 nε n n 即得: P A
p < ε = 1 lim n →+∞ n
大数定律的重要意义: 贝努里大数定律建立了在大量重复独立试验中事件出现频率的稳 定性,正因为这种稳定性,概率的概念才有客观意义,贝努里大 数定律还提供了通过试验来确定事件概率的方法,既然频率nA/n 与概率p有较大偏差的可能性很小,我们便可以通过做试验确定 某事件发生的频率并把它作为相应的概率估计,这种方法即是在 第7章将要介绍的参数估计法,参数估计的重要理论基础之一就 8 是大数定理。
浙大概率论与数理统计课件——数理统计
§2 中心极限定理背景:
有许多随机变量,它们是由大量的相互独立 的随机变量的综合影响所形成的,而其中每 个个别的因素作用都很小,这种随机变量往 往服从或近似服从正态分布,或者说它的极 限分布是正态分布,中心极限定理正是从数 学上论证了这一现象,它在长达两个世纪的 时期内曾是概率论研究的中心课题。
浙大概率论与数理统计课件——数理统计
定理 5.4 ( 独立同分布的中心极限定理 )设随机变量X1 , X 2 ,L , X n ,L 相互独立同分布, E ( X i ) = µ , D ( X i ) = σ , i = 1, 2,L2
思考题:
则前n个变量的和的标准化变量为:Yn =
∑Xi =1
n
i
nµ
nσ
1 n X = ∑ Xi的近似 n i=1 分布是什么?
n X i nµ 2 ∑ x t 1 e 2 dt x ∈ R, 有: lim P (Yn ≤ x ) = lim P i =1 ≤ x = ∫ n →+∞ n →+∞ nσ ∞ 2π 证明略。 此定理表明,当n充分大时,Yn 近似服从N ( 0,1) .
即: ∑ Xi (近似)~N (nµ , nσ 2 ),i=1
n
答案:N ( µ ,
σ2n
)
从而,P (a < ∑ X i ≤ b) ≈ Φ (i =1
n
b nµ a nµ ) Φ( ). nσ nσ
浙大概率论与数理统计课件——数理统计
定理5.5 ( 德莫佛--拉普拉斯定理 )设nA为n次贝努里试验中A发生的次数,P ( A ) = p ( 0 < p < 1) ,2 b t nA np 则对任何区间[ a, b ],有: P a < lim ≤ b = ∫ 1 e 2 dt , n →+∞ a 2π np(1 p )
1 第i次试验时A发生 证明:令X i = 0 第i次试验时A未发生则X1 , X 2 ,L , X n ,L 相互独立同分布,Xi ~ b(1, p ).
P ( a < nA ≤ b ) b np ≈ Φ( ) np(1 p ) Φ ( a np ) np (1 p )
由于nA = X 1 + X 2 + L + X n ,
2 b t nA np 由定理5.4, lim P a < ≤ b = ∫ 1 e 2 dt n →+∞ a 2π np(1 p)
即:n A (近似) ~ N (np, np (1 p )).
浙大概率论与数理统计课件——数理统计
例2:设某种电器元件的寿命服从均值为100小时的指 数分布,现随机取得16只,设它们的寿命是相互 独立的,求这16只元件的寿命的总和大于1920小 时的概率。解:记16只电器元件的寿命分别为X1 , X 2 ,L , X 16 ,则16只电器元件的寿命总和为X = ∑ X i ,2i =1 16
由题设E ( X i ) = 100, D ( X i ) = 100
根据独立同分布的中心极限定理: = X 1600 近似服从N ( 0,1) 4 ×100 400 P ( X > 1920 ) = 1 P ( X ≤ 1920 ) ≈ 1
Φ 1920 1600 400 Y=i =1 i
∑X
16
16 × 100
(
)
= 1 Φ ( 0.8 ) = 0.2119
浙大概率论与数理统计课件——数理统计
例3:某保险公司的老年人寿保险有1万人参加,每人每年交200元, 若老人在该年内死亡,公司付给受益人1万元。设老年人死亡 率为0.017,试求保险公司在一年内这项保险亏本的概率。解:设X为一年中投保老人的死亡数,则X ~ b ( n, p ) , n = 10000, p = 0.017
由德莫佛--拉普拉斯中心极限定理,保险公司亏本的概率为:
P (10000 X > 10000 × 200 ) = P ( X > 200 ) 200 np ≈ 1 Φ np (1 p ) = 1 Φ ( 2.321) ≈ 0.01
思考题: 求保险公司至少 盈利10万元的概率。
答案: 0.93713
浙大概率论与数理统计课件——数理统计
例4:设某工厂有400台同类机器,各台机器发生故障的概 率都是0.02,各台机器工作是相互独立的,试求机 器出故障的台数不小于2的概率。解:设机器出故障的台数为X, 则X ~ b ( 400, 0.02 ),分别用三种方法计算:1. 用二项分布计算
P ( X ≥ 2 ) = 1 P ( X = 0 ) P ( X = 1) = 1 0.98400 400 × 0.02 × 0.98399 = 0.99722. 用泊松分布近似计算
λ = np = 400 × 0.02 = 83. 用正态分布近似计算
查表得
P ( X ≥ 2 ) = 1 P ( X = 0 ) P ( X = 1) ≈ 1 0.000335 0.002684 ≈ 0.9969
npq = 400 × 0.02 × 0.98 = 2.8 1 np P ( X ≥ 2 ) = 1 P ( X ≤ 1) ≈ 1 Φ npq = Φ 7 = 0.9938 2.8
( )
浙大概率论与数理统计课件——数理统计
第六章 数理统计的基本概念关键词: 总 体 个 体 样 本 统 计 量
χ 2 分布t 分布 F 分布
浙大概率论与数理统计课件——数理统计
引言:数理统计学 数理统计学是一门关于数据收集、整理、分析 数理统计学 和推断的科学。在概率论中已经知道,由于大 量的 随机试验中各种结果的出现必然呈现它的 规律 性,因而从理论上讲只要对随机现象进行 足够多次观察,各种结果的规律性一定能清楚 地呈现,但是实际上所允许的观察永远是有限 的,甚至是 少量的。 例如:若规定灯泡寿命低于1000小时者 为次 品,如何确定次品率?由于灯泡寿命试验是 破坏性试验,不可能把整批灯泡逐一检测,只 能抽取一部分灯泡作为样本进行检验,以样本 的信 息来推断总体的信息,这是数理统计学研 究的问题之一。16