青岛大学研究生医学统计学
第六章 假设检验基础第一节 第二节 第三节 第四节 第五节2011年12月15日星期四
假设检验的概念与原理 检验( test) t检验(t test) 二项分布与Poission Poission分布 二项分布与Poission分布 资料的Z 资料的Z(U)检验 假设检验与区间估计的关系 假设检验的功效青岛大学医学院公共卫生系流行病与卫生 统计学教研室 周晓彬制作
青岛大学研究生医学统计学
第一节 假设检验的概念与原理一、假设检验的思维逻辑 二、假设检验的基本步骤
2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
一、假设检验的思维逻辑样本统计量与总体参数间(或统计量与统计 样本统计量与总体参数间( 量间的)的差异产生的原因: 量间的)的差异产生的原因: 个体变异所导致的抽样误差所引起; 1. 个体变异所导致的抽样误差所引起; 2. 总体间确实有差异 用来判断差别由哪一种情况引起的数理统计 方法,就是假设检验(又称显著性检验) 方法,就是假设检验(又称显著性检验) hypothesis)。 (test of hypothesis)。2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
二、假设检验的基本步骤1、建立假设与确定检验水准(α) 建立假设与确定检验水准( H0: μ1=μ2 无效假设(null hypothesis) 无效假设( hypothesis) H1: μ1≠μ2 备择假设(alternative hypothesis) 备择假设( hypothesis) 检验水准(level of a test):α=0.05(双侧) 检验水准( test):α=0.05(双侧 ):α=0.05(双侧) 选则假设检验方法和计算统计量: 2、选则假设检验方法和计算统计量: 根据统计推断目的、设计类型、资料组数、 根据统计推断目的、设计类型、资料组数、样本含量等 选择方法。 检验、 选择方法。如两组小样本均数比较用t检验、大样本均数比 检验、 检验等。 较Z检验、2个样本方差齐性检验用F检验等。 确定P 3、确定P值, P≤α(0.05) 样本差别有统计学意义; 样本差别有统计学意义; P >α(0.05) 样本差别无统计学意义 4、作出判断2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
第二节 t检验(t test) 检验( test)一、一组样本资料比较的t检验 一组样本资料比较的t 样本均数与总体均数的比较) (样本均数与总体均数的比较) 配对设计资料的t 二、配对设计资料的t检验 三、两组独立样本的t检验 两组独立样本的t 四、大样本均数比较的Z检验 五、两组独立样本资料的方差齐性检验 六 成组设计的两样本几何均数比较的t检验 成组设计的两样本几何均数比较的t
2011年12月15日星期四
青岛大学医学院公共卫生
系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
一、一组样本资料比较的t检验 一组样本资料比较的t 样本均数与总体均数的比较) (样本均数与总体均数的比较)推断样本所代表的未知总体均数µ与已知总体均数µ 推断样本所代表的未知总体均数µ与已知总体均数µ0 有无差别。 有无差别。 已知总体均数µ 一般为理论值、 已知总体均数µ0一般为理论值、标准值或经大量 观察所得的稳定值。 观察所得的稳定值。 的计算公式: 统计量t的计算公式:
| X µ0 | | X µ0 | t= = , ν = n 1 SX S n2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
实例n=35, =3.42, =0.40, 难产儿出生体重 n=35, X =3.42, S =0.40, =3.30(大规模调查获得) 问相同否? ,问相同否 一般婴儿出生体重 µ 0 =3.30(大规模调查获得) 问相同否? , 1.建立假设 确定检验水准α 建立假设、 1.建立假设、确定检验水准α 无效假设, hypothesis) H0: µ = µ 0 (无效假设,null hypothesis) 备择假设,alternative hypothesis, ) H1: µ ≠ µ 0 (备择假设,alternative hypothesis, 双侧检验,检验水准: 双侧检验,检验水准:α=0.05 2.计算检验统计量 2.计算检验统计量t= 3.42 3.30 0.40 / 35 = 1.77 ,
ν = n 1 = 35 1 = 34
3.查相应界值表, 3.查相应界值表,确定 P 值, 查相应界值表 >0.05, 查附表 2, t 0.05 / 2, 34 = 2.032 , t < t 0.05 / 2, 34 ,P >0.05, 水准, 按α=0.05 水准,不拒绝 H0,两者的差别无统计学意义 H0, 4.作出结论。在а=0.05 的水准上不能拒绝 H0,还不能认为难产 作出结论。青岛大学医学院公共卫生系流行病与 儿的出生体重高于一般婴儿。 儿的出生体重高于一般婴儿。 2011年12月15日星期四 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
不小于一般 如果有理由认为难产儿出生体重的总体均数 一定 不小于一般 婴儿,则可用单侧检验 one-sided) 单侧检验( 婴儿,则可用单侧检验(one-sided) 即: , 难产儿出生体重的总体均数与一般婴儿相等) H0: µ = 3.30 (难产儿出生体重的总体均数与一般婴儿相等) 难产儿出生体重的总体均数大于一般婴儿) H1: µ > 3.30 (难产儿出生体重的总体均数大于一般婴儿) 单侧检验, 检验水准: 单侧检验, 检验水准:α=0.05 0.05, 查附表 2 单侧 t 界值 t 0.05,34 = 1.691 , t = 1.77 > t 0.05, 34 ,P < 0.05, 水准, 按α=0.05 水准,拒绝 H0,接受 H1,两者的差别有统计 学 意 义, 难产儿平均出生体重大于一般婴儿。 难产儿平均出生体重大于一般婴儿。 以上双侧检验和单侧检验的结论截然不同。 以上双侧检验和单侧检验的结论截然不同。所以选择单侧检验 一定要有过硬的专业
依据 而且在发表论文时要特别注明。 专业依据, 一定要有过硬的专业依据,而且在发表论文时要特别注明。一般情 双侧检验( 况都一律采用双侧检验 two-sided 。 况都一律采用双侧检验(two-sided)
2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
配对设计资料的t 二、配对设计资料的t检验两种情况: 两种情况: 1.随机配对设计 随机配对设计(randomized design)是 1.随机配对设计(randomized paired design)是 将受试对象按某些混杂因素(如性别、年龄、窝 将受试对象按某些混杂因素(如性别、年龄、 别等)配成对子, 别等)配成对子,每对中的两个个体随机分配给 两种处理(如处理组与对照组); 两种处理(如处理组与对照组); 2.或者同一受试对象作两次不同的处理 或者同一受试对象作两次不同的处理( 2.或者同一受试对象作两次不同的处理(自身对 照) 。 优点:配对设计减少了个体差异。 优点:配对设计减少了个体差异。 特点:资料成对,每对数据不可拆分。 特点:资料成对,每对数据不可拆分。2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
实例用药前后患儿血清中免疫球蛋白IgG(mg/dl) 用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量 IgG(mg/dl)含量 序号 用药前 用药后 1 1206.44 1678.44 2 921.69 1293.36 3 1294.08 1711.66 4 945.36 1416.70 5 721.36 1204.55 6 692.32 1147.30 7 980.01 1379.59 8 691.01 1091.46 9 910.39 1360.34 10 568.56 1091.83 11 1105.52 1728.03 12 757.43 1398.86 差值( 差值(后-前) 472.00 371.67 417.58 471.34 483.19 454.97 399.58 400.45 449.95 523.27 622.51 641.44
2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
1.建立假设、确定检验水准α 1.建立假设、确定检验水准α 建立假设 H0: µ d = 0 H1: µ d ≠ 0 (双侧检验)α=0.05 双侧检验) 2.计算检验统计量 2.计算检验统计量
d = 5707.95 12 = 475.66 , ∑ d = 5707.95 , ∑ d 2 = 2793182.166 , d 2 (∑ d ) 2 / n ∑ Sd = = 84.2747 n 1 |d | 475.66 t= = = 19.532, ν = n 1 = 12 1 = 11 S d / n 84.2747 / 123.查相应界值表, 3.查相应界值表,确定 P 值。 查相应界值表 0.05, 查表 t 0.05 / 2 ,11 = 2.201 , t t 0.05 / 2 ,11 ,P <0.05,拒绝 H0,差别有统计学意 义。 作出结论。 水准上 增高。 4.作出结论。在α=0.05 水准上,可以认为用药后小儿 IgG 增高。2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
两组独立样本的t 三、两组独立样本的t检验完全随机设计(completely 完全随机设计(completely random design) : 把受试对象完全随机
分为两组(或从2 把受试对象完全随机分为两组(或从2个总体 中分别随机抽取一定数量的受试对象), ),分别 中分别随机抽取一定数量的受试对象),分别 给予不同处理,然后比较独立的两组样本均数。 给予不同处理,然后比较独立的两组样本均数。 各组对象数不必严格相同。 各组对象数不必严格相同。 目的:比较两总体均数是否相同。 目的:比较两总体均数是否相同。 条件:假定资料来自正态总体, 条件:假定资料来自正态总体,σ12=σ22
2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
X1 - X2 t= , S X 1- X 2
ν = n1 - 1 + n2 - 1 = n1 + n2 - 2
S X 1-X 22
1 1 = Sc ( + ) n1 n222 2 2
X 1 - (∑ 1 )2 / n1 + ∑ 2 - (∑ 2 )2 / n2 ( n1 - 1) S1 + ( n2 - 1) S2 X X X 2 ∑ Sc = = n1 - 1 + n2 - 1 n1 + n2 - 2
2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
实例白血病组 ( X 1 ) :12.3 13.2 13.7 15.2 15.4 15.8 16.9 正常组 ( X 2 ) : 10.8 11.6 12.3 12.7 13.5 13.5 14.8 平均含量(mg/g)是否不同? 问正常鼠和白血病鼠脾脏中 DNA 平均含量(mg/g)是否不同? 本例: =14.64 4.64, 1.62, =12.74 2.74, 1.33 本例: n1 =7, X 1 =14.64, S 1 =1.62, n2 =7, X 2 =12.74, S 2 =1.33 1.建立假设、 1.建立假设、确定检验水准α。 建立假设
H0: µ 12
= µ2
H1: µ 1
≠ µ2
α=0.05
2.计算检验统计量。 2.计算检验统计量。 计算检验统计量
t=
(7 1) ×1.622 + (7 1) ×1.332 Sc = = 2.20 7+7 2 | X1 X 2 | |14.64 12.74 | = = 2.39 ,ν = 7 + 7 2 = 12 1 1 1 2 1 Sc ( + ) 2.20 × ( + ) n1 n2 7 73.查相应界值,确定 P 值。 3.查相应界值, 查相应界值 0.05, 查表 t 0.05 / 2,12 = 2.179 , t > t0.05/ 2,12 ,P < 0.05,拒绝 H0,差别有统计学意义 含量不同。 4.作出结论。在α=0.05 的水准上正常鼠和白血病鼠脾脏中 DNA 含量不同。 作出结论。2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
方差不齐时Satterthwaite 方差不齐时Satterthwaite近似法 Satterthwaite近似法 (t’检验 )Satterthwaite 法(1946)对自由度校正。 最终结果查附表 2 的 t 界值表。
t'=
X
1
X
2
S 12 S 22 + n1 n2
t = t'
S 12 S 22 2 ( + ) 2 2 (S X1 + S X 2 )2 n1 n2 ν = = 4 4 SX1 SX2 S 12 2 S 22 2 ( ) ( ) + n1 n2 n1 1 n 2 1 + n1 1 n2 1
2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
青岛大学研究生医学统计学
实例为探讨硫酸氧钒对糖尿病性白内障的防治作 研究人员将已诱导糖尿病模型的20 20只大 用,研究人员将已诱导糖尿病模型的20只大 鼠随机分为两组。一组用硫酸氧钒治疗( 鼠随机分为两组。一组用硫
酸氧钒治疗(DV ),另一组作对照观察 另一组作对照观察( ),12 12周后 组),另一组作对照观察(D组),12周后 测大鼠血糖含量(mmol/L),结果为 DV组 结果为, 测大鼠血糖含量(mmol/L),结果为,DV组12 样本均数为6.5 只,样本均数为6.5 mmol/L ,标准差为 样本均数为13.7 1.34 mmol/L ;D组8只,样本均数为13.7 标准差为4.21 mmol/L ,标准差为4.21 mmol/L 。问两组 动物血糖含量的差别有无统计学意义? 动物血糖含量的差别有无统计学意义?2011年12月15日星期四
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作