10.4 统计案例
考纲点击 1.了解独立性检验(只要求 2×2 列联表)的基本思想、方法 及其简单应用. 2.了解回归分析的基本思想、方法及其简单应用.
说基础课前预习读教材
考点梳理 一、回归分析 1.定义:对具有①__________的两个变量进行统计分析 的一种常用方法. ^ ^ ^ ^ ^ 2.随机误差:线性回归模型用y=bx+a+e表示,其中a和 ^ b为模型的②__________,③__________称为随机误差.
3.样本点的中心 在具有线性相关关系的数据(x1,y1),(x2,y2), (xn,yn) ^ ^ ^ ^ ^ ^ 中,用最小二乘法估计模型y=bx+a+e 中的未知参数a和b, 则 ^ b= ∑ xi- x yi- y i=1 ∑ xi- x 2 i=1n n
^ ^ a= y -b x
其 中 x = ④ ________________ , y = ⑤ __________________⑥________称为样本点的中心.
4.相关系数 (1)r= ∑ xi- x yi- y i=1n 2 ∑ xi- x i∑ =1 i=1 n n
yi- y
2
.
(2)当 r>0 时,表明两个变量⑦__________; 当 r<0 时,表明两个变量⑧__________. r 的绝对值越接近于 1,表明两个变量的线性相关性⑨ __________.r 的绝对值越接近于 0 时,表明两个变量之间⑩ ________________________.通常|r|大于 ______时, 认为两个 变量有很强的线性相关性.
二、独立性检验 1.分类变量的定义 如果某种变量的不同“值”表示个体所属的不同类型,像 这样的变量称为 __________.
2.2×2 列联表 假设有两个分类变量 X 和 Y,它们的值域分别为{x1,x2} 和{y1,y2},其样本频数列联表(称为 2×2 列联表)为 y1 y2 总计 x1 a b ______ x2 c d ______ 总计 a+c b+d n=a+b+c+d n ad-bc 2 K2= ,用它的大小可以决定是否 a+b c+d a+c b+d 拒绝原来的统计假设 H0,如果 K2 值较大,就拒绝 H0,即拒绝 事件 A 与 B __________.
答案:①相关关系
②未知参数
③e
1 ④n(x1+x2+ +
1 xn) ⑤ n (y1 +y2 + +yn) ⑥( x , y ) ⑦正相关 ⑧负相关 ⑨越强 ⑩几乎不存在线性相关关系 0.75 分类变量 a+b c+d 无关
考点自测 1.相关系数是度量( ) A.两个变量之间直线关系的强弱程度 B.散点图是否显示有意义的模型 C.两个变量之间是否存在因果关系 D.两个变量之间是否存在关系
解析:相关系数是度量两个变量之间直线关系的强弱程度 的. 答案:A
2.在吸烟与患肺癌这两个分类变量的计算中,下列说法 正确的是( ) A.若 K2 的观测值为 k=6.635,我们有 99%的把握认为吸 烟与患肺癌有关系,那么在 100 个吸烟的人中必有 99 人患有 肺癌 B.从独立性检验可知有 99%的把握认为吸烟与患肺癌有 关系时,我们说某人吸烟,那么他有 99%的可能患有肺癌 C.若从统计量中求出
有 95%的把握认为吸烟与患肺癌有 关系,是指有 5%的可能性使得推断出现错误 D.以上三种说法都不正确
解析:因为统计结果只是说明事件发生的概率大小,具体 到一个个体不一定发生. 答案:C
3.甲、乙、丙、丁四位同学各自对 A、B 两变量的线性相 关性作试验,并用回归分析方法分别求得相关系数 r 与残差平 方和 m 如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 则哪位同学的试验结果体现 A、B 两变量更强的线性相关 性?( ) A. 甲 B. 乙 C. 丙 D. 丁
解析:由表可知,丁同学的相关系数 r 最大且残差平方和 m 最小,故丁同学的试验结果体现 A、B 两变量更强的线性相 关性. 答案:D
4.分析两个分类变量之间是否有关系的常用方法有 ________________ ; 独 立 性 检 验 的 基 本 思 想 类 似 于 __________.
解析:频率比较法,图形分析法,独立性检验;反证法. 答案:频率比较法、图形分析法、独立性检验 反证法
5.在独立性检验中,选用 K2 统计量,用其取值大小来推 断独立性是否成立, K2 满足条件__________时, 当 我们有 99% 的把握说事件 A 与 B 有关.
解析:由独立性检验判断表得 K2>6.635. 答案:K2>6.635