第四节
变量间的相关关系
统计案例
基础盘查一(一)循纲忆知
变量的相关关系
1.会作两个有关联变量的数据的散点图,会利用散点图认识变 量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公 式建立线性回归方程.
3.了解回归分析的基本思想、方法及其简单应用.
(二)小题查验1.判断正误(1)相关关系与函数关系都是一种确定性的关系,也是一种因果 关系 (× )
(2)利用样本点的散点图可以直观判断两个变量的关系是否可以 用线性关系去表示 (√ )
(3)通过回归方程^ y =^ b x+^ a 可以估计和观测变量的取值和变化趋 势 (√ )
(4)任何一组数据都对应着一个回归直线方程
( × )
2.(人教 A 版教材例题改编)从某大学中随机选取 8 名女大学生 其身高和体重数据如表: 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61^
43
59
y=0.849x-85.712 则女大学生的身高预测体重的回归方程为__________________.
3.已知 x,y 之间的一组数据如下表: x 2 3 4 5 6 y 3 4 6 8 9 对于表中数据,现给出如下拟合直线:①y=x+1;②y= 8 2 3 2x-1;③y=5x-5;④y=2x.则根据最小二乘法的思想求
③ 填序号). 得拟合程度最好的直线是____(
解析:由题意知 x =4, y =6,∴^ b=^-
∑ =1 i
5
xi-x yi- y 2 ∑ x - x i i=1 5-
-
-
8 = , 5
- ^ 2 8 2 ^ ∴a= y- b x=- ,∴y= x- ,∴填③. 5 5 5
基础盘查二(一)循纲忆知
独立性检验
了解独立性检验(只要求 2×2 列联表)的基本思想、方法及 其简单应用.(二)小题查验
1.判断正误(1)事件 X,Y 关系越密切,则由观测数据计算得到的 K2 的 观测值越大2 n ab - cd (2)K2= a+b a+d a+c b+d
( √ )( × )
2.(人教 A 版教材习题改编)为研究吸烟是否对患肺癌有影响,某 肿瘤研究所随机地调查了 9 965 人,得出如下结果(单位:人): 不患肺癌 不吸烟 吸烟 总计 7 775 2 099 9 874 患肺癌 42 49 91 总计 7 817 2 148 9 965
有关 填“有关”或“无关”) 则患肺癌与吸烟______(
3.某班主任对全班 30 名男生进行了作业量多少的调查,数据如 下表: 认为作业多 认为作业不多 喜欢玩电脑游戏 不喜欢玩电脑游戏 总计 12 2 14 8 8 16 总计 20 10 30
该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关
0.050 . 系,则这种推断犯错误的概率不超过________2 30 × 12 × 8 - 2 × 8 解析: 计算得 K2 的观测值为 k= ≈4.286 14×16×20×10
>3.841,则推断犯错误的概率不超过 0.050.
考点一
相关关系的判断 (基础送分型考点——自主练透)
[必备知识](1) 如果散点图中点的分布从整体上看大致
在一条直线的附 近,我们说变量 x 和 y 具有线性相关关系.(2)相关系数 r= ,当 r>0 时,两变量 2 2 2 2 ∑ x i -nx ∑yi -ny = =n-
∑ xiyi-nxy =i 1 n i 1
n
--
-
i 1
正相关,当 r<0 时,两变量负相关,当|r|≤1 且|r|越接近于 1,相关 程度越高,当|r|≤1 且|r|越接近于 0,相关程度越低.
[题组练透] 1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是 ( )
A.r2<r4<0<r3<r1 C.r4<r2<0<r3<r1
B.r4<r2<0<r1<r3 D.r2<r4<0<r1<r3
解析:易知题中图 (1)与图 (3)是正相关,图 (2)与图(4)是负 相关,且图 (1)与图 (2)中的样本点集中分布在一条直线附 近,则 r2<r4<0<r3<r1.
答案:A
2. 四名同学根据各自的样本数据研究变量 x, y 之间的相关关系, 并求得回归直线方程,分别得到以下四个结论: ①y 与 x 负相关且y=2.347x-6.423; ②y 与 x 负相关且y=-3.476x+5.648; ③y 与 x 正相关且y=5.437x+8.493; ④y 与 x 正相关且y=-4.326x-4.578. 其中一定不正确的结论的序号是 A.①② C.③④ B.②③ D.①④ ( )^ ^ ^ ^
解析:正相关指的是 y 随 x 的增大而增大,负相关指的是 y 随 x 的增大而减小,故不正确的为①④,故选 D.
答案:D
[类题通法]相关关系的直观判断方法就是作出散点图,若散点图呈带 状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线 型也是有相关性,若呈图形区域且分布较乱则不具备相关性.
考点二
回归方程的求法及回归分析 (重点保分型考点——师生共研)
[必备知识]回归方程的求法求回归方程的方法是最小二乘法,即使得样本数据的点到 回归直线的距离的平方和最小.
若变量 x 与 y 具有线性相关关系,有 n 个样本数据(xi,yi)(i
xi-x yi- y =1,2, ,n),则回归方程^ y =^ b x+^ a 中^ b=i= 1
n
-
=
xi-x 2i= 1
n
-
i=1
xiyi-nxy- 2 xi -nx2 i=1
n
--
n
n n - - - 1 1 ^ - ^ ,a = y - b x.其中x=n xi,y=n yi,(x,y)称为样 i=1 i=1- -
本点的中心.
[提醒]
回归直线^ y =^ b x+^ a 必过样本点的中心 (- x ,- y ),
这个结论既是检验所求回归直线方程是否准确的依据,也是求 参数的一个依据.
[典题例析]
(2014· 新课标全国卷Ⅱ)某地区 2007 年至 2013 年农村居民家庭 人均纯收入 y(单位:千元)的数据如下表: 年份 年份代号 t 人均纯收入 y 2007 2008 2009 2010 2011 2012 2013 1 2.9 2 3.3 3 3.6 4 4.4 5 4.8 6 5.2 7 5.9
(1)求 y 关于 t 的线性回归方程;
(2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区 …… 此处隐藏:733字,全部文档内容请下载后查看。喜欢就下载吧 ……