本章内容 第5章
用样本推断总体
本课内容 本节内容 5.1
总体平均数与 方差的估计
议一议阅读下面的报道,回答问题.
议一议
从上述报道可见,北京市统计局进行2012年度
人口调查采用的是什么调查方式?
我们在研究某个总体时,一般用数据表示总体中 每个个体的某种数量特性,所有这些数据组成一个总 体,而样本则是从总体中抽取的部分数据,因此,样 本蕴含着总体的许多信息,这使得我们有可能通过样 本的某些特性去推断总体的相应特性.
从总体中抽取样本,然后通过对样本的分析, 去推断总体的情况,这是统计的基本思想.用样本 平均数、样本方差分别去估计总体平均数、总体 方差就是这一思想的一个体现.实践和理论都表明:
对于简单随机样本,在大多数情况下,当样本容量足够大时,这种估计是合理的.
说一说(1)如何估计某城市所有家庭一年内平均丢弃的塑料 袋个数? (2)在检查甲、乙两种棉花的纤维长度时,如何估计 哪种棉花的纤维长度比较整齐?可以进行简单随机抽样, 然后用样本去推断总体.
由于简单随机样本客观地反映了实际情况, 能够代表总体,因此我们可用简单随机样本的 平均数与方差分别去估计总体的平均数与方差. 例如,我们可以从某城市所有家庭中随机抽取 一部分家庭,统计他们在一年内丢弃的塑料袋 个数,然后求出它们的平均值,再用这个平均 值去估计该城市所有家庭一年内平均丢弃的塑 料袋个数.
同样,我们可以从甲、乙两种棉花中各抽 取一定量的棉花,分别统计它们的纤维长度的 方差,再用这两个方差分别去估计这两种棉花 纤维长度的整齐性,方差小的棉花品种整齐性 较好.
动脑筋
某农科院在某地区选择了自然条件相同的 两个试验区,用相同的管理技术试种甲、乙两 个品种的水稻各100亩.如何确定哪个品种的水 稻在该地区更有推广价值呢?
为了选择合适的稻种,我们需要关心这两种水稻 的平均产量及产量的稳定性(即方差).于是,待水稻 成熟后,各自从这100亩水稻随机抽取10亩水稻,记录 它们的亩产量(样本),数据如下表所示:
种 类 甲 乙 865 870 885 875 886 884
每亩水稻的产量(kg) 876 885 893 886 885 888 870 882 905 890 890 895 895 896
可以求出,这10亩甲、乙品种的水稻的平均产量分 别为:1 x (865 885 886 876 893 885 870 905 890 895 ) =885(kg); 甲 101 x乙 (870 875 884 885 886 888 882 890 895 896) =885.1(kg). 10
由于这10亩水稻是简单随机抽取的,因此可以分别用这 10 亩水稻的平均产量去估计这两
种水稻大面积种植
后的平均产量.
由于在试验区这两种水稻的平均产量相差很小, 从而我们可以估计出大面积种植这两种水稻后的平 均产量也应相差很小,所以,单从平均产量这一角 度来考虑,我们还不能确定哪种水稻更有推广价值. 因此,我们还需考虑这两种水稻产量的稳定性.
利用计算器,我们可计算出这10亩甲、乙品种
水稻产量的方差分别为129.6,59.09.由于59.09<129.6,2 2 即 s乙 s甲 ,因此我们可以估计种植乙种水稻的产
量要比种植甲种水稻的产量稳定.从而我们可以得出: 在该地区,种植乙种水稻更有推广价值.
例 一台机床生产一种直径为40mm的圆柱形零 件,在正常生产时,生产的零件的直径的方差应 不超过0.01.如果超过0.01,则机床应检修调整.下表是某日8:30—9:30及10:00—11:00两个时段 中各随机抽取10个零件量出的直径的数值(单位:mm):8:30—9:30 10:00—11:00 40 40 39.8 40 40.1 39.9 40.2 40 39.8 39.9 40.1 40.2 40.2 40 40.2 40.1 39.8 40 39.8 39.9
试判断在这两个时段内机床生产是否正常.
8:30—9:30 10:00—11:00
4040
39.840
40.139.9
40.240
39.839.9
40.140.2
40.240
40.240.1
39.840
39.839.9
解
在8:30~9:30这段时间内生产的零件中, 随机抽取的10个零件的直径的平均数 x1 、 2 s 方差 1 分别为:
x1 (40 39.8 4 40.1 2 40.2 3) 10 40.2 2 2 2 ( 40 40 )( + 39.8 40 ) 4 + ( 40.1 40 ) 2 + ( 40.2 40 ) 3 = 0.03. s1 = 10 2
8:30—9:3010:00—11:00
40 40
39.8 40
40.1 39.9
40.2 40
39.8 39.9
40.1 40.2
40.2 40
40.2 40.1
39.8 40
39.8 39.9
在10:00~11:00这段时间内生产的零件中, 随机抽取的10个零件的直径的平均数 x2 、 方差 s2 2 分别为:
x2 (5 40 39.9 3 40.2 40.1) 10 40.2 2 2 2 ( 40 40 )( + 39.9 40 ) 4 + ( 40.2 40 ) 2 + ( 40.1 40 ) 3 = 0.008. s2 = 10 2
由于随机抽取的8:30~9:30这段时间内生产的 10个零件的直径的方差为0.03,远远超过0.01的界 限,因此我们可以推断在这段时间内该机床生产 不正常. 类似地,我们可以推断在10:00~11:00这
段时间内该机床生产正常.
练习1. 小明为了估计自己从起床至到达教室所需的平均时间, 他随机记录了自己20天每天从起床至到达教室所需的 时间,得到下表:时间(min) 天数(天) 45 2 46 1 47 1 48 2 49 4 50 5 51 3 52 1 53 1
试据此估计小明从起床至到达教室所需的平均时间.
时间(min)天数(天)
45
46
47
48
49
50
51
52
53
2
1
1
2
4
5
3
1
1
解
t =(45×2+46×1+47×1+48×2+49×4+50×5+51×3+52×1+53×1)÷ 20 = 49.15 (min)
答:小明从起床至到达教室所需的平均时间 为49.15 分钟.