第二章 统 计
2.1 随机抽样 2.1.1 简单随机抽样
问题提出
1 5730 p 2
t
我们生活在一个数字化时代,时刻 都在和数据打交道,例如,产品的合格 率,农作物的产量,商品的销售量,电 视台的收视率等.这些数据常常是通过 抽样调查而获得的,如何从总体中抽取 具有代表性的样本,是我们需要研究的 课题.
思考 :要判断一锅汤的味道需要把整 锅汤都喝完吗?应该怎样判断? 将锅里的汤“搅拌均匀”,品尝 一小勺就知道汤的味道,这是一个简 单随机抽样问题,对这种抽样方法, 我们从理论上作些分析.
知识探究(一):简单随机抽样的基本思想
思考1:从5件产品中任意抽取一件,则 每一件产品被抽到的概率是 1/5 一般 地,从N个个体中任意抽取一个,则每 1/n 一个个体被抽到的概率是______思考2:从6件产品中随机抽取一个容量 三 为3的样本,可以分___次进行,每次从 一 不放回 中随机抽取___件,抽取的产品_____, 这叫做逐个不放回抽取.在这个抽样中, 1/3 某一件产品被抽到的概率是____
思考3一般地,从N(总体容量)个个体中 随机抽取n(样本容量)个个体作为样本, 则每一个个体被抽到的概率_______ n/N 思考4:食品卫生工作人员,要对校园食 品店的一批小包装饼干进行卫生达标检 验,打算从中抽取一定数量的饼干作为 检验的样本.其抽样方法是: 将这批小包装饼干放在一个麻袋中搅 拌均匀,然后逐个不放回抽取若干包, 这种抽样方法就是简单随机抽样.
简单的随机抽样的含义一般地,设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样 本(n≤N), 如果每次抽取时总体内 的各个个体被抽到的机会都相等,则 这种抽样方法叫做简单随机抽样.抽取 的样本叫随机样本。
小结: 简单随机抽样的主要特点 (1)总体的个体数有限; (2)样本的抽取是逐个进行的,每次 只抽取一个个体; (3)抽取的样本不放回,样本中无重 复个体; (4)每个个体被抽到的机会都相等, 抽样具有公平性.
知识探究(二):简单随机抽样的方法
思考1:假设要在我们班选派5个人去参 加某项活动,为了体现选派的公平性, 你有什么办法确定具体人选?思考2:用抽签法(抓阄法)确定人选, 具体如何操作? 用小纸条把每个同学的学号写下来 放在盒子里,并搅拌均匀,然后随机从 中逐个抽出5个学号,被抽到学号的同学 即为参加活动的人选.
抽签法抽样的操作步骤如下: 第一步,将总体中的所有个体编号,并 把号码写在形状、大小相同的号签上. 第二步,将号签放在一个容器中,并搅 拌均匀. 第三步,每次从中抽取一个号
签,连续 抽取n次,就得到一个容量为n的样本.
思考4:你认为抽签法有哪些优点和缺 点?优点:简单易行,当总体个数不多的时 候搅拌均匀很容易,个体有均等的机会 被抽中,从而能保证样本的代表性.
缺点:当总体个数较多时很难搅拌均匀, 产生的样本代表性差的可能性很大.
随机数表:从0,1,2, ,9十个数中 每次随机抽取一个数,每个数每次被抽 1/10 取的概率是____ ,依次排列成一个数表 称为随机数表(见教材P103页), 思考6:假设我们要考察某公司生产的 500克袋装牛奶的质量是否达标,现从 800袋牛奶中抽取60袋进行检验,利用 随机数表抽取样本时应如何操作?
第一步,将800袋牛奶编号为001,002, , 799. 第二步,在随机数表中任选一个数作为起始 数(例如选出第8行第7列的数7为起始数). 第三步,从选定的数7开始依次向右读(读数 的方向也可以是向左、向上、向下等),将 编号范围内的数取出,编号范围外的数去掉, 直到取满60个号码为止,就得到一个容量为 60的样本.
样本: 785 ,567, 199,507,
随机数表法抽样的步骤 第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为 起始数. 第三步,从选定的数开始依次向右(向 左、向上、向下)读,将编号范围内的 数取出,编号范围外的数去掉,直到取 满n个号码为止,就得到一个容量为n的 样本.
练习1:为了检验某种产品的质量,决定从 40件产品中抽取10件进行检查,试利用简单 随机抽样法抽取样本,并简述其抽样过程.
方法一:抽签法;1:将总体中的所有个体编号,并把号码写在形 状,大小相同的号签上. 2:将号签放在一个容器中,并搅拌均匀. 3:每次从中抽取一个号签,连续抽取10次,就 得到一个容量为10的样本.
方法二:随机数表法
1:将总体中的所有个体编号:00,01, ,39.2:在随机数表中任选一个数作为起始数. 3:从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范 围外的数去掉,直到取满10个号码为止,就 得到一个容量为n的样本.
练习2: 利用随机数表法从500件产品 中抽取40件进行质检. (1)这500件产品可以怎样编号? (2)如果从随机数表第10行第8列的数 开始往左读数,则最先抽取的5件产品 的编号依次是什么?编号:000,001,002, ,499. 样本: ,100, ,155, 236, 206, 243,
思考:在1936年美国总统选举前,一份颇有名气
的杂志的工作人员对兰顿和罗斯福两位候选人做 了一次民意测验.调查者通过电话簿和车辆登记簿 上的名单给一大批人发了调查表.调查结果表明, 兰顿当选的可能性大(57%)
,但实际选举结果正 好相反,最后罗斯福当选(62%).你认为预测结 果出错的原因是什么? 思考 1:这里抽取样本的方法是不是简单的随机抽样? 2:这里的样本是不是方便样本(容易得到的样本) 3:这样的样本代表哪些个体? 原因:样本来自少数富人,不能代表全体选民。 即样本的代表性差。
小结:抽签法与随机数表的异同点相同点: 1 都是简单的随机抽样; 2 都要求被抽总体中的个体数有限; 3 都是逐个地进行抽取; 4 都是不放回抽样; 5 每个个体被抽到的可能性相同,具有公平 性。
不同点: 1 抽签法相对于随机数表法简单; 2 抽签法适用于总体中的个体数较少的情况, 随机数表法适用于总体中的个体数较多的情况;
作业: P57练习:1,2,3,4.