第 5 章 抽样与参数估计
5-1
第 5 章 抽样与参数估计5.1 5.2 5.3 5.4 5.5 抽样与抽样分布 参数估计的基本方法 总体均值的区间估计 总体均值的区间估计 总体比例的区间估计 总体比例的区间估计 样本容量的确定
5-2
学习目标1. 2. 3. 4. 5. 6.5-3
理解抽样方法与抽样分布 估计量与估计值的概念 点估计与区间估计的区别 总体均值的区间估计方法 总体比例的区间估计方法 样本容量的确定方法
参数估计在统计方法中的地位
统计方法描述统计 推断统计
参数估计5-4
假设检验
5.1 抽样与 抽样分布一. 什么是抽样推断 二. 概率抽样方法 三. 抽样分布
5-5
统计推断的过程总体
样 本
样本统计量 例如:样本均 值、比例、方 差
5-6
抽样方法
5-7
抽样方法抽样方式概率抽样 非概率抽样
简单随机抽样 整群抽样 多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
5-8
概率抽样(probability sampling) sampling)1. 也称随机抽样 2. 特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会 被抽中
每个单位被抽中的概率是已知的, 每个单位被抽中的概率是已知的, 或是可以计算出来的 当用样本对总体目标量进行估计时 ,要考虑到每个样本单位被抽中的 概率5-9
简单随机抽样(simple random sampling) sampling)1. 从总体 N 个单位中随机地抽取 n 个单位作为样本 从总体N 个单位中随机地抽取n ,每个单位入抽样本的概率是相等的 2. 最基本的抽样方法,是其它抽样方法的基础 最基本的抽样方法, 3. 特点简单、直观,在抽样框完整时, 简单、直观,在抽样框完整时,可直接从中抽取样 本 用样本统计量对目标量进行估计比较方便
4. 局限性当N很大时,不易构造抽样框 很大时, 抽出的单位很分散, 抽出的单位很分散,给实施调查增加了困难 没有利用其它辅助信息以提高估计的效率
5 - 10
分层抽样(stratified sampling) sampling) 1. 将抽样单位按某种特征或某种规则划分为 不同的层,然后从不同的层中独立、 不同的层,然后从不同的层中独立、随机 地抽取样本 2. 优点保证样本的结构与总体的结构比较相近, 保证样本的结构与总体的结构比较相近,从 而提高估计的精度 组织实施调查方便 既可以对总体参数进行估计, 既可以对总体参数进行估计,也可以对各层 的目标量进行估计
5 - 11
整群抽样(cluster sampling) sampling) 1. 将总体中若干个单位合并为组(群),抽样时 将总体中若干个单位合并为组( ),抽样时 直接抽取群, 直接抽取群,然后对中选群中的所有单位 全部实施调查 2. 特点抽样时只需群的抽样框, 抽样时
只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用, 调查的地点相对集中,节省调查费用,方便 调查的实施 缺点是估计的精度较差5 - 12
系统抽样(systematic sampling) sampling) 1. 将总体中的所有单位 ( 抽样单位 ) 按一定顺 将总体中的所有单位( 抽样单位) 序排列, 序排列,在规定的范围内随机地抽取一个 单位作为初始单位, 单位作为初始单位,然后按事先规定好的 规则确定其它样本单位先从数字1 先从数字 1 到 k 之间随机抽取一个数字 r 作为 之间随机抽取一个数字r 初始单位,以后依次取r+k,r+2 初始单位,以后依次取r+k,r+2k…等单位
2. 优点:操作简便,可提高估计的精度 优点:操作简便, 3. 缺点:对估计量方差的估计比较困难5 - 13
抽样分布
5 - 14
抽样分布(sampling distribution) distribution)1. 在重复选取容量为n的样本时,由每一个样本算 在重复选取容量为n 出的该统计量数值的相对频数分布或概率分布 2. 是一种理论分布 3. 随机变量是 样本统计量样本均值, 样本均值, 样本比例,样本方差等
4. 结果来自容量相同的所有可能样本 结果来自容量相同的所有可能样本 5. 提供了样本统计量长远我们稳定的信息,是进 行推断的理论基础,也是抽样推断科学性的重 要依据5 - 15
抽样分布(sampling distribution) distribution)总 体
样 本 5 - 16
计算样本统计 量 例如:样本均 值、比例、方 差