spss
第14卷第4期长沙民政职业技术学院学报
Vol114No14回归模型异方差性的检验与消除研究
———以SPSS为分析工具
郁 菁
(重庆城市管理职业学院,重庆市 400055)
[摘 要] 在经济研究中,异方差性的存在给回归模型带来了严重的后果,而传统的检验和消除方法非常复杂。文
中用SPSS为分析工具,使回归模型异方差性检验和消除的方法更加简单化。
[关键词] 异方差性;加权最小二乘法;SPSS
[中图分类号] C81 [文章标识码] A [文章编号] 1671-5136(2007)04-0034-03
一、异方差性检验的必要性
的普遍规律。定的因果关系,关的经济政策,。要认识和掌握客观经济规律就必须探求经济现象间经济变量的变化规律,回归分析是处理随机变量之间的相关关系的一种统计方法。即研究一个被解释变量
(又称因变量)与一个或多个解释变量(又称自变量)之间的统计关系。
传统的多元线性回归模型中
βββεi (i=1,2,…,n)yi=β0+1x1i+2x2i+…+kxki+总是存在基本假设:解释变量为非随机变量且彼
此间互不相关(实际上我们一般只要求解释变量间不存在完全共线性),样本容量多于参数个数,随机误差项与解释变量之间不相关,随机误差项相互独立且服从期望为零、标准差为σ的正态分布即随机误差项具有0均值和同方差的特性(E(εi)=0 Var(εi)=σ2)。在这些基本假设下,我们可以用最小二乘估计(OLSE)法估计出回归模型中的回归参数,得到BLUE(最优线性无偏)估计量。
,导致随机误
,。当我们所研究的问,引起随机误差项产生异方差的原因很多,其中样本数据为截面数据时较容易出现异方差性。而当一个回归问题存在异方差性时,如果仍用OLSE估计未知参数,就会造成估计值不是最优、参数的显著性检验失效、回归方程的应用效果极不理想等严重后果。 二、异方差性检验和消除的理论基础
对异方差检验的方法有很多,如残差图分析法、等级相关系数法、格莱斯尔检验等等,尽管检验方法不同,但都有一个共同原理:都是设法检验εi的方差与解释变量xj的相关性,通过εi的估计量来实现这些检验,如果εi与某一xj之间存在相关性,则模型存在异方差性。本文采用残差图和等级相关系数法进行异方差性检验。
既然异方差问题的出现对回归模型有严重的影响,就必须对建立的回归模型进行补救。本文用最常用的加权最小二乘法(WLS)消除异方差性。其基本原理是:
βεi (i=对于一元线性回归模型 yi=β0+1xi+1,2,…,n)
但在建立实际经济问题的回归模型时,经常存在与这些假设相违背的情况,我们通常说的异方差性就
是其中之一(Var(εi)≠Var(εj),当i≠j时)。经济现象是错综复杂的,在建立经济问题的回归分析模型时,经常会出现某一因素或一些因素随着解释变量观测值
σe(εVar(εεii)=0 i)=
2
σ2 其中Var(εi)=σ存在异方差性,εi=f(xi)
如果已知εi的方差与解释变量某种函数成比例,即
2
则用
f(xi)去除一元线性回归模型的各项,得
[收稿日期] 2007-06-15 [作者简介] 郁 菁(1975-),女,重庆大学经济与工商管理学院技术经济与管理专业2005级研究生、重庆城市管理
职业学院工商管理系讲师,从事统计学教育、管理方法研究。
spss
第4期 郁 菁:回归模型异方差性的检验与消除研究35
yif(xi)
β0
f(xi)
+
)=
β1xi
f(xi)
εi
f(xi)
21分析结果
(1)参数估计及异方差性检验
于是Varεi
f(xi)
Var(εi)2
=σ 实现了同方
f(xi)
运行SPSS,依次点击Analyze→Regression→Line2ar,将人均食品消费支出选为Dependent,人均纯收入选为Independent,依次点击Statistics(estimates、durbin—Watson、casewisediagnotics—allcases、Modelfit)、Plots(将Zresid选为Y轴,Zpred选为X轴,Normalprobabilityplot),其余采用默认方式,单击确定,得到
差性,模型得到了补救。
这里。
f(xi)
(宋廷山李杰2007)在实际应用WLS时,经常使
用自变量的幂函数的倒数形式作为权数对原模型进行
加权:ωi=m
xi
m究竟取何值,可以利用SPSS的权数估计功能计
如下输出结果
表2 方差分析表
算出来。最后得到经过加权最小二乘法处理的消除了
异方差性的回归模型。
从上面的分析可以看出,回归模型异方差性的检验和消除方法非常复杂,而用SPSS计算方法的目的,济研究中,SPSS。
三、利用SPSS工具进行回归模型异方差性研究
11数据收集:本文用2005年全国各地区农村居
()(残差)SumofSquares(平方表3 回归方程系数表
民家庭人均纯收入和各地区农村居民人均食品消费支出的数据进行分析。
表1 2005年全国各地区农村居民家庭人均纯收入和各地区农村居民人均食品消费支出表各地区农
人均食品村居民家消费支出庭人均纯
收 入
1735195411711398881374983014804
7346126557918734811642890166298818736901213263199322112782471775276129665919526401964450136312818939301552870158
注:Coefficients(系数)Constant(常量)
地区北京
天津河北山西
地区湖北湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆
人均食品消费支出
1192125714331011789142111861711113417531130134812441356819186789751718811851238121926185818855893132129221538780318167
各地区农村居民家庭人均纯收 入
30991203117174469014924941
67300410328091
32280217818761962041179207719020521631979188215114625081892482115
图1 残差图
以上结果说明所建立的回归模型y=4081149+01225x通过了F检验和T检验,即在0105水平下模
型整体拟合优度高,回归系数显著性程度高。但是从残差图可以看出,模型存在异方差性。进一步利用Spearman等级相关系数来检验模型的异方差性。将
内蒙古10541263
辽宁11271225吉林10031222黑龙江92315904上海江苏浙江安徽福建江西山东河南
2683189115691266206114379991792215171601122015271087164885819723
上一步得到的残差值取绝对值,并和解释变量(人均纯收入)分别进行排秩计算,依次点击Analyze→Corre2late→Bivariate,将人均纯收入的秩和残差值的秩选入
变量窗口,选择Spearman相关系数,得到如下结果
表4 Spearman相关系数检验表
(数据来源:中国统计年鉴2006)
spss
36 长沙民政职业技术学院学报 2007年
因为Sig值(01008)〈0105,所以认为异方差
性存在。注:Correlations(相关分析)Rankofresidul(残差的秩)
(2)异方差性消除依次点击Analyze→Regression→Weight—Estima2tion,将人均食品消费支出选为因变量,人均纯收入选为自变量,人均纯收入选为WeightVariable,Power取值范围从-2到2,每次变化015,得到如下结果:
Sourcevariable(自变量):各地区农村居民家庭人均纯收入
Log-likelihoodFunction(极大似然函数)=-2111961714 POWERvalue(指数值)=21000
TheValueofPOWERMaximizingLog-likelihoodFunction=21000
Dependentvariable(因变量):人均食品消费支出ListwiseDeletionofMissingData
MultipleR()(残差)F=36138323
SignifF(统计中的P值)=010000
———VariablesintheEquation———
Variable B SEB Beta T Sig各地区农村居民家庭人均纯收入 01197727 01032780 01740323 61032 010
(Constant) 4971238468 941616466 51255 010
从上述结果可以看出,m取值为2(因为其对应着最大的对数似然函数值-2111961714),所以权数为
wi=2
x,1197727x
F检验和T检验,同时也消除了异。
[参考文献]
[1]何晓群1现代统计分析方法与应用[M]1北京:中国人民
数)0154808
AdjustedR)0153301 StandardError(标准差) 0105801
———AnalysisofVariance:(方差分析)———
DF(自由度) SumofSquares(平方和) MeanSquare(平均平方和)
Regression 1 0112242953 0112242953(回归)
Residuals 30 0110094996 0100336500
大学出版社,19981
[2]宋廷山,李杰1回归模型的异方差性消除方法探讨[J]1统
计教育,2007141
(责任编校:张 蕾)