第七章 相关分析
第一节 相关分析的意义和任务一、相关关系的概念(注意相关关系与函数关系的区别)(一) 函数关系它反映着现象之间存在着严格的依存关系,也 就是具有确定性的对应关系,这种关系可用一个 数学表达式反映出来。
例如某种商品的销售额和销售量之间, 由于价格因素,所以两者可表现为严格的 依存关系。
(二) 相关关系它反映着现象之间的数量上不严格的依存关系, 也就是说两者之间不具有确定性的对应关系,这种关 系有二个明显特点: 1.相关关系是现象之间确实存在数量上的依存关系, 即某一社会经济现象变化要引起另一社会经济现象的 变化; 2.现象之间的这种依存关系是不严格的,即无法用 数学公式表示。
例
商品价格和商品销售量之间,存在着一 定的依存关系,即商品价格发生变动,商品 的销售量也会随之发生变动。
在具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用X表示;发生对 应变化的变量称因变量,一般用y表示。
二、相关关系的种类
(一)按相关关系涉及的因素多少来分,可分为: 单相关和复相关。二因素之间的相关关系称单相关,即只涉及 一个自变量和一个因变量。 三个或三个以上因素的相关关系称复相关,或 多元相关,即涉及二个或二个以上的自变量和因变 量。 在实际工作中,如存在多个自变量,可抓住其 中主要的自变量,研究其相关关系,而保持另一些 因素不变,这时复相关可转化为偏相关。(了解)
(二) 按相关关系的形式来分,可分为: 直线相关和曲线相关直线相关是指两个相关现象之间,当自变量X的数 值发生变动时,因变量y随之发生近似于固定比例的变 动,在相关图上的散点近似地表现为直线形式,因此 称其为直线相关关系。
曲线相关是指两个相关现象之间,当自变 量X的数值发生变动时,因变量y也随之发生变 动,但这种变动在数值上不成固定比例,在相 关图上的散点可表现为抛物线、指数曲线、双 曲线等形式,因此称其为曲线相关关系。
(三)按相关关系的性质来分,可分为: 正相关和负相关
正相关是指两相关现象变化的方向是一致的。负相关是指两相关现象变化的方向是相反的。
(四) 按相关程度分,可分为: 完全相关、不完全相关和不相关完全相关就是相关现象之间的关系是完全确定的 关系,因而完全相关关系就是函数关系。 不相关是指两现象之间在数量上的变化上各自独 立,互不影响。 不完全相关就是介于完全相关和不相关之间的一 种相关关系。相关分析的对象主要是不完全相关关 系。
三、相关分析
的主要内容相关分析的主要内容,概括起来是五个方面:
(一)确定现象之间有无关系,以及相关 关系的表现形式; (二) 确定相关关系的密切程度; (三)选择合适的数学模型;(四)测定变量估计值的可靠程度; (五)对计算出的相关系数,进行显著检验。
第二节 简单线性相关分析一、相关表和相关图 简单相关表 — 根据总体单位的原始资料汇编的相关表 分组相关表 — 将原始资料进行分组而编制的相关表 单变量分组表 — 按自变量分组 双变量分组表 — 按自变量和因变量均分组
相关图,也称散布图(或散点图)。
例1 某市1998年 — 2005年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。 (简单相关表) 工资性 城镇储蓄存 现金支出 款余额(万 (万元)x 元)y 500 120 540 140 620 730 900 970 1050 1170 150 200 280 350 450 510
序号 1 2 3 4 5 6 7 8
年份 1998 1999 2000 2001 2002 2003 2004 2005
550 500
Ç ò ¢ î æ î à î ³ Õ ´ Ð ´ ¿ Ó ¶ ò ª (Í Ô )
450 400 350 300 250 200 150 100 50 400 500 600 700 800 900 1000 1100 1200
¤Ê Ô Ö ð §ö ò ª ¹ ×Ð Ï ½ Ö ³ (Í Ô )
(分组相关表)(单变量分组相关表) 例2 (双变量分组相关表:表7-4p351)企业按销售额分组 (万元) 4以下 4~ 8 8 ~ 12 12 ~ 16 16 ~ 20 20 ~ 24 24 ~ 28 流通费用率 (%) 9.65 7.68 7.25 7.00 6.86 6.73 6.64流通费用率(%)10 9.5 9 8.5 8 7.5 7 6.5 6 0 4 8 12 16 20 24 28 销售额(万元) 32 36
28 ~ 3232 ~ 36
6.606.58
二、相关系数的测定与应用
相关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综 合性指标。一般用符号r表示。