大连民族学院
数 学 实 验 报 告
课程: 多元统计分析 实验题目: 因子分析 系别: 理学院 专业: 数学与应用数学 姓名: 班级: 信息102 指导教师:腾颖俏 完成学期: 月
实验目的:1. 2.运用因子分析方法分析数据。 利用 spss 进行因子分析。
实验内容: (问题、数学模型、要求、关键词)对企业经济效益指标体系的八项指标建立因子分析模型。数据如下表所示: 表 1 原始数据表格固定资 产利税 厂家编号及指标 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 琉璃河 邯郸 大同 哈尔滨 华新 湘乡 柳州 峨嵋 耀县 永登 工源 抚顺 大连 江南 江油 率 16.68 19.7 15.2 7.29 29.45 32.93 25.39 15.05 19.82 21.13 16.75 15.83 16.53 22.24 12.92 资金利 税率 26.75 27.56 23.4 8.97 56.49 42.78 37.82 19.49 28.78 35.2 28.72 28.03 29.73 54.59 20.82 销售收 入利税 率 31.84 32.94 32.98 21.3 40.74 47.98 36.76 27.21 33.41 39.16 29.62 26.4 32.49 31.05 25.12 资金利 润率 18.4 19.2 16.24 4.76 43.68 33.87 27.56 14.21 20.17 26.52 19.23 17.43 20.63 37 12.54 固定资 产产值 率 53.25 59.82 46.78 34.39 75.32 66.46 68.18 6.13 59.25 52.47 55.76 61.19 50.41 67.95 51.07 流动资 金周转 天数 55 55 65 62 69 50 63 76 71 62 58 61 69 63 66 万元产 值能耗 28.83 32.92 41.69 39.28 26.68 32.87 35.79 35.76 39.13 35.08 30.08 32.75 37.57 32.33 39.18 全员劳 动生产 率 1.75 2.87 1.53 1.63 2.14 2.6 2.43 1.75 1.83 1.73 1.52 1.6 1.31 1.57 1.83
实验方法和步骤(包括数值公式、算法步骤、程序) :1.选择菜单项 Analyze→Data Reduction→Factor。打开 Factor Analysis 对话框,将 原始变量移入 Variables 列表框中; 2.点击 Descriptives 按钮,展开相应的对话框。选择 Initial solution 复选项。这个 选项给出个因子的特征值,各因子特征值占总方差的百分比以及累计百分比。单击 Continue 按钮,返回主界面 3.单击点击 Extraction 按钮,打开 Extraction 子对话框,设置有关因子提取的选项, 选择“主成分”因子分子方法,
在 Method 下拉列表中选择因子提取的方法,SPSS 提供了七种提取方法可供选择,一 般选择默认选项 Principal components,即“主成分法” 。 在 Analyze 选 项 栏 中 指 定 用 于 提 取 因 子 的 分 析 矩 阵 , 分 别 为 相 关 系 数 矩 阵 (Correlation matrix)和协方差矩阵(Covariance matrix) 。如果选择相关系数矩阵, 则表示首先对原始数据进行标准化,然后再进行因子分析;如果选择协方差矩阵,则表 示直接对原始数据进行因子分析。这里我们选择默认的相关系数矩阵。 在 Display 选项栏中指定与因子提取有关的输出项,其中, Unrotated factor solutions 表示输出旋转前的因子方差贡献表和旋转前的因子载荷阵;Scree Plot 表示 输出因子碎石图。因子碎石图
其实就是样本协差阵的特征根按大小顺序排列的折线图, 可以用来帮助确定提取多少个因子。典型的碎石图会有一个明显的拐点,拐点之前是较 大特征根连接形成的陡峭折线,拐点之后是较小特征根连接形成的平缓折线,一般选择 拐点之前的特征根数目为提取因子的数目。这里我们将两个选项都选中。 在 Extract 选项栏中指定因子提取的数目,有两种设置方法:一种是在 Eigenvalues over 后的输入框中设置提取的因子对应的特征值的范围,系统默认值为 1,即要求提取 那些特征值大于 1 的因子;第二种设置方法是直接在 Number of factors 后的输入框中 输入要求提取的公因子的数目。这里选择第二种,提取公因子数为 3 个。 4.点击 Rotation 按钮, 打开 Rotation 子对话框, 设置有关因子旋转的选项, 选择 Varimax (最大方差旋转法) ; Method 选项栏用于设置因子旋转的方法, 可供选择的方法包括方差 最大旋转法(Varimax) 、直接斜交旋转法( Direct Oblimin) 、四次方最大正交旋转法 (Quartmax) 、平均正交旋转法(Equamax) 、斜交旋转法(Promax) ,如果选择 None 选项, 则不进行旋转。 Display 选项栏用于设置与因子旋转有关的输出项。 其中, Rotated factor solutions 表示输出旋转后的因子方差贡献表和旋转后的因子载荷阵;Loading plots 表示输出旋转 后的因子载荷散点图图,旋转后因子散点图是以因子为坐标轴,以旋转后因子载荷为坐 标的散点图,从该散点图中可以直观地观察因子载荷在各因子上的分布状况 5.点击 Scores 按钮,打开 Factor Scores 子对话框,设置有关因子得分的选项。 选中 Save as variables 复选框,表示将因子得分作为新变量保存在数据文件中。提 取了几个因子则会在数据文件中保存几个因子得分变量,变量名为“facm_n” ,其中,m 表示第 m 个因子, n 表示进行第 n 次因子分析的结果。选中 Display factor score coefficient matrix 复选框,这样在结果输出窗口中会给出因子得分系数矩阵 6.单击 OK,运行因子分析过程
实验数据和分析:表2 特征值与方差贡献率Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Rotation Loadings Sums of Squared Loadings % of % of % of Component Total Variance Cumulative % Total Variance Cumulative % Total Variance Cumulative % 1 4.853 60.660 60.660 4.853 60.660 60.660 3.836 47.956 47.956 2 1.244 15.549 76.209 1.244 15.549 76.209 1.706 21.323 69.279 3 .870 10.878 87.087 .870 10.878 87.087 1.425 17.808 87.087 4 .552 6.898 93.984 5 .357 4.463 98.447 6 .102 1.275 99.722 7 .021 .259 99.981 8 .002 .019 100.000 Extraction Method: Principal Component Analysis.
由上表可知,三个公因子的累计方差贡献率为87.09%表3 共同度
Communalities Init
ial Extraction 1.000 .976 1.000 .968 1.000 .862 1.000 .986 1.000 .672 1.000 .906 1.000 .773 1.000 .824 Extraction Method: Principal Component Analysis. 固 定 资产 利 税 率 资 金 利税 率 销 售 收入 利 税 率 资 金 利润 率 固 定 资产 产 值 率 流 动 资金 周 转 天 数 万 元 产值 能 耗 全 员 劳动 生 产 率
表给 3 出了 8 个原始变量的变量共同度。 变量共同度反映每个变量对提取 出的所有公共因子的依赖程度。 表 3 可以看出, 除固定资产产值率和万元产值 能耗的共同度小于 80%,其余的变量共同度都在 80%以上,说明提取的因子已 经包含了原始变量的大部分信息,因子提取的效果比较理想。Scree Plot5
4
Eigenvalue
3
2
1
0
1
2
3
4
5
6
7
8
C omponent Number
图1 碎石图
图 1 给出了因子的碎石图。 图中横坐标为因子的序号, 纵坐标为相应特征根的值。
从图中可以看到,前 3 个因子的特征根普遍较高,连接成了陡峭的折线,而第 4 个因 子之后的特征根普遍较低, 连接成了平缓的折线, 这进一步说明提取 3 因子是比较适 当的。 表4 旋转后的因子载荷Rotated Component Matrixa
Component 2 固 定资 产 利 税率 .815 .551 资 金利 税 率 .974 .107 销 售收 入 利 税率 .675 .636 资 金利 润 率 .971 .200 固 定资 产 产 值率 .660 .225 流 动资 金 周 转天 数 .032 -.376 万 元产 值 能 耗 -.608 .138 全 员劳 动 生 产率 .142 .857 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 24 iterations. 1
3 -.089 -.092 -.039 -.057 -.431 .873 .620 -.264
表 4 给出了旋转后的因子载荷矩阵, 根据该表可以写出每个原始变量的因子表达 式: X1=0.815F1+0.551F2+(-0.89)F3 X2=0.947F1+0.107F2+(-0.092)F3 x1-固定资产利税率,x2-资金利税率,x3-销售收入利税率,x4-资金利润率,x5-固 定资产利润率,x6-流动资金周转天数,x7-万元产值能耗,x8-全员劳动生产率。 所提取的公因子中 F1 在 X1,X2,X3,X4,X5 上有较大的载荷,该因子概括了企 业的资产获取利润的能力。F2 在 X3,X8 上有较大的载荷,该因子概括了产品的获利 率。F3 在 X6,X7 上有较大的载荷,该因子概括了资金的利用率。 表5 因子得分系数矩阵
Component Score Coefficient Matrix Component 2 固 定资 产 利 税率 .159 .259 资 金利 税 率 .331 -.173 销 售收 入 利 税率 .091 .381 资 金利 润 率 .311 -.082 固 定资 产 产 值率 .139 -.075 流 动资 金 周 转天 数 .218 -.123 万 元产 值 能 耗 -.187 .428 全 员劳 动 生 产率 -.195 .654 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores. 1
3 .160 .068 .208 .122 -.248 .695 .515 -.007
表 5 给出了因子得分系数矩阵,根据表中的因子得分
系数和原始变量的标准化 值就可以计算每个观测值的各因子的得分。本例中旋转后的因子得分表达式可以写 成: F1=0.159X1+0.331X2+.0.091X3+0.311X4+0.139X5+0.218X6-0.187X7-0.195X8 F2=0.259X1-0.068X2+0.381X3-0.082X4-0.075X5-0.123X6+0.428X7+0.654X8 F3=0.16X1+0.068X2+0.208X3+0.122X4-0.248X5+0.695X6+0.515X7-0.007X8 由于我们在 Factor Scores 子对话框中选择了 Save as variables 复选框,所 以, 在数据文件中会生成 3 个因子得分变量, 变量名分别为: fac1_1、 fac2_1、 fac3_1。 这里有两点值得注意的地方: (1)由于我们是以相关系数矩阵为出发点进行因子分析,所以,因子得分表达式 中的各变量应该是经过标准化变换后的标准变量,均值为 0,标准差为 1。 (2)由于因子载荷阵经过了旋转,所以,因子得分不是利用初始的因子载荷阵, 而是利用旋转后的因子载荷阵计算得到的。
实验的启示:1、进一步深刻学习了因子分析相关知识; 对于 spss 软件的因子分析应用有了基本掌握。