浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
目录
PRELIS 应用范例....................................................................................................................................................................2 1.1
处理连续性数据...................................................................................................................................................2 例1:以健身调查数据示范数据的清理和准备..........................................................................................................2 关于数据.......................................................................................................................................................................................2 数据准备和前期处理...................................................................................................................................................................3 读入 Excel 数据文件....................................................................................................................................................................4 定义变量类型...............................................................................................................................................................................5 处理缺失值...................................................................................................................................................................................6 定义整体缺失值(global missing value) 并进行成列删除(listwise deletion)...............................................................6 多元计算(multiple imputation)..........................................................................................................................................8 插入新变量...................................................................................................................................................................................9 为新变量赋值..............................................................................................................................................................................11 选择观测对象并产生一个子数据集..........................................................................................................................................12 将 PSF数据集输出为 Excel可读的文件...................................................................................................................................14 数据总览(data screening).......................................................................................................................................................15 计算正态值(normal scores)....................................................................................................................................................17 计算矩阵......................................................................................................................................................................................19 例2:多元回归分析...................................................................................................................................................20 关于数据......................................................................................................................................................................................20 多元线性回归模型......................................................................................................................................................................21 多元线性回归分析......................................................................................................................................................................21 例3:用美国经济数据构建二阶最小二乘模型........................................................................................................23 关于数据......................................................................................................................................................................................23 二阶最小二乘数学模型..............................................................................................................................................................24 二阶最小二乘分析......................................................................................................................................................................25 例4 :以心理学数据为例示范探索性因子分析......................................................................................................26 关于数据......................................................................................................................................................................................26 探索性因子分析的数学模型......................................................................................................................................................27 探索性因子分析..........................................................................................................................................................................28
1
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
PRELIS 应用范例
PRELIS是LISREL 8.7的一部分。它主要用于在构建结构模型之前,对数据进行前期处理和初
步分析。PRELIS的主要用途包括:
o 将其它格式的数据文件(SAS, SPSS, Excel, Stat等等)读入并存储为PRELIS数据文
件。 o 将PRELIS(*.psf)数据输出为其他软件可读的相应格式。
o 对PRELIS数据进行处理。(定义变量类型,处理缺失值,数据筛选,生成子数据集
等)。 o 回归模型分析及初步的因子分析等。
o 计算矩阵(协方差矩阵,多项相关系数以及渐近协方差矩阵等)。 o 可以用图表直观地表现数据的状况。
在这一章里,我们用不同类型的变量为例介绍如何应用PRELIS来实现上述功能。本章中的所有数据都存在LISREL安装文件夹中的TUTORIAL子文件夹里。
1.1
处理连续性数据
这一节里,我们主要介绍如何应用菜单选项对连续性变量进行处理。我们首先来示范如何用PRELIS进行数据清理。然后我们示范如何进行多元线性回归分析以及二阶最小二乘分析。
例1:以健身调查数据示范数据的清理和准备
关于数据
健身和血液中胆固醇的含量是影响心脏健康的两个重要因素。在一个相关的研究课题中,对三组成年男子,共60人进行了调查并记录了相关数据。这是一个Excel格式的数据集,其文件名是fitchol.xls,存储在TUTORIAL子文件夹中。下表列出了前十个被调查者的观测数据。
PRELIS应用范例
2
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
注意:
-9代表缺失值。在这个数据集中,共有三个观测对象的数据资料中出现缺失值。这个数据集中的变量依次是:
o Group – 组别 (1是举重运动员, 2是学生,3是长跑运动员) 。 o Age – 年龄。 o Length – 身高cm。 o Mass – 体重 kg。 o %Fat – 脂肪百分比。 o Strength 肺活量 lb。 o Trigl – 甘油三酸脂肪。 o Cholest – 胆固醇。
要得到此数据集更详细的信息,请参考 Du Toit, Steyn 和 Stumpf (1986)。
数据准备和前期处理
以数据集 fitchol.xls 为例,我们用图解说明怎样用PRELIS进行以下工作。
o 读取 Excel 数据 o 定义数据类型
o 定义整体缺失值 (global missing value) o 插入新变量 o 给新变量赋值
o 选择观测对象并产生子数据集 o 将PSF 数据文件转换为Excel 文件
PRELIS应用范例
3
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
o 数据总览(data screening) o 多元计算(multiple imputation) o 计算正态值 o 计算矩阵
读入 Excel 数据文件
o 选择 File 菜单的 Import Data 选项
以打开 Open 对话框。
o 在Files of type下拉菜单中选择Excel (*.xls) 选项。
o 如下图所示:找到并选择TUTORIAL子文件夹fitchol.xls 文件。
o 点击 Open键以打开 Save As 对话框。在File name 字符区内输入 fitchol 得到如下对话
框。
PRELIS应用范例
4
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
o 点击 Save 键以打开如下 PSF 窗口。
定义变量类型
PRELIS将 Excel格式的数据文件读入并生成PSF文件时,变量类别默认为有序变量。在fictchol.psf这个数据集中,除了Group 以外,其他变量都是连续的。如下,我们将示范如何从新定义变量类别。
o 点击PSF 窗口中Data 菜单的Define Variables选项激活Define Variables对话框。
o 从变量列表中选择变量 Group 激活Define Variables 对话框上的所有键。
PRELIS应用范例
5
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
o 点击 Variable Type 键 打开 Variable Types for Group… 对话框。 o 激活 Continuous 选项按钮,选中 Apply to all 复选框得到 如下对话框。
o 点击 OK 键回到 Define Variables对话框。
o 再点击Define Variables 对话框上的OK 键回到 PSF 窗口。 o 点击File 菜单上的Save 选项保存修改后的数据文件 fictchol.psf。 o 点击Data 菜单上的Define Variables 选项激活Define Variables 对话框。 o 从变量列表中选择 变量 Group 。
o 点击Variable Type 键 打开 Variable Types for Group… 对话框。 o 激活 Ordinal 选项按钮。
o 点击 OK键回到 Define Variables对话框。
o 再点击Define Variables 对话框上的OK 键回到 PSF 窗口。 o 点击File 菜单上的Save 选项保存修改后的数据文件 fictchol.psf。 注意:
名义变量和有序变量在PRELIS中都被定义为有序变量。
处理缺失值
对缺失值的处理是整理数据的重要环节。对其处理方法主要有两种:一是删除含缺失值的观测对象,或者填充缺失值。PRELIS里,有两种方法删除含缺失值的对象:1、Listwise deletion (成列删除,即删除所有含缺失值的观测对象);2、Pairwise deletion (成对删除,即计算两个变量的相关系数时,只使用两个变量都有数据的那些样品)。填补缺失值也有两个方法:1、匹配计算(impute by matching);2、多元计算(multiple imputation)。这一小节,我们以图例说明如何定义缺失值。
定义整体缺失值(global missing value) 并进行成列删除(listwise deletion)
通过以下步骤,我们将-9 定义为 fitchol.psf中的整体缺失值。
PRELIS应用范例
6
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
o 打开 PSF 窗口,点击Data 菜单上的Define Variables选项。
o 在变量 列表中选择变量 Group激活Define Variables 对话框上的所有键。 o 点击 Missing Values 键打开 Missing Values for Group… 对话框。 o 如下所示在Global missing value对应的字符区键入 -9。 o 激活Deletion methods 中的Listwise 选项按钮。
o 点击 OK 键回到Define Variables 对话框。 o 点击 OK 键 回到 PSF 窗口。
o 点击File 菜单上的Save 选项 保存 fictchol.psf。
我们可以将listwise deletion后没有任何缺失值的数据另存为一个新的数据文件。
o 点击Statistics 菜单上的Output options 选项。 o 钩上Data 中 Save the transformed data to file 复选框。
o 如下图所示,在对应的字符区键入 fitcholcplt.psf 作为文件名。
PRELIS应用范例
7
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
o 点击 OK 键 打开fitcholcplt.out 窗口。
这样, fitcholcplt.psf 数据文件就生成了。它被存储在 fitchol.psf所在的文件夹里。这个新的数据文件包含57个观测对象。
多元计算(multiple imputation)
有两种方法进行多元计算:Expected Maximization (EM算法)和Monte Carlo Markov Chain (MCMC算法)。
o 点击PSF 窗口中Statistics 菜单上的Multiple Imputation 选项激活 Multiple Imputation 对
话框。
PRELIS应用范例
8
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
o 如下所示从变量列表中选择所有的变量并点击 Select 键。
o 点击上述对话框中的Output Options打开Output对话框。 o 在Data 部分中的 Save the transformed data to file 复选框打上钩。 o 在相应的字符区键入文件名 fitcholimp.psf。 o 点击 OK 键回到 Multiple Imputation 对话框。
o 点击Multiple Imputation 对话框上的Run 键运行PRELIS并生成输出文件fitchol.out。
通过以上步骤,填补缺失值后的数据集 fitcholimp.psf 就生成了。这个文件存在 fitchol.psf所在的文件夹中,包含60个观测对象,没有缺失值。
插入新变量
通过如下步骤,我们可以给fitcholcplt.psf数据集中插入一个新变量,并将其命名为Totchol。
o 点击Windows 菜单上的Close all 选项关闭所有打开的窗口。 o 点击File 菜单的 Open 选项。
o 在Files of type 下拉菜单中选择 PRELIS Data (*.psf) 选项。
o 找到并选上 fitcholcplt.psf 文件,点击 Open 键 以打开fitcholcplt.psf 的PSF窗口。 o 如下点击Data 菜单上的Insert Variables选项
PRELIS应用范例
9
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
打开如下Insert Variables对话框。
o 点击 OK 键,一个新变量就被插入到数据文件中,其位置在Group前,变量名是
var9。 o 点击Data 菜单Define Variables 选项激活Define Variables 对话框。 o 选中变量 var9。 o 点击 Rename 键。 o 键入 Totchol。
o 点击 OK 键回到 Define Variables 对话框。
o 点击Define Variables 对话框中的OK 键得到如下PSF 窗口。
o 点击File 菜单上的Save as 选项。 o 如下在File name 字符区键入 fitchol2。
PRELIS应用范例
10
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
这样一个新变量 Totchol 就被插入到原有的数据集中并存储为 fictchol2.psf 。但是,这个变量的所有值都是零。
为新变量赋值
接下来,我们要使这个新变量Totchol代表Trigl和Cholest的和。
o 点击Transformation 菜单上的Compute 选项 打开 Compute 对话框。 o 选中并用鼠标将Totchol 拖入Compute 对话框中的灰色字符区。 o 点击 “=” 键。
o 选中并用鼠标将Trigl拖入Compute 对话框中的灰色字符区。 o 点击 “+” 键。
o 选中并用鼠标将 Cholest拖入灰色字符区得到如下 Compute 对话框。
PRELIS应用范例
11
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
o 点击 OK 键 可以看到如下 PSF 窗口。
o 点击File 菜单上的Save 选项保存数据集 fictchol2.psf。
选择观测对象并产生一个子数据集
假如我们现在只想分析长跑运动员的数据。 我们可以将所有Group值为3的数据选出,并生成一个子数据集。
o 在fictchol2.psf 窗口中,点击 Data 菜单上的 Select Variables/Cases 选项打开 Select
Data 对话框。 o 点击 Select Cases 标签。
o 在Variable List 列表里选中变量 Group。
PRELIS应用范例
12
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
o 在Condition部分激活 Select only those cases with vale 选项按钮。 o 选中 equal to ( = ) 选项按钮。 o 在相应的字符区输入 3。
o 点击 Add 键得到如下 Select Data 对话框。
o 点击 Output Variables 打开Output 对话框。
o 在Data 区域中的Save the transformed data to file 复选框打上勾。 o 如下图所示键入文件名 fitchol2G3.psf。
PRELIS应用范例
13
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
o 点击 OK 键 回到Select Data 对话框。
o 点击Select Data 对话框上的Run 键生成结果文件 fitchol2.out。
通过如下步骤,可以看到新产生的数据集fitchol2G3.psf。
o 首先,点击Windows 菜单上Close all 选项关闭所有打开的窗口。 o 点击File 菜单Open 选项。
o 点击 PRELIS Data (*.psf) 选项 from the Files of type 下拉菜单 box。 o 找到并选中 fitchol2G3.psf。
o 点击 Open 键 以打开如下PSF窗口。
这个新的数据集中,只包括20个长跑运动员。
将 PSF数据集输出为 Excel可读的文件
我们用 fitchol2G3.psf 演示如何将PSF 数据输出位 Excel可读的文件。
o 在PSF 窗口中打开fitchol2G3.psf。
o 点击File 菜单上Export LISREL Data 选项打开Save As 对话框。
PRELIS应用范例
14
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
o 在 Save as type 下拉菜单中选择Comma Separated (*.csv) 选项。 o 如下所示,在File name字符区键入 fitchol2G3。
o 点击 Save 键将数据集存储在TUTORIAL 子文件夹中, 其文件名为fitchol2G3.csv。o 如下所示,在 Excel 表格窗口中打开这一文件。
数据总览(data screening)
PRELIS应用范例
15
浅谈企业管理人员培训新思路;现代企业员工培训新趋势;日本企业员工培训的组织保障;lisrel-prelis应用范例中文手册
在进行数据分析之前,数据总览(data screening)是必不可少的一步。PRELIS 的数据总览功能提供了数据集的基本信息,比如:数据集中有多少变量,多少观测对象,缺失数据的状况等。同时,它还提供每个变量的简要信息。
o 打开数据集 fictchol.psf。
o 如下所示,点击Statistics 菜单Data Screening 选项。
PRELIS就会生成结果文件 fitchol.out。数据集的基本信息如下。
在上图的结果文件中可以看到:Group, Age和Trigl中不含任何缺失值,Strength中有2个缺失值,其他的变量中有一个缺失值。这个数据集中一共包含60个观测对象。不含任何缺失值的观测对象有57个。
在这个结果文件中,我们还可以看到每个变量的基本信息。如下图所示,以Age为例,我们可以看到该变量的直方图。
PRELIS应用范例
16