SPSS 入门讲义蓝志坚
关于SPSS软件
SPSS是“社会科学统计软件包” (Statistical Package for the Social Science) 的简称,是一种集成化的计算机数据处 理应用软件。1968年,美国斯坦福大学 H.Nie等三位大学生开发了最早的SPSS统 计软件,并于1975年在芝加哥成立了 SPSS公司,已有30余年的成长历史,全 球约有25万家产品用户,广泛分布于通 讯、医疗、银行、证券、保险、制造、 商业、市场研究、科研、教育等多个领 域和行业。SPSS是世界上公认的三大数 据分析软件之一(SAS、SPSS和SYSTAT)
目前,世界上最著名的数据分析软件是SAS和 SPSS。SAS由于是为专业统计分析人员设计的, 具有功能强大,灵活多样的特点,为专业人士 所喜爱。而SPSS是为广大的非专业人士设计, 它操作简便,好学易懂,简单实用,因而很受 非专业人士的青睐。此外,比起SAS软件来, SPSS主要针对着社会科学研究领域开发,因而 更适合应用于教育科学研究,是国外教育科研 人员必备的科研工具。1988年,中国高教学会 首次推广了这种软件,从此成为国内教育科研 人员最常用的工具。
SPSS软件的特点
①集数据录入、资料编辑、数据管理、统 计分析、报表制作、图形绘制为一体。从 理论上说,只要计算机硬盘和内存足够大, SPSS可以处理任意大小的数据文件,无论 文件中包含多少个变量,也不论数据中包 含多少个案例
②统计功能囊括了《教育统计学》中所有的项 目,包括常规的集中量数和差异量数、 相关 分析、回归分析、方差分析、卡方检验、t检 验和非参数检验;也包括近期发展的多元统计 技术,如多元回归分析、聚类分析、判别分析、 主成分分析和因子分析等方法,并能在屏幕 (或打印机)上显示(打印)如正态分布图、直方 图、散点图等各种统计图表。从某种意义上讲, SPSS软件还可以帮助数学功底不够的使用者学 习运用现代统计技术。使用者仅需要关心某个 问题应该采用何种统计方法,并初步掌握对计 算结果的解释,而不需要了解其具体运算过程, 可能在使用手册的帮助下定量分析数据。
③自从1995年SPSS公司与微软公司合作开发 SPSS界面后,SPSS界面变得越来越友好,操 作也越来越简单。熟悉微软公司产品的用户学 起SPSS操作很容易上手。SPSS for Windows界 面完全是菜单式,一般稍有统计基础的人经过 三天培训即可用SPSS做简单的数据分析,包括 绘制图表、简单回归、相关分析等等,关键在 于如何进行结果分析及解释,这一方面需要学 习一些数理统计的基本知识,另一方面也要多 进行实践,在实践中了解各种统计结果的实际 意义
一、SPSS统
计数据的创建与编辑
SPSS数据的属性及其定义方法 SPSS数据文件的构成 应用案例:定义SPSS数据结构 SPSS数据的录入 SPSS数据的编辑 数据文件的操作
1.SPSS数据的属性及其定义方法
一个完整的SPSS数据结构包括: 变量名、变量类型、变量名标签、变量值标 签、缺失值的定义、度量的尺度、及数据 的显示属性(显示宽度、列宽度、对齐方 式)
1.1变量名首字符必须是字母或汉字,后面可以是除(!、?*)之外的 任意字符。 变量名的结尾不能是圆点、句点、下划线 变量名的长度不能超过64个字符 变量名必须唯一,并且不区分大小写 SPSS的保留字不能作为变量名(ALL、NE、EQ、GT AND、NOT、WITH) 如不指定变量名,则系统默认变量名以VAR开头后面跟5 个数字 为了便于记忆和理解变量名与其所代表的具体含义致。
1.2变量的类型(Type)数值型:根据其功能和形式又可细分为(标准 型、逗号型、句点型、科学计数型、美元 型和自定义货币型) 字符型 日期型 系统默认为标准数值型
1.2.1数值型变量
标准型:是SPSS默认的类型,宽度8、小数点2、小 数点用圆点。 科学计数类型:适合数值很大或很小的变量,变量 显示为指数形式。如:-1.28E+002表示-1.28×102 逗号型(comma ) 圆点型(Dot) 美元型(Dollar) 自定义货币型
1.2.2日期型变量(Date)
用于表示日期和时间的变量类型SPSS提供 了多达29种日期型变量的格式.
1.2.3字符型变量(String)
是非数值型变量类型,其值是由字符串组成 的.对其定义的对话框只有一个输入项
1.2.4修改数据变量的默认值
对于SPSS变量的参数,系统都会自动给出默 认值.也可通过Edit菜单中的Date对话框重新 设置
点击
1.3变量标签(Label)
变量名标签(variable label) 对变量名含义的进一步补充说明。
变量值标签(Value Label) 是对数值型变量各个取值的含义给予进一步 的解释和说明
1.4变量缺失数据(missing value)
系统默认无缺失值:如当前变量测试值、记录完全正确、 无遗漏,则可用无缺失值。
离散缺失值:如性别0、3、4都是非法的,可分 别填入
点击
定义缺失值范围:这种缺失值针对连续的变量值。当指定 某一范围的值出现在当前定义的变量中,则被当作缺失值 处理。如在性别变量值中输入了3、4、5、6。可以在 LOW后面输入3,HIGHT后面输入6。注意这个定义范围 内不能有合法值。
”0“就是包括不了 的离散值
1.5度量尺度
定距型变量(scale)可以表示如温度、重量等含义的连续性 数值变量,也可以表示年龄、次数等离散型变量.还可以表 示
时间的日期变量或者货币的货币型变量,但不能是字符型 变量. 定序型变量(ordinal)其值表示一种顺序的前后,如职称变量 可分为高中低三个档次,可用A(1)、B(2)、C(3)表示,定序 型变量可以是数值型也可以字符型 定类型变量(nominal):该变量不存在变量值之间的大小、 顺序的前后等。只表示属于的类别。如性别中“1”表示男, “2”表示女等,可以是数值型也可以字符型