第一章 SPSS统计软件简介
在当今信息化时代的背景下,无论是个人,还是政府或企业都需要在海量的信息中获取有价值的信息,并据此做出科学的评估和决策。为此,对信息的采集、处理、分析并给出专业人士可接受的评估和预测报告等工作变得十分重要。SPSS正是为此功能而设计的一整套集数据处理、评估和预测的解决方案。
SPSS的原名全称是:Statistical Package for the Social Sciences,即社会科学统计程序。2000年SPSS公司已正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。
SPSS由美国斯坦福大学的三位研究生于20世纪60年代末研制,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部。1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报纸杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。迄今SPSS软件已有50余年的成长历史。全球约有25万家产品用户,它们分布于通信、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用*广泛的专业统计软件之一。
SPSS软件是公认的*优秀、应用*为广泛的统计分析软件包之一。20世纪80年代,微软公司研发了Windows后,SPSS迅速向Windows移植。至90年代,正式推出SPSS for Windows版本。与以往的SPSS for DOS版本相比,SPSS for Windows显得更加直观易用。首先,它采用现今广为流行的电子表格形式,作为数据管理器,使用户变量命名、数据格式定义、数据输入与修改等过程一气呵成,免除了原DOS版本在文本方式下数据录入的诸多不便;其次,采用菜单方式选择统计分析命令,采用对话框方式选择子命令,简明快捷;*后,采用对象链接和嵌入技术,使计算结果可方便地被其他软件调用,进行数据共享,提高工作效率。近几年SPSS的发展尤为迅速,并以每年一个新版本的速度进行更新,尤其是2006年9月推出的SPSS 15.0 for Windows版本,在操作界面、数据管理、统计分析、图形处理以及可扩展的编程能力和中文操作的兼容等方面都有了很大的改进,令人耳目一新。
SPSS的基本功能:包括数据管理、统计分析、图表分析、输出管理等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段*小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。
SPSS有专门的绘图系统,可以绘制各种图形。总结SPSS有以下特点:
(1)操作简单,交互式界面友好:SPSS是世界上*早采用图形菜单驱动界面的统计软件,它*突出的特点就是操作界面极为友好。除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过“菜单”、“按钮”和“对话框”来完成。只要了解统计分析的原理,无须通晓统计方法的各种算法,即可得到需要的统计分析结果。
(2)功能强大:具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了通过从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等,来绘制各种图形。SPSS可编程性扩展了外部编程语言的全部能力,用于Python编程语言、R语言、Microsoft.NET和Java。
(3)方便的数据接口:能够读取及输出多种格式的文件,比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件,Excel的*.xls文件等均可转换成可供分析的SPSS数据文件;能够把SPSS的图形转换为7种图形文件;结果可保存为txt及html格式的文件。
(4)全新的导出技术:可以将统计结果图标直接导入到Office中的PowerPoint之中,特别增加了转换为PDF格式的插件,在输出菜单中选择。
(5)灵活的功能模块组合:SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
(6)分析结果清晰、直观、易用。
SPSS统计分析工具具有理论严谨、内容丰富,数据管理、统计分析、趋势研究、制表绘图、文字处理等功能特点,几乎无所不包。
(郭怀兰 邬闻文)
第二章 数据文件的建立
数据文件的建立是指将科学研究过程中获得的各种信息,以数据的形式存入计算机的存储介质中,建立可随时存取、修改、统计分析的数据文件的全过程。
例2-1 某医师进行了心肌梗死的病例对照研究,选择了30例病例和30名对照,调查了病例组和对照组的基线资料(表2-1)。
问题2-1
(1)如何将表2-1中的数据输入SPSS?
(2)如已用其他软件建立了数据文件,如何用SPSS调用这些文件?
表2-1 心肌梗死病例对照研究基线数据
第一节 在SPSS数据编辑窗口建立数据文件
一、SPSS 22.0界面介绍
SPSS所处理的数据文件有两种来源:一是SPSS环境下建立的数据文件;二是调用其他软件建立的数据文件。
当用户初次运行SPSS 22.0时,系统会自动弹出一个导航对话框,如图2-1所示,提示用户的下一步操作。操作方法:选择“Type in data”单选按钮,然后单击OK按钮;或者在该窗口中单击Cancel按钮即可进入SPSS数据编辑窗口,如图2-2所示。
图2-1 SPSS导航对话框
图2-2为一个典型的Windows视窗操作界面,由窗口名显示栏、窗口控制按钮、SPSS主菜单、常用工具按钮、数据单元格信息显示栏及数据编辑显示区域等部分构成。
1. 窗口名显示栏 位于窗口顶部左上角,显示窗口名称和编辑的数据文件名,没有文件名时显示为“Untitled1[DataSet0]-IBM SPSS Statistics Data Editor-IBM SPSS Statistics Data Editor”。
2. 窗口控制按钮 在窗口顶部的右上角,第一个按钮是窗口*小化,第二个按钮是窗口*大化,第三个按钮是关闭窗口。
3. SPSS主菜单 在标题栏的下方,窗口显示的第二行,由十二个菜单项组成,有:File(文件),Edit(编辑),View(视图),Data(数据),Transform(转换),Analyze(分析),Direct Marketing(直销),Graphs(图形),Utilities(实用程序),Add-ons(附加),Window(视窗),Help(帮助)等,详见表2-2。
图2-2 SPSS操作界面
表2-2 SPSS主菜单组成及其功能
其中在SPSS Data Editor窗口中,Edit菜单、Data菜单和Transform菜单中的命令可对数据进行各种编辑。下面予以简单介绍。
(1)Edit菜单中常用的命令有:Undo(撤销)、Redo(重做)、Cut(剪切)、Copy(复制)、Paste(粘贴)、Find(查找)等。
(2)Data菜单中常用的命令如下:
Define Variable Properties:定义变量属性。
Copy Data Properties:复制变量属性。
Sort Cases:记录按观察值大小重新排序。可按多个变量排序(升序、降序均可)。
Merge Files:合并数据文件,又分合并观测对象和合并变量。合并观测对象就是在原数据文件基础上加入新的观测对象,原数据文件和新数据文件的结构*好一致;合并变量就是在原数据文件基础上加入新的变量,原数据文件和新数据文件*好有一个相同的识别变量,并且已
展开