SPSS数据在市调中的形成-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 软件培训>>

SPSS软件培训

>>

SPSS数据在市调中的形成

SPSS数据在市调中的形成

发布:许大哥 | 分类:SPSS软件培训

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

经管之家新媒体交易平台

提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯"等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

提供微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

我们公司常用的数据分析软件有两个:Quantum和SPSS。早期的工作,包括输入、查错和简单的统计,主要用Quantum软件来完成,而后期深入的统计分析用SPSS来进行。一个准确无误的SPSS数据文件是统计分析的原材料,那么如 ...
免费学术公开课,扫码加入


我们公司常用的数据分析软件有两个:Quantum和SPSS。早期的工作,包括输入、查错和简单的统计,主要用Quantum软件来完成,而后期深入的统计分析用SPSS来进行。 一个准确无误的SPSS数据文件是统计分析的原材料,那么如何才能形成一个准确无误的SPSS数据文件呢?
在这里主要介绍如何把零乱的问卷答案整理成SPSS格式的电子数据,也就是数据的前期处理,它的基本过程是:首先,在确认的问卷上标上输入的记号(即上Column),根据问卷定义输入的模板、编写查错程序(用于检查问卷矛盾和逻辑关系)和数据报告程序(撰写数据报告用)。在问卷回来后,如果问卷上有开放题或者半开放题,则对问卷上的文字进行编码,然后对所有答案统一输入到电脑上,再进行查错工作。在查错过程中,发现有问题的问卷返回访问部。直到所有问卷输入完毕并通过查错程序检查,保证数据正确后,再运行预先写好的SPSS程序,出SPSS格式的数据报告。数据的前期处理可通过以下几个核心步骤来完成:

一、编写SPSS程序

我们知道后期深入的统计分析用SPSS来进行,数据前期处理的目的就是把零乱的问卷答案整理成SPSS格式的电子数据。SPSS程序只要用来读取后缀名为 .dta的数据文件,并通过程序来设置各变量的属性。
SPSS(Statistical Package for the Social Science,社会科学统计软件包)是世界著名的统计分析软件之一。SPSS常用的窗口是数据编辑窗口,它与微软公司的Excell窗口有些相似,并且有一些功能相同。不过SPSS的数据统计功能要比Excell强很多。下面简单介绍SPSS:
SPSS的数据编辑窗口有以下特点:
1.一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测量的特征。例如问卷上的每一个题目就是一个变量。
2.行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case)。例如:一份问卷就是一个观测(Case)。
3.单元包含值,即每个单元包括一个观测中的单个变量值,单元(Cell)是观测和变量的交叉。
4.数据文件是一张长方形的二维表,数据文件的范围是由观测和变量的数目决定的,可以在任一单元中输入数据。
SPSS程序除了读取数据外,还要定义变量。定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(值标签)和变量的格式,这都是通过程序来实现。
(1) 定义变量名Name
SPSS默认的变量名为Var00001、Var00002、Var00003等,用户也可以根据自己的需要来命名变量。最好变量名要与变量所表达的意思相一致(见名知意),如:Name(名字)、Tel(电话)、Address(地址)、Age(年龄),一个好的变量名对以后的数据分析有很大的帮助。
SPSS变量的命名和一般的编程语言一样,有一定的命名规则,具体内容如下:
1、变量名必须与字母、汉字或字符@开头,其他字符可以是任何字母、数字、#等符号。
2、变量最后一个字符不能是句号
3、不能使用空白字符或其他特殊字符(如!?等)
4、变量名必须唯一,同一个数据文件中不能有两个相同的变量名。
5、在SPSS中不区分大小写。例如,NAME与name被认为同一个变量名称。
6、SPSS的保留字不能作为变量名称,如All,And,Or,With等。
(2)定义变量类型Type
SPSS有8种可选基本变量类型。有数值型、逗号型、句点型、科学计数型、日期格式型、美元型、定制货币型和字符串型。可任选一种进行定义。
1、数值型(Numeric)。数值型变量是SPSS的缺省类型,可以进行修改,重新定义数字的Width和Decimal。
2、逗号型(Comma)和句点型(Dot)。实际上是数值型变量的特殊表达方式,如:数值型为 1234567.89 ,逗号型为:1,234,567.89。句点型为1.234.567,89,这便于阅读和减少出错。
3、科学计数型(Scientific notation)。表达式为a.bE±c。 a为原数据的最高位数字,b为除去原数据的最高位以外余下的数据,E原数据的最高位数字的10的方次数。例如数字为 10000000,如果用科学计数型表示为1.0E+08。 数字 0.00000001,如果用科学计数型表示为1.00E-08。表示指数的字母可以用E,也可以用D,指数的部分可以带正号也可以带负号,例如,123,可以用下列方式输入123、1.23+2、1.23D2、1.23E2、1.23E+2等。
4、日期格式型(Date)。用户可从系统提供的多种日期显示形式中选择自己需要的形式。如选择mm/dd/yy形式,则1998年2月5日显示为02/05/98。
5、货币型(Dollar)。用户可从系统提供的多种货币显示形式中选择自己需要的,并定义数值宽度和小数位,显示形式为在数值前加$符号。例如在变量栏中输入236500,回车后显示$236,500。
6、定制货币型(Custom currency)。用来自定义制货币类型或货币的符号,例如汽车价格为¥17900元,在SPSS中缺省类型没有前面的前缀¥符号,也没有后边的元。这是就需要自定义
7、字符串型(String)。又称字母数字型变量,用户可定义字符串的长度以便输入字符,字符串型变量不能用于进行计算。
(3) 变量长度(Width)。设置变量长度。
(4) 变量小数点位数(Decimal) 。设置变量的小数点。
(5) 变量标签(Label)。变量标签是对变量名的进一步描述,需要时可用标签对变量名的含义加以解释。一般由研究员亲自来定义数据报告标签,这样,在后面的图表制作中能直接使用这些标签,而不需要再做修改。
(6) 变量值标签(Values)。值标签是对变量的每一个可能取值的进一步描述,当变量是定性或定序变量时,这是非常有用的。如定义变量名为“职称”,变量值为1、2、3,值标签分别为“教授、副教授、讲师。
(7) 缺失值的定义(Missing)。SPSS有两类失值:系统缺失值和用户缺失值。在数据长方形中任何空的数字单元都被认为是系统缺失值,用点号(。)表示。由于特殊原因造成的信息缺失值,称为用户缺失值。例如在统计过程中,可能需要区别一些被访者不愿意回答的题目,然后将他们标为用户缺失值,统计过程可识别这种标识,带有缺失值的观测被特别处理。
(8) 变量的显示宽度(Columns)。输入变量的显示宽度,默认为8。
(9) 变量显示的对齐方式(Align)。输入值在单元袼的显示方式,有三种对齐方式:Left(左对齐),Right(右对齐),Center(居中对齐)。
(10) 变量的测量尺度(Measure)。变量按测量精度可以分为定性变量、定序变量、定距变量和定比变量几种。
1、定性变量。又称为名义变量(Nominal),是一种测量精度最低、最粗略的基于“质“因素的变量,他的取值只代表观测对象的不同类别,例如“姓名”、“性别”变量都是定性变量。
2、定序变量。又称为有序变量(Ordinal)、顺序变量,它取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。例如,“最高学历”变量的取值是:1—小学及以下、2—初中、3—高中、中专、技校、4—大学专科、5—大学本科、6—研究生以上。由小到大的取值代表学历由低到高。
3、定距变量。又称为间隔(Interval)变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。例如,“年龄”变量,其取值60与20相比,表示60岁比20岁大,并且可以计算出大40岁。
4、定比变量。又称比率变量(Ratio),它与定距变量意义相近,差别在于定距变量中的“0”值只表示某一个取值,不表示“没有”。如,在测定温度的摄氏表中,0度并不表示没有温度。而定比变量的“0”值表示“没有”。如:人的身高就是一个定比变量,如果身高为“0”米,则表示这个人不存在。在实际应用中,通常对定距变量和定比变量不需加以区别。

二、编码

为什么要编码?编码有什么好处?也许大家提出这样的疑问。编码是市场研究过程中一个不可缺少的重要环节,是对开放题和半开放题的文字答案进行分类、合并和上码(即数字化处理)的过程,用数字形式表达的文字答案更有利于问卷的输入和数据分析。
编码的目的及重要性:1.文字数字化处理;;2.对所有被访者的意见进行统计、分类;3.加快输入速度; 4.便于数据分析;5.可以缩短整个项目的时间。
编码原则:1.编码的内容要求通俗易懂;2.编码要覆盖这次调查的所有意见;3.在编码之前,确认已结构化的编码表是符合要求的
4.编码前必须了解答案;5.一个意见只能编一个码,不能重复编码。对于意思相同,而只是表达方式不同的意见,应用同一个码
「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-1067120-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。