楼主: xddlovejiao1314
45831 151

[学习资料] SPSS数据分析心得小结_数据分析心得分享   [推广有奖]

教师

心灵导师

学术权威

74%

还不是VIP/贵宾

-

TA的文库  其他...

个人学术成果库

威望
6
论坛币
253191 个
通用积分
30832.8349
学术水平
1935 点
热心指数
2485 点
信用等级
1632 点
经验
716708 点
帖子
7056
精华
7
在线时间
5196 小时
注册时间
2013-5-24
最后登录
2024-3-23

一级伯乐勋章 初级学术勋章 初级热心勋章 初级信用勋章 中级热心勋章 中级学术勋章 中级信用勋章 高级热心勋章 高级学术勋章 高级信用勋章 特级热心勋章 特级学术勋章 特级信用勋章

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

SPSS数据分析心得小结_数据分析心得分享

学习数据分析之spss分析工具,可真的不是一般的功夫,真的要很认真和很细心才能做得好spss。下面我来和大家分享一下关于SPSS数据分析心得小结,希望大家从这数据分析心得分享中能得到一些启示和指导。


心得1:拿到一份数据,或者在看到国内外某个学者的文章有想法而自己手里的数据刚好符合这个想法可以做时,在整理好数据后不要急于建模。一定要对数据做缺失值处理、异常值处理。在数据预处理的基础上再进一步建模,否则可能得到错误的结果。


心得2:承接心得1,数据预处理怎么做。一是缺失值的处理。我个人有几个看法:一是数据样本量足够大,在删除缺失值样本的情况下不影响估计总体情况,可考虑删除缺失值;二是数据样本量本身不大的情况下,可从以下两点考虑:1是采用缺失值替换,SPSS中具体操作为“转换”菜单下的“替换缺失值”功能,里面有5种替换的方法。若数据样本量不大,同质性比较强,可考虑总体均值替换方法,如数据来自不同的总体(如我做农户调研不同村的数据),可考虑以一个小总体的均值作为替换(如我以一个村的均值替换缺失值)。2是根据原始问卷结合客观实际自行推断估计一个缺失值的样本值,或者以一个类似家庭的值补充缺失值。


心得3:承接心得1,数据预处理第二点异常值的处理。我大概学了两门统计软件SPSS和Stata,SPSS用的时间久些,熟悉一下,Stata最近才学,不是太熟。关于这点我结合着来说。关于异常值的处理可分为两点,一是怎么判定一个值是异常值,二是怎么去处理。判定异常值的方法我个人认为常用的有两点:1是描述性统计分析,看均值、标准差和最大最小值。一般情况下,若标准差远远大于均值,可粗略判定数据存在异常值。2是通过做指标的箱图判定,箱图上加“*”的个案即为异常个案。发现了异常值,接下来说怎么处理的问题。大概有三种方法:一是正偏态分布数据取对数处理。我做农户微观实证研究,很多时候得到的数据(如收入)都有很大的异常值,数据呈正偏态分布,这种我一般是取对数处理数据。若原始数据中还有0,取对数ln(0)没意义,我就取ln(x+1)处理;二是样本量足够大删除异常值样本;三是从stata里学到的,对数据做结尾或者缩尾处理。这里的结尾处理其实就是同第二个方法,在样本量足够大的情况下删除首尾1%-5%的样本。缩尾指的是人为改变异常值大小。如有一组数据,均值为50,存在几个异常值,都是500多(我这么说有点夸张,大概是这个意思),缩尾处理就是将这几个500多的数据人为改为均值+3标准差左右数据大小,如改为100。总结而言,我个人认为做数据变换的方式比较好,数据变换后再做图或描述性统计看数据分布情况,再剔除个别极端异常值。


心得4:如何做好回归分析。经过多次实战,以及看了N多视频,上了N多课,看了N多专业的书。我个人总结做回归的步奏如下:1是承接心得1-3,对数据进行预处理,替换缺失值和处理异常值;2是将单个自变量分别与因变量做散点图和做回归,判定其趋势,并做好记录(尤其是系数正负号,要特别记录);3是自变量和因变量一起做相关系数,看各个变量相关关系强弱,为下一步检验多重共线性做准备;4是自变量多重共线性诊断。若变量存在多重共线性,可采用主成分回归,即先将存在多重共线性的变量做主成分分析合并为1个变量,然后再将合并成的新变量和其余自变量一起纳入模型做回归;5是做残差图,看残差图分布是否均匀(一般在+-3个单位之间均匀分布就比较好);6是报告相应结果。


心得5:看到论坛上有网友问为什么他(她)老师不建议采用后向步进法处理变量多重共线性。记得张文彤老师说过他有个同学做过一个研究,即采用后向步进法剔除变量的方式去做回归,得到的结果犯错的几率比较大。张老师也不建议用这个方法处理多重共线性。处理多重共线性比较好的方法是做主成分回归。


心得6:有个朋友问我在报到回归结果时用未标准化的回归系数好,还是用标准化后的回归系数好。我个人觉得这个问题仁者见仁智者见智,要看想表达什么。具体而言,如果想表达在其它条件不变的情况下,自变量X每变化1个单位,因变量变化多少个单位,这种情况用未标准化回归系数就好;如果想比较各个自变量对因变量影响的相对大小,即判断相对而言,哪个变量对因变量影响更大。这时需要消除量纲的影响,看标准化后的回归系数。


心得7:这是投稿一篇SSCI外审专家提出的意见。我做的是无序多分类logistic回归模型。因变量分了5类,有一类个数比较多,达到300多,有1-2类个案比较少,只有30左右。专家提到了要做稳健性检验。这个用stata软件编程加一个robust即可解决问题。不知道在SPSS里面怎么做。欢迎知道的朋友一起讨论下。我个人认为这是一个好问题的。不做稳健性检验模型可能受一些极端值的影响,结果不稳定。可能本来显著的变量剔除1-2个样本后就变得不显著了。所以做回归分析稳健性检验也比较重要。


PS:如果有可能,我希望在后面的心得中附上实际操作的步奏图和解释的。看看有没有人需要这个。不然可能说的一些东西需要的人能看明白,但还是不清楚怎么做。希望和大家一起交流学习。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:SPSS数据分析心得小结 SPSS数据分析心得 spss数据分析 数据分析心得分享 spss数据 SPSS数据分析心得小结 数据分析心得分享

回帖推荐

王爱张0923 发表于63楼  查看完整内容

楼主可以放一些后续图和讲解,大家一起学习!O(∩_∩)O~

谨言雪 发表于58楼  查看完整内容

LZ写的很详细,获益匪浅!

yulinwei 发表于56楼  查看完整内容

厉害,学到不少东西

手扶式拖拉基 发表于53楼  查看完整内容

写的确实好

臭屁的乐乐瓜 发表于52楼  查看完整内容

赞~看了两个楼主的帖子了,写的很详细,一下就学会了。

【琴】 发表于26楼  查看完整内容

写的不错,回归系数我一般都用标准化系数

hrh_xa 发表于22楼  查看完整内容

赞!同意将后续数据处理步骤列出,便于大家学习讨论;同时有感于楼主的心得之作,后续也将自己数据处理的心得记录,以利学习!

song787669 发表于20楼  查看完整内容

使用一个具体案例就更加好了。

damai4001 发表于16楼  查看完整内容

赞,期待后续

damai4001 发表于15楼  查看完整内容

写的很好,很有启发,谢谢楼主

JustinPingGu 发表于12楼  查看完整内容

很棒,真心学到东西,多分享实例哈

yyalex2009 发表于10楼  查看完整内容

学习了。

gxnnhsd 发表于6楼  查看完整内容

非常正确的思路,做统计分析之前必须对数据先进行清洗。最好再用统计描述把最小、最大值列出,看有无超出合理范围的数字,如有,先进行处理。

晴天滴雨2015 发表于4楼  查看完整内容

谢谢分享~~

huangap 发表于2楼  查看完整内容

已有 15 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
douyaoyao + 5 + 5 + 5 热心帮助其他会员
菇凉凉水水 + 1 + 1 + 1 精彩帖子
criscuo + 1 + 1 + 1 精彩帖子
hxlyxj + 5 + 5 + 5 精彩帖子
zouguangyong + 100 + 2 + 3 + 2 精彩帖子
18305181536 + 1 + 1 + 1 精彩帖子
天雨流芳黄 + 1 + 1 + 1 热心帮助其他会员
niuniuyiwan + 60 + 5 + 5 + 5 精彩帖子
xiaowenzi22 + 20 观点有启发
JustinPingGu + 1 精彩帖子

总评分: 经验 + 220  论坛币 + 40  学术水平 + 26  热心指数 + 32  信用等级 + 22   查看全部评分

本帖被以下文库推荐

说话是一种能力,少说是一种智慧
沙发
huangap 发表于 2015-2-6 18:26:00 |只看作者 |坛友微信交流群
已有 1 人评分经验 热心指数 收起 理由
xddlovejiao1314 + 10 + 1 鼓励积极发帖讨论

总评分: 经验 + 10  热心指数 + 1   查看全部评分

使用道具

藤椅
xddlovejiao1314 学生认证  发表于 2015-2-6 21:46:31 |只看作者 |坛友微信交流群
huangap 发表于 2015-2-6 18:26

使用道具

谢谢分享~~
已有 1 人评分经验 热心指数 收起 理由
xddlovejiao1314 + 10 + 1 鼓励积极发帖讨论

总评分: 经验 + 10  热心指数 + 1   查看全部评分

使用道具

报纸
xddlovejiao1314 学生认证  发表于 2015-2-7 20:33:45 |只看作者 |坛友微信交流群
晴天滴雨2015 发表于 2015-2-6 23:52
谢谢分享~~

使用道具

地板
gxnnhsd 发表于 2015-2-8 01:34:57 |只看作者 |坛友微信交流群
非常正确的思路,做统计分析之前必须对数据先进行清洗。最好再用统计描述把最小、最大值列出,看有无超出合理范围的数字,如有,先进行处理。
已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
xddlovejiao1314 + 100 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 100  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

7
xddlovejiao1314 学生认证  发表于 2015-2-8 12:18:09 |只看作者 |坛友微信交流群
gxnnhsd 发表于 2015-2-8 01:34
非常正确的思路,做统计分析之前必须对数据先进行清洗。最好再用统计描述把最小、最大值列出,看有无超出合 ...
有时间多交流学习。

使用道具

8
tinghaodi 发表于 2015-2-9 16:28:46 |只看作者 |坛友微信交流群
写的确实好
已有 1 人评分经验 热心指数 收起 理由
xddlovejiao1314 + 10 + 1 鼓励积极发帖讨论

总评分: 经验 + 10  热心指数 + 1   查看全部评分

使用道具

9
xddlovejiao1314 学生认证  发表于 2015-2-9 16:33:15 |只看作者 |坛友微信交流群
tinghaodi 发表于 2015-2-9 16:28
写的确实好
谢谢,多交流啊~

使用道具

10
yyalex2009 发表于 2015-2-12 22:55:56 |只看作者 |坛友微信交流群
学习了。
已有 1 人评分经验 热心指数 收起 理由
xddlovejiao1314 + 10 + 1 鼓励积极发帖讨论

总评分: 经验 + 10  热心指数 + 1   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 23:05