楼主: xddlovejiao1314
11461 34

[问答] SPSS数据分析心得小结 [推广有奖]

教师

心灵导师

学术权威

74%

还不是VIP/贵宾

-

TA的文库  其他...

个人学术成果库

威望
6
论坛币
253191 个
通用积分
30832.8349
学术水平
1935 点
热心指数
2485 点
信用等级
1632 点
经验
716798 点
帖子
7056
精华
7
在线时间
5196 小时
注册时间
2013-5-24
最后登录
2024-3-23

一级伯乐勋章 初级学术勋章 初级热心勋章 初级信用勋章 中级热心勋章 中级学术勋章 中级信用勋章 高级热心勋章 高级学术勋章 高级信用勋章 特级热心勋章 特级学术勋章 特级信用勋章

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
心得1:我们做问卷调查的人,经常会遇到收集到的数据是偏正态分布的连续变量(主要表现为有极端值存在),可考虑用对数变换的方法对原始数据进行处理。倘若对数变换后还是存在很多极端值(看箱图),这时可考虑将其分组(如分成高、中、低),然后再通过设置两个虚拟变量的方式将分组后的变量处理后引入下一步的建模;


心得2:在对农户问卷数据做聚类分析时,先考察数据的分布,一般情况下很多变量均是正偏态分布,在不想去除极端值的情况下(去除极端值会造成本不多的样本再度流失)可考虑在系统聚类时用横向标准化的方法并用中位数进行聚类。这样既不损失样本,又能在不受极端值影响下考察数据的集中趋势,不至于得到不好甚至错误的分析结果(因为均值受极端值影响);

心得3:在做回归分析时(不管是线性回归还是logistic回归),先做变量间多重共线性诊断(可通过主成分回归解决多重共线性问题),然后在变量选择时依据0.05的标准依次剔除不显著的变量。这样做比单纯使用逐步向前或向后法要好。因为据估算,直接使用逐步向前或向后的方法选择变量,其犯错误的概率为1/3左右。故而,有时间还是人为的多跑跑模型为好,不要太依赖于软件所谓的“智能”;

心得4:在处理数据时,当存在极端异常值时(通过箱图判断),如果是正偏态分布,可通过取对数办法解决。如果数据里面包含负数,没法取对数时,可通过缩尾处理极端异常值。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:SPSS数据分析心得小结 SPSS数据分析心得 spss数据分析 spss数据 数据分析 正态分布 下一步 中位数 样本

已有 3 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
niuniuyiwan + 60 + 5 + 5 + 5 精彩帖子
我的素质低 + 40 + 10 精彩帖子
statax + 15 + 1 + 1 鼓励积极发帖讨论

总评分: 经验 + 60  论坛币 + 55  学术水平 + 6  热心指数 + 6  信用等级 + 15   查看全部评分

本帖被以下文库推荐

说话是一种能力,少说是一种智慧
沙发
gxnnhsd 发表于 2015-1-22 00:26:47 |只看作者 |坛友微信交流群
不错的Idea,谢啦!
已有 1 人评分经验 收起 理由
xddlovejiao1314 + 10 鼓励积极发帖讨论

总评分: 经验 + 10   查看全部评分

使用道具

藤椅
caicailuguo 发表于 2015-1-22 00:33:08 |只看作者 |坛友微信交流群
赞。请问心得3 怎么做  现在在做 m regression
已有 1 人评分经验 收起 理由
xddlovejiao1314 + 10 鼓励积极发帖讨论

总评分: 经验 + 10   查看全部评分

使用道具

板凳
南南数据 发表于 2015-1-22 01:08:02 |只看作者 |坛友微信交流群
不错啊,看得出是非常细心的研究者。
已有 1 人评分经验 收起 理由
xddlovejiao1314 + 10 鼓励积极发帖讨论

总评分: 经验 + 10   查看全部评分

使用道具

报纸
xddlovejiao1314 学生认证  发表于 2015-1-22 09:09:10 |只看作者 |坛友微信交流群
gxnnhsd 发表于 2015-1-22 00:26
不错的Idea,谢啦!
感谢感谢,多交流,呵呵~

使用道具

地板
xddlovejiao1314 学生认证  发表于 2015-1-22 09:11:08 |只看作者 |坛友微信交流群
gxnnhsd 发表于 2015-1-22 00:26
不错的Idea,谢啦!
不大清楚你想问的问题,你是想问主成分回归怎么做还是为啥问题呢?主成分回归是先对自变量做多重共线性诊断,将存在多重共线性的变量做主成分分析,合并成一个新的变量,然后再将新的变量和因变量做进一步的回归分析。

使用道具

7
xddlovejiao1314 学生认证  发表于 2015-1-22 09:12:01 |只看作者 |坛友微信交流群
南南数据 发表于 2015-1-22 01:08
不错啊,看得出是非常细心的研究者。
呵呵,感谢感谢,多交流啊。数据预处理比较重要,所以在这块最近费的时间比较多,才有这么一点心得。

使用道具

8
songchaoxiang 发表于 2015-1-22 11:48:06 |只看作者 |坛友微信交流群
我现在在学spss,我想问一下在进行显著性检验的时候,在不知道原假设的情况下,怎样通过p值判断结果是否显著?(在spss中)谢谢啦!!
已有 1 人评分经验 收起 理由
xddlovejiao1314 + 10 鼓励积极发帖讨论

总评分: 经验 + 10   查看全部评分

使用道具

9
xddlovejiao1314 学生认证  发表于 2015-1-22 14:30:23 |只看作者 |坛友微信交流群
songchaoxiang 发表于 2015-1-22 11:48
我现在在学spss,我想问一下在进行显著性检验的时候,在不知道原假设的情况下,怎样通过p值判断结果是否显著 ...
额,各个专业标准不一样,一般以0.05作为标准。小于等于0.05拒绝原假设,大于接收。

使用道具

10
songchaoxiang 发表于 2015-1-23 11:01:22 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-1-22 14:30
额,各个专业标准不一样,一般以0.05作为标准。小于等于0.05拒绝原假设,大于接收。
谢谢!这个我知道,我想问的是怎样判断原假设是什么?(在spss中)谢谢啦!!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 04:27