楼主: freecit
3561 2

[统计软件与数据分析] 关于在数据分析中将类别变量当作数值型变量的注意事项 [推广有奖]

  • 1关注
  • 0粉丝

已卖:496份资源

本科生

44%

还不是VIP/贵宾

-

威望
0
论坛币
2810 个
通用积分
0.6352
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
866 点
帖子
38
精华
0
在线时间
107 小时
注册时间
2014-10-24
最后登录
2021-10-9

楼主
freecit 发表于 2016-4-12 23:51:09 |AI写论文
100论坛币
请问在做回归分析当中,对于无序分类变量 有序变量,什么时候可以作为数值型变量出来,什么时候只能作为虚拟变量处理,有什么检验可以做,需要注意哪些事项,(最好能够提供文献出处,也能让我们这些新人更好的学习)希望前辈们可以提供指导,先谢谢诸位了。

关键词:注意事项 数据分析 数值型 变量处理 分类变量 回归分析 最好

沙发
robbieyeah 发表于 2016-4-15 03:12:08
Regression 是假设所有的数值都是IID,所以对无序数据适用比较好。有序数据会有autocorrelation,通常会有很大的偏差,但也要看具体问题。至于什么时候用 数值型变量 和 虚拟变量,这只能看你具体用什么函数做计算。 数值型变量通常是continuous variable (1,1.1,1.12,。。。)虚拟变量通常哦代表discrete variable (A,B,C,D)。如果你的数据是货币,温度之类的通常是数值,如果数据是性别,籍贯,就是虚拟。 当然你也可以把数据分成不同的bin来进行分类从而转化成虚拟,但这要是具体情况而定。

藤椅
freecit 发表于 2016-4-17 20:14:59
robbieyeah 发表于 2016-4-15 03:12
Regression 是假设所有的数值都是IID,所以对无序数据适用比较好。有序数据会有autocorrelation,通常会有很 ...
感谢回复,谢谢你的热心帮助,我的数据因变量是无序分类变量,自变量主要是里克特量表数据(1——5),做logistic回归,之前疑惑的地方是:对于里克特量表应该如何引入模型,是按照数值型变量引入一个X,还是引入4个虚拟变量。现在弄明白了,可以做一个似然比检验。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-30 11:46