楼主: williamjhan
3159 17

[问题] 请问217个观测值是不是太少了? [推广有奖]

11
40904060 学生认证  发表于 2013-12-9 23:06:59
williamjhan 发表于 2013-12-9 22:56
2-5个就少了点,我的自变量分成3大类,每类有4个变量,这样就12个了,再加上因变量3个*4个模型
能不能先做因子 12个 合成3大个变量

12
williamjhan 发表于 2013-12-10 07:17:59
40904060 发表于 2013-12-9 23:06
能不能先做因子 12个 合成3大个变量
应该可以吧,但是我不会聚类分析的操作

13
飞起一脚 发表于 2013-12-11 15:50:01
数据量的大与小是相对的,根据你的描述,你的样本量已经比较大了。个人觉得你的重点应该是数据的预处理,很多时候大家都在追求复杂的模型(例如人工神经网络等等)但忽略了数据的预处理。而在很多数时候,决定数据分析成败的,就是数据的预处理。

几个比较常规的预处理步骤:1)去除 missing value 或者用 imputation 2 ) 降维 (主成分分析 pca 或者偏最小二乘 pls), 按照你现在的情况,降维与不降维都可以, 不过如果你的数据各变量间存在较高的相关性,则建议你提取主成分 3)在提出主成分前将数据进行Pareto Scale或者univariance scale, 否则你的主成分很有可能被小部分变量左右

14
williamjhan 发表于 2013-12-12 22:30:05
飞起一脚 发表于 2013-12-11 15:50
数据量的大与小是相对的,根据你的描述,你的样本量已经比较大了。个人觉得你的重点应该是数据的预处理,很 ...
你说的天花乱坠,我第二段基本没看懂

请问你论坛币为啥是-86,这维降的不错啊

15
飞起一脚 发表于 2013-12-13 01:55:40
为了避免歧义,一些具体的名词我用的英文原词,你可以百度或者google一下,应该就会了解了哈

16
williamjhan 发表于 2013-12-13 21:24:30
飞起一脚 发表于 2013-12-13 01:55
为了避免歧义,一些具体的名词我用的英文原词,你可以百度或者google一下,应该就会了解了哈
英文我都能看懂,只是这个中文看不懂

17
飞起一脚 发表于 2013-12-13 23:13:08
唉...我是得加强练习中文了....

18
williamjhan 发表于 2013-12-14 22:28:55
飞起一脚 发表于 2013-12-13 23:13
唉...我是得加强练习中文了....
Take it easy. Just kidding.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 16:42