楼主: icybluexia
3333 3

stata菜鸟求助聚类分析?因子分析?or 都不需要? [推广有奖]

  • 0关注
  • 0粉丝

本科生

51%

还不是VIP/贵宾

-

威望
0
论坛币
118 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
7907 点
帖子
11
精华
0
在线时间
187 小时
注册时间
2009-11-30
最后登录
2018-10-17

楼主
icybluexia 发表于 2011-6-14 20:55:46 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
没有系统学过stata,论文用logit模型,数据来自问卷,很多缺失值,很多自变量。问卷的有些自变量是相似的,想把那么多变量合并成几组,来检验这几个因素对因变量的解释情况。
请问这个该用因子分析还是聚类分析?我只是想简单的把一些变量分个组。。
PS,这种分析如果要应用到panel data是否可行?

谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 因子分析 聚类分析 tata panel data 求助 聚类分析 因子分析 菜鸟 Stata

沙发
蓝色 发表于 2011-6-14 21:27:40
根据  理论和常识来确定变量

藤椅
icybluexia 发表于 2011-6-17 15:58:54
2# 蓝色
谢谢版主,我已筛选至38个自变量。。。
可是有些问题,比如有5个变量是这样的数据
1.你认为你活到75岁的概率有多大
2.你认为你活到80岁的概率有多大
3.你认为你活到85岁的概率有多大
4。你认为你活到90岁的概率有多大
5.你认为你活到100岁的概率有多大

这都是关于longevity的自我评估,我该如何处理这样的5个相关的变量呢?需要做聚类/因子分析么?

求解答,谢谢!!

板凳
h3327156 发表于 2011-6-17 16:41:41
我个人觉得,先不用那么急。
单就数据来自问卷,很多缺失值 这一句话,就很值得探索。

当您依据蓝色版主的那句 "根据  理论和常识来确定变量"
同时经过您专业的经济素养,筛选至38个自变量。
那么,先看看这些变数的叙述统计吧! 首先确定,有没有违反您的直觉。
再则,当这些变数同时被考虑进去模型时,您造成的missing值个数有多少个。
譬如A及B与C三个变数,您未来打算放入模型,那A与B及C有各自的缺失值,
放入模型后,通常进行的,会是min{A,B,C}三者最小无缺失值的个数。

简言之,因为Missing value的问题,最后,您要从最简单的叙述统计,
去探讨有无违反直觉,有无丧失样本的代表性。 【这是最基本,但也最容易被质疑的地方】
如果没有丧失,再接着去探讨后续的研究问题吧!

当然,现代有关Missing值得处理,已发展成一门学问,
而stata的手册 [MI] 也进行了部份探讨与介绍。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-2 06:31