请问,应该如何combine different variable, same observation at different time point?
(ps:目前做毕业论文中,分析我的研究数据需要用到STATA,才发现这个软件太强大了,有点混乱了!)
数据例子:
我的数据是同一批参与调查的人,在不同的时间里,填了一共5份问卷,现在我想要把所有时间点的数据,COMBINE成一个VARIABLE,应该如何操作?
简单来说,我的问卷是调查, 母亲怀孕的时候,吃FISH的FREQUENCY,就是:
Never Less than 1 1-3/m 2-4/w 5-6/w 1/day 2-3/day
FISH 0 1 2 3 4 5 6
Variable obs Mean Std.Dev Min Max
-------------------------------------------------------------------------------------------------------------------------
fish1 1205 xxx xx xx xx
fish2 1203
fish3 864
fish4 868
fish5 438
参与调查的总人数是1303,经过怀孕期, 所以按照时间点,把问卷做成了5份!我这里就简单的说,譬如,
数据里,fish1, 2, 3, 4, 5,代表了不同的时间点,比如说,fish1=第一个月, fish2=第二个月,etc
(参与调查的人数和人,都是同一批,只是在这5个月里,每个人在每一个月填了一份相同DESIGN的问卷,)
所以现在就得到了同一批参与者有5个时间点的数据,我现在需要把5个时间点的数据COMBINE成整个过程(变成这5个月内的总情况),就是说,把fish1, 2, 3, 4, 5全部combine成一个varible, 比如说, fish_all, 来看整个OVERALL的frequency,就是整个5个月内发生的情况frequency就是看整个怀孕期间,母亲吃FISH的FREQUENCY是怎样的情况。预期COMBINE后的VARIABLE应该是这个样子:(但我不知道怎么操作)
tab fish_all
fish_all Freq. Percent Cum.
------------------------------------------------------------------------------------------
0
1
2
3
4
5
6
------------------------------------------------------------------------------
Total xx xx
请问,是不是应该用merge呢?我试着操作了,总是出现错误!
另外,这种情况下,总数据的人数是1303,所有越到后面的时间点上,参与调查的人,并没有回答这一题,导致了很多数据丢失~
COMBINE后,observations的人数,是不是该是小于438的???意思就是,COMBINE只会把5个月里全部完成问卷的人的数据COMBINE在一起??
可能我解释得有点混乱,研究这个STATA,已经把我弄崩溃了~ 不好意思!
希望大家能帮帮我~ 谢谢~~


雷达卡




京公网安备 11010802022788号







