16495 20

[面板数据求助] 如何用stata将三年的CFPS数据,同一标签下相同追踪样本的信息合并? [推广有奖]

  • 0关注
  • 0粉丝

初中生

0%

还不是VIP/贵宾

-

威望
0
论坛币
12 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
52 点
帖子
5
精华
0
在线时间
16 小时
注册时间
2017-4-18
最后登录
2018-6-4

楼主
昆哥光芒万丈 发表于 2018-5-19 22:55:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如图,合并成这样的面板数据便于分析
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:CFPS数据 stata CFPS FPS CFP

RM{74BOH04G@4A6TJZN]]VH.png (14.82 KB)

RM{74BOH04G@4A6TJZN]]VH.png

沙发
黃河泉 在职认证  发表于 2018-5-21 11:05:49
你若要问程序,永远附上资料;若要附上资料,永远用 dataex 印出资料;先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html

藤椅
昆哥光芒万丈 发表于 2018-5-21 21:49:50
我是stata新手,第一次发帖,请见谅。。。下面三个例子是CFPS2010、2012和2014的fid标签下前30个数据
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double fid
  4. 110001
  5. 110003
  6. 110005
  7. 110006
  8. 110007
  9. 110009
  10. 110010
  11. 110011
  12. 110013
  13. 110019
  14. 110020
  15. 110021
  16. 110022
  17. 110023
  18. 110024
  19. 110026
  20. 110027
  21. 110028
  22. 110030
  23. 110031
  24. 110033
  25. 110035
  26. 110038
  27. 110039
  28. 110040
  29. 110041
  30. 110042
  31. 110043
  32. 110044
  33. 110045
  34. end
  35. label values fid fid
复制代码

  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double fid
  4. 100453
  5. 105179
  6. 105592
  7. 106601
  8. 108244
  9. 108640
  10. 110003
  11. 110006
  12. 110009
  13. 110011
  14. 110013
  15. 110015
  16. 110020
  17. 110021
  18. 110022
  19. 110023
  20. 110024
  21. 110026
  22. 110027
  23. 110030
  24. 110031
  25. 110033
  26. 110035
  27. 110038
  28. 110040
  29. 110041
  30. 110042
  31. 110043
  32. 110045
  33. 110047
  34. end
  35. label values fid fid12
复制代码

  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double fid
  4. 100051
  5. 100125
  6. 100160
  7. 100286
  8. 100376
  9. 100435
  10. 100453
  11. 100551
  12. 100569
  13. 100724
  14. 100765
  15. 101129
  16. 101130
  17. 101288
  18. 101571
  19. 101698
  20. 101797
  21. 102888
  22. 102992
  23. 103614
  24. 103671
  25. 103766
  26. 103788
  27. 103924
  28. 104088
  29. 104521
  30. 104645
  31. 105492
  32. 106335
  33. 106383
  34. end
  35. label values fid fid14
复制代码



然后为了把这三年fid相同(三年都参加过)的样本找出来,其他的删掉,我在打开2010数据的command中输入
  1. merge 1:1 fid using "D:\QMDownload\stata\Stata12\2012.dta", keep(3) nogen
  2. merge 1:1 fid using "D:\QMDownload\stata\Stata12\2014.dta", keep(3) nogen
复制代码

然后显示interviewerid is str20 in using data
r(106);和releaseversion is str4 in using data
r(106);

板凳
玄一无相 在职认证  学生认证  发表于 2018-5-22 10:15:42
首先,我没用过CFPS,不过这里fid相同就意味着相同的受访者吗?
其次,从技术上而言,是说有的变量存储格式问题吧,interviewerid、releaseversion等变量,format标准下?

报纸
黃河泉 在职认证  发表于 2018-5-22 10:39:33
昆哥光芒万丈 发表于 2018-5-21 21:49
我是stata新手,第一次发帖,请见谅。。。下面三个例子是CFPS2010、2012和2014的fid标签下前30个数 ...
1. 爾後請用回復。 2. 你的關鍵 (問題) 變量例如 interviewerid、releaseversion 应该要 show 出来。

地板
昆哥光芒万丈 发表于 2018-5-22 15:48:57
玄一无相 发表于 2018-5-22 10:15
首先,我没用过CFPS,不过这里fid相同就意味着相同的受访者吗?
其次,从技术上而言,是说有的变量存储格式 ...
对fid就是家户号,三年都在的说明都参加过。格式如何标准求指导谢谢!

7
昆哥光芒万丈 发表于 2018-5-22 15:58:15
黃河泉 发表于 2018-5-22 10:39
1. 爾後請用回復。 2. 你的關鍵 (問題) 變量例如 interviewerid、releaseversion 应该要 show 出来。
没看到这个回复访员编码和第二个变量(该数据库也没说明这个变量的label)我取了40个:
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double interviewerid
  4. 110103002
  5. 110103002
  6. 110103002
  7. 110103002
  8. 110103002
  9. 110103002
  10. 110103002
  11. 110103003
  12. 110103003
  13. 110103003
  14. 110103003
  15. 110103003
  16. 110103003
  17. 110103003
  18. 110103003
  19. 110103002
  20. 110103002
  21. 110103002
  22. 110103002
  23. 110103002
  24. 110103002
  25. 110103002
  26. 110103003
  27. 110103003
  28. 110103003
  29. 110103003
  30. 110103003
  31. 110103001
  32. 110103001
  33. 110103001
  34. 110103001
  35. 110103001
  36. 110103001
  37. 110103001
  38. 110103001
  39. 110103001
  40. 110103001
  41. 110103001
  42. 110103001
  43. 110103001
  44. end
  45. label values interviewerid interviewerid
复制代码
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double releaseversion
  4. 5
  5. 5
  6. 5
  7. 5
  8. 5
  9. 5
  10. 5
  11. 5
  12. 5
  13. 5
  14. 5
  15. 5
  16. 5
  17. 5
  18. 5
  19. 5
  20. 5
  21. 5
  22. 5
  23. 5
  24. 5
  25. 5
  26. 5
  27. 5
  28. 5
  29. 5
  30. 5
  31. 5
  32. 5
  33. 5
  34. 5
  35. 5
  36. 5
  37. 5
  38. 5
  39. 5
  40. 5
  41. 5
  42. 5
  43. 5
  44. end
  45. label values releaseversion releaseversion
复制代码
Listed 40 out of 14798 observations

8
黃河泉 在职认证  发表于 2018-5-22 16:39:28
昆哥光芒万丈 发表于 2018-5-22 15:58
没看到这个回复访员编码和第二个变量(该数据库也没说明这个变量的label)我取了40个:Listed 40 ...
不知从何回答起。

9
认奴作郞 发表于 2018-7-12 09:46:05
你好,我现在遇到了跟你相同的问题:首先是如何将数据库2010、2012、2014、2016的面板数据整合起来,我尝试用个体作为唯一的标识进行合并,merge m:n Pid using data2.0 ,能显示出来,但不知道怎么定义年份这个变量。请问你的现在有结果了吗?望分享,谢谢!

10
认奴作郞 发表于 2018-7-12 09:47:19
你好,我遇到了跟你相同的问题,首先是如何将数据库2010、2012、2014、2016的面板数据整合起来,我尝试用个体作为唯一的标识进行合并,merge m:n Pid using data2.0 ,能显示出来,但不知道怎么定义年份这个变量。请问你的现在有结果了吗?望分享,谢谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-9 04:09