楼主: luolibjfu
2052 8

[问答] 请教家庭和个人数据合并后,数据分析如何不重复计算 [推广有奖]

  • 1关注
  • 0粉丝

本科生

45%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
2.0001
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
241 点
帖子
11
精华
0
在线时间
174 小时
注册时间
2011-6-15
最后登录
2022-6-21

楼主
luolibjfu 学生认证  发表于 2019-5-8 17:11:44 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
合并家庭经济数据库和家庭成员数据库后,fid16 、pid、familysize16分别为家庭编码、个人编码、家庭人数,如何计算不同家庭人数的频数分布?直接tab familysize16的话,会将同一家庭的其他成员的家庭人数重复计算,查阅到的有runby、levelsof 等,但不是很理解,请教各位老师如何处理?谢谢~



        copy starting from the next line        ------        ----------------
  1. * Example generated by        -dataex-. To install: ssc install        dataex
  2. clear
  3. input double(fid16 pid        familysize16)
  4. 100051 110043107 3
  5. 100051 100051502 3
  6. 100051 100051501 3
  7. 100160 120009102 1
  8. 100286 130005103 1
  9. 100376 130094103 2
  10. 100376 100376551 2
  11. 100435 100435552 4
  12. 100435 130155521 4
  13. 100435 277731501 4
  14. end
  15. label values pid pid
复制代码



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:个人数据 数据合并 数据分析 generated Starting STATA CFPS数据 家庭与个人数据合并

回帖推荐

黃河泉 发表于6楼  查看完整内容

试试
已有 1 人评分热心指数 收起 理由
eijuhz + 2 精彩帖子

总评分: 热心指数 + 2   查看全部评分

沙发
黃河泉 在职认证  发表于 2019-5-8 18:01:00
根本看不懂你要什么?请根据资料举例!

藤椅
luolibjfu 学生认证  发表于 2019-5-9 08:18:47
老师,我可能没表述清楚,要计算的是家庭人数的分布,比如1人户、2人户、3人户的占比,但是目前数据中同一个家庭编码下有多人,得出的是并不是以家庭为单位的频数分布,需要除以对应家庭人数(比如计算的3人户的频数是3077,需要将其除以3得出的1026才是以家庭为单位的家庭规模),请问老师,这种情况在stata中如何处理?谢谢~

板凳
luolibjfu 学生认证  发表于 2019-5-9 08:19:12
黃河泉 发表于 2019-5-8 18:01
根本看不懂你要什么?请根据资料举例!
老师,我可能没表述清楚,要计算的是家庭人数的分布,比如1人户、2人户、3人户的占比,但是目前数据中同一个家庭编码下有多人,得出的是并不是以家庭为单位的频数分布,需要除以对应家庭人数(比如计算的3人户的频数是3077,需要将其除以3得出的1026才是以家庭为单位的家庭规模),请问老师,这种情况在stata中如何处理?谢谢~

报纸
luolibjfu 学生认证  发表于 2019-5-9 08:19:17
黃河泉 发表于 2019-5-8 18:01
根本看不懂你要什么?请根据资料举例!
老师,我可能没表述清楚,要计算的是家庭人数的分布,比如1人户、2人户、3人户的占比,但是目前数据中同一个家庭编码下有多人,得出的是并不是以家庭为单位的频数分布,需要除以对应家庭人数(比如计算的3人户的频数是3077,需要将其除以3得出的1026才是以家庭为单位的家庭规模),请问老师,这种情况在stata中如何处理?谢谢~

地板
黃河泉 在职认证  发表于 2019-5-9 08:51:48
luolibjfu 发表于 2019-5-9 08:19
老师,我可能没表述清楚,要计算的是家庭人数的分布,比如1人户、2人户、3人户的占比,但是目前数据中同一 ...
试试
  1. collapse familysize16, by(fid16)
复制代码

7
luolibjfu 学生认证  发表于 2019-5-9 09:05:40
黃河泉 发表于 2019-5-9 08:51
试试
谢谢您的建议,得出了!还想请教您,之后仍想以家庭为单位分析变量间的关系,比如家庭规模对消费的影响,是否应通过建立循环函数来实现?

8
黃河泉 在职认证  发表于 2019-5-9 10:04:11
luolibjfu 发表于 2019-5-9 09:05
谢谢您的建议,得出了!还想请教您,之后仍想以家庭为单位分析变量间的关系,比如家庭规模对消费的影响, ...
这我就不知道了!

9
luolibjfu 学生认证  发表于 2019-5-13 09:34:19
黃河泉 发表于 2019-5-9 10:04
这我就不知道了!
谢谢您!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-28 16:04