楼主: luolibjfu
1546 8

[问答] 请教家庭和个人数据合并后,数据分析如何不重复计算 [推广有奖]

  • 1关注
  • 0粉丝

本科生

45%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
2.0001
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
241 点
帖子
11
精华
0
在线时间
174 小时
注册时间
2011-6-15
最后登录
2022-6-21

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
合并家庭经济数据库和家庭成员数据库后,fid16 、pid、familysize16分别为家庭编码、个人编码、家庭人数,如何计算不同家庭人数的频数分布?直接tab familysize16的话,会将同一家庭的其他成员的家庭人数重复计算,查阅到的有runby、levelsof 等,但不是很理解,请教各位老师如何处理?谢谢~



        copy starting from the next line        ------        ----------------
  1. * Example generated by        -dataex-. To install: ssc install        dataex
  2. clear
  3. input double(fid16 pid        familysize16)
  4. 100051 110043107 3
  5. 100051 100051502 3
  6. 100051 100051501 3
  7. 100160 120009102 1
  8. 100286 130005103 1
  9. 100376 130094103 2
  10. 100376 100376551 2
  11. 100435 100435552 4
  12. 100435 130155521 4
  13. 100435 277731501 4
  14. end
  15. label values pid pid
复制代码



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:个人数据 数据合并 数据分析 generated Starting STATA CFPS数据 家庭与个人数据合并

回帖推荐

黃河泉 发表于6楼  查看完整内容

试试
已有 1 人评分热心指数 收起 理由
eijuhz + 2 精彩帖子

总评分: 热心指数 + 2   查看全部评分

沙发
黃河泉 在职认证  发表于 2019-5-8 18:01:00 |只看作者 |坛友微信交流群
根本看不懂你要什么?请根据资料举例!

使用道具

藤椅
luolibjfu 学生认证  发表于 2019-5-9 08:18:47 |只看作者 |坛友微信交流群
老师,我可能没表述清楚,要计算的是家庭人数的分布,比如1人户、2人户、3人户的占比,但是目前数据中同一个家庭编码下有多人,得出的是并不是以家庭为单位的频数分布,需要除以对应家庭人数(比如计算的3人户的频数是3077,需要将其除以3得出的1026才是以家庭为单位的家庭规模),请问老师,这种情况在stata中如何处理?谢谢~

使用道具

板凳
luolibjfu 学生认证  发表于 2019-5-9 08:19:12 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-5-8 18:01
根本看不懂你要什么?请根据资料举例!
老师,我可能没表述清楚,要计算的是家庭人数的分布,比如1人户、2人户、3人户的占比,但是目前数据中同一个家庭编码下有多人,得出的是并不是以家庭为单位的频数分布,需要除以对应家庭人数(比如计算的3人户的频数是3077,需要将其除以3得出的1026才是以家庭为单位的家庭规模),请问老师,这种情况在stata中如何处理?谢谢~

使用道具

报纸
luolibjfu 学生认证  发表于 2019-5-9 08:19:17 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-5-8 18:01
根本看不懂你要什么?请根据资料举例!
老师,我可能没表述清楚,要计算的是家庭人数的分布,比如1人户、2人户、3人户的占比,但是目前数据中同一个家庭编码下有多人,得出的是并不是以家庭为单位的频数分布,需要除以对应家庭人数(比如计算的3人户的频数是3077,需要将其除以3得出的1026才是以家庭为单位的家庭规模),请问老师,这种情况在stata中如何处理?谢谢~

使用道具

地板
黃河泉 在职认证  发表于 2019-5-9 08:51:48 |只看作者 |坛友微信交流群
luolibjfu 发表于 2019-5-9 08:19
老师,我可能没表述清楚,要计算的是家庭人数的分布,比如1人户、2人户、3人户的占比,但是目前数据中同一 ...
试试
  1. collapse familysize16, by(fid16)
复制代码

使用道具

7
luolibjfu 学生认证  发表于 2019-5-9 09:05:40 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-5-9 08:51
试试
谢谢您的建议,得出了!还想请教您,之后仍想以家庭为单位分析变量间的关系,比如家庭规模对消费的影响,是否应通过建立循环函数来实现?

使用道具

8
黃河泉 在职认证  发表于 2019-5-9 10:04:11 |只看作者 |坛友微信交流群
luolibjfu 发表于 2019-5-9 09:05
谢谢您的建议,得出了!还想请教您,之后仍想以家庭为单位分析变量间的关系,比如家庭规模对消费的影响, ...
这我就不知道了!

使用道具

9
luolibjfu 学生认证  发表于 2019-5-13 09:34:19 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-5-9 10:04
这我就不知道了!
谢谢您!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 21:49