楼主: lolo2xj
4943 11

[其他] 【已解决】Stata处理数据的问题 [推广有奖]

  • 0关注
  • 19粉丝

学习不止——永远的小学生

博士生

63%

还不是VIP/贵宾

-

威望
0
论坛币
3754 个
通用积分
6.8439
学术水平
38 点
热心指数
70 点
信用等级
37 点
经验
9340 点
帖子
260
精华
0
在线时间
312 小时
注册时间
2007-5-28
最后登录
2017-8-1

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教各位高手:我是用的是CHIP数据(1995和2002),其中在做农村教育收益率的问题时,需要将农村个人数据与家庭数据merge起来,而数据中教育年限考察的是家庭中各成员的,每个成员对应一份数据,同一个家庭中的成员对应一个由省市(a1)和户(b101)两个变量共同组成的家庭代码,而且不同的省会有相同的户的代码(所以确定一个家庭只能由a1和b101共同决定)。
现在我的想法是先把每个家庭中成员的平均受教育年限算出来,形成一个住户平均教育年限表,再去与住户收入表merge,请问这里用Stata命令是怎样的,该如何处理?
还有没有更好的办法?
我是stata的初学者,请各位赐教!!谢谢了!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 处理数据 tata 已解决 数据merge 收益率 而且 如何

沙发
lolo2xj 发表于 2009-12-9 00:43:37 |只看作者 |坛友微信交流群
我有尝试过用tabstat b110a  if a1==110221 & b101==101
(其中b110a为个人受教育年限, a1为省市代码(110221为其中的一个),b101为户代码)
但这样仅处理了一户,数据中共有7000多户,有没有对应的循环命令之类的?
我没学过编程,所以学这些命令都很慢很费劲,现在看的都还是基础。但急于要弄这个,所以只好求助大家,谢谢了!
拿了橘子就跑!!——Knowledge is power!

使用道具

藤椅
sungmoo 发表于 2009-12-9 09:10:37 |只看作者 |坛友微信交流群
这个需要贴出一个数据片段,根据数据来设计。

使用道具

板凳
ctx5518 发表于 2009-12-9 13:54:27 |只看作者 |坛友微信交流群
首先根据省代码和户代码建立连接变量连接两个数据库:egen unique_id=concat(province household)
merge

然后算出每户的人口数:   bysort unique_id: gen id=_n

然后机关家庭平均教育水平: bysort unique_id: egen mean_education=mean(b110a)

然后保留家庭中的第一个样本: keep if id==1
                                                          drop id
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
lolo2xj + 1 + 1 + 1 谢谢!

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

报纸
lolo2xj 发表于 2009-12-9 21:38:56 |只看作者 |坛友微信交流群
这是我要用的数据,CHIP1995的农村个人和家庭调查
谢谢!
3# sungmoo

CHIP1995.rar

2.9 MB

本附件包括:

  • 03012-0001-Data.dta
  • 03012-0002-Data.dta
  • Chinese Household Income Project, 1988 .pdf
  • CHIP(1995) descriptioncitation.pdf
  • CHIP(1995) Questionnaire.pdf
  • CHIP(1995)Codebook.pdf

拿了橘子就跑!!——Knowledge is power!

使用道具

地板
sungmoo 发表于 2009-12-9 21:48:47 |只看作者 |坛友微信交流群
lolo2xj 发表于 2009-12-9 00:37 现在我的想法是先把每个家庭中成员的平均受教育年限算出来
求平均值的分母是什么?(比如,每户全部人口?每户满足一定条件的全部人口?)

使用道具

7
sungmoo 发表于 2009-12-9 22:02:45 |只看作者 |坛友微信交流群
*设求平均值的分母是每户全部人口。数据文件均在默认目录中

use 03012-0001-Data, clear
collapse b110a,by(a1 b101)
mer using 03012-0002-Data
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
lolo2xj + 1 + 1 + 1 谢谢!

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

8
lolo2xj 发表于 2009-12-11 00:20:19 |只看作者 |坛友微信交流群
哦 谢谢了,试了一下,可以
非常感谢版主答疑解惑
我要求的是家庭>16&<60的劳动力的教育等情况
已经自行加了限制条件
再次感谢!!
7# sungmoo
拿了橘子就跑!!——Knowledge is power!

使用道具

9
lolo2xj 发表于 2009-12-11 00:21:09 |只看作者 |坛友微信交流群
感谢热心人!
4# ctx5518
拿了橘子就跑!!——Knowledge is power!

使用道具

10
lixiaosheng393 发表于 2009-12-15 18:11:43 |只看作者 |坛友微信交流群
有了这个命令collapse b110a,by(a1 b101)   你的分类什么的都好解决
已有 1 人评分热心指数 收起 理由
lolo2xj + 1 xiexie!!

总评分: 热心指数 + 1   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 05:50