楼主: zmq2224650
1884 5

[编程问题求助] stata将数据合并后,发现同一个id但是对应不同的人 [推广有奖]

  • 1关注
  • 1粉丝

讲师

29%

还不是VIP/贵宾

-

威望
0
论坛币
2272 个
通用积分
59.1256
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
3537 点
帖子
283
精华
0
在线时间
255 小时
注册时间
2020-3-6
最后登录
2023-8-18

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我现在需要用到是2003-2017年的农户数据,逐年清理合并数据后,检查发现,同一个id对应的人并不一样,比如说id为1101101的人在2003年至2010年的年龄分别为70、71、72、73、74、75、76、77;性别为男。但是到了2011年-2017年年龄又分别为49、50
、51、52、53、54、55,性别为女。就是说明同意id 在2011年后换成了另一个人。整个样本量很大,出现这种情况的id还不少,要如何清理呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 数据合并 tata 合并数据 样本量 stata学习 数据处理 面板数据 农户 数据清理

沙发
蓝色 发表于 2020-10-16 14:30:49 |只看作者 |坛友微信交流群
检查原始没有合并前的数据
看看是不是错误的

使用道具

藤椅
冷冷静 发表于 2020-10-16 19:00:19 来自手机 |只看作者 |坛友微信交流群
zmq2224650 发表于 2020-10-16 10:28
我现在需要用到是2003-2017年的农户数据,逐年清理合并数据后,检查发现,同一个id对应的人并不一样,比如说 ...
这就是数据的问题了,可能你需要根据初始数据每一个样本的信息重新生成一个唯一识别的id

使用道具

板凳
zmq2224650 发表于 2020-10-17 14:31:50 |只看作者 |坛友微信交流群
蓝色 发表于 2020-10-16 14:30
检查原始没有合并前的数据
看看是不是错误的
先谢谢您的回复!我检查过了,合并前的数据里,唯一的id对应的人在不同的年份就出现了错误,比如2003年-2010年原始数据的id:1101101对应的是同一个男性(根据年龄、受教育程度等判断为同一个人),但是到了2011年-2017年同一个id:1101101却对应了一个女性。主要是出现这种情况的样本还挺多,就不知道如何进一步清理了

使用道具

报纸
zmq2224650 发表于 2020-10-17 14:37:25 |只看作者 |坛友微信交流群
冷冷静 发表于 2020-10-16 19:00
这就是数据的问题了,可能你需要根据初始数据每一个样本的信息重新生成一个唯一识别的id
嗯嗯,我想也只能这样了,应该是需要逐年,根据每一个人的基本信息(年龄、性别、受教育程度或者是否参与过农业技术培训等)匹配上之后,再生成唯一的id,可是我不知道这一步如何在stata 中实现,请问您知道要怎么操作么?

使用道具

地板
younger.han 发表于 2024-4-15 13:41:22 |只看作者 |坛友微信交流群
我也想知道这个问题怎么解决,最近在处理CFPS的数据,发现相同的pid确对应的不同了人。请问楼主现在知道怎样解决了吗

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 20:05