楼主: jenphilip
9662 16

[面板数据求助] 请教关于CHNS数据处理的问题 [推广有奖]

  • 0关注
  • 0粉丝

初中生

38%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
0
学术水平
1 点
热心指数
0 点
信用等级
1 点
经验
374 点
帖子
11
精华
0
在线时间
12 小时
注册时间
2014-10-29
最后登录
2015-9-1

楼主
jenphilip 发表于 2015-8-22 22:02:31 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
这里想问一个自己都感觉很弱但是让我很困惑的问题。本人正尝试在用CHNS调查数据做性别收入差距的明瑟回归,但是在第一步数据处理上卡壳。在CHNS的调查问卷里关于教育年限的问题是这样的设置的,请问如何转换获得教育年限。是否可以获得?

QQ20150822-1@2x.jpg

因为我觉得受教育年限这个变量是很重要的,但是数据库里只有1993年大部分数据有“受教育年限”的直接显示。其他年限的都空缺。如何做明瑟回归? 以自己现在的智商,并不能找到用数据库里其他数据计算出受教育年限的方法。数据是在坛子里下载的,(这个帖子 https://bbs.pinggu.org/thread-2691991-1-1.html ) 我现在的感觉就是这个数据库不能用于做明瑟回归,至少除了1993年的数据不能,但是一直不解的地方就是,考虑到CHNS这个数据库的细化性和科学性,像“受教育年限”这样大量学术研究都需要的基本变量怎么会不能获得呢?尤其现在又质疑自己明瑟回归的理解是不是也不很透彻,现在就需要搞清楚状况,否则实在不能进行下一步。还希望各位能帮我解决这个基本的常识问题..谢谢大家! sample.txt (6.33 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:CHNS数据 数据处理 CHNS CHN thread CHNS eview stata

QQ20150822-1@2x.jpg (164.19 KB)

QQ20150822-1@2x.jpg

已有 1 人评分学术水平 信用等级 收起 理由
日新少年 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  信用等级 + 1   查看全部评分

本帖被以下文库推荐

沙发
夏目贵志 发表于 2015-8-22 22:17:15
没有可靠的办法。你怎么知道大学毕业的人中小学的时候没留级没跳级?

藤椅
raiderqi 发表于 2015-8-22 22:22:49
CHNS的数据调查的真的很详细。 。你可以根据不同的阶段来确定。基本可以

板凳
jenphilip 发表于 2015-8-22 22:38:17
raiderqi 发表于 2015-8-22 22:22
CHNS的数据调查的真的很详细。 。你可以根据不同的阶段来确定。基本可以
可是如何转换呢?能否一起探讨一下这个问题,还有就是我在eviews中打开原始dta文件时(因为并没有学stata,所以就用eviews了),还有一个变量是a11a_93,描述是教育年限,但是10万的sample里只有极少数有数据,其他都是NA,而我要研究成人数据,将数据筛选后更少,这个情况难道是数据损坏?因为现在根据他的调查问卷的问题,我不能找出计算教育年限的方法,但又觉得教育年限这样的重要变量不可能在这么一个严谨的研究数据库里不能获得,所以现在很困惑。。

报纸
shaode01 学生认证  发表于 2015-8-22 22:48:28 来自手机
jenphilip 发表于 2015-8-22 22:02
本人正尝试在用CHNS调查数据做性别收入差距的明瑟回归,但是在第一步数据处理上卡壳。在CHNS的调查问卷里关 ...
把部分原始数据贴出来,想办法给你整整

地板
shaode01 学生认证  发表于 2015-8-22 22:50:03 来自手机
jenphilip 发表于 2015-8-22 22:02
本人正尝试在用CHNS调查数据做性别收入差距的明瑟回归,但是在第一步数据处理上卡壳。在CHNS的调查问卷里关 ...
你就不能先在别的地方处理好再导入吗?比如在excel里面

7
jenphilip 发表于 2015-8-22 23:06:55
shaode01 发表于 2015-8-22 22:50
你就不能先在别的地方处理好再导入吗?比如在excel里面
谢谢回复!我现在已经把数据导入excel正在尝试处理。如果也能帮忙看看非常感谢!我先把原始数据传上来,然后再回复自己发现的问题。

8
jenphilip 发表于 2015-8-22 23:14:02
shaode01 发表于 2015-8-22 22:50
你就不能先在别的地方处理好再导入吗?比如在excel里面
变量a11是贴图的第一个问题,还有一个变量是a11a_93,在eview中打开原始数据描述教育年限,但是sample里只有很少一部分有这个数据,比如1993年的数据大部分有,现在我就在观察1993的数据,发现了一楼说的一些问题,比a11都是28--“2年中等技术学校”,但是a11_93的数据并不一样,有的是12年,有的是13年,里面应该是存在比如跳级,留级的问题,所以不知道怎么转换(找不到规律)..如果需要完整问卷调查我也可以提供。谢谢!

9
shaode01 学生认证  发表于 2015-8-24 00:13:19
=IF(ROUNDUP(AH2/10,0)=2,MOD(AH2,10),IF(ROUNDUP(AH2/10,0)=3,MOD(AH2,10)+6,MOD(AH2,10)+6+9))

给你个思路,在a11a_93列填充上面这个公式,公式是个嵌套if,意思就是如果a11是1开头的,那就取个位数,如果是2开头的就个位数加6,如果是其他的(3开头的)就个位数加6+9,然后复制到整列。
有个问题,有么有其他选项表明这个人是否跳级或留级,否则a11a_93没有借鉴意义,93是不是有特殊含义,比如学制?
已有 1 人评分热心指数 收起 理由
桂楚 + 2 观点有启发

总评分: 热心指数 + 2   查看全部评分

10
jenphilip 发表于 2015-8-24 00:43:06
shaode01 发表于 2015-8-24 00:13
=IF(ROUNDUP(AH2/10,0)=2,MOD(AH2,10),IF(ROUNDUP(AH2/10,0)=3,MOD(AH2,10)+6,MOD(AH2,10)+6+9))

给你个 ...
我觉得那个93是1993年的意思,以为只有1993的数据是有具体年限数据的。调查问卷里并没有跳级或者留级的选项。我现在个人觉得数据处理的差不多,打算去eviews里跑一下程序,看看自己对模型的理解对不对,非常感谢回复!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-7 23:20