楼主: liuyangclick
15415 36

[数据软件处理] 小白VS中国工业企业数据库(5):相邻三年间的匹配 [推广有奖]

21
1023715119 发表于 2018-6-9 00:29:15 来自手机
请问楼主,我用的数据是2000-2006,在进行相邻三年匹配过程中,在生成unblance 2001-2002-2003时,总是不出现2003 no match,所以导致在这一步中,2003的样本量和原始样本量不一致。但是,其他各个相邻三年的数据样本都是正确的,请问您知道是什么原因吗?
焦急等待回复中,,非常感谢!

22
shineunique 发表于 2018-7-28 15:33:08
请问有哪位大神 知道这里面的provinece 指得是啥呀,这个1998-2003年没得什么省份的数据啊

23
经少林精舍1 发表于 2018-10-26 15:45:26
shineunique 发表于 2018-7-28 15:33
请问有哪位大神 知道这里面的provinece 指得是啥呀,这个1998-2003年没得什么省份的数据啊
同问,请问有答案了吗

24
dbdbdbdbt101 发表于 2018-10-26 22:19:26
经少林精舍1 发表于 2018-10-26 15:45
同问,请问有答案了吗
没有,我试了下剔除code重复值然后匹配上结果稍微少几千个企业,目前只有这个办法

25
windtalker312 发表于 2019-1-3 09:24:20
谢谢楼主分享

26
CAVS960210 发表于 2019-1-9 13:32:41
michaelcxb 发表于 2018-2-17 20:44
请问这一步应该在哪里进行?是不是用duplicates drop code?
你好请问一下这个code的意思是用收入和利润匹配吗?这个就算是同一个企业收入和利润不同年份也不一样吧。。

27
michaelcxb 学生认证  发表于 2019-1-10 02:56:38
CAVS960210 发表于 2019-1-9 13:32
你好请问一下这个code的意思是用收入和利润匹配吗?这个就算是同一个企业收入和利润不同年份也不一样吧。 ...
是的,但是我们用同一年的收入和利润匹配。

28
zwhappying 发表于 2019-5-9 15:30:23
请问 处理不一致的情况:处理不一致情况(disagreement ) (_merge==5 if "update" is used):这部分究竟是什么意思,不太明白是做什么的,还望楼主解答,谢谢

29
ww0123 发表于 2019-5-22 18:54:41
shineunique 发表于 2018-7-28 15:33
请问有哪位大神 知道这里面的provinece 指得是啥呀,这个1998-2003年没得什么省份的数据啊
省份信息是根据省地县码或者行政区划代码匹配得来的

30
FF182 发表于 2019-6-23 19:31:11
ww0123 发表于 2019-5-22 18:54
省份信息是根据省地县码或者行政区划代码匹配得来的
请问前面的程序有匹配得到这个变量吗?我按楼主的代码运行,到这一步卡了,没找到省份信息。跪求回答,非常感谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-3 06:27