楼主: hhwm_310
28652 97

[其他] 利用python处理《中国工业企业数据库(1998-2013)》——免费公开所有资料   [推广有奖]

91
windtalkerr(真实交易用户) 发表于 2022-1-10 13:32:24
gongyintan 发表于 2020-5-25 15:30
part1的第六步找出“所有法人代码为空或者长度小于9的”之后的补全是手动还是依据什么?谢谢
您好,我也遇到了这个问题,请教一下处理方法是什么?谢谢

92
hhwm_310(真实交易用户) 学生认证  发表于 2022-1-13 16:44:40
纵横分析 发表于 2021-9-9 17:06
您好,我在进行第十一步时也遇到了相同的问题,用您最原始的代码也同样会显示'utf-8' codec can't decode ...
很抱歉,希望你能解决了。太晚回复了。我觉得这种错误是偶然的不能解码,忽略掉错误后,会对那一行不进行处理,这可能就是一种误差吧,应该在可接受范围内。

93
hhwm_310(真实交易用户) 学生认证  发表于 2022-1-13 16:47:29
windtalkerr 发表于 2022-1-10 13:32
您好,我也遇到了这个问题,请教一下处理方法是什么?谢谢
这个步骤论文当中应该有写,这么久了我也不记得了。找出来是为了补上,补上的依据就是法人单位,以及其他信息,这样比较后,或许能找到相同信息,这样的话,法人代码就能补出来。也可以参考brant的论文。最后还是有一部分需要手工判断的。你这边如果要求质量不高的话,手工判断部分可以选择忽略,进行排除样本范围。

94
我是鬼马Casper(未真实交易用户) 发表于 2022-3-24 00:10:54
b站的视频也讲的很好,真的十分感谢!!!

95
zaaazs(真实交易用户) 学生认证  发表于 2022-4-9 20:01:48
zan
zan
zan

96
Monster520(真实交易用户) 发表于 2022-4-11 21:38:38
楼主 有问题请教 私信你了

97
淡抹年华(真实交易用户) 发表于 2022-4-28 23:25:37 来自手机
hhwm_310 发表于 2019-8-18 17:08
本来不想重新开帖子,想着也没有直接提供结果,也没必要藏着掖着了,方法、代码,视频都有,想学的就给个机 ...
您好,工企2012年缺失数据较多,请问您是怎么计算中间投入和工业增加值的呢

98
qgjtso111(未真实交易用户) 在职认证  发表于 2022-5-2 13:32:42
辛苦辛苦辛苦,感谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 17:00