楼主: hhwm_310
24818 97

[其他] 利用python处理《中国工业企业数据库(1998-2013)》——免费公开所有资料   [推广有奖]

91
windtalkerr 发表于 2022-1-10 13:32:24 |只看作者 |坛友微信交流群
gongyintan 发表于 2020-5-25 15:30
part1的第六步找出“所有法人代码为空或者长度小于9的”之后的补全是手动还是依据什么?谢谢
您好,我也遇到了这个问题,请教一下处理方法是什么?谢谢

使用道具

92
hhwm_310 学生认证  发表于 2022-1-13 16:44:40 |只看作者 |坛友微信交流群
纵横分析 发表于 2021-9-9 17:06
您好,我在进行第十一步时也遇到了相同的问题,用您最原始的代码也同样会显示'utf-8' codec can't decode ...
很抱歉,希望你能解决了。太晚回复了。我觉得这种错误是偶然的不能解码,忽略掉错误后,会对那一行不进行处理,这可能就是一种误差吧,应该在可接受范围内。

使用道具

93
hhwm_310 学生认证  发表于 2022-1-13 16:47:29 |只看作者 |坛友微信交流群
windtalkerr 发表于 2022-1-10 13:32
您好,我也遇到了这个问题,请教一下处理方法是什么?谢谢
这个步骤论文当中应该有写,这么久了我也不记得了。找出来是为了补上,补上的依据就是法人单位,以及其他信息,这样比较后,或许能找到相同信息,这样的话,法人代码就能补出来。也可以参考brant的论文。最后还是有一部分需要手工判断的。你这边如果要求质量不高的话,手工判断部分可以选择忽略,进行排除样本范围。

使用道具

b站的视频也讲的很好,真的十分感谢!!!

使用道具

95
zaaazs 学生认证  发表于 2022-4-9 20:01:48 |只看作者 |坛友微信交流群
zan
zan
zan

使用道具

96
Monster520 发表于 2022-4-11 21:38:38 |只看作者 |坛友微信交流群
楼主 有问题请教 私信你了

使用道具

97
淡抹年华 发表于 2022-4-28 23:25:37 来自手机 |只看作者 |坛友微信交流群
hhwm_310 发表于 2019-8-18 17:08
本来不想重新开帖子,想着也没有直接提供结果,也没必要藏着掖着了,方法、代码,视频都有,想学的就给个机 ...
您好,工企2012年缺失数据较多,请问您是怎么计算中间投入和工业增加值的呢

使用道具

98
qgjtso111 发表于 2022-5-2 13:32:42 |只看作者 |坛友微信交流群
辛苦辛苦辛苦,感谢分享

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 00:00