楼主: hhwm_310
24821 97

[其他] 利用python处理《中国工业企业数据库(1998-2013)》——免费公开所有资料   [推广有奖]

81
hhwm_310 学生认证  发表于 2021-4-24 22:31:14 |只看作者 |坛友微信交流群
乐佩嘉嘉 发表于 2021-4-20 09:39
你好请问博主b站上传的视频有交叉匹配的讲解吗?交叉匹配的方法不太明白
你看到的视频,就是我所有的视频了,所有的方法都是思想,工具只是实现的方式。希望我的方法能给你提供思路,然后能学习下工具,实现自己的想法。所以,估计很难帮助你了

使用道具

82
hhwm_310 学生认证  发表于 2021-4-24 22:33:42 |只看作者 |坛友微信交流群
乐佩嘉嘉 发表于 2021-4-24 16:17
楼主您好,非常感谢您的分享,我想请教您下就是在调整字段顺序那里,您的统一文档里是有83个变量但是在每个 ...
这个国家统计局应该是有解释的吧。毕竟统计都是为了经济服务的,指标的变动和增减都很正常,所以,就看你自己需要哪些数据了。建议你查查资料

使用道具

83
hhwm_310 学生认证  发表于 2021-4-24 22:35:21 |只看作者 |坛友微信交流群
weq951753 发表于 2021-3-18 22:21
太强了
谢谢,能对你有帮助才是重要的。

使用道具

84
hhwm_310 学生认证  发表于 2021-4-24 22:35:48 |只看作者 |坛友微信交流群
13607664397 发表于 2021-3-20 09:02
好厉害楼主
谢谢夸奖,加油咯。

使用道具

85
乐佩嘉嘉 发表于 2021-4-25 12:22:11 |只看作者 |坛友微信交流群
hhwm_310 发表于 2021-4-24 22:33
这个国家统计局应该是有解释的吧。毕竟统计都是为了经济服务的,指标的变动和增减都很正常,所以,就看你 ...
感谢楼主回答!不过我想问的意思是,您有一个字段代码对照表文档不是自己设置了83个指标嘛,然后每年都根据统一的顺序做一个对照的表格来统一变量顺序,第一列是统一顺序的,第二列是原本的顺序,没有匹配上的就是404,但是我看到每年的文件之中统一顺序那列不止83个,而且每年的数量都不一样,您后面是会把83个变量之后的删掉吗?

使用道具

86
hhwm_310 学生认证  发表于 2021-4-25 22:30:51 |只看作者 |坛友微信交流群
乐佩嘉嘉 发表于 2021-4-25 12:22
感谢楼主回答!不过我想问的意思是,您有一个字段代码对照表文档不是自己设置了83个指标嘛,然后每年都根 ...
对的呢,其他的就不需要了,毕竟字段太多内存消耗大。你可以自己选择适合自己的字段,或者都统一了也是可以的

使用道具

87
乐佩嘉嘉 发表于 2021-4-29 10:35:45 |只看作者 |坛友微信交流群
hhwm_310 发表于 2021-4-25 22:30
对的呢,其他的就不需要了,毕竟字段太多内存消耗大。你可以自己选择适合自己的字段,或者都统一了也是可 ...
太感谢楼主了!!还有一个问题是您调整行政区划代码中的新旧代码转换文件,其中新代码是按照2015年的代码和名称吗?

使用道具

88
hhwm_310 学生认证  发表于 2021-5-9 18:18:29 |只看作者 |坛友微信交流群
乐佩嘉嘉 发表于 2021-4-29 10:35
太感谢楼主了!!还有一个问题是您调整行政区划代码中的新旧代码转换文件,其中新代码是按照2015年的代码 ...
理论是的,是按新不按旧的原则

使用道具

89
纵横分析 学生认证  发表于 2021-9-9 17:06:24 |只看作者 |坛友微信交流群
hhwm_310 发表于 2019-11-14 19:50
你好,报错的原因图片上已经说明了,再finished上面一行,是因为文件编码UTF-8不能解码文件的一个字符报错 ...
您好,我在进行第十一步时也遇到了相同的问题,用您最原始的代码也同样会显示'utf-8' codec can't decode bytes in position 2046-2047: invalid continuation byte的错误。在将第十步的文件进行了向utf-8的转换之后仍然不行,想请问您还有可能是什么原因导致的?

屏幕截图 2021-09-09 165800.jpg (155.95 KB)

屏幕截图 2021-09-09 165800.jpg

使用道具

90
纵横分析 学生认证  发表于 2021-9-17 16:44:05 |只看作者 |坛友微信交流群
纵横分析 发表于 2021-9-9 17:06
您好,我在进行第十一步时也遇到了相同的问题,用您最原始的代码也同样会显示'utf-8' codec can't decode ...
用去掉bom的方法也不管用,在open里加了errors = 'ignore'之后程序运行下去了,但是不知道会不会对后面造成影响。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 02:28