楼主: w269750749
107 0

[数据处理] 1998-2014年中国工业企业数据库 全部处理过程分享 [分享]

  • 6关注
  • 9粉丝

博士生

30%

还不是VIP/贵宾

-

威望
0
论坛币
602 个
通用积分
5.0002
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
2083 点
帖子
64
精华
0
在线时间
465 小时
注册时间
2012-11-24
最后登录
2019-10-12

w269750749 学生认证  发表于 2019-10-11 15:37:31 |显示全部楼层

详细的处理思路和过程在下面附件里有个PDF教程(如果有数据也可以借鉴我的思路自己整理)




首先声明
:数据代码是楼主自己跑的,本人也是穷学生,也经历了数据无从下手,抓耳挠腮的痛苦,数据是一次次调试,花费大量心血才完成的,希望能为大家提供便利。因为整个过程全部分享,中间没有手动操作,全部都是stata命令实现的。

软件:

用stata13处理的 打开do文档也需要stata13,否则中文会乱码。

电脑配置:

处理器越高越好,对内存要求比较大,形成最后的面板数据文件需要12个G运行内存左右(内存小会保存不了,卡死),硬盘空间所有的文件跑下来需要100多G ;本人用i7多线程的笔记本处理3多小时左右就能跑出最后数据。




处理数据的原则:

原始数据直接加载到stata中,所有的处理过程都用stata命令操作,用stata保存的数据不覆盖原来的数据。

这样做的好处时,(1)保持数据的原始性,所有的操作步骤都清晰可见,其实数据处理过程都会有错误出现,发现错误的时候这样可以修改stata命令后重新执行。不会出现中间手动修改后发现错误后不可复制以前的步骤。(2)之后年份数据出来之后,方便进行更新,按照思路下来是很容易合成的。




处理过程有什么问题可以加扣扣469705256交流,数据是自己处理的,自己研究过程有什么问题也可以交流。



中国工业企业数据库处理思路教程2019.10.11 - 副本.pdf (1.03 MB, 售价: 1 个论坛币)






您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-10-14 14:30