详细的处理思路和过程在下面附件里有个PDF教程,免费(如果有数据也可以借鉴我的思路自己整理)
首先声明:数据代码是楼主自己跑的,本人也是穷学生,也经历了数据无从下手,抓耳挠腮的痛苦,数据是一次次调试,花费大量心血才完成的,希望能为大家提供便利。因为整个过程全部分享,中间没有手动操作,全部都是stata命令实现的。
软件:
用stata13处理的 打开do文档也需要stata13,否则中文会乱码。
电脑配置:
处理器越高越好,对内存要求比较大,形成最后的面板数据文件需要10个G运行内存左右(内存小会保存不了,卡死),硬盘空间所有的文件跑下来需要100多G ;本人用i7多线程的笔记本处理2多小时左右就能跑出最后数据,用i3台式机,12年老电脑,内存加到16G,大约需要6个小时左右吧。
处理数据的原则:
原始数据直接加载到stata中,所有的处理过程都用stata命令操作,用stata保存的数据不覆盖原来的数据。
这样做的好处时,(1)保持数据的原始性,所有的操作步骤都清晰可见,其实数据处理过程都会有错误出现,发现错误的时候这样可以修改stata命令后重新执行。不会出现中间手动修改后发现错误后不可复制以前的步骤。(2)之后年份数据出来之后,方便进行更新,按照思路下来是很容易合成的。
处理过程有什么问题可以加扣扣469705256交流,数据是自己处理的,自己研究过程有什么问题也可以交流。