软件:
用stata13处理的 打开do文档也需要stata13,否则中文会乱码。
电脑配置:
处理器越高越好,对内存要求比较大,形成最后的面板数据文件需要10个G运行内存左右(内存小会保存不了,卡死),硬盘空间所有的文件跑下来需要100多G ;本人用i7多线程的笔记本处理2多小时左右就能跑出最后数据,用i3台式机,12年老电脑,内存加到16G,大约需要6个小时左右吧。
处理数据的原则:
原始数据直接加载到stata中,所有的处理过程都用stata命令操作,用stata保存的数据不覆盖原来的数据。
这样做的好处时,(1)保持数据的原始性,所有的操作步骤都清晰可见,其实数据处理过程都会有错误出现,发现错误的时候这样可以修改stata命令后重新执行。不会出现中间手动修改后发现错误后不可复制以前的步骤。(2)之后年份数据出来之后,方便进行更新,按照思路下来是很容易合成的。
下面的文件都是dta格式的,对所有变量的代码和标签进行统一,无须再次调整
2013.txt
(66 Bytes, 需要: RMB 8 元)
2012.txt
(66 Bytes, 需要: RMB 8 元)
2011.txt
(66 Bytes, 需要: RMB 8 元)
2010.txt
(66 Bytes, 需要: RMB 8 元)
2009.txt
(66 Bytes, 需要: RMB 8 元)
2008.txt
(66 Bytes, 需要: RMB 8 元)
2007.txt
(66 Bytes, 需要: RMB 5 元)
2006.txt
(66 Bytes, 需要: RMB 5 元)
2005.txt
(66 Bytes, 需要: RMB 5 元)
2004.txt
(66 Bytes, 需要: RMB 5 元)
2003.txt
(66 Bytes, 需要: RMB 5 元)
2002.txt
(66 Bytes, 需要: RMB 5 元)
2001.txt
(66 Bytes, 需要: RMB 5 元)
2000.txt
(66 Bytes, 需要: RMB 5 元)
1999.txt
(66 Bytes, 需要: RMB 5 元)
1998.txt
(66 Bytes, 需要: RMB 5 元)
处理过程的do文档
数据处理过程 结果.txt
(67 Bytes, 需要: RMB 500 元)