首先,非常感谢连玉君老师!!!
连玉君老师2010年曾经写过一篇博文(http://blog.cnfol.com/arlion/article/1287199937-28549911.html)以解决这个问题,不过,现在国泰安数据库的文件说明内容及格式较2010年有较大变动,使用连老师博客提供的代码已经不能解决。所以我对连老师的程序进行了一些改动。现在分享出来,或许会对有的坛友有帮助。
------------------------------------------------------------------------------------------------------------
准备工作:
Stata下载的数据解压后一般会有一个txt文件(文件名中含有“[DES]”),它对各变量的意义进行了说明,如图所示:
1:打开这个txt文件,全选,复制,粘贴到Stata的Data-editer里面,如下图:
2:执行如下命令:
replace var1 = subinstr(var1," - ","-",.)
// subinstr为字符替换函数,相当于office里面的Ctrl+H
replace var1 = subinstr(var1," ["," *[",.)
split var1, p(*) gen(s)
//以*为分隔点,将var1拆分出新变量s1,s2 ,…,sk+1(k为var1中*的个数)
gen str20 s3 = " label var "
replace s1 = lower(s1)
//将变量名中所有字母转换为小写,如需转换为大写则将lower写为upper
replace s2 = `"""' + s2 + `"""'
gen a1 = " "
gen a2 = a1
order a1 s3 s1 s2 a2
keep a1 s3 s1 s2 a2
3.将data-editor窗口中的内容贴入do-editor文件即可:


雷达卡




京公网安备 11010802022788号







