响应版主提议,我也献上拙作一个:
这是我之前做的一个论文,用的是cgss数据(不过导师要求不能外泄,所以我会把相关的变量名修改下)
第一步:设定目录和权重,复杂抽样大多会设置一个权重和分层【解释-pw:proportional weight;分层:strata】,一般数据在最后边会注明这个东西。
cd: //设置目录//
use cgss.dta, clear
svyset s42 [pw=weight], strata(stratum)
第二步:修改变量,涉及到 recode, generate等命令:
我们一般都不在原数据上修改,保持数据的可靠性,所以recode之后,要gen一个新变量;在下面就是加一个label,便于自己识别(其实就是do文件编写习惯)
recode a44 (1=1) (2/3=0) (else=.), gen (vote)
label var vote "XXX活动"
对于收入,我们通用的方法是取对数,这样可以使之正态化(P-P图可以很清晰的看出来),不然不符合我们一般对于变量分布的要求:
gen inc=a8a
gen lninc=ln(inc)
label var lninc "收入对数"
控制变量:
通常包括年龄,性别,户籍等等
这个大家可以参照上面的步骤进行实践。
总之,变量这部分,大多都是参照这个模式,另:foreach,forvalue,一般用于规律性特别强的变量(或者模型),版主也提到了,有个例子在上面,我之前用的比较少,所以就不班门弄斧了~
第三步:描述性统计分析
logout, save(plitical) word replace: ///
tabstat varlist , ///
stats(n mean sd min max) c(s) f(%6.2f)
这个就是可以把自己做的描述性统计表格输出到word文档里面,当然,Excel还有LaTeX也都可以,只要把第一行命令中的“word”换了就可以。
第四步,建模和输出表格
OLS,GLS,HLM等等,自己根据教材建模,stata的help文件也都有很多例子,大家有兴趣可以自行参阅~
一般是这样,以OLS为例
reg y x1 x2
est store m1
reg y x3 x4
est store m2
esttab m1 m2 using C:\Users\filename.rtf, ///
replace b(%6.3f) se(%6.2f) star(^ 0.1 * 0.05 ** 0.01 *** 0.001) nogap compress
下面就是把两个模型输出来,replace后面就是表格参数,包括显著度设定,标准误,系数的(小数点后)位数,压缩等~
最后,数出来的filename就是我们的表格,拿出来自己修改就好了,就是比较标准的统计结果表格。
走过路过,希望各位看官给个好评~
PS:也希望各位支持版主工作~


雷达卡


,多看看连老师的do必有进步


京公网安备 11010802022788号







