|
做量化分析的一些思路:
首先,先对数据进行描述性统计计算,展示对被解释变量、解释变量以及控制变量的描述性统计分析,常用的命令是
/*描述性统计计算*/
sum 变量名称, detail
/*更高阶的做表方式*/
table (command) (result), ///
command(Obs=r(N) Min=r(min) Median=r(p50) Max=r(max) Mean=r(mean) Variance=r(Var) StdDev=r(sd): sum 变量1, detail) ///
command(Obs=r(N) Min=r(min) Median=r(p50) Max=r(max) Mean=r(mean) Variance=r(Var) StdDev=r(sd): sum 变量2, detail) ///
command(Obs=r(N) Min=r(min) Median=r(p50) Max=r(max) Mean=r(mean) Variance=r(Var) StdDev=r(sd): sum 变量3, detail) ///
nformat(%10.2g) sformat(%7s) /*计算描述性统计的结果*/
/*以此类推,有几个想要展示的变量就重复几次*/
/*输出描述性统计结果表*/
putdocx paragraph
collect style putdocx, layout(autofitcontents) title("表1.XXXX情况描述性统计表") indent(8 pt)
return list
collect label list command, all /*列出每一行的内容并报告行号*/
collect label levels command 1 "变量1的标签", modify
collect label levels command 2 "变量2的标签", modify
collect label levels command 3 "变量3的标签", modify
collect preview
putdocx collect /*将表格插入到word文档中*/
/*生成对描述性统计的文字说明*/
putdocx paragraph
putdocx text ("表1给出了对被解释变量、解释变量以及控制变量的描述性统计分析结果。"), font("宋体",10.5)
putdocx save A.docx , append
接下来,进入实证分析的部分
/*实证分析*/
gen inter= 解释变量1*调节变量2 /*通过解释变量1与调节变量2相乘,生成交乘项inter*/
reg 被解释变量 解释变量1 inter 解释变量2
predict e, residual
putdocx begin
putdocx paragraph, style(Heading1) /*设置格式为word标题1*/
putdocx text ("三、实证分析"), font("宋体",, black)
在报告计量结果之前,首先需要检验数据变量是否满足最小二乘法的基本假定,这些假定包括线性性、正态性、独立性和同方差性。可以通过以下几种图形检验的方法进行。
1. 残差分布分位正态图
检验回归误差项e偏离参考线的程度,具体命令为
/*正态性检验*/
/*分位正态*/
putdocx paragraph
quantile e, graphregion(fcolor(white) lcolor(white)) b1("图1. 残差分布分位正态图") xsize(8) ysize(6) scale(1.4)
graph export qua.png , replace
putdocx image qua.png, width(8 cm) height(6 cm)
/*说明*/
putdocx paragraph
putdocx text ("由图1可以看出,回归误差项e在均值点前半部分高于参考线,在均值点后半部分低于参考线,这表明回归误差项基本满足对称性,但在均值两侧的分布相比正态分布的数据更加集中,与正态分布存在一定差异。"), font("宋体",10.5)
2. 残差分布直方图(附参考线)
检验残差项e偏离正态分布的情况,具体命令为
/*正态拟合*/
putdocx paragraph
hist e, bin(7) percent normal graphregion(fcolor(white) lcolor(white)) b1("图2.残差分布直方图(附参考线)") fcolor(dknavy) lc(black) xsize(8) ysize(6) scale(1.4)
graph export hist.png , replace
putdocx image hist.png, width(8 cm) height(6 cm)
/*说明*/
putdocx paragraph
putdocx text ("图2的结论与图1结论类似。由图2可以明显看出,相较于正态分布,回归误差项在靠近均值附近的分布集中趋势更高,表现出有别于正态分布的形态,但是偏离程度不大。"), font("宋体",10.5)
3. 残差散点图
检验残差项e在随着X的变化是否没有明显变化规律,具体命令为
/*线性性与同方差性检验*/
putdocx paragraph
scatter e Dep01, graphregion(fcolor(white) lcolor(white)) yline(0) b1("图3.残差散点图(附参考线)")
graph export escatt.png , replace
putdocx image escatt.png, width(8 cm) height(6 cm)
/*说明*/
putdocx paragraph
putdocx text ("由图3可以看出,回归误差项较为均匀的分布在X轴两侧,且没有明显的证据表明随机误差项的均值随着X的变化而有规律的而变化,因此原模型满足线性性假定和独立性假定。但是,随着X的增加,回归误差项e的离散程度有轻微扩大的趋势,因此在最终模型当中,应当对方差进行修正,以避免异方差问题对显著性的影响"), font("宋体",10.5)
putdocx save A.docx, append
|