有相当多的统计程序对数据要求比较严格,它们只有在变量服从或者近似服从正态分布的时候才是有效的,所以在对整理收集的数据进行预处理的时候需要对它们进行正态检验,如果数据不满足正态分布假设,就要对数据进行必要的转换。
关于正态性检验和数据转换,常用到sktest、ladder、gladder、qladder等操作命令。
sktest命令的语法格式为:
sktest varlist [if] [in] [weight] [, noadjust]
对于varlist中的每个变量,sktest给出了一个基于偏度的正态性检验和另一个基于峰度的正态性检验,然后将这两个检验合并成一个整体检验统计量。
ladder命令的语法格式为:
ladder varname [if] [in] [, generate(newvar) noadjust]
ladder的功能在于搜索幂级数的子集(Tukey 1977),尝试幂阶梯上的每一种幂并逐个反馈结果是否显著地为正态或者非正态,使用户可以非常方便地找到将变量(varname)转换为正态分布变量的有效转换方式。
gladder的功能在于根据ladder变换的结果展示出9个变换的直方图,从而可以更直观地看出幂阶梯和正态分布检验有效结合的结果。gladder命令的语法格式为:
gladder varname [if] [in] [, histogram_options combine_options]
qladder与gladder类似,区别是qladder显示varname变换的分位数,根据幂级数与正态分布的分位数进行比较。qladder命令的语法格式为:
qladder varname [if] [in] [, qnorm_options combine_options]
文章内容节选自《STATA统计分析从入门到精通》 “2.1.3 正态性检验和数据转换”一节,杨维忠、张甜编著,清华大学出版社。
系统学stata,这一本就够了:《STATA统计分析从入门到精通》 杨维忠、张甜编著,清华大学出版社 陈强老师作序推荐,国内少有的真正意义上的从入门到精通的教科书、工具书。


雷达卡



京公网安备 11010802022788号







