【stat代码模板】频数分析、列联表分析、独立性检验_tabulate_tabi
感谢数说工作室
(1)单变量频数分析
————————模板————————
tabulate 变量if var=value,missing nolabel plot
————————模板————————
If…用来筛选满足条件的数据,可缺省。
Missing是将缺失值也同其他值一样列示,可缺省。
Nolabel使用数值而不使用数值标签,可缺省。
Plot显示相关频数的条形图,可缺省。
例如,列示出女生语文成绩的频数表
Tabulate Chinese if gender==”女”
(2)双变量频数分析、一致性检验
——————————————模板——————————————
tabulate 变量1 变量2, chi2 column row cell nolabel missing
——————————————模板——————————————
Column给出每一单元格频数占列频数的百分比。
Row给出每一单元格频数占行频数的百分比。
Cell给出每一单元格频数占总频数的百分比。
Chi2给出行列变量相互独立的pearson卡方检验结果,原假设是两变量独立。
比如,列示班级和性别的列联表,给出报告列百分数和行列变量独立性检验卡方值:
Tabulate class gender,column chi2
(3)直接对列联表分析
现在没有原始数据,只有如下现成的列联表,为3000名失业人员性别与文化程度的二维频数表:
文化程度 性别 | 大专 | 中专 | 高中 | 初中以下 | 合计 |
男 | 40 | 138 | 620 | 1043 | 1841 |
女 | 20 | 72 | 442 | 625 | 1159 |
合计 | 60 | 210 | 1062 | 1668 | 3000 |
现在分析视野人员的性别和文化程度十分有关,语句为:
tabi 40 138 620 1043\20 72 442 625,chi2
结果给出p值为0.062,拒绝原假设,认为失业人员的性别和文化程度有关。


雷达卡




京公网安备 11010802022788号







