共n个变量,其中一些观测可能有几个变量缺失,需要统计每个观测缺失值数量、非缺失值的和(或均值)时,由于缺失值不能进行直接加减运算,可能会导致有些麻烦,而egen函数可以计算其中非缺失值。
比如有问卷统计了所有人a b c三轮的成绩,但部分人只参加了两次,要计算总成绩和平均成绩,又要求参加了两轮者计算两轮平均成绩,不能把把缺失值直接转成0,此时可以用egen
webuse egenxmpl4, clear
egen hsum = rowtotal(a b c) //计算 a b c 的和,生成新变量hsum
egen havg = rowmean(a b c) //计算 a b c 的均值,生成新变量havg
egen hsd = rowsd(a b c) //计算 a b c 的标准差
egen hnonmiss = rownonmiss(a b c) //计算 a b c 中非缺失值个数
egen hmiss = rowmiss(a b c) //计算 a b c 中缺失值个数
list