情况是这样的:
假设我一个年份变量,从2000年到2010年,然后每年有3个地区编号,为A, B, C.
用 bysort 年份: tabulate 编号
可以得到非常直观的结果,就是每个地区编号在某个年份有多少次观测(observations)。
现在我想把发生数在20以下的观测值全部drop掉,请问该怎么做?比如说,在2003年,A区只有8个观测值,那么就drop掉所有2003年的A区观测。
用 bys 年份 (编号): egen freq = count(编号) 并不能带来我想要的结果,freq的数量很大,明显和前面生成的表格不一样。


雷达卡




京公网安备 11010802022788号







