- * Example generated by -dataex-. To install: ssc install dataex
- clear
- input double(id industry year sale sd)
- 2 2 2011 105 12.561846997953765
- 3 3 2011 99 12.561846997953765
- 1 1 2011 97 12.561846997953765
- 4 4 2011 82 12.561846997953765
- 5 5 2011 75 12.561846997953765
- 4 4 2012 92 3.391164991562634
- 1 1 2012 97 3.391164991562634
- 5 5 2012 88 3.391164991562634
- 3 3 2012 93 3.391164991562634
- 2 2 2012 90 3.391164991562634
- 4 4 2013 123 17.34358671094304
- 1 1 2013 98 17.34358671094304
- 2 2 2013 101 17.34358671094304
- 3 3 2013 77 17.34358671094304
- 5 5 2013 113 17.34358671094304
- 1 1 2014 103 12.529964086141668
- 4 4 2014 117 12.529964086141668
- 3 3 2014 95 12.529964086141668
- 5 5 2014 85 12.529964086141668
- 2 2 2014 90 12.529964086141668
- end
我想要画sale的标准差sd关于年份year的散点图,使用代码:
scatter sd year
但是虽然画出来看上去只有四个点,(因为year只有4年,而每年虽然有多个样本,但是sd的数值是一样的),但实际上stata应该是画了20个点(即我的全样本,只是说因为很多点重合了)
我的实际问题是,由于我的样本量很大,约8万个样本,而我想画的图实际上类似于上面的例子,可能只需要画20年的散点图,总共也只需要有20个点,但为了得到这20个点的散点图,用scatter命令不得不画8万个点,非常消耗计算机资源,也经常导致我的stata卡死。。。。请问各位老师有什么优化的算法么?万分感谢!


雷达卡



京公网安备 11010802022788号







