夏目贵志 发表于 2015-8-17 21:22 
andruw是以前用过这个数据吗?
其实我最后做出来poverty的变量和你的几乎一样(但是和原文不同)。所以 ...
这个数据没有用过。我兴趣偏宏观。
figure 1 我用了两种思路尝试。第一种思路就是根据数据自己计算,不过画出图来跟原文差别比较明显。接着,我去
http://www.sca.isr.umich.edu/直接下载了quarterly data画,这是第二种思路。第二种思路的画出的图与原文没有差别。
figure 2-figure 5 没有直接的数据下载,便按最初想法一个一个计算。结果不错,与原文没有差别。夏目贵志兄提到,画这几个图最大的障碍是计算poverty threshold,这个我十分认同。不过,稍加分析会发现,每年poverty threshold数据表结构十分一致,只需写个loop就能处理所有的表格。
至于task 2和task 3,我都稍微尝试了,结果很难达到“小数点后三位之内都相同”(不过基本上都能达到“量级”上的一致)。考虑到原文与自己的研究无关,并且task 2和task 3并不需要比较复杂的技术(做table 1,2, 3, 我用了postfile 和testsave;做table 4,5,6,我用了outreg2),我就放弃了继续尝试。
总体而言,这篇文章replicate看似的简单,其实还是挺棘手的。比如,本文并非严格的学术期刊论文,很多信息没有较好的披露,需要我们去猜测。作者处理数据也未完全按照学术界普遍认可的方式来完成。
我之所以将重心放在task 1,主要是基于如下考虑:(1)这篇文章的图比较不典型,不像常规的学术论文中的图。学术论文中的图相对比较简洁,layout没有这篇文章这么丰富;(2)虽然该文的图不常规,不过对于认识Stata的画图引擎和Stata画图的“grammar”有很大助益。比如,调整graph region, plot region;在图形中输出不同的字体以及改变字体的大小;改变坐标轴tick的位置;调整legend;以及在graph combine中如何保持风格的一致性等等。
最后,再次感谢夏目贵志兄组织这个活动,参与的过程中让我获益匪浅。