笔记:STATA||虚拟变量||分段作图
缘起:29号晚上听张老师讲计量,老师给出了下面一幅图,第二个明显要比第一个的拟合效果好很多。心向往之,回到宿舍后自己试了一遍,大致能做出一个差不多的结果,但是要比张老师的丑很多。把stata命令一步一步的写出来,做个交代,也留个纪念。
图中用到的数据是1980-2006年中国能源消费总量和名义GDP的数据,《中国统计年鉴》上就有,如下。给名义GDP和能源消费总量分别取个stata能识别的英文名字:GDP和Encon(就是Energy consumption的缩写)。
把数据导入stata,写一行命令就可以得到第一幅图,这是极简单的。
twoway (scatter encon gdp)(lfit encon gdp)
难在第二幅图。老师说,第二幅图实际上是两条抛物线(二次函数)的图形,以2000年为分界点,所以需要设置一个虚拟变量dummy,让它在1980-2000年间为0,在2001-2006年间记为1,然后再画图拟合。此时,用到的命令就是:
twoway (scatter encon gdp)(qfit encon gdp if dummy==0)(qfit encon gdpif dummy==1)
回车一下就能到的第二幅图,但是这图比起张老师的来丑了好多。等我以后学到新技术了,再来改进吧。
两幅图,实际上加上数据导入,一共只需要写三行命令即可。但是,在我自己写的过程中,无论以最简单的“stata 作图”还是复杂点的“stata 虚拟变量 作图”“stata 分段函数 作图”为关键词搜索,都没有发现网上有相关资料。自己一点点摸索出第二条命令,很辛苦但是也很满足。