我已经购买了数据一段时间,并做了数据清理和整合,来说下这份数据的优缺点吧,以免更多的人不清楚细节白白浪费钱。
优点:每个省份下面都有一些城市,虽然很多城市其实是不全的,但是找到那么多个excel表,相信是费了时间和功夫的。
缺点:1.只有少数的几个城市是统计到了1997年,大部分城市其实并没有那么长的统计时长,而且缺漏的城市比较多。
2.指标主要包括降水量,气温还有日照时数,但是也有城市连这三个指标都不全,可能只有一个或者两个指标。当然也有少数城市统计了风速和其他指标,但想做成面板数据100%的不可能。
3.整个统计其实非常杂乱,我自己做数据清理大概花了1周多的时间,有的城市横向排列,有的纵向排列,最关键的是里面有很多看不见的双引号,导致数据的处理非常麻烦,根本不可能直接用stata转。(有些引号是需要复制到文本文档中才可以看到,这意味着所有的数据其实并不是数据本身的格式,处理的时候一定要仔细)
4.还有些数据一列排了好几个指标,总之非常混乱,做数据清理真的需要花功夫
5.数据本身不值199,既然要卖,自然是整理好的,一盘散沙,确实有点不值得。
以上,供参考。(无攻击,只是购买方的一点体会)
|