最近在搜集和统计上市公司数据,以前没做过,比想象中繁琐得多。但还是劝慰自己,学术本来就是一条辛苦的路,谁让自己选择了这条路呢。
一直不想去做调查问卷,很担心数据的质量问题,拿着错误的一手数据,做出来的也没什么意思,所以一直倾向于用上市公司数据做。好在,有国泰安,巨灵等数据库,要不然自己一个个去门户网站上找,那真是要累死人了。
从国泰安数据库下载了自己要用的数据,很高兴,接着就用excel开始做一些初步的筛选,统计和处理,没想到,一做就是一个月,其中大量数据缺失,都是自己一个一个公司到新浪财经上找出来,填进去的,有时候很烦很累,但是付出的越多,越是舍不得放弃。
今天,感觉快奔溃了,所以上来发泄一下,也平复一下自己的心情。统计数据的过程中,发现好多项的数据有明显错误,同一和前几年出入非常大,一看就知道是扯淡,也不知道国泰安是怎么统计数据,我闭着眼睛统计也知道不该是这样的结果。看到这样的数据,我真的想哭,不明白统计这样的数据有什么意义,当初还不如自己瞎编,想要什么结果有什么结果。
一个数据库,也有好几十万。面对的群体也是非常庞大,中国的学者们就拿着这些破烂数据去做什么所谓的研究,恐怕永远也研究不出什么。
就是发泄发泄,发泄完了,还是继续自己所谓的学术吧。呵呵。


雷达卡







京公网安备 11010802022788号







