楼主: bbs0805
115204 230

[学习心得] [讨论]Stata与R比较   [推广有奖]

201
xingxf 发表于 2014-6-16 10:11:12
trueeconlover 发表于 2014-6-16 09:49
哈哈哈 字里行间你确实水平很有限。断章取义和发挥想象力的能力倒是不错。我现在就是在一个论坛,已经说了 ...
我回了您的帖子,您又在已有的帖子上加内容,我说您引用的图表存在selection bias。您特意在前面的帖子上加上“你肯定又要跳出来说sample bias了”和“不是最理想单我不想花时间”。
您还加上“要不然我这个默默无名的普通小虾米当初早就选择去所谓的欧洲顶级大学了(已被录取)。”

看了您的回复,发现您水平确实高,又参加美国学术会议,还跟领军人物探讨用啥统计软件,还被欧洲顶级大学录取。但是给您提个小建议,您引用reference的水平相对一般。可是,我看美国人写的paper,可是特别讲究证据和reference啊。另外,还发现您给别人扣帽子的水平挺高,哈哈。

202
trueeconlover 发表于 2014-6-16 10:21:14
xingxf 发表于 2014-6-16 10:11
我回了您的帖子,您又在已有的帖子上加内容,我说您引用的图表存在selection bias。您特意在前面的帖子上 ...
我只说一句:我的modification是在你发帖之前。而并非你说的“我回了您的帖子,您又在已有的帖子上加内容”。 自己看看时间,欧洲天才。

203
xingxf 发表于 2014-6-16 10:26:40
trueeconlover 发表于 2014-6-16 09:49
哈哈哈 字里行间你确实水平很有限。断章取义和发挥想象力的能力倒是不错。还有我现在就是在一个论坛,已经 ...
我承认挺累的,但是跟高人请教不能怕累啊。看您改了上一贴,我刚回一帖,发现您把这贴又根据我前面的内容做了调整,让您费心了,不好意思。您找reference不想花时间,给我提名“现代孔乙己”,“欧洲大神”挺及时。看得出您做研究的时候具备信手拈来的能力。
另外,好奇怪啊,我只是说了“比如在欧洲,当然也可以很方便接触到美国资源和美国学者,也可以受到严格训练。在中国顶尖大学学习,也可以接触到美国资源和学者。而且,不论在中国,美国还是欧洲,大学也分档次啊,一概而论没什么意思。”
上面那些话我既没说我在欧洲大学学习,也没说我在中国顶尖大学学习。我只是想说欧洲和中国学者也能接触到美国资源。您给我加一个“欧洲大神”,我可担待不起啊。

另外,您说的对,太累了。为了别太累,此帖之后,我就不再回您了,当然,您精力充沛,新来一帖或者改改老帖不费吹灰之力,向您学习了。给您添麻烦了,不好意思。

204
trueeconlover 发表于 2014-6-16 10:30:41
xingxf 发表于 2014-6-16 10:26
我承认挺累的,但是跟高人请教不能怕累啊。看您改了上一贴,我刚回一帖,发现您把这贴又根据我前面的内容 ...
还是那句话:我的修改在你发帖之前,天才,看看发帖修改时间。。。

我从来没有根据你的内容作调整,你太高看你自己了。而是之前我就把内容给完善了,一想就知道你会怎么argue....

205
kewill 发表于 2014-6-17 14:10:30
学习了

206
xingxf 发表于 2014-6-17 18:02:35
我喜欢用Stata,原因很简单,就我目前的工作而言,SAS能做的,Stata也能做,而且Stata语法比SAS简洁的多,为什么不用Stata呢?但是,要说Stata的应用比SAS等软件更广泛,更受欢迎,目前,找不到这样的证据。目前的证据只能说明SPSS,SAS比Stata应用广泛的多,而R是越来越受欢迎。


前面有人贴出了一张说明Stata更受学者欢迎的图表,需要指出的是,那是一张预测图,那张图表的出处是http://r4stats.com/2013/05/14/beginning-of-the-end-v2/
原文在预测各种软件在未来的使用情况之前,先显示了目前各种软件的使用情况,那么目前的真实情况如何呢?
fig_7a_scholarlyimpactbig6.png
由图可知,SAS比Stata使用更广泛。


好了,下面是一张预测图,前面有人贴出来过
forecast.png
这张图是应用ARIMA进行的预测,预测是根据如下数据做出的:
data.jpg

从Google Scholar的数据可知,学术界SPSS和SAS的使用率远远高于Stata,不往远了说,就说2012年,SPSS的Google Scholar Hits是Stata的3倍多,SAS的Google Scholar Hits是Stata的2倍多,R的Google Scholar Hits都比Stata多。


那为什么预测图中Stata和R的在未来的受欢迎程度远远高于SPSS和SAS呢?作者说了:“The dip in SPSS use in 2002-2003 drove the function a bit crazy as it tried to see a repetitive up-down cycle, so I modeled the SPSS data only from its 2005 peak onward.  ” SPSS的预测是根据2005年以后的数据。SPSS和SAS的Google Scholar Hits均从2005年后呈下降趋势,那么预测中SPSS和SAS的Google Scholar Hits从2013年后下降也就不足为奇了。那么Stata和R的Google Scholar Hits从1995到2012一直是上升趋势,那么预测中的增长趋势当然也不足为奇。但是,这种预测可靠么?对SAS,Stata和R的预测基于18个观察值,对SPSS的预测只基于8个观察值。其实作者自己也说了:“Any forecasting book will warn you of the dangers of looking too far beyond the data and above forecast does just that.”


大家要是对上述博文感兴趣,可以看下面的附件或者登录到我上面提到的网址
Forecast Update - Will 2014 be the Beginning of the End for SAS and SPSS?.pdf (334.35 KB)


说白了,到目前为止,找不到Stata比SAS应用更广泛的统计证据。但是Stata和R越来越受欢迎。就我个人而言,Stata是我目前做研究最常用的软件。Stata完全可以提供一站式的解决方案。与SAS不同,Stata是将数据导入内存,在内存处理数据,Stata较老的版本对相对较大的数据没办法处理。Stata 12可以支持1T内存,当然一般应用也没那么大的需求。我经常用Stata 12处理几千万行甚至上亿行的数据,软件很可靠。Stata 13对长字符的支持,又是一个重大革新。


另外,R的发展很快,越来越受欢迎。就说Coursera上配合统计学、计量经济学、计量金融等课程的软件,多数都用的R。Coursera上可是汇聚了全世界的顶尖名校。目前,咱们中国的北大、复旦、上海交大、香港科技大学、香港中文大学、国立台湾大学也在上面。研究美国金融问题的离不开WRDS(Wharton Research Data Services )数据库,WRDS整合了多个数据库的服务,包括最常用的CRSP、Compustat、IBES等等,WRDS的后台软件是SAS,因此一直提供对SAS的编程帮助,现在也开始提供对R的编程帮助,尽管也提供Stata,Matlab等格式的数据,但是目前没有详细的编程帮助。其实,R的一个优势就是user written package(这其实也是Stata的一个优势),用户编写的程序质量有高有低,选用CRAN认证的package还是很有保证的。尤其是,许多package本身就是知名学者写的,有的作者可能就是那个统计模型的创始人,那么这样的package有什么不可靠的呢?从上面这几点来看,那些说R是开源软件,可以用户贡献,因而不能被学术机构接受的言论,根本站不住脚。不说Coursera上哪些名校用R,就说WRDS的W可是代表的沃顿商学院啊,在商学院里,哪个比Wharton更权威呢?(当然,你还可以说哈佛商学院,伦敦商学院,INSEAD等等。但是,我想说他们都属于顶尖商学院,一样权威。)

同时,论述R如何有前途的文章有很多,我也就不再举例了,其实上面提的文章就来自于一个专注于R的博客http://r4stats.com/









207
AASMTSH 发表于 2014-6-17 18:21:06
牛人理解的都好高深啊

208
ilovestata 发表于 2014-6-17 20:59:57
楼上两位都是牛人,自己又学到不少知识,感谢

209
郑世杰0522 发表于 2014-6-28 08:32:52
好吧  1

210
vsksing 发表于 2014-7-6 00:57:50
trueeconlover 发表于 2014-6-14 05:09
我再重复一下事实:美国主流经济学家大部分用stata. Period.
美国主要用SAS处理数据,用stata做计量,   stata是计量软件,SAS是数据处理软件,他两个相比,等于关公战秦琼。   stata能做的 SAS能做,SAS能做的,stata很多做不了。 你还几亿条数据都跑过? 胡说八道,stata的一个被人攻击的弊端就是数据先进内存,然后计算, 你丫有这么大的内存? SAS在设计之初就考虑到这个问题,SAS的数据时逐条读取的,和内存关系不大,当然,越大越好。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-26 16:09