资料狂人 发表于 2015-9-17 08:25
坛友吃饭不喝酒:
R语言在论文数据处理上,和eviews、stata等相比,优势在哪里?
做论文所需要的回归、聚 ...
你好,你的问题问的很好!
R是由新西兰奥克兰大学的Ross Ihaka与Robert Gentleman一起开发的一个面向对象的编程语言,因两人的名都是以R开头,所以命名为“R”。R是“GNU S”,一个免费开源、能够自由有效地用于统计计算和绘图的语言和环境,可以在UNIX、Windows和Mac OS系统运行,它提供了广泛的统计分析和绘图技术,包括回归分析、时间序列、分类、聚类等方法。R的前身是S语言,S语言是贝尔实验室(Bell Laboratories)的Rick Becker、John Chambers和Allan Wilks开发的,提供了一系列统计和图形显示工具,这个语言过去一度是数据分析领域里面的标准语言。但是正在逐步被R语言取代。
相对于eviews, stata的优势有:
(1). R是免费的,不存在版权的问题。现在还有许多人使用SPSS、SAS、MatLab,但大都用的都是盗版软件。从法律上来讲这是非法的,但是非法的东西在中国很流行,很多教授也用这些非法软件,甚至还大面积安装。不过,这种行为并不可取,而免费就成为了R流行开来的最大的一个因素。
(2).80%的统计学者和数据分析师都在用R,并且这些学者和数据分析师开发了很多R的packages,目前大概有7000多个packages,涉及到统计的各个方面,所以资源很丰富,几乎目前最新的一些统计方法,在eviews,stata等上面还没法用的时候,在R上几乎都可以实现
(3).R是开源的,你可以看到各个package的R源程序,可以在这些程序的基础上去修改实现自己提出的一些统计方法,就像Google首席经济学家 Hal Varian所说:“R最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。”
(4). 完整的数组和矩阵操作运算符以及完整的数据分析工具;
(5). 出色的图形统计功能。除了基本统计直方图、折线图等,还可以绘制一些高级的图形,而这些是SPSS这类软件所不能匹敌的。R的图形统计工具一般有四个等次,最基本的plot,高级一点的grid,然后到Lattice,最后到ggplot2。ggplot2是一个更具有创新性的图形展示工具,它有自己的语法,相当于一门新的绘图语言。除此之外,ggobi这类的动态绘图也是具有很好的交互性的绘图软件。
(6). 简单高效的建模工具。只需用lm就可以建立线性模型,广义线性模型可以用glm,广义可加模型也有gam就函数。
(7). 提供很多高级功能。除了统计之外,你还可以使用R来给电脑关机,发微博,发校内状态,下五子棋以及配合LaTeX撰写动态统计报告以及自动生成概率统计的试卷和答案。
(8). 兼容几乎全平台。除了支持OS X、Linux、Windows之外,甚至可以在iOS设备上编辑和运行R的程序,还可以在iphone等移动设备上安装R程序。
(9). 逐渐支持多国语言。作为一个开源软件,R在其主页上也有提供大家添加数据自己国家语言的文件(http://developer.r-project.org/Translations.html)。其中,中文的翻译也在https://github.com/r-cn/r-cntrans 上面得到了国内众多的R爱好者的支持。
(10). 更新速度快。R几乎囊括了所有统计方法,当其他软件还不能完成一些最新的统计方法,在R中几乎都可以完成。R的更新速度是以周来计算的。
关于回归,聚类,因子分析等方法都是比较经典的方法在R里面都有现成的函数去实现,这个很简单,不需要很多编程技巧的,只要调用函数就可以了。比如做回归,只要用lm()就可以了,很简单的,再比如K-mean聚类分析只要用K-means函数就可以了,此外还有一个专门做聚类的package cluster.
关于R的参考书,现在市面已经很多了,我自己在今年3月也出了一本入门级参考书《R数据分析——实例详解》,电子工业出版社!
谢谢!
【R特训】R数据分析从入门到精通_方匡南老师主讲,10月2-5日@北京
https://bbs.pinggu.org/thread-3820540-1-1.ht