楼主: ruiqwy
57157 166

R上了纽约时报了,庆祝。。(附R软件简介)   [推广有奖]

  • 0关注
  • 71粉丝

UseR!&DM

学科带头人

55%

还不是VIP/贵宾

-

威望
3
论坛币
79854 个
通用积分
87.2833
学术水平
100 点
热心指数
128 点
信用等级
79 点
经验
36469 点
帖子
991
精华
5
在线时间
1570 小时
注册时间
2006-3-31
最后登录
2024-2-23

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
 纽约时报记者Ashlee Vance《纽约时报》科技版刊登了题为 Data Analysts Captivated by R’s Power的文章,这是R自1996年由Robert Gentleman和Ross Ihaka 教授开发以来的最大新闻之一,值得庆幸。R自诞生以来,深受统计学家和统计、计量爱好者的喜爱,已经成为主流软件之一。该文的经典语录摘录如下:(中文系本人翻译,不一定准确)

“R is really important to the point that it’s hard to overvalue it,” said Daryl Pregibon, a research scientist at Google, which uses the software widely. “It allows statisticians to do very intricate and complicated analyses without knowing the blood and guts of computing systems.”
  R重要的一点在于你怎么评估他都不会高估,它允许统计学家做很多复杂的分析,而不需要懂得很多的计算机知识。           
                         ————Google科学家 Daryl Pregibon,google广泛使用R软件

What makes R so useful — and helps explain its quick acceptance — is that statisticians, engineers and scientists can improve the software’s code or write variations for specific tasks. Packages written for R add advanced algorithms, colored and textured graphs and mining techniques to dig deeper into databases.
        让R变得如此有用和如此快地广受欢迎是因为统计学家、工程师、科学家们在不断精炼代码或编写各种特具体的包。现在R软件增添了很多高级算法、作图颜色、文本注释,以及为与数据库链接等提供了挖掘技术。

The financial services community has demonstrated a particular affinity for R; dozens of packages exist for derivatives analysis alone.
                  金融服务部门对R表现出了极大的兴趣,各种各样的衍生品分析包出现。

“The great beauty of R is that you can modify it to do all sorts of things,” said Hal Varian, chief economist at Google. “And you have a lot of prepackaged stuff that’s already available, so you’re standing on the shoulders of giants.”
     R最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。                                           
                                                                                                                  ————Google首席经济学家 Hal Varian“

R has really become the second language for people coming out of grad school now, and there’s an amazing amount of code being written for it,” said Max Kuhn, associate director of nonclinical statistics at Pfizer. “You can look on the SAS message boards and see there is a proportional downturn in traffic.”
  R已经成为一个人从研究生院毕业后的第二门语言了,那里由很多各种各样的code.但SAS留言板的人气存在一定比例的下降。
                                                 ————   辉瑞(财富500强公司之一,总部所在地美国,主要经营制药)非临床统计副主任 Max Kuhn

感兴趣者可详读:http://www.nytimes.com/2009/01/07/technology/business-computing/07program.html?_r=2






附记:(由本人整理撰写)

R语言简介

R语言是一种为统计计算和图形显示而设计的语言环境,是贝尔实验室(Bell Laboratories)的Rick Becker、John Chambers和Allan Wilks开发的S语言的一种实现,提供了一系列统计和图形显示工具。S语言也是目前比较流行的统计软件S-PLUS的基础。
R语言的创始人Ross Ihaka和Robert Gentleman,由于这两位“R之父”的名字都是以R开头,所以就称之为R语言。
R语言是一组数据操作,计算和图形显示工具的整合包。相对于其它同类软件,其特色在于:
1.有效的数据处理和保存机制。
2.拥有一整套数组和矩阵的操作运算符。
3.一系列连贯而又完整的数据分析中间工具。
4.图形统计可以对数据直接进行分析和显示,可用于多种图形设备。
5.一种相当完善、简洁和高效的程序设计语言。它包括条件语句、循环语句、用户自定义的递归函数以及输入输出接口。
6.R语言是彻底面向对象的统计编程语言。
7.R语言和其它编程语言、数据库之间有很好的接口。
8.R语言是自由软件,可以放心大胆地使用,但其功能却不比任何其它同类软件差。
9.R语言具有丰富的网上资源,更为重要的一点是R提供了非常丰富的程序包,除了推荐的标准包外还有很多志愿者贡献的贡献包,可以直接利用这些包,大大提高工作效率。R语言的官方网站是http://www.r-project.org,与R语言有关的网站还有CRAN(镜像),其主站网址是:http://www.cran.r-project.org,相应的中国镜像网是:http://mirrors.geoexpat.com/cran/,在这些网站可以下载到很多程序包以及有关R语言的资料。


R语言与统计、计量

R语言具有丰富的统计方法,大多数人使用R语言是因为其(它具有)强大的统计功能。不过对R语言比较准确的认识是一个内部包含了许多经典统计技术的环境。部分的统计功能是整合在R环境的底层,但是大多数统计功能则以包的形式提供。大约有25个包和R同时发布,也被称为标准包,如果要想得到更多的其它包,可以在R的中国镜像里找到(http://www.lmbe.seu.edu.cn/CRAN/),镜像里除了有各种包以外,还提供了其它比如关于R使用的一些资料。大多数经典的统计方法和最新的技术都可以在R中直接得到,终端用户只要花点时间去寻找就可以了。
R语言的统计分析过程常常被分解成一系列步骤,并且所有的中间结果都被保存在对象(Object)中,以便使用R里面的函数做进一步的分析。虽然SAS、SPSS和Minitab也提供了丰富的屏幕输出内容,但其中间结果很难在后续过程中分析使用。
R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。
与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行统计分析。R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者(用户)能灵活地进行数据分析,甚至创造出符合需要的新的统计计算方法。
目前国外绝大多数的统计和计量经济学研究人员以及实业界人士都选择R软件!

对R几点理解:

1、R的好处不仅仅在于其免费,更重要的在于其是开源,灵活,更新速度快,集思广益。而且R有点像是一种网络,用的人越多,贡献的人也越多,这样其的价值就成几何级数上升。我以前用过几乎所有的统计软件,但自从学会R,目前几乎只用R做分析。我相信很多人都有这种情形。

2、很多软件只是一个黑箱子,数据丢进去,结果出来。这样的结果,你会放心吗?而且这样学习,你根本不懂计量、统计背后真正的含义。可以这样说,永远别想真正学会统计思想,你的统计分析只是依样画葫芦,有时画得很像,但不懂神韵!很多时候是"garbage in and garbage out"

3、R初学确实有点难懂,但R的编程思想非常简单,几乎就是写数学公式一样简单,学过C和C++等低层语言就会知道R的编程是如此之简单,R是一种面向对象的高级语言。R入门者其实只要有人稍加指点,很快学会其基本操作!

4、学R应该说是一种趋势,如果和国外搞计量、搞统计的教授接触,应该知道现在大部分的教授都在用R,国内用R还只是一小部分,发展趋势一定是其他软件无法比拟的!

5、不同软件都有其优点和缺点,本人不是贬低其他软件之意!但我想真正学会计量、统计的人来说学R是非常重要的,除非只是想依样画葫芦。

6、R的好处和发展趋势,在未来3-5年,可能会超出任何人的想象!Let's wait and see!

[此贴子已经被作者于2009-3-4 10:29:20编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:纽约时报 r软件 statistician proportional complicated 简介 软件 庆祝 纽约时报

已有 2 人评分经验 学术水平 收起 理由
李会超 + 40 精彩帖子
落泪伊繁花 + 1 观点有启发

总评分: 经验 + 40  学术水平 + 1   查看全部评分

本帖被以下文库推荐

R is the second language for me!Using R is standing on the shoulders of giants!   Let\'s use R together!
沙发
davidhaitaopan 发表于 2009-1-19 12:09:00 |只看作者 |坛友微信交流群

还有一篇,全文转载:

R You Ready for R?

January 8, 2009, 1:52 pm — Updated: 9:22 am -->R You Ready for R?By Ashlee VanceStatistics professor Robert Gentleman who helped developed the R programming language. (Credit: Stuart Isett for The New York Times)There seems to be a cathaRsis taking place.
My story published Tuesday on the R programming language has generated a flood of reader e-mail messages. The story covers the software’s broad usage and vibrant developer community in detail, but, in short, R helps people deal with large volumes of data in a wide variety of industries, including pharmaceuticals, finance and oil and gas.
Also of note, the software is open source, meaning people can pick it up for free and make their own changes to the code. Such flexibility has inspired statistically minded people of all stripes to get behind R and make it a real success story.
Most of the people reacting to the story expressed pleasure at seeing R receive mainstream attention. People chimed in with the unique ways they’re using the technology. Vhayu Technologies talked about its passion for tweaking R to help traders on Wall Street, while others discussed its increasing adoption at universities for everything from biology to economics.
There were also some complaints that my story did not focus enough on S, which was a precursor to R developed at Bell Labs. John Chambers, now a consulting professor of statistics at Stanford University, drove much of the early S work at Bell Labs and talked with me at length about S and R. Without question, R arrived as a result of the fine work done with S, but it’s the rapid rise of R, helped by its open-source nature, that has proved so gripping.
Speaking of R, Mr. Chambers said, “It’s way beyond anything we could have imagined at Bell Labs.”
If you’d like some more of S’s history, you’ll find it at the end of Mr. Chambers’s new book, “Software for Data Analysis.”
In addition, the commercial potential of R is worth some further discussion.
Pfizer was a prominent R user mentioned in the story. The company relies on R for its nonclinical drug studies and has shied away from using the technology for clinical research that will ultimately be presented to regulators. For such work, Pfizer instead turns to software from SAS Institute, which brings in more than $2 billion a year in revenue from data analytics software and services.
Were Pfizer to use R in clinical studies, it would run the risk of seeing its research questioned or even rejected by regulators doubting the veracity of results based on what they view as an unknown quantity.
“It’s very hard to displace the industry standard in those types of cases,” said Max Kuhn, associate director of nonclinical statistics at Pfizer.
Of course, the Linux operating system over the course of many years has managed to rise from an unknown entity to one that has gained top approval from governments around the world for everything from handling top-secret files to being used for processing tax data. So we’ll see what happens with R in the long run.
Revolution Computing stands as one company trying to push the commercial agenda forward with R.
While the base software is free, Revolution offers ways to speed up the software on certain applications and to run it on large computers. In addition, Revolution provides support services to customers like Pfizer and Bank of America. Intel’s venture capital arm invested in Revolution last year.
Lastly, some readers had questions on exactly how many people use R. A number of people interviewed, including those who work most closely with the software, estimated the R population at 250,000.
Intel Capital has placed the number of R users at 1 million, and Revolution kicks the estimate all the way up to 2 million.
Such disparity often accompanies open-source projects, where it’s difficult to tell just how far a piece of software’s tentacles spread and how active the users really, um, R.

使用道具

藤椅
ruiqwy 发表于 2009-1-19 12:43:00 |只看作者 |坛友微信交流群
R最近几年发展很迅速,已经成为主流软件之一,国外搞科研的、甚至实业界都越来越多用R了。
从最初学R时,国内很少人知道,根本没想到会发展如此之快。现在国内学R的队伍逐渐壮大。。。值得庆幸啊!
R软件前途无量。。。选择R是正确的。。
R is the second language for me!Using R is standing on the shoulders of giants!   Let\'s use R together!

使用道具

板凳
windlove 发表于 2009-1-19 20:31:00 |只看作者 |坛友微信交流群
我现在用的主要的3个统计软件是R,SAS 和MATLAB, R 和MATLAB在程序编排上有很多相似之处。 我有在R 里面写过像rref (reduce row echolon form)这样的matlab functioin,编写的时候结构是一样的。2者相对着学很有好处。 

SAS对处理huge data的好处是显而易见的,速度极快。 不过programming的语言比较非传统,东西太多了。每个不同的manual都有好几百页甚至上千页。学起来太累了。不过现在上班必须用SAS我也没办法。

从大学一年级开始用MATLAB,二年级开始用 R,三年级开始用SAS, 到现在工作了, R和MATLAB是用的最多的。 
R 和 MATLAB在computational statistics方面的优势是相当的。
R 我用的最多的就是在linear model, GLM, Time Series ,survival and computer intensive.  
MATLAB 用的最多的是在multivariate and computer intensive. 
SAS 的话 统计方面用的不太多确实。目前为止 categorical,longitudinal还有survival. 
已有 2 人评分学术水平 热心指数 收起 理由
cjboof + 1 分析的有道理
kakamama + 1 + 1 说的很好。学习了!

总评分: 学术水平 + 2  热心指数 + 1   查看全部评分

使用道具

报纸
ruiqwy 发表于 2009-1-19 21:11:00 |只看作者 |坛友微信交流群
讲得很好!!R和matlab有很多相同之处。相对来说,SAS在速度,尤其处理海量数据确实有优势。其他方面,我觉得R是最方便的。。。
R is the second language for me!Using R is standing on the shoulders of giants!   Let\'s use R together!

使用道具

地板
ruiqwy 发表于 2009-2-8 13:08:00 |只看作者 |坛友微信交流群
有关R和其他软件的比较详见:http://www.sciviews.org/benchmark/

 在这个版本里虽然使用的R版本比较低,但R的表现相当突出。作者最后得出的结论:
R is one of the fastest open source data analysis packages. Since it is free and provides many additional packages for all kind of statistics, we warmly recommend it.
R is the second language for me!Using R is standing on the shoulders of giants!   Let\'s use R together!

使用道具

7
bioengineer 发表于 2009-2-9 13:52:00 |只看作者 |坛友微信交流群
Not so many people use R when I first heard about it in 2006. But the popularity is totally different in 2009.
Biomedical engineering Digital signal processing Biostatistics

使用道具

8
guv007 发表于 2009-2-13 15:56:00 |只看作者 |坛友微信交流群
哈哈 :)

使用道具

9
yjjssd 发表于 2009-2-14 05:44:00 |只看作者 |坛友微信交流群

恩,代表一种趋势.

使用道具

10
thegodofR 发表于 2009-2-14 13:18:00 |只看作者 |坛友微信交流群
嗯,我目前在美国学计量经济学,这边的大多数教授确实都使用R软件!
数码产品中心:http://gouwu.alimama.com/channel/digital.htm?pid=mm_13909716_0_0

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 02:09