楼主: casboryy
3372 1

[Hadoop] Hadoop大数据分析获本地R语言支持 [推广有奖]

学术权威

55%

还不是VIP/贵宾

-

TA的文库  其他...

精华汇总

论坛简报

威望
3
论坛币
414973 个
通用积分
4011.1905
学术水平
1142 点
热心指数
838 点
信用等级
982 点
经验
3002 点
帖子
1586
精华
37
在线时间
4240 小时
注册时间
2009-9-12
最后登录
2024-4-22

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

随着大家对大数据分析越来越感兴趣,软件供应商Revolution Analytics改进了其R语言统计功能旗舰产品,使它能够与Hadoop数据处理平台运行。

   

这个新的Revolution R Enterprise 7(RRE 7)还能够使R在Teradata数据库内运行。

   

R语言提供了一种方法来对一组数据运行常用统计测试(例如线性和非线性建模、时间序列分析、分类和聚类),通常结果是以图形的形式出现。

   

R越来越多地用于复杂的数据分析,即那些超出标准商业智能程序包范围的数据分析。Revolution Analytics公司预计全世界有超过200万人在使用R。

   

RRE7包含R算法库——可以跨多个节点并行运行,这与Hadoop管理大数据集的方式相同。RRE7可以被添加到Cloudera CDH3和CDH4 Hadoop发行版,以及Hortonworks数据平台1.3。

  

这个新的R库保护最常用的统计和预测分析算法,用于数据处理、数据采样、描述性统计、统计测试、数据可视化、仿真、机器学习和预测模型等任务。

   

通过分析节点内的数据,而不是移动数据到其他位置进行分析,基于R的数据分析可以更快地进行。它还允许对一整组数据进行分析,而不是数据的子集或者摘要--企业数据仓库(EDW)通常是采用这样的方式。

   

Revolution Analytics希望将R加入到Hadoop和Teradata数据库可以拓宽该语言的使用范围。该公司还设计了一个新的工作流程界面,其中不需要知道如何部署特定的R算法。这缓解了使用Java或者其他语言编程R的麻烦,让其在Hadoop平台运行。

   

除了支持这些新的平台,RRE7还采用了一些新的算法和流程。其一是建立Decision Forests的模型集,Decision Forests是用于预测未来结果的机器学习技术。新的Stepwise Regression功能还可以帮助我们自动化选择用于预测模型中最重要的变量。新的Decision Tree可视化可以提供图形化的方式来描述数据集内复杂的关系和相关性。

   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Hadoop大数据分析 hadoop大数据 Hadoop 大数据分析 数据分析 全世界 数据库 供应商 产品 程序

Be Captain Of Your Destiny!
沙发
zhongzihong 发表于 2014-2-8 20:31:40 |只看作者 |坛友微信交流群
恭喜恭喜,有没有相关的资料或者教程介绍如何在Hadoop上配置R呢
曾经错过

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 01:55