楼主: zhou1_20
1993 8

[问答] 大家都使用什么方法让百万级别的数据在R语言中有效的运行。 [推广有奖]

已卖:689份资源

副教授

20%

还不是VIP/贵宾

-

威望
0
论坛币
18999 个
通用积分
1029.7754
学术水平
146 点
热心指数
166 点
信用等级
135 点
经验
36357 点
帖子
541
精华
0
在线时间
887 小时
注册时间
2015-9-25
最后登录
2025-12-4

楼主
zhou1_20 发表于 2017-1-21 15:07:01 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
大家都使用什么方法让百万级别的数据在R语言中有效的运行。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:什么方法 R语言

沙发
cheetahfly 在职认证  发表于 2017-1-21 16:32:29
用dplyr、tidyr等packages,把data.frame转换成tibble类型,够用。

藤椅
飞天玄舞6 在职认证  发表于 2017-1-21 17:49:58
基本上需要和Hadoop结合在一起了

板凳
Tony_Liu 在职认证  发表于 2017-1-21 18:00:51
加大内存

报纸
zhou1_20 发表于 2017-1-21 19:12:27 来自手机
飞天玄舞6 发表于 2017-1-21 17:49
基本上需要和Hadoop结合在一起了
handoop做可视化怎么样

地板
飞天玄舞6 在职认证  发表于 2017-1-21 19:39:57
zhou1_20 发表于 2017-1-21 19:12
handoop做可视化怎么样
可视化不知道,我也是刚开始学

7
felixzhao123 发表于 2017-1-22 08:50:27
正常来说,百万级的数据,R处理问题不大。
dplyr tidyr都可以处理,但速度不是优势,但是可以接受
data.table可以达到python级别的处理速度
机器学习建模用h2o速度很快

8
zhou1_20 发表于 2017-1-22 09:17:53 来自手机
felixzhao123 发表于 2017-1-22 08:50
正常来说,百万级的数据,R处理问题不大。
dplyr tidyr都可以处理,但速度不是优势,但是可以接受
data.t ...
ok

9
caimiao0714 学生认证  发表于 2019-1-8 00:05:05
cheetahfly 发表于 2017-1-21 16:32
用dplyr、tidyr等packages,把data.frame转换成tibble类型,够用。
data.table里面的data.table类型是所有R包里面最快的,千万级别的数据也可以处理。不过最好能有一个服务器来处理这样类型的数据。
已有 1 人评分论坛币 收起 理由
jiangbeilu + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-9 05:17