楼主: 渔夫
990 2

[实际应用] data.table: Extension of data.frame for fast indexing, fast ordered joins, fast [推广有奖]

  • 1关注
  • 2粉丝

本科生

58%

还不是VIP/贵宾

-

威望
0
论坛币
4185 个
通用积分
1.8400
学术水平
13 点
热心指数
27 点
信用等级
26 点
经验
986 点
帖子
49
精华
0
在线时间
157 小时
注册时间
2004-9-14
最后登录
2024-2-23

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
data.table: Extension of data.frame for fast indexing, fast ordered joins, fast assignment, fast grouping and list columns

http://datatable.r-forge.r-project.org/



Fast subset, fast grouping, fast assign, fast ordered joins and list columns in a short and flexible syntax, for faster development.

DT[X] is a fast join for large data (DT and X both type data.table).
DT[,sum(b*c),by=a] is fast aggregation (a, b and c are column names).
DT[i,b:=3.14] is fast sub-assignment (to column b) by reference.
DT[,p:=x/sum(x),by=group] to add a new column by reference by group.
fread("big.csv") is 3+ times faster than read.csv(,colClasses,nrow,etc).
10+ times faster than tapply()
100+ times faster than ==
500+ times faster than DF[i,j]<-value
Latest stable release: 1.9.0 on CRAN, 25 Feb 2014

User reviews, data.table wiki and Stack Overflow data.table tag
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Extension Indexing ordered Index Table names

已有 1 人评分经验 收起 理由
ltx5151 + 20 根据规定进行奖励

总评分: 经验 + 20   查看全部评分

沙发
ltx5151 发表于 2014-2-26 23:30:31 |只看作者 |坛友微信交流群

使用道具

藤椅
渔夫 发表于 2014-2-27 10:06:54 |只看作者 |坛友微信交流群
ltx5151 发表于 2014-2-26 23:30
哈哈,之前分享过 https://bbs.pinggu.org/thread-2279782-1-1.html
不好意思。补充一个相关的package
dplyr

http://blog.rstudio.org/2014/01/17/introducing-dplyr/

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-3 04:08