近日发现一个处理大数据集十分强大的package。不知大家是否已经用过,总之在这里分享一下。
这个package叫data.table。其实就是一个类似于data.frame的类,里面内嵌了几种优质的运算操作。如果使用得当(取决于个人用法),据小弟简单测试,对数据分化运算的速度高出相同的R基本操作上百倍。比plyr里面的诸多函数也快5~20倍不等。
网页 : 。http://datatable.r-forge.r-project.org/
可以在SCAN上面下载。
附上一个简单的10mins intro