本人在实际研究过程以及阅读文献总结出来,R(我用的是Rstudio)在运行某些复杂的模型,加之庞大的数据时,往往会出现越运行越卡的现象,提供一个较好的解决方法(实测有效),仅供参考普通直接用read.csv读入的是dataframe,现用data.table以及dplyr两个包对数据进行加载,分两步进行,代码如下:
library(data.table)
data_train_select<-fread('data_train_select.csv')
#应用dplyr一般化表格数据
library(dplyr)
data_train_select<-as.tbl(data_train_select)
实测能显著改善Rstudio运行效率。
另外在程序代码中设置gc()释放内存也是一个比较好的习惯。