一直感觉R在数据处理(ETL)这部分很凌乱,原生的函数里,tapply好像一直不支持 y~x的函数形式,aggregate又不支持多function。
参数的方式也不统一,每次都要查帮助。reshape2倒是利器,不过如其包名,基本上只管reshape,别的事儿都不管。
plyr不太熟呢,数据量大了还行不行?
还有啥包?
觉得各本讲分析的书里对数据处理这方面都没太展开,只是基于分析案例讲的。
哪位能推荐一本专门讲数据处理的世界观、方法论、方方面面的书啊?
多谢!