rt,处理这么一个问题
原始数据
cn wk logon
1 0 15
1 1 20
1 3 13
2 0 3
2 1 5
2 2 2
想要转换成
cn wk0 wk1 wk2 wk3
1 15 20 0 13
2 3 5 2 0
这样,怎么个量级呢?500W日志,18W个cn(行), 80+个列
自己写了一个for for 嵌套的循环,一晚上只跑了300个cn。。。
不信邪,优化了一下循环,速度提升了22倍,试着跑了5个,依然需要几秒,算下来跑完需要好几天
实在不能忍,各种查资料,找到了reshape2相关的这个帖子
http://stackoverflow.com/questions/17382097/transpose-data-by-groups-in-r
试着reshape了一下,心说,吃个午饭时间看看跑的怎么样吧。。。。。。
神奇的事情发生了——就那么啪的一下,结果出来了! 18W*85的dataframe已经好了!!!
太TM牛逼了吧,Hadley Wickham大神这次R语言年会要来的,找他要签名去!!!