有个数据集,已经存为RData格式。load以后,想根据其中一列的值,分为两个数据集,不知道用什么函数合适。比如有一列是日期,例如“2000.10.10”,字符型。想根据这一列得到年份,然后2000年以前的作为一个数据集,之后的另外放一个数据集,请问该怎么处理?
函数split可以分割,但是需要一个因子水平的变量,用年份那就不知道分成多少个了,而我只需要2个。
然后这个字符型的日期,怎么提取年份呢?简单的substr+as.numeric当然可以,但是我的数据集特别大,行数多,循环就累死了。想把整个数据集作为矩阵来处理,就搞不定了。
如果用as.Date来变为日期类型,似乎又不知道怎么提取年份了,请高手指点~