|
其实就是因子转化,一般用R软件的时候熟练了矩阵、数据框和向量,但是忽视了每本书一开始讲的数据类型中的因子,其实你的是指就是因子,我自己写了两行代码就可以理解了:
x<-c("偶尔","持续","有时","偶尔","偶尔","有时","偶尔","有时","持续","偶尔","经常","偶尔","持续","偶尔","偶尔")
x1<-factor(x,labels = c(1,2,3,4),levels = c("偶尔","有时","经常","持续"))
输的x1的结果为
1 4 2 1 1 2 1 2 4 1 3 1 4 1 1
Levels: 1 2 3 4
数据结构如下:
str(x1)
Factor w/ 4 levels "1","2","3","4": 1 4 2 1 1 2 1 2 4 1 ...
只是转化为文本是不对的,数据类型应该是上述的四个levels的因子,而且,如果有顺序,还应该添加order=T的参数
例如,
x1<-factor(x,labels = c(1,2,3,4),levels = c("偶尔","有时","经常","持续"),ordered = T)
x1
1 4 2 1 1 2 1 2 4 1 3 1 4 1 1
Levels: 1 < 2 < 3 < 4
观察数据结构
str(x1)
Ord.factor w/ 4 levels "1"<"2"<"3"<"4": 1 4 2 1 1 2 1 2 4 1 ...
可见生成了1"<"2"<"3"<"4"的四个有序因子,转化成有序很重要的是我们可以认为持续、经常登有优劣顺序,转化为文本是不能比较持续的
详细的可以看看R语言书记,基本上前两章将数据类型一定会有讲因子的,这比你问题中描述的转化为文本更符合统计的要求。
|