楼主: xinyinian
5409 3

[实际应用] 关于stringsAsFactor =F 以及 factor类型的疑问 [推广有奖]

  • 0关注
  • 0粉丝

本科生

40%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
1.6116
学术水平
5 点
热心指数
0 点
信用等级
0 点
经验
525 点
帖子
23
精华
0
在线时间
114 小时
注册时间
2018-12-28
最后登录
2023-10-27

楼主
xinyinian 发表于 2018-12-29 10:05:13 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位大神,我在阅读时发现,在某些时候导入数据时有stringsAsFactor=F,看了百度还是不太明白,什么时候用stringsAsFactor?
另外,在做一些预测时,有时会把某列转化成factor,例如,data<- transform(data,y=as.factor(y)),为什么要如此转换?
求指教。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:strings factor string Facto tring

6~S5][TX@XJG4H3GWTML_S6.png (13.17 KB)

6~S5][TX@XJG4H3GWTML_S6.png

沙发
啊啊啊啊啊吖 发表于 2018-12-30 15:30:53
重现编码转化成因子,关于factor其实可以查看内置帮助help,里面更加详细

藤椅
cheetahfly 在职认证  发表于 2019-1-7 23:15:06
在计算机发展的早期,硬盘和内存都比较贵,将数据存储为Factor形式,可以节约空间,R语言默认保留了这一习惯。但现在介质都非常便宜了,所以很多人觉得没有这个必要,比如大牛Hadley就主张直接存为character的形式。
不过,作为factor也有很多好处,其中之一是确定为discrete variable。有一些算法要求转化为factor。

板凳
caimiao0714 学生认证  发表于 2019-1-7 23:39:36
cheetahfly 发表于 2019-1-7 23:15
在计算机发展的早期,硬盘和内存都比较贵,将数据存储为Factor形式,可以节约空间,R语言默认保留了这一习惯 ...
factor还有另外一个优势就是在做分类型变量的分析的时候,你可以指定你的参照组以及每个数字对应的标签。比如:
x = factor(x, levels = c(0, 1, 2), labels = c("Apple", "Google", "Microsoft"))
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-7 05:06