楼主: xinyinian
4733 3

[实际应用] 关于stringsAsFactor =F 以及 factor类型的疑问 [推广有奖]

  • 0关注
  • 0粉丝

本科生

40%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
1.6075
学术水平
5 点
热心指数
0 点
信用等级
0 点
经验
525 点
帖子
23
精华
0
在线时间
114 小时
注册时间
2018-12-28
最后登录
2023-10-27

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位大神,我在阅读时发现,在某些时候导入数据时有stringsAsFactor=F,看了百度还是不太明白,什么时候用stringsAsFactor?
另外,在做一些预测时,有时会把某列转化成factor,例如,data<- transform(data,y=as.factor(y)),为什么要如此转换?
求指教。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:strings factor string Facto tring

6~S5][TX@XJG4H3GWTML_S6.png (13.17 KB)

6~S5][TX@XJG4H3GWTML_S6.png

重现编码转化成因子,关于factor其实可以查看内置帮助help,里面更加详细

使用道具

藤椅
cheetahfly 在职认证  发表于 2019-1-7 23:15:06 |只看作者 |坛友微信交流群
在计算机发展的早期,硬盘和内存都比较贵,将数据存储为Factor形式,可以节约空间,R语言默认保留了这一习惯。但现在介质都非常便宜了,所以很多人觉得没有这个必要,比如大牛Hadley就主张直接存为character的形式。
不过,作为factor也有很多好处,其中之一是确定为discrete variable。有一些算法要求转化为factor。

使用道具

板凳
caimiao0714 学生认证  发表于 2019-1-7 23:39:36 |只看作者 |坛友微信交流群
cheetahfly 发表于 2019-1-7 23:15
在计算机发展的早期,硬盘和内存都比较贵,将数据存储为Factor形式,可以节约空间,R语言默认保留了这一习惯 ...
factor还有另外一个优势就是在做分类型变量的分析的时候,你可以指定你的参照组以及每个数字对应的标签。比如:
x = factor(x, levels = c(0, 1, 2), labels = c("Apple", "Google", "Microsoft"))
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-13 03:18