楼主: maiweijie4321
1730 3

[问题] 从数据集data中按某个因子变量筛选符合条件的数据。 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

0%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.2148
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
817 点
帖子
65
精华
0
在线时间
147 小时
注册时间
2017-12-6
最后登录
2021-4-14

楼主
maiweijie4321 发表于 2018-5-29 10:00:56 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我这边有一个数据集集,大概有2万行数据,有两个变量为x1,x2,其中,x1为字符串型,x2为因子型,
其中,levels(data$x2)=747,也就是x2为747个层次。现在,我从数据集data中按照x2层次分别提取
数据子集,使得一共有747个子集。如果用which来选,那要做747次。请问哪位人大的师兄能帮下小妹吗?
感激不尽!!!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析与挖掘

沙发
阿扁V5 学生认证  发表于 2018-6-1 09:25:43
  1. # 用比较笨的循环
  2. for(i in levels(data$x2)){
  3. eval(parse(text = paste("data_", i ," = data[which(data$x2 == ", i, "),]", sep = ''))
  4. }
复制代码

藤椅
maiweijie4321 发表于 2018-6-6 14:04:01
阿扁V5 发表于 2018-6-1 09:25
运行出错,请指教? QQ截图20180606140517.png

板凳
阿扁V5 学生认证  发表于 2018-6-6 15:04:52
应该是大括号内的表达式最后漏了一个小括号,下面这个代码跑得通的,把Species替换为你的x2就好了

  1. # 用比较笨的循环
  2. data = iris
  3. for(i in levels(data$Species)){
  4.   eval(parse(text = paste("data_", i ," = data[data$Species == '", i, "', ]", sep = '')))
  5. }
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-27 10:11