楼主: wuchm
1367 5

[问答] 【求助】R 对变量样本筛选问题,请教各位大侠! [推广有奖]

  • 6关注
  • 1粉丝

已卖:1417份资源

博士生

53%

还不是VIP/贵宾

-

威望
0
论坛币
2397 个
通用积分
4.5700
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
5181 点
帖子
230
精华
0
在线时间
236 小时
注册时间
2007-4-24
最后登录
2024-9-18

楼主
wuchm 发表于 2015-3-3 21:34:11 |AI写论文
10论坛币
问题1:区域维度有3维、4维的,如果4维包含在3维下面,怎么将将两者合并到3维;
原始数据:数据框q有变量a:
a                                                  
安徽/中国/亚洲                           
合肥/安徽/中国/亚洲                    
浙江/中国/亚洲                             
安徽/中国/亚洲                           

希望通过用R分析得出结果:
新增变量b:对a进行重分类:
a                                                   b
安徽/中国/亚洲                   安徽/中国/亚洲
合肥/安徽/中国/亚洲           安徽/中国/亚洲
浙江/中国/亚洲                   浙江/中国/亚洲  
安徽/中国/亚洲                   安徽/中国/亚洲

问题2: 变量a里面,怎么只保留“合肥安徽中国亚洲”,其他三个样本不取?

最佳答案

ofzhengyi 查看完整内容

代码: #输入数据 q
关键词:各位大侠 样本筛选 原始数据 数据框 中国 安徽 亚洲 样本 合肥

沙发
ofzhengyi 发表于 2015-3-3 21:34:12
代码:
#输入数据
q<-NULL
q$a<-c("安徽/中国/亚洲","合肥/安徽/中国/亚洲","浙江/中国/亚洲","安徽/中国/亚洲")
q<-data.frame(q,stringsAsFactors=FALSE)
#数据分析
q$b<-sapply(strsplit(q$a,"/"),function(x)paste(x[(length(x)-2):length(x)],collapse="/"))

输出:
                    a              b
1      安徽/中国/亚洲 安徽/中国/亚洲
2 合肥/安徽/中国/亚洲 安徽/中国/亚洲
3      浙江/中国/亚洲 浙江/中国/亚洲
4      安徽/中国/亚洲 安徽/中国/亚洲

唉,为了回答你的问题,我袜子都没洗呢~
上面代码怎么会乱码,上传附件吧~
renda.zip (351 Bytes) 本附件包括:
  • renda.r

藤椅
水天一色DIY 在职认证  发表于 2015-3-4 09:16:54
其实问题1和问题2都可以一次性解决:
从目前的数据来看,你可以split每个字符串,通过判断子字符串个数去做
已有 1 人评分经验 收起 理由
李会超 + 20 热心帮助其他会员

总评分: 经验 + 20   查看全部评分

板凳
wuchm 发表于 2015-3-4 12:41:54
水天一色DIY 发表于 2015-3-4 09:16
其实问题1和问题2都可以一次性解决:
从目前的数据来看,你可以split每个字符串,通过判断子字符串个数去做 ...
可以具体写个程序么?

报纸
wuchm 发表于 2015-3-5 08:30:18
ofzhengyi 发表于 2015-3-3 21:34
代码:
#输入数据
q
非常感谢!热心人哈!
袜子扔进洗衣机就可以了嘛

地板
wuchm 发表于 2015-3-5 12:34:31
ofzhengyi 发表于 2015-3-3 21:34
代码:
#输入数据
q
有两个小问题请教下:
1、我的数据是这样的,该变量存在于数据框中(有多个变量),属性是factor,怎么转换为char呢?

2、如果只筛选四层的样本,怎么处理?

谢谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-25 16:35