人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛 › R属性处理

发帖

楼主: JLOGAN

2559 9

[学习分享] R属性处理 [推广有奖]

3关注
0粉丝

硕士生

16%

还不是VIP/贵宾

威望: 0 级
论坛币: 24 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 2830 点
帖子: 87
精华: 0
在线时间: 97 小时
注册时间: 2016-5-28
最后登录: 2018-8-4

楼主

JLOGAN 发表于 2016-9-18 22:42:28 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

各位前辈，在下目前遇到一个问题，不知怎么实现，跪求指教！根据第一个表得到第二个，每个id含有的转化为表2的形式，所有id含有的全都加进在第一行，然后每个id中出现的为1，不出现的为0.

1	A
1	B
1	C
1	D
1	C
2	E
2	D
2	S
2	A
3	A
3	S
3	D
3	F
4	G
5	J
5	V

转化成

	A	B	C	D	E	F	G	H	S	J	V
1	1	1	1	1	0	0	0	0	0	0	0
2	1	0	1	0	1	0	0	0	1	0	0
3	1	0	0	1	0	1	0	0	1	0	0
4	0	0	0	0	0	0	1	0	0	0	0
5	0	0	0	0	0	0	0	0	0	1	1

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：ABCDEFG ABCD 跪求指教求指教 fgh

相关帖子

沙发

千5320 发表于 2016-9-18 23:39:46

楼主发帖的水平还是需要提高一个

藤椅

johnmy 发表于 2016-9-18 23:58:10

第三行和第五行是重的，我去掉了其中一个。
> d
num letter id
1 1    A  1
2 1    B  1
3 1    C  1
4 1    D  1
6 2    E  2
7 2    D  2
8 2    S  2
9 2    A  2
10 3    A  3
11 3    S  3
12 3    D  3
13 3    F  3
14 4    G  4
15 5    J  5
16 5    V  5

板凳

johnmy 发表于 2016-9-19 00:02:43

library(dplyr)
e<-spread(d,key=letter,value = num,fill = 0)
f<-e[-1]
f[f!=0]<-1
cbind(e$id,f)

复制代码

已有 1 人评分	经验	收起理由
李会超	+ 40	热心帮助其他会员

总评分: 经验 + 40 查看全部评分

报纸

JLOGAN 发表于 2016-9-19 16:12:33

johnmy 发表于 2016-9-18 23:58
第三行和第五行是重的，我去掉了其中一个。
> d
num letter id

谢谢您！我想提一个新问题，如果数据是按照如下形式给出
id attr
1 [A][B][C]
2 [D][E][F][S]
3 [W][D]
4 [P]
5 [J][C]
还是同样形式的结果该如何实现呢？

地板

JLOGAN 发表于 2016-9-19 16:13:42

千5320 发表于 2016-9-18 23:39
楼主发帖的水平还是需要提高一个

谢谢提醒，希望多多给出建议

7楼

johnmy 发表于 2016-9-19 16:32:20

JLOGAN 发表于 2016-9-19 16:12
谢谢您！我想提一个新问题，如果数据是按照如下形式给出
id attr
1 [A][C]

学习一下tidyr和dplyr包吧。
很有用。
你的例子估计要先用]作为分界把字符拆开，再替换了不需要的。或是先把[]替换再拆分，然后再用dplyr中的spread

8楼

JLOGAN 发表于 2016-9-21 11:50:01

johnmy 发表于 2016-9-19 00:02

请问前辈，加上第三列id有用吗？我就用前两列的话提示错误：
Error: Duplicate identifiers for rows (3397, 3399), (1040, 1042), (3622, 3623),
已经去重了，这是什么原因呢

9楼

JLOGAN 发表于 2016-9-21 11:52:02

johnmy 发表于 2016-9-19 16:32
学习一下tidyr和dplyr包吧。
很有用。
你的例子估计要先用]作为分界把字符拆开，再替换了不需要的。或是 ...

果然有用，谢谢亲~~

10楼

johnmy 发表于 2016-9-21 14:40:09

JLOGAN 发表于 2016-9-21 11:50
请问前辈，加上第三列id有用吗？我就用前两列的话提示错误：
Error: Duplicate identifiers for rows (3 ...

不知道，反正有时间提示重复我就再加上一列

返回列表

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[学习分享] R属性处理 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

[学习分享] R属性处理 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群