[问答] 小白求助，用户属性的预处理 [推广有奖]

0关注
0粉丝

高中生

还不是VIP/贵宾

威望: 0 级
论坛币: 0 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 62 点
帖子: 6
精华: 0
在线时间: 34 小时
注册时间: 2013-8-20
最后登录: 2016-7-22

楼主

away44 发表于 2016-3-1 14:49:30 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

现有一份文档，每行的数据是该用户的标签属性，现在想把他们整理一下以方便建模，格式如下：

原文件：

C;B;D
D;A
A;D;C
B;C;D;A

整理后：

A    B    C    D
0    1    1    1
1    0    0    1
1    0    1    1
1    1    1    1

请问有什么比较好的方式么？谢谢!

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：预处理用户标签

回帖推荐

cheetahfly 发表于2楼查看完整内容

假设该文档的文件名是test.txt，数据总共有n行，我们用来存放该数据的变量是rawdata 和 data： # 读取数据 rawdata

沙发

cheetahfly

发表于 2016-3-1 17:38:16

假设该文档的文件名是test.txt，数据总共有n行，我们用来存放该数据的变量是rawdata 和 data：
# 读取数据
rawdata <- vector(mode = "list", length = n)
for (i in seq_len(n)) {
rawdata[[n]] <- scan("test.txt", sep = ";", what = character(0), skip=i-1, nlines = 1)
}
# 清洗数据
rawdata <- lapply(rawdata, factor, levels = c("A", "B", "C", "D"))
data <- t(sapply(rawdata, table))
data
A B C D
[1,] 0 1 1 1
[2,] 1 0 0 1
[3,] 1 0 1 1
[4,] 1 1 1 1