楼主: away44
1085 2

[问答] 小白求助,用户属性的预处理 [推广有奖]

  • 0关注
  • 0粉丝

高中生

2%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
62 点
帖子
6
精华
0
在线时间
34 小时
注册时间
2013-8-20
最后登录
2016-7-22

楼主
away44 发表于 2016-3-1 14:49:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现有一份文档,每行的数据是该用户的标签属性,现在想把他们整理一下以方便建模,格式如下:

原文件:

C;B;D
D;A
A;D;C
B;C;D;A

整理后:

A     B     C     D
0     1     1      1
1     0     0      1
1     0     1      1
1     1     1      1

请问有什么比较好的方式么?谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:预处理 用户 标签

回帖推荐

cheetahfly 发表于2楼  查看完整内容

假设该文档的文件名是test.txt,数据总共有n行,我们用来存放该数据的变量是rawdata 和 data: # 读取数据 rawdata

沙发
cheetahfly 在职认证  发表于 2016-3-1 17:38:16
假设该文档的文件名是test.txt,数据总共有n行,我们用来存放该数据的变量是rawdata 和 data:
# 读取数据
rawdata <- vector(mode = "list", length = n)
for (i in seq_len(n)) {
  rawdata[[n]] <- scan("test.txt",  sep = ";", what = character(0), skip=i-1, nlines = 1)
}
# 清洗数据
rawdata <- lapply(rawdata, factor, levels = c("A", "B", "C", "D"))
data <- t(sapply(rawdata, table))
data
     A B C D
[1,] 0 1 1 1
[2,] 1 0 0 1
[3,] 1 0 1 1
[4,] 1 1 1 1
已有 1 人评分学术水平 收起 理由
万人往LVR + 3 精彩帖子

总评分: 学术水平 + 3   查看全部评分

藤椅
away44 发表于 2016-3-1 19:06:07
cheetahfly 发表于 2016-3-1 17:38
假设该文档的文件名是test.txt,数据总共有n行,我们用来存放该数据的变量是rawdata 和 data:
# 读取数据 ...
谢谢!我去试试

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-20 01:34