楼主: catflu
1435 1

[问答] 求助处理半结构化数据 [推广有奖]

  • 0关注
  • 0粉丝

小学生

57%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
40 点
帖子
2
精华
0
在线时间
10 小时
注册时间
2016-3-17
最后登录
2016-4-14

楼主
catflu 发表于 2016-3-17 10:10:52 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现有一份半结构化的数据,结构大概为 用户ID  运动1,运动1时长,运动2,运动2时长.....  现在想把它整理一下,把相同活动的时间累加到一起,存到数据框里,举例如下:

user1      足球,3,篮球,4,游泳,2,足球,5
user2      篮球,2,篮球,3,游泳,3,羽毛球,5,足球,2,足球,4
user3      足球,1
user4      


整理后:

user_id         足球      篮球       游泳        羽毛球
user1             8           4            2              0
user2             6           5            3              5
user3             1           0            0              0
user4             0           0            0              0

求教,这种半结构化的数据如何处理比较高效?或者有什么合适的package可以处理?谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:半结构化数据 结构化数据 结构化 package User 羽毛球 篮球 用户 游泳 足球

沙发
jiangbeilu 学生认证  发表于 2016-3-17 16:03:15
这种格式,应该是list形转化成data.frame类型的,R中有个包,rlist,厦门大学任坤写的,可以试一下。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 12:37