签到
- 苹果/安卓/wp
- 苹果/安卓/wp
客户端
0.0

0.00

经管百科

人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛 › 【求助！】对一个分类型变量每个样本都有多个标签的情况 ...

楼主: 慕目穆木

1500 2

[问答] 【求助！】对一个分类型变量每个样本都有多个标签的情况应该怎么去统计他们的频数？ [推广有奖]

0关注
1粉丝

已卖：20份资源

硕士生

20%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 56 个
通用积分: 0.0001
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 5016 点
帖子: 91
精华: 0
在线时间: 150 小时
注册时间: 2016-9-8
最后登录: 2019-2-25

楼主

学生认证

发表于 2018-4-1 10:43:58 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

比如网易云音乐歌单的标签，每一个歌单都对应至多三个标签

歌单名称	歌单标签
［Bossa Nova］拉丁爵士音乐精选集	Bossa Nova,拉丁,爵士
［Jazz Samba］桑巴爵士音乐精选集	拉丁,爵士,Bossa Nova
来电铃声	R&B/Soul,Bossa Nova,New Age
维密天使大秀2018御用名曲	R&B/Soul,New Age,Bossa Nova

对于这种数据我要怎么去统计每一个标签的频数呢？
我目前能想到的就是strsplit 或者是用通配符，但是感觉他们都要用到for，效率应该会不高，有没有什么现成的包可以直接用上呢？
谢谢各位

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：split BOSS Soul jazz AMBA

相关帖子

回复

沙发

在职认证

发表于 2018-4-1 13:22:52

library(tidyverse)
myData %>%
seperate(歌单标签, c("tag1", "tag2", "tag3"), sep =",") %>% # 假设最多的标签是3个
gather(ignore, tag, tag1:tag3) %>%
select(-ignore)

复制代码

已有 2 人评分	学术水平	热心指数	信用等级	收起理由
慕目穆木	+ 1	+ 1	+ 1	精彩帖子
菊花冰糖水	+ 1	+ 1		学习学习

总评分: 学术水平 + 2 热心指数 + 2 信用等级 + 1 查看全部评分

回复

藤椅

学生认证

发表于 2018-4-2 22:31:59

cheetahfly 发表于 2018-4-1 13:22

学习了谢谢！！！

回复

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明