楼主: 慕目穆木
1448 2

[问答] 【求助!】对一个分类型变量每个样本都有多个标签的情况应该怎么去统计他们的频数? [推广有奖]

  • 0关注
  • 1粉丝

已卖:20份资源

硕士生

20%

还不是VIP/贵宾

-

威望
0
论坛币
56 个
通用积分
0.0001
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
5016 点
帖子
91
精华
0
在线时间
150 小时
注册时间
2016-9-8
最后登录
2019-2-25

楼主
慕目穆木 学生认证  发表于 2018-4-1 10:43:58 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
比如网易云音乐歌单的标签,每一个歌单都对应至多三个标签
歌单名称歌单标签
[Bossa Nova]拉丁爵士音乐精选集Bossa Nova,拉丁,爵士
[Jazz Samba]桑巴爵士音乐精选集拉丁,爵士,Bossa Nova
来电铃声R&B/Soul,Bossa Nova,New Age
维密天使大秀2018御用名曲R&B/Soul,New Age,Bossa Nova


对于这种数据我要怎么去统计每一个标签的频数呢?
我目前能想到的就是strsplit 或者是用通配符, 但是感觉他们都要用到for,效率应该会不高,有没有什么现成的包可以直接用上呢?
谢谢各位
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:split BOSS Soul jazz AMBA

沙发
cheetahfly 在职认证  发表于 2018-4-1 13:22:52
  1. library(tidyverse)
  2. myData %>%
  3.   seperate(歌单标签, c("tag1", "tag2", "tag3"), sep =",")  %>% # 假设最多的标签是3个
  4.   gather(ignore, tag, tag1:tag3) %>%
  5.   select(-ignore)
复制代码
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
慕目穆木 + 1 + 1 + 1 精彩帖子
菊花冰糖水 + 1 + 1 学习学习

总评分: 学术水平 + 2  热心指数 + 2  信用等级 + 1   查看全部评分

藤椅
慕目穆木 学生认证  发表于 2018-4-2 22:31:59
cheetahfly 发表于 2018-4-1 13:22
学习了 谢谢!!!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-22 06:20