5551 3

[问答] R语言如何统计数据框重复数据并新增一列显示统计量 [推广有奖]

  • 0关注
  • 0粉丝

高中生

70%

还不是VIP/贵宾

-

威望
0
论坛币
1007 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
198 点
帖子
11
精华
0
在线时间
47 小时
注册时间
2019-3-19
最后登录
2024-1-9

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据 我有一列数据,是address_code,我想新增一列new来放address_code重复的统计个数,比如48416,重复2次(第30行和31行),那new就是2(第30行),2(第31行)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:统计数据 重复数 统计量 数据框 R语言

回帖推荐

megapanda 发表于3楼  查看完整内容

设数据集是x,则x_new就是需要的列: table函数可以用于统计元素的频率
沙发
nieqiang110 学生认证  发表于 2020-6-11 16:42:30 |只看作者 |坛友微信交流群
data%>%group_by(address_code)%>%mutate(new=n()-1)%T>%str->data

使用道具

藤椅
megapanda 发表于 2020-6-11 16:51:59 |只看作者 |坛友微信交流群
设数据集是x,则x_new就是需要的列:
  1. x_tab = table(x$hkall.address_code)
  2. x_new = as.numeric(x_tab[as.character(x$hkall.address_code)])
复制代码


table函数可以用于统计元素的频率

使用道具

megapanda 发表于 2020-6-11 16:51
设数据集是x,则x_new就是需要的列:
感谢感谢,问题很好的解决了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 23:04