1849 4

[问答] 如何利用plyr包对数据进行分组处理? [推广有奖]

  • 0关注
  • 0粉丝

大专生

5%

还不是VIP/贵宾

-

威望
0
论坛币
96 个
通用积分
1.0005
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
888 点
帖子
38
精华
0
在线时间
20 小时
注册时间
2017-2-5
最后登录
2020-1-13

楼主
想学好R的徐二狗 发表于 2017-4-17 22:14:15 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如图,我想利用plyr包进行分组数据处理,主要是想先按照ID分类,再对每天的体重进行一个异常值筛选,将异常的体重(比如在上下四分位点之外的)进行一个删除,想问一下plyr这个包是不是可以做到,然后该用什么样的方法去写出这个代码。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


1.png (37.59 KB)

1.png

回帖推荐

stzhao 发表于3楼  查看完整内容

沙发
想学好R的徐二狗 发表于 2017-4-17 22:15:36
忘记说了,因为数据很多,有18万条左右,有200多个不同的ID和20多个不同的日期。

藤椅
stzhao 在职认证  发表于 2017-4-18 10:38:10
  1. library(dplyr)
  2. mydata %>%
  3.       group_by(ID) %>%
  4.       filter(Weight <= quantile(Weight)[4] & Weight >= quantile(Weight)[2]) %>%
  5.       ungroup()
复制代码
已有 1 人评分经验 收起 理由
李会超 + 40 热心帮助其他会员

总评分: 经验 + 40   查看全部评分

板凳
想学好R的徐二狗 发表于 2017-4-18 13:40:45
stzhao 发表于 2017-4-18 10:38
你好,我运行了一下,这个和我之前用的outliners,箱线图删除异常值差不多,但是存在几个问题,一是还是会存在较小的体重值,第二个是删除了大概一半的数据。
我的想法是比如针对ID为1813这个个体,在7月17日的体重值进行筛选,因为体重是机器测定的,会存在一定的波动,所以要把过小的和过大的异常值删除, 比如10次测定里面,大部分是1.2,1.3左右的,有存在0.9的数据,我想把这个0.9的删除,来保证数据的准确性。

报纸
stzhao 在职认证  发表于 2017-4-18 14:38:54
想学好R的徐二狗 发表于 2017-4-18 13:40
你好,我运行了一下,这个和我之前用的outliners,箱线图删除异常值差不多,但是存在几个问题,一是还是会 ...
如果想按照ID和日期进行体重值的筛选,只需要在group_by里面加上这两个变量。
  1. group_by(ID, EntryDate)
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 11:59