楼主: 林随机漫步
2989 1

[学习分享] R语言 分组计算,不止group_by [推广有奖]

  • 1关注
  • 3粉丝

已卖:1份资源

硕士生

7%

还不是VIP/贵宾

-

威望
0
论坛币
154 个
通用积分
102.8396
学术水平
11 点
热心指数
11 点
信用等级
11 点
经验
1957 点
帖子
67
精华
0
在线时间
138 小时
注册时间
2014-1-11
最后登录
2025-9-29

楼主
林随机漫步 发表于 2019-9-4 12:34:32 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
原创:拴小林 数据驱动实践2019-08-30 21:55:14

最近在研究excel透视图,想到好像自己在R-分组操作并不是很流畅,顺便学习分享一下。R自带数据集比较多,今天就选择一个我想对了解的mtcars数据集带大家学习一下R语言中的分组计算(操作)。


目录

1 dplyr包中的group_by联合summarize

1.1 group_by语法

1.2 summarise语法

1.3 group_by和summarise单变量分组计算

1.4 group_by和summarise多变量分组计算

2 ddply

2.1 ddply语法

2.2 ddply分组计算示例

3 aggregate

3.1 aggregate语法

3.2 aggregate分组计算示例

3.3 aggregate分组计算补充(formula形式)

4 splite


正文

首先给大家看一下mtcars数据集的基本情况,data.frame类型,32个观测对象,11个变量。

> head(mtcars)
> str(mtcars)

1 dplyr包中的group_by联合summarize

1.1 group_by语法

  1. group_by(.data, ...,)
复制代码


1.2 summarise语法

  1. summarise(.data, ...)
复制代码

注:计算函数Useful functions拓展中英语不解释了,应该懂得


1.3 group_by和summarise单变量分组计算示例

  1. > library(dplyr) #加载dplyr包
复制代码


1.4 group_by和summarise多变量分组计算示例

  1. > mtcars %>% group_by(vs, am) %>% summarise(n = n())
复制代码

2 ddply

接触了Hadley Wickham神包tidyverse以后感觉数据操作那么简单,这里介绍一种可以实现分组计算/操作的方法,就是plyr包的split-apply-combine思想

2.1 ddply语法

  1. ddply(.data, .variables, ... )
复制代码

2.2 ddply分组计算示例

  1. > library(plyr); library(dplyr)
复制代码

注意ddply中分组变量一定要在“点+括号中”,例如".(sex) 或 .(group, sex)"


3 aggregate

3.1 aggregate语法

  1. aggregate(x, by, FUN)
复制代码


3.2 aggregate分组计算示例

  1. > aggregate(state.x77, list(Region = state.region), mean)         
复制代码


———————

  1. > aggregate(state.x77,list(+           Region = state.region,+           Cold = state.x77[,"Frost"] > 130),+           mean)  
复制代码

3.3 aggregate分组计算补充(formula形式)


  1. aggregate(formula, data, FUN)#Formulas, one ~ one, one ~ many, many ~ one, and many ~ many:> aggregate(weight ~ feed, data = chickwts, mean)      
复制代码

4 splite

感觉splite没有太多好讲的,直接上例子体会一下吧~

  1. > require(stats); require(graphics)
复制代码


【推荐书籍】
R数据科学 作者:[新西兰]哈德利·威克姆(Hadley Wickham),[美]加勒特·格罗勒芒
R数据科学实战:工具详解与案例分析 作者:邬书豪,刘健

《R数据科学》是一本专门讲解tidyverse相关包的书籍,主要涉及dplyr、tidyr、ggplot2、purrr等,非常值得学习,基本上此一本书可以解答数据处理的大部分问题





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Group R语言 Population Aggregate IMPORTANT

沙发
xujingjun 发表于 2019-9-4 12:41:28

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-2 05:00