本书的目标是教会读者使用重要的数据科学工具,从而为实施数据科学奠定坚实的基础。 读完本书后,你将掌握R语言的精华,并能够熟练使用多种工具来解决各种数据科学难题。每一章都按照这样的顺序组织内容:先给出一些引人入胜的示例,以便你可以整体了解这一章的内容,然后再深入细节。本书的每一节都配有习题,以帮助你实践所学到的知识。
对应的中文目录翻译
第一部分 探索
第 1 章 使用ggplot2进行数据可视化 3
第 2 章 工作流:基础 29
第 3 章 使用dplyr进行数据转换 33
第 4 章 工作流:脚本 60
第 5 章 探索性数据分析 63
第 6 章 工作流:项目 86
第2部分 数据处理
第 7 章 使用tibble实现简单数据框 93
第8 章 使用readr进行数据导入 98
第9章 、利用tidyr整理数据
第 10 章 使用dplyr处理关系数据 114
第11章 使用stringr处理字符串 131
第 12 章 使用forcats处理因子 154
第 13 章 使用lubridate处理日期和时间 160
第三部分 编程
第 14 章 使用magrittr进行管道操作 179
第 15 章 函数 185
第 16 章 向量 201
第 17 章 使用purrr实现迭代 219
第四部分 模型
第 18 章 使用modelr实现基础模型 243
第 19 章 模型构建 266
第 20 章 使用purrr和broom处理多个模型 284
第五部分 沟通
第 21 章 R Markdown 295
第 22 章 使用ggplot2进行图形化沟通 308
第 23 章 R Markdown输出类型 331
第 24 章 R Markdown工作流 339