R 是一个开源、跨平台的科学计算和统计分析软件包,它提供了丰富多样的统计功能和强大的数据分析功能。随着数据科学的快速发展,R 已经成为数据分析领域非常流行的语言。本书通过 15 章内容,向读者全面讲解了 R 的基础知识和编程技巧。本书不仅介绍了 R的安装、基本对象、工作空间管理、基本表达式、基本对象操作、字符串的使用等基础内容,还对数据处理、R 的内部机制、元编程、面向对象编程、数据库操作、数据操作进行了讲解,同时也涉及高性能计算、网页爬虫和效率提升等重要主题。本书面向数据领域的从业人员,尤其适合想要通过学习 R 编程及相关工具提升数据处理效率的读者阅读,也适合计算机或统计相关专业的学生参考使用。通过阅读本书,读者将全面掌握 R 的相关特性及其在数据处理和分析方面的应用,极大地提升自己的专业技能。
本书与其他 R 语言图书有一个重要的不同:该书更倾向于帮助读者系统化地认识 R 作为一门编程语言的设计和行为,通过许多例子和实验帮助读者弄清楚 R 语言中各种常用数据结构的行为,以及所有这些行为背后统一的设计原则和行为准则。对于许多初学者以及其他编程语言的用户来说,R 语言是难以预料、充满怪癖的,至少不是十全十美的。但是,当了解到这些统一的行为准则后,你可能会惊叹 R 语言本身的一致性,以及表达数据和逻辑的灵活性。这些特性允许我们高效地进行数据探索、分析、可视化、报告等。本书将用一半的篇幅来介绍基本的 R 语言和对象,然后探索 R 语言的高级特性,让读者更加深入地理解其行为,形成一个整体的知识脉络。此时,当你写出一个 R 语言表达式,就能立刻猜想会发生什么,即使和想象的不一样,也能很快找到问题所在。打好了这个基础后,我们会介绍数据相关的主要技术,包括关系性与非关系性数据库,实现快速数据操作的扩展包等。掌握了语言和对象的特性以及流行的扩展工具后,我们就可以随时根据问题选择工具,因而生产力就能大幅提升,可以将主要经历投入在思考和解决业务问题,而非一知半解、绞尽脑汁地去找代码中的纰漏且摸不着头脑。最后,本书介绍了一系列工具,涵盖数据研究的多个方面,读者可以根据自己的需要继续学习。本书原版为英文版,对于国内的读者可能阅读中文版更加方便。为了保证翻译的质量,我推荐厦门大学经济学院和王亚南经济研究院(WISE)的研究生学弟、学妹们翻译本书。他们来自于一个自发组织的数据科学小组 WISER Club,经受过严格的学术训练,参与过多种数据研究项目,对 R 语言相关的应用已经有相当的经验,并且对推广数据科学充满热情。希望本书能让你更加深入地了解 R 语言和相关工具,更加自信、自由地探索数据的海洋。