R vs Python:可用性,受欢迎度,优缺点,工作和薪水
如果您是高级数据科学家或预测分析专家,则可能同时使用R&Python,以及其他工具(例如SAS,SQL等)。但是,如果您是初学者或只是想开始从事某职业,该怎么办?数据科学,机器学习和业务分析?您应该学习哪一个-R或Python?在数据科学家,研究人员和分析专业人员中,这一直是一个充满争议的话题。在本文中,我们将讨论R vs Python –可用性,受欢迎程度指数,优势与局限性,工作机会和薪水。
R介绍
R是一种统计和可视化语言,具有深厚的数学意义。R开发于1992年,多年来一直是大多数数据科学家首选的编程语言。R使您可以为想要执行的任何分析找到一个库。丰富的库使R成为统计分析(尤其是专业分析工作)的首选。此外,使用R的突出功能之一是您可以创建漂亮的数据可视化报告并传达调查结果。
R:面向程序员的热门软件包
dplyr, plyr和 用于数据处理的 数据表
操纵弦的弦杆
动物园可以使用定期和不定期的时间序列
ggvis, lattice和 ggplot2 数据可视化
机器学习的插入符
Python简介
Python基于C,它是一种深刻而又庞大且直观的软件开发语言。它比许多其他语言更容易学习,并且不需要完全流利就可以将其用于基因组学或其他生物数据分析。它可以进行一些统计,并且是一种出色的脚本语言,可以帮助您将工作流或管道组件链接在一起。
Python于1989年发布,其理念是强调代码的可读性和效率。它是一种面向对象的编程语言,这意味着它将数据和代码分组为可以相互交互和修改的对象。Java,C ++和Scala是其他示例。
Python是用于大规模部署和实现机器学习的工具。它几乎可以完成与R相同的任务:数据整理,工程设计,功能选择Web抓取,应用程序等。但是,Python代码比R更易于维护且更健壮。它为机器学习或人工智能提供了最先进的API。
大多数数据科学工作都可以通过五个Python库完成:Numpy,Pandas,Scipy,Scikit-learn和Seaborn。此外,Python使可重复性和可访问性比R更容易。如果需要在应用程序或网站中使用分析结果,Python是最佳选择。
Python:面向程序员的流行库
熊猫数据处理
SciPy / NumPy 用于科学计算
scikit-learn用于机器学习
用于图形的matplotlib
统计模型以探索数据,估计统计模型以及执行统计测试和单元测试
1