对于R软件来说,R的数据分析优势是众所周知的,而数据分析师纠结使用R还是Python主要基于以下几个原因:
1. 运算速度:
针对于程序速度的比较,有众多的测试方法和不同的结果,大体上从基本运算速度来说,Python是快于R的,但是,如果你愿意多花些心思更好的利用矢量化编程进行计算,那么无论从程序的长度来是速度上,都会使R的表现有显著性提高,对大部分运算,R的速度是可以和python接近的。
2. 全面性:
从这点来说, Python是强于R的。无论是对其他语言的调用,和数据源的连接、读取,对系统的操作,还是正则表达和文字处理,Python都有着明显优势。但R有包罗万象的统计函数可以调用,特别是在时间序列分析方面,无论是经典还是前沿的方法都有相应的包直接使用。
总的来说Python是一套比较平衡的语言,各方面都可以,无论是对其他语言的调用,和数据源的连接、读取,对系统的操作,还是正则表达和文字处理,Python都有着明显优势。
而R是在统计方面比较突出。
所以,对于本地文件直接的数据分析,R相对于Python来说,分析更专业一点,但对于比较复杂的数据分析来说(例如调取网页数据、数据库等),最好的方式是将Python与R结合使用。
|