随着科学技术和生产力的发展,经济活动中的数据可得性越来越容易,因此,现实的统计分析中,数据的量非常大,统计分析中所用的方法也越来越复杂,对数据的可视化要求也越来越高。使用计算机和统计软件进行数据的处理和分析,已经成为一种潮流。
在计算机开始普及之前,统计分析中的计算问题使得统计学的应用受到了极大的限制。但随着计算机技术的发展,尤其是笔记本电脑的普及,统计学的教学发生了颠覆性的变化。对于统计学的学习者而言,复杂的计算问题可以由电脑完成,人们可以将更多的时间用于对统计分析的思想和原理的理解。
在当今,统计学的教学离不开电脑,更离不开统计软件。由于绝大部分的统计方法都由统计软件来完成,因此,学习统计学必须要精通一款统计软件。在本节,我们将对常见的统计软件进行简单的介绍。
一般而言,常见的统计软件按照其进行统计分析的操作方式,可以分为菜单式统计软件,如SPSS和Eviews软件等;命令式统计软件,如SAS 和Stata等; 编程式统计软件,如Matlab和R等。
一、菜单式编程软件
所谓菜单式统计软件,指的是该统计软件在进行统计分析时,主要通过下拉菜单的方式来进行。这类统计软件的代表是SPSS和Eviews等。
1. SPSS
SPSS是统计产品解决方案(Statistical Product and Service Solutions)的缩写,也是世界上著名的标准统计软件之一。SPSS软件的特点是简单、易懂且操作方便。另外,该软件具有较强的绘制图形和表格的能力,输出的结果也比较规范和直观,适合进行社会科学研究中的数据分析。使用SPSS软件,只要掌握一定的Windows系统的操作技能,了解统计分析的基本原理,就可以利用它进行数据分析。利用该软件,可以进行描述性统计学分析、区间估计、假设检验、相关分析、回归分析以及方差分析等。但SPSS软件的时间序列分析的能力相对较弱。另外,作为菜单式操作软件,SPSS统计分析的效率相对较低。
2. EVIEWS
Eviews 软件是计量经济学观点(Econometrics Veiws)的缩写,是最常见的 计量经济学软件包。在上世纪80年代中期,Eviews软件由高铁梅老师从美国引进到我国的计量经济学课程的教学。和SPSS一样,Eviews 软件也是菜单操作软件。 虽然Eviews 软件主要应用于计量经济学中的模型估计、模型检验和模型的预测等,但该软件也可以用于统计分析,同样,Eviews 软件的绘制图形功能也十分强大。 另外,由于该软件上手比较快,操作也比较简单,因此,Eveiws在统计分析中也相当的流行。
二、 命令式统计软件
命令式统计软件,指的是在进行统计分析时,主要通过在其命令输入窗口输入相应的命令的方式来实现对数据的处理和分析。和菜单式统计软件相比,命令行式统计软件的下拉菜单的功能比较简单,无法通过菜单实现绝大部分的统计分析。因此,只能在命令输入窗口输入相应的命令,实现对数据的分析,并利用相应的命令,展示统计分析的结果。具有代表性的命令行式统计软件是SAS和Stata。
1. SAS
SAS是统计分析系统(Statistical Analysis System)的缩写,是在业界享 有盛誉的统计软件。在数据处理和统计分析领域,SAS是国际上的标准软件和最权威的应用软件。SAS提供了能够从事统计分析、经济计量分析、时间序列分析、决策分析、财务分析和全面质量管理的工具。和菜单式软件相比,SAS是一个由30多个模块构成的组合式软件系统。另外,SAS是用汇编语言编写而成的统计软件,因此,使用SAS通常需要编写程序。但由于SAS的编程语言是非矩阵语言,因此,在进行统计分析时,SAS编程比较繁琐,最好的方式仍然是逐条输入命令的方式来运行它。
2.STATA
STATA与SAS、SPSS被共同成为三大权威统计软件,它被广泛地应用于统计学、经济学、生物学、医药学、社会学、人口学等等一系列学科的研究。STATA软件具有数据处理、绘图、统计分析、回归分析和编程处理这五大主要功能,其相互配合,可以完成系统完整的数据分析和处理任务。与其他统计软件一样,STATA具有正常的标题栏、菜单栏、工具栏和状态栏,由于Stata主要是通过命令进行操作,因此,这些工具栏的统计分析功能相对较弱。
三、 编程式统计软件
编程式统计软件软件指的是通过运行程序文件来完成统计学的数据处理、参数估计、模型检验和处理等一系列过程的统计学软件。和菜单式统计软件与命令式统计软件相比,编程式统计软件的效率最高,处理速度最快,但其学习成本也最大。这类软件的缺点在于软件的使用者不仅要精通统计学的基本计算和处理过程,还需要具备一定的编程技能。常见的菜单式操作软件主要有PYTHON、MATLAB和R 语言等。
1. PYTHON
PYTHON是能够简单有效地进行面向对象编程的计算机编程语言。在功能上,我们可以将Phython看成一款免费、开源的统计软件。Python的语法简洁易懂,代码块结构清晰明了,易于阅读和维护。Python支持多种编程范式,包括面向对象编程等,并且具有丰富的标准库和扩展库,适用于各种应用场景。例如Phython的科学计算扩展库NumPy、SciPy和matplotlib,分别为Python提供了快速数组处理、数值运算以及绘图功能。因此Python语言及其众多的扩展库所构成的开发环境十分适合工程技术、科研人员处理实验数据、制作图表,甚至开发科学计算应用程序。
2. MATLAB
MATLAB是美国MathWorks公司出品的商业数学软件,用于数据分析、深度学习、图像处理、量化金融与风险管理等领域。MATLAB和Mathematica、Maple并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。是矩阵运算、绘制函数和数据和实现算法中最常用的数学软件之一。和GAUSS软件一样,MATLAB也是一款以矩阵为其编程语言的软件,其功能要远超GAUSS。但和其他软件相比,MATLAB软件的体量最大,运行速度对电脑的要求极高,因此限制了该软件的推广和使用的范围。目前,国内几乎看不到以MATLAB为专用统计软件的统计学教程。
3.R
R语言是统计领域广泛使用的,诞生于1980年左右的S语言的一个分支。Auckland大学的Robert Gentleman 和 Ross Ihaka 及其他志愿 人员开发了一个R系统。R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。
R是一个免费的自由软件,对于UNIX、LINUX、MacOS和WINDOWS操作系统,都有相应的免费版本。在R主页上可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了常见的基础模块,其他模块可以通过CRAN获得。


雷达卡




京公网安备 11010802022788号







