|
因为统计在数学建模中出现的概率很高,因此我的统计软件之路也基本从这里开始:
1.SPSS
SPSS是最便于上手的软件,就不多说了。基本就是鼠标点点的事情,当然前提是你有统计学的基础,比如有感觉说拿到数据首先应该标准化处理,对于缺失数据要怎么办,对于分类数据是否需要人工设置分类变量。我用的最多的SPSS中的功能是分析-探索,分析-频率,分析-描述性统计,以及聚类分析,非参数检验等。但是用多了,也就发现它的不足,黑箱子,自己无法调出自己想要的内容。傻瓜软件的坏处自然也就是这样,并不需要你多想。
2.R
R的接触比SPSS早,有一次吴喜之教授来学校做讲座,提到了R for beginners.然后我回去就下载了R,用它也是简单的做做分布检验,运用概率相关知识做做经验分布,还记得那几个前缀p,d,n,等等,这点和matlab很像。也用过R做过回归等,命令lm.不过我目前需要的功能SPSS都可以帮我实现吧,只是有时候会在一些中间步骤的处理上用到R。软件真的不在多,而在熟。当时自己在R上真的用了很多心思,但是后来SPSS玩熟了,命令也就忘了。所以我觉得最好的方法是遇到问题,就用那一个软件(推荐R,SAS),遇到问题就想用它该怎么做。
3.matlab
只用过matlab做分布的检验,首先画出原数据分布,用dfittool进行拟合分布,然后再用kstest,或者chi2gof检验分布。
4.SAS
不熟悉,感觉这个软件也不友好。
综合来看,R还是最优秀的。但是对于一般的需求来说,并不需要学习编程的话,用SPSS就够了。做好统计学,做好的数据分析,前提还是统计学知识要精通,软件是辅助。
|