huanghao028 发表于 2012-6-10 11:20
请教一个问题:
自学SAS数据分析、数据挖掘方面的应用和SQL相关操作,该怎么做呢,?
现在毫无头绪,不 ...
等上了手后就发现是个广阔的天地。
我目前只能做到时间序列分析这块,运用SAS。(这是因为STATA的数据变量数内存只分配2M,而SAS无限大,存在硬盘中)
我相信学校旁边有那个旧书店,你找本《应用时间序列分析》中国人民大学出版社,王燕著。这是本科生教材。上面有案例结合SAS,我正在学做这个,因为我目前数据量是在10万以内,STATA够呛!内容不多,上手很快。
班内对SAS有介绍了,说是很强大的软件,什么编程之类的,那个呢有那啥方面的教程,可以找找相关的书记、看看啊~
然后至于怎么做回归分析这个您可以去看看别的教程,那些内容在上手后,会发现学得很快,就是柳暗花明又一村啊!!!
关键的问题是SQL查询,SAS有这功能,这个说实话我还没有用到这步,但是正在学习。这个看网上怎么说的。不过在sas之前,我倒是觉得数据库MYSQL或者oracle,咱们还是要学习点,把基础教程搞会了,这样可以:一,万一以后数据量达到千万了,咱还可以继续学;二,SAS的SQL查询我估摸着应该不会太复杂(具体我也不知道)。
再说这SQL数据库,据说是平时上班喝喝茶看看报纸怎么的,关键时刻加班甚至几夜不睡do可以,在几千万这种级别的;2,据说华为移动do是几千万甚至上亿级别的;3,前两个是废话,数据库管理才是王道。
再说数据发掘,本人开始觉得数据挖掘很神奇很强大,后来才知道,需要很好的基础知识,需要很好的耐心,建模这类的(本人入行较短)貌似开始不怎么需要,或者说利用目前的计量模型即可吧。班内的有些资料,说实在的,咱目前还没到那阶段,现在去看为时过早,咱是一步步走过来,功到自然成。
您还在学校里,可能没我这么大压力,倒是可以利用股市的数据来进行模拟,用大智慧下载保存股市数据。班内有着方面的讲义,您倒是可以看看。或者是别的什么数据。
上次班内有人说了,还是要多看看文献,站在巨人的肩膀上,不为了计量而计量,软件上手很快,想法创意的需要积累。大概是这意思。
说了这么多,就是这行是个积累的过程,静下心慢慢来。