以下观点仅仅是我的观点,也欢迎各位高人指正,补充:
第一:开发的能力。也就是数据处理的能力。在SAS工具里面,主要的体现是你对BASE模块的操控能力。这里我想纠正两个误区:一是以为做
分析的只要会各种统计分析过程就可以了,数据处理交给别人做。实际上,数据处理在整个分析流程中占用的时间要超过一半,真正到建模阶段
,只要你具备相应的统计学背景,就应该没有问题,所以,数据处理的质量高低将直接决定你模型的效果。别人做和自己亲自做对数据的理解
是完全不一样的。二是以为BASE SAS非常容易,不就是if/else;do循环等语句吗?实际上,我要告诉大家的,SAS真正的精华
是BASE,尤其是MACRO!在医学领域,由于大部分程序涉及到的实验数据非常少,所以数据本身的业务逻辑相对比较简单,因此对
BASE的应用相应也就简单。但是在商业;金融等领域,由于分析员对面的将是整个大型数据库或数据仓库,再加上商业需求的业务逻辑
十分复杂,所以对数据处理的要求相对较高。目前我所见到的国内受雇于SAS中国区公司的最N的几个人写的ETL的作业调度程序
全部是用BASE实现的。那么如何提高数据处理的能力?我觉得最直接有效的方法就是看别人是怎么写的。大家可以看看www.sas.net
这个论坛里面有很多非常精彩的code。其中有几个N人像Ahuige;Steven等都是目前国内非常顶N的人物,还有中国工商银行的
若干大侠,你看看他们在回答网友提出的问题的解决方法的时候将会彻底颠覆你对BASE的看法。
第二:方法论设计的能力。对前期的数据处理完成后,需要根据需求设计项目方法论。这里绝对不能认为方法论就是统计方法。从大的方面
应该包括两种情况:第一种是自创的方法论,这是方法论在设计中最难的。自创的方法论需要根据项目本身的需求来设计。比如,如何评价
营销活动的好坏?我们team当时就设计了一个非常有用的方法论,并不断完善推广到公司标准,这里根本就不需要所谓的高深的统计
建模知识,需要的是你对业务深刻的理解,而且设计的方法论一定要得到你的客户--Marketing部门人员的认同。第二种才是统计建模
的能力。在医学领域,由于更多的要涉及到实验设计。临床医学等知识,所以SAS当中的PROC模块像方差分析;glm模块,生存分析
,genmod模块等应用比较多。在商业,金融等领域,由于更多的是涉及marketing,所以SAS当中的PROC模块像回归分析;
logistic分析;bayes分析;聚类分析等等用的比较多。还有所谓的一些机器学习想神经网络;决策树等也比较常用。
第三:分析的能力。前面两种能力可以统计工作经验的积累一般都可以达到,只要你智力正常。但是分析的能力更多的是一种天赋了。
所谓分析就是你必须把business和technical之间做一个无缝的mapping,能让你做出来的东西marketing人员也能
理解,这就需要把technical语言最终转化为business语言,这是非常难的,这其实是在两个不同系统之间来回转换,打个比喻,
你在后台用所有的原料和技术炒了一盘你认为是非常好吃的菜,结果端到餐桌上,顾客认为不好吃。那谁说了算?当然是顾客。我们做
分析的就好比后台的那个厨师,marketing部门就好比前台的顾客,最终对你价值的评价是他们,而不是你自己。所以很多做分析的
以为用了很多技术手段就一切ok了,这显然是错误的。
第四:表达的能力。上面说了,分析完你的结论后,最终要形成一定的物理文件给marketing部门看,所以即便你有了很多非常有趣
的结果,如何展现给他们?这就需要组织你的表达框架,一般这个框架在ppt里面完成。主要包括:1.需求是什么?2.需求要达到什么目标?
3.分析出了什么有价值的东西?4.这些结论对marketing有用吗?有指导意义吗?5.你的建议是什么?所有这些你都需要用非常
business的语言来表述,像什么“变量”;“模型”之类的词肯定是不能出现在报告当中的,取而代之的可以是像“市场影响因素”;
“对市场的预期”等词语。
第五:business的能力。这是做分析人士的最高境界。几乎很少有人能够企及。事实上,前面所有的工作都是marketing人员
给分析人员安排的,也就是说,作为一个分析人员,基本上都是被动的接受marketing的需求。但是,如果通过你的工作,marketing
人员已经对你产生了绝对的信任,他们就会让你参与到他们的项目前期设计当中来,他们每天有很多的ideal,但是他们并不知道
哪些ideal是可行的,这时候,你就完全从你所掌握的知识来告诉他们哪些ideal是可行的。所以你必须具备business thinking
的能力,知道市场,了解市场发生的状况。
匆忙利用中午休息的时间写了一些,欢迎拍砖!
