说明:这个帖子分5部分,每部分都根据我自己的体验和思考说了一个问题,以下是相关链接,欢迎拍砖。当然也欢迎版主加精,呵呵。
写给统计专业的学弟学妹们(2)——关于选择统计专业的若干问题
写给统计专业的学弟学妹们(4)——找数据分析师相关的工作要注意什么问题
对于刚进入统计专业的新人,一定会有很多和我当年一样的困惑,下面我把这些我能想到的困惑和我自认为正确的解答列举如下:
1) 统计到底是什么?是统计局干的统计吗?
统计学是一门有效收集数据、整理数据、分析数据以支持科学决策的学科。至于是不是统计局干的统计,这个事情要这么看,国外的统计局干的统计实际上的统计学理论一个很重要的应用。国内理论上也应该这样,但是国内的统计局迫于某些领导的淫威偶尔甚至经常会造点假,给大家造成了很多误解。
2) 统计和数学有关系吗?
我个人是这样看的,应该说有点联系,但没有必然联系,有点像马和狗的关系。这个区别从现象上来说有如下几点不同:
A. 数学学科一般都要强调数学,比如应用数学、理论数学。统计学一般要加上统计学。比如数理统计学和经济统计学,他们都是一级学科。
B. 国外一般都有两个统计系,一个叫统计系,一个叫生物统计系。一般不放在数学系下面。国内很多学校比如人大教统计学院、上海财大叫管理与统计学院、华东师大金融与统计学院,统计专业和数学专业也没放在一起。所以你会发现有些学校统计专业的开出的课程除数学分析、高代、概率论、数理统计其余的跟数学相关的课程基本上没有。
C. 从上面也可以看出,统计实际可以跟很多应用非常强的学科结合在一块,比如管理、金融、营销等。可以说统计是一种实践性非常强的工具。数学往往并不具备这样的功能。所以从事统计学术工作者往往除了玩统计之外,往往会弄弄除统计之外的副业,比如生物统计、生物信息学、化学计量、经济计量等。因为这些学科里面有大量需要统计区去解决的问题。
本质上的区别主要有如下几点:
A. 研究的目的不同:统计学理论研究主要是根据实际的问题和困难提出创新的数据处理方法、模型和算法,比较容易落到实处。数学通常研究的是一些比较理论的框架;
B. 研究的对象不同:统计学研究的根本对象是具体问题抽象出的数据。数学则研究的是抽象的空间和数量关系;
C. 思考的逻辑不同:统计更倾向于一种归纳逻辑,很多统计问题,很难像数学一样给出一个定理性的证明。数学更倾向于一种演绎逻辑。
D. 另外研究的手法不同,统计更强调模拟数据实验的方法。
3) 统计学专业和概率论与数理统计专业有什么关系?
呵呵,这个问题,我想说如下几点我的理解:
A. 这个问题我当年读本科的时候特别纠结,读研究生的时候就更纠结。因为很多人不理解有什么区别,每次都需要我去普及一些常识;
B. 依照国内的分专业原则统计学更偏向于应用,主要指的是经济统计,概率论与数理统计则偏向于统计理论方法的研究。这种区分方法感觉特别别扭。但是实在没有什么办法。这可能跟中国当时统计应用的场景比较单一,学术研究的经费来源渠道非常有限有关。因为这个学科在当时能发挥的价值还很有限,所以都需要找一个比较强势一点的学科做靠山。应用统计就找了经济做靠山,简称统计学,数理统计就找了概率论做靠山。所以就有了这种特别扯淡的区分;
C. 还有一个比较奇特的现象,就是这样区别对待,给大家创造了一个可以相互鄙视的机会和理由。做应用的觉得做理论做出来的理论没什么实用价值,做理论觉得做应用的比较浅薄。这个一方面说明,在中国对这个问题的认识还比较混乱,没有形成相对比较统一的认识,统计科学的发展还非常落后;另外一方面也说明中国统计界能做出理论和应用完美结合的成果实在太少。实际在统计很发达的欧美国家,大家没有刻意这么去区分。做应用的执着于用统计方法去解决实际问题,做理论也会根据实际问题去不断创新方法和理论。
4) 统计是热门专业吗?
同学你问这个问题,说明你对目前的行情实在不怎么了解。据我了解的单位招聘情况、 我找工作及周围人找工作的情况来看,统计专业绝对算目前的热门专业。我觉得主要有如下几个原因导致这个专业目前相当热门:
A. 统计天生就和数据分析就是夫妻,这个没办法,因为数据分析中用到的原理、思想和方法基本上来自统计。我个人其实建议将统计专业改成数据分析专业好了。实际上统计学的大师级人物图基在1962年就曾在统计学最顶尖的刊物《annals of statistics》发表过一遍《the future of data analysis》文章提过这个问题。还在这篇文章中提出了著名的“探索性数据分析”的理念;
B. 现在大部分企业尤其是互联网企业获取数据的成本已经很低,这为数据分析有源源不断的原材料数据提供了保障;
C. 企业的竞争环境越来激烈,所以量化管理和决策的思想也越来越受到企业的重视,基于数据的决策也越来越多被应用于企业
D. 多年来,尤其是近5年来互联网、电信企业对于数据分析的重视让数据分析这个行业已慢慢成熟起来
在考研的时候统计也是非常热门的专业,主要原因是从学术的角度看统计学于很多学科都有这天然的深刻的联系,比如:
A. 机器学习、模式识别这样学科的很多方法和理念都来自于统计。当然从这些学科发展也为统计提供了很好的养分;
B. 计量经济学和金融计量学里面的分析方法和时间序列的分析方法一致。
C. 还有生物统计,实际数理统计学的很多理论基本上都来自pearson、fisher等对生物遗传学研究的总结
D. 化学计量、心理计量学、信息计量学等等一些学科应用的方法也都来自于统计学。
可以说只要有数据的地方、有不确定性的地方就会有统计的身影。
正是基于以上商业应用和学术应用上的需要,目前在国内统计应该说已经成为当之无愧的热门学科了。当然话说回来了,正是统计学和其它学科的广泛联系,我们在找工作时也不得不面临这些专业的学生竞争。所以我们应该以数据挖掘和大统计的视角来学习统计。
5) 一般哪些企业会招聘统计相关专业的毕业生?
主要有如下一些行业的企业会招聘统计专业的毕业生:
A. 金融证券行业,这个行业里面会有两个职位和统计比较契合,一个是证券研究员、一个是金融工程师,这个行业薪资普遍都比较高。
B. 银行业:这个行业里面风险管理和信用评分之类的职位与统计比较契合。这个
行业里面的职位薪资也还不错
C. 互联网:这个行业里面数据分析师和数据挖掘工程师的职位与统计比较契合
这个行业平均薪资还行
D. 咨询行业:这个行业里面咨询顾问和数据分析师这两个职位和统计比较契合
这个行业里面薪资都还不错
E. 电信业:这个行业里面也大量招聘数据分析师和数据挖掘工程师,但薪资相对而言一般
F. 医药行业:这个行业最近几年招人比较多。而且严格要求会SAS、有统计专业背景
6) 薪资怎么样?
一线城市北上广深应届本科大概在4000-7000。应届硕士大概在6000-10000左右。至于后面要看个人能力和努力程度。二线除城市这种需求相对会少些。
7) 做数据分析相关的工作具体需要学习哪些知识呢?
主要要具备如下一些知识:
专业技能:excel、sql、sas或者R,这个必须相当熟练,最好PPT也玩的非常不错。如果能懂hadoop,会用hive,那就更好了。如果再能懂点C和java,会实现算法。那就非常完美了
专业理论:线性模型、logistic模型、时间序列模型、多元分析、方差分析、数据挖掘。学这些主要要弄清楚想法、算法原理、用法及优缺点
通用能力:结构化的思考能力、沟通能力和表达能力
8) 我对统计非常感兴趣,关于怎么学习统计你能给一些建议吗?
这个统计系的老师们比我更专业。所以多听一下他们的意见和建议。我个人觉得这个看你未来是想做学术型的工作还是想到企业工作。
如果是前者的话,要做好如下几点:
A. 重点打好概率论和数理统计的理论基础;
B. 要注重各种模型及算法的学习;
C. 学好R,会做各种统计试验,我个人觉得统计目前的发展对于模拟数据试验的依赖性还是蛮强的
D. 选定一个具体的问题,去深入研究一下。多读一下一流统计刊物上的文章。一般真正读懂一两篇可能就会有很多新的想法
如果是到企业,要做好以下几点:
A. 要注重各种模型及算法的学习,注意各种方法的适用范围;
B. 学好SAS,能用SAS实现完整的数据挖掘流程;
C. 可以到kaggle上面去下载几个企业实际的数据挖掘项目,完整的去做一下,并不断的去优化;
D. 学好口语,这个进外企非常重要。外企招聘这一块的人的薪资都不错。相对而言做的东西也专业一些。比如eBay、尼尔森等
9) 数据分析师在企业大概要做哪些工作?
首先说一下企业数据中心的简单架构。一般来数据中心主要分五个模块:
A. 数据仓库:主要是把业务上产生的不怎么干净和规范的数据转换为需要的数据;
B. BI报表:主要是根据业务的分析框架和需求上基于数据仓库去开发一个报表系统
C. 数据分析和挖掘:主要针对一些具体的项目的执行,比如从数据仓库里面提个数据、比如分析最近短信量下降的原因,比如做个游戏道具的定价、比如做个用户的流失预警
D. 数据产品:主要是针对某些固定的挖掘需求系统化的开发一些产品。比如智能推荐系统、CRM、精准营销系统
E. 行业分析:主要做一些用户的调研分析及竞争对手的分析
数据分析师主要做C、D、E三块相关的工作。具体主要做的事情有用SQL提取数据和整理数据、用EXCEL做一些简单的数据处理和分析、用SAS做一些模型、用PPT做一些报告、用JAVA或者C等做一些算法上的开发等等
另外数据分析通常会常伴CEO左右,所以最好知识能够全面一点,最好能懂点管理、营销,最好能用业务语言表达分析的结果。这样升迁会比较快。
10) 我对统计有初步了解了,但是我实在不怎么喜欢,我该怎么办?
建议先弄明白自己真的是不喜欢吗,自己不喜欢统计的原因是什么,再想想不喜欢这个到底喜欢什么。如果弄清楚了真正喜欢的东西,转系我觉得也可行。当然实在弄不清楚。建议先适应一阶段。有句话叫日久生情。当然如果实在生不了情,那就应付吧。但是始终还是要找件自己喜欢的有出路的事情来做——我喜欢玩游戏,能不能就以这个为职业——当然如果有门路能坚持当然是可以的。前提当然还是要把每门功课弄及格。我记得我们这届有一个非常成功案例,具体名字我就不说了。这兄弟实在不怎么喜欢统计。但别人喜欢写程序,而且喜欢英语。这兄弟其它的东西就应付着,重点做他喜欢的事情。后面进了一家小的外企。工作三年之后,跳到成都IBM做DBA,日子也过的很逍遥。实际还有两个兄弟跟这个情况也很类似。总之无论如何要找到自己的兴趣点。学一点能在未来用得着的真本事。这个上帝会想办法给你回报的。