如何成为合格的大数据人才?
刚刚结束的第五届中国数据分析行业峰会发布了《中国大数据人才培养体系》,指出大数据人才应当是具备数据认知、数据调用、数据综合处理、数据呈现和数据决策等多种能力的复合型人才,这为数据分析师的培养指明了方向。
点击进入『21世纪大数据人才汇聚领域』
点击进入『21世纪大数据高薪就业领地』
在以往,人们一般觉得只要具备某种IT技能,比如几种编程语言,就说明你是IT人,是一个大数据人才。然而后来大家逐渐发现,有很多IT人员从程序员转行到数据分析行业时,却并不能够胜任。也就是说,绝非仅仅拥有IT技能就可以称得上是合格的数据分析师、大数据人才。
那什么样的人才能够称得上是合格的大数据人才呢?今天,我们就和您分享一篇来自“第五届中国数据分析行业峰会之CPDA数据分析师专场”中王鑫老师的现场演讲,从中选择了一个具体的实际例子来抛砖引玉:
某公司微信运营经理小高运营的微信公众平台每天产生大量数据,而他的重要工作之一,就是从海量数据中发现对提高公众号文章质量有用的信息。
微信公众平台的后台有许多数据,包括所有文章的发文时间点、送达人数、取消关注数、所有竞争粉丝量等等。
小高之前做过程序员,懂得编程语言和许多IT技能,然而面对这么多数据,他却无从下手——他懂编程语言,却不知道需要用一段什么样的代码来发掘数据中的信息;他懂数据挖掘算法,却不知道文章质量该用哪种算法的哪种指标来衡量;他懂得发文时间点、送达人数、取消关注数、所有竞争粉丝量这些所有数据的含义,却不知道怎样建立它们之间的联系,并从中发现价值。
小高带着这些疑问找到一位行内的资深数据分析专家,专家告诉他,在数据分析实务中,首先要理解业务,其次才是运用工具进行分析。微信公众号后台的数据很多,但是从业务角度可以大致按照五个维度划分,分为五类指标:粉丝增长指标,粉丝活跃指标,文章信息指标,文章传播指标和文章价值指标。
在从业务角度建立了文章价值评估体系之后,我们再来考虑数据分析的方法和工具,就水到渠成了。很显然我们可以使用聚类的方法,把数据集聚为五类,结果如下图所示。
我们看到,第一类文章是新关注数、净增粉丝数和来自历史文章的阅读人数,三个指标都非常高,而这三个指标源自粉丝增长指标和粉丝活跃指标,这说明无论新用户还是老用户都非常喜欢看这类文章;第二类文章在各项指标上都不高,说明是非常平庸的文章;第三类文章的取消关注数最高,表明当目标用户看到这类文章以后,纷纷取消关注,而这一类文章共有91篇,是占比最大的,可见这类文章是降低公众号质量的罪魁祸首,下一步就是把这些文章揪出来,看看它们到底差在哪里,以后避免发此类文章;第四类文章,无论传播指标、粉丝增长指标还是粉丝活跃指标都非常高,说明这是精品文章,但非常可惜的是,这类文章只有一篇;第五类文章,从公众号分享到朋友圈的人数最多,并且添加收藏的人数也最多,说明这类文章的价值比较高,大家看过以后愿意分享和收藏。
在专家的指导下,小高成功实现了对公众号文章质量的评估,顺利完成了任务。
可见,一个合格的数据分析师,首先要对业务非常熟悉,这样才能够把握数据的内涵和意义,这是数据分析的第一步,也是最关键的一步。而这正是需要通过不断学习才能够达到的。在准确理解业务以后,才能够正确、恰当地运用自己的数据分析知识和工具,进行数据分析,进而得出有用的结论。无论哪一方面的能力有欠缺,都不能够胜任数据分析师的工作。
综合性能力需要不断学习、全面培养。也许你已经是一名前进在数据分析路上的学员了,也许你还在大数据门外徘徊寻找入门时机,又或者你已经是一名行业“老司机”,无论怎样,学习是一种精神,你都需要建立“终身学习”的思想。
如果你希望可以成长为一名合格的大数据人才,你可以来“数据.微课堂”进行学习,我们通过14年的经验积累,行业内的深度调研,精心打磨课程品质,为你在大数据岗位晋升保驾护航!