8021 3

[行业动态] 大数据时代:成为一名优秀数据分析师必备的七大专业能力 [推广有奖]

企业贵宾

巨擘

0%

还不是VIP/贵宾

-

威望
4
论坛币
624047 个
通用积分
147.0356
学术水平
918 点
热心指数
988 点
信用等级
842 点
经验
398662 点
帖子
9795
精华
48
在线时间
17322 小时
注册时间
2014-8-19
最后登录
2022-11-2

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

大数据时代:成为一名优秀数据分析师备的七大专业能力


大数据Big data的火热,催生了好多学习数据分析相关专业的学子纷纷投向大数据分析行业,都想在高额的大数据分析行业职位中占有自己的一席之地。但人人都有一个很伟大并且美好的梦想,却不是每一个人都有能力或机会去实现这个梦想。要梦想成真,我们必须具备抓住机会和稳住机会的能力。好多人都想成为数据分析师,但是要想成为一名合格甚至优秀的数据分析师需要具备哪些基本的专业能力呢?下面,小编来和大家好好讲讲成为一名优秀数据分析师必备的七大专业能力,看看你自己都还欠缺些啥,需要加强些啥。


(106).jpg



优秀数据分析师必备的七大专业能力


1. 数据采集


了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。这会帮助数据分析师更有针对性的控制数据生产和采集过程,避免由于违反数据采集规则导致的数据问题;同时,对数据采集逻辑的认识增加了数据分析师对数据的理解程度,尤其是数据中的异常变化。比如:


Omniture中的Prop变量长度只有100个字符,在数据采集部署过程中就不能把含有大量中文描述的文字赋值给Prop变量(超过的字符会被截断)。


(109).jpg


在Webtrekk323之前的Pixel版本,单条信息默认最多只能发送不超过2K的数据。当页面含有过多变量或变量长度有超出限定的情况下,在保持数据收集的需求下,通常的解决方案是采用多个sendinfo方法分条发送;而在325之后的Pixel版本,单条信息默认最多可以发送7K数据量,非常方便的解决了代码部署中单条信息过载的问题。(Webtrekk基于请求量付费,请求量越少,费用越低)。


当用户在离线状态下使用APP时,数据由于无法联网而发出,导致正常时间内的数据统计分析延迟。直到该设备下次联网时,数据才能被发出并归入当时的时间。这就产生了不同时间看相同历史时间的数据时会发生数据有出入。


在数据采集阶段,数据分析师需要更多的了解数据生产和采集过程中的异常情况,如此才能更好的追本溯源。另外,这也能很大程度上避免“垃圾数据进导致垃圾数据出”的问题。


2.数据存储


无论数据存储于云端还是本地,数据的存储不只是我们看到的数据库那么简单。比如:


数据存储系统是MySql、Oracle、SQL Server还是其他系统。


数据仓库结构及各库表如何关联,星型、雪花型还是其他。


生产数据库接收数据时是否有一定规则,比如只接收特定类型字段。


生产数据库面对异常值如何处理,强制转换、留空还是返回错误。


生产数据库及数据仓库系统如何存储数据,名称、含义、类型、长度、精度、是否可为空、是否唯一、字符编码、约束条件规则是什么。


(102).jpg


接触到的数据是原始数据还是ETL后的数据,ETL规则是什么。


数据仓库数据的更新更新机制是什么,全量更新还是增量更新。


不同数据库和库表之间的同步规则是什么,哪些因素会造成数据差异,如何处理差异的。


在数据存储阶段,数据分析师需要了解数据存储内部的工作机制和流程,最核心的因素是在原始数据基础上经过哪些加工处理,最后得到了怎样的数据。由于数据在存储阶段是不断动态变化和迭代更新的,其及时性、完整性、有效性、一致性、准确性很多时候由于软硬件、内外部环境问题无法保证,这些都会导致后期数据应用问题。


3.数据提取


数据提取是将数据取出的过程,数据提取的核心环节是从哪取、何时取、如何取。


从哪取,数据来源——不同的数据源得到的数据结果未必一致。


何时取,提取时间——不同时间取出来的数据结果未必一致。


如何取,提取规则——不同提取规则下的数据结果很难一致。


(101).jpg


在数据提取阶段,数据分析师首先需要具备数据提取能力。常用的Select From语句是SQL查询和提取的必备技能,但即使是简单的取数工作也有不同层次。


第一层是从单张数据库中按条件提取数据的能力,where是基本的条件语句;第二层是掌握跨库表提取数据的能力,不同的join有不同的用法;第三层是优化SQL语句,通过优化嵌套、筛选的逻辑层次和遍历次数等,减少个人时间浪费和系统资源消耗。


其次是理解业务需求的能力,比如业务需要“销售额”这个字段,相关字段至少有产品销售额和产品订单金额,其中的差别在于是否含优惠券、运费等折扣和费用。包含该因素即是订单金额,否则就是产品单价×数量的产品销售额。


4.数据挖掘


数据挖掘是面对海量数据时进行数据价值提炼的关键,以下是算法选择的基本原则:


没有最好的算法,只有最适合的算法,算法选择的原则是兼具准确性、可操作性、可理解性、可应用性。


没有一种算法能解决所有问题,但精通一门算法可以解决很多问题。


挖掘算法最难的是算法调优,同一种算法在不同场景下的参数设定相同,实践是获得调优经验的重要途径。


在数据挖掘阶段,数据分析师要掌握数据挖掘相关能力。一是数据挖掘、统计学、数学基本原理和常识;二是熟练使用一门数据挖掘工具,Clementine、SAS或R都是可选项,如果是程序出身也可以选择编程实现;三是需要了解常用的数据挖掘算法以及每种算法的应用场景和优劣差异点。


(94).jpg


5.数据分析


数据分析相对于数据挖掘更多的是偏向业务应用和解读,当数据挖掘算法得出结论后,如何解释算法在结果、可信度、显著程度等方面对于业务的实际意义,如何将挖掘结果反馈到业务操作过程中便于业务理解和实施是关键。


(92).jpg


6.数据展现


数据展现即数据可视化的部分,数据分析师如何把数据观点展示给业务的过程。数据展现除遵循各公司统一规范原则外,具体形式还要根据实际需求和场景而定。基本素质要求如下:


工具:PPT、Excel、Word甚至邮件都是不错的展现工具,任意一个工具用好都很强大。


形式:图文并茂的基本原则更易于理解,生动、有趣、互动、讲故事都是加分项。


原则:领导层喜欢读图、看趋势、要结论,执行层欢看数、读文字、看过程。


场景:大型会议PPT最合适,汇报说明Word最实用,数据较多时Excel更方便。


最重要一点,数据展现永远辅助于数据内容,有价值的数据报告才是关键。


(87).jpg


7.数据应用


数据应用是数据具有落地价值的直接体现,这个过程需要数据分析师具备数据沟通能力、业务推动能力和项目工作能力。


数据沟通能力。深入浅出的数据报告、言简意赅的数据结论更利于业务理解和接受,打比方、举例子都是非常实用的技巧。


业务推动能力。在业务理解数据的基础上,推动业务落地实现数据建议。从业务最重要、最紧急、最能产生效果的环节开始是个好方法,同时要考虑到业务落地的客观环境,即好的数据结论需要具备客观落地条件。


项目工作能力。数据项目工作是循序渐进的过程,无论是一个数据分析项目还是数据产品项目,都需要数据分析师具备计划、领导、组织、控制的项目工作能力。


(86).jpg


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:大数据时代 数据分析师 数据分析 大数据 分析师 大数据时代:成为一名优秀数据分析师必备的七大专业能力 大数据时代 成为一名优秀数据分析师必备的七大专业能力 数据分析师 优秀数据分析师必备的七大专业能力

回帖推荐

心从未停止呼吸 发表于4楼  查看完整内容

数据应用是数据具有落地价值的直接体现,这个过程需要数据分析师具备数据沟通能力、业务推动能力和项目工作能力。 随着互联网的普及和技术的发展,现在的年轻一代几乎都过上了“足不出户走遍全世界”的生活模式,由此带来的大数据分析的效应和魅力就焕发生机。通过大数据分析来获取消费者的种种行为惯性和消费指标,我们可以更好地规划和经营自己的生意和公司。并且由于大数据分析的茁壮发展,大数据创业潮也如雨后春笋般迸发生机 ...

https://www.cda.cn/?seo-luntan
高薪就业·数据科学人才·16年教育品牌
沙发
保罗沃克 在职认证  发表于 2016-3-17 17:11:15 |只看作者 |坛友微信交流群
当用户在离线状态下使用APP时,数据由于无法联网而发出,导致正常时间内的数据统计分析延迟。直到该设备下次联网时,数据才能被发出并归入当时的时间。这就产生了不同时间看相同历史时间的数据时会发生数据有出入。

使用道具

藤椅
放纵我的放纵 在职认证  发表于 2016-3-17 17:17:06 |只看作者 |坛友微信交流群
在数据采集阶段,数据分析师需要更多的了解数据生产和采集过程中的异常情况,如此才能更好的追本溯源。另外,这也能很大程度上避免“垃圾数据进导致垃圾数据出”的问题。

使用道具

数据应用是数据具有落地价值的直接体现,这个过程需要数据分析师具备数据沟通能力、业务推动能力和项目工作能力。
随着互联网的普及和技术的发展,现在的年轻一代几乎都过上了“足不出户走遍全世界”的生活模式,由此带来的大数据分析的效应和魅力就焕发生机。通过大数据分析来获取消费者的种种行为惯性和消费指标,我们可以更好地规划和经营自己的生意和公司。并且由于大数据分析的茁壮发展,大数据创业潮也如雨后春笋般迸发生机。不过大数据创业潮看似一片繁华,但个中的病态或潜伏的危机也是此起彼伏啊。大数据创业潮的未来到底在哪里,大数据分析带你好好走一遭,了解了解。

不要为了大数据而作大数据,初以为略有道理,现在发现,仍有很多人埋在这个坑里,为了大数据而做大数据,不仅是现在一些创业者和投资者的误区,甚至很有可能在未来的一小股泡沫中,越吹越大,这股泡沫什么时候来谁也不知,或许半年,或许两年。
业内有些高瞻远瞩的人士所提,大数据本质是类似工具的演变,手中拥有用户的现有玩家将在第一时间巩固自己的数据,并用算法进行内部优化。

就好比是突然发明了轮子,于是原来用人抬的各种运输公司都转变使用车轮,至于那些想跟风生产轮子的,生产轮毂的,培训教育大家怎么用轮子的,还有将轮子涂色设计成各种精美图案的公司,或许都不太会赚到钱。

若从大数据本身概念,则难以对现有数据护城河的公司(尤其是互联网公司)形成冲击,因技术上的事情,大家都懂,没有信息不对称的空间。

另一种考量则是基于行业优化,诸如医疗,航运,金融等等方向,对其中的运营环节进行数据的挖掘、整理和优化,这个就是一个从上而下的思路,从需求开始,一步一步向下设计架构,形成一个内部封闭的数据处理系统。

还有一种则是在全行业中形成一个自我的地盘,好比占领一处要地,让上下游的,友商有求于他,衡量下来跟他合作最划算,这方面的创业比如基因测序,比如语音识别,一旦形成规模,则壁垒鲜明,雷池难越,可以坚固地存在很久。

还有一种是可视化和分析方向,这个方向更多意义上是国外引进过来的,通俗点将可以说是淘宝的数据魔方或者生意参谋应用到其他行业,而在现在的技术条件下(数据调用难度),无外乎应用到其他互联网行业,其现实意义相当于是百度统计的2.0版,当然分析方向的创业者们有更宏伟的目标,至于未来如何,我想只有时间给出答案了。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 20:55