楼主: CDA网校
10335 49

[每天一个数据分析师] 零基础转行数据分析,看这篇文章就够了 [推广有奖]

回帖奖励 90 个论坛币 回复本帖可获得 10 个论坛币奖励! 每人限 1 次

管理员

大师

62%

还不是VIP/贵宾

-

威望
3
论坛币
30923 个
通用积分
3025.7713
学术水平
260 点
热心指数
268 点
信用等级
235 点
经验
194684 点
帖子
5096
精华
19
在线时间
3688 小时
注册时间
2019-9-13
最后登录
2024-4-25

初级热心勋章

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如果有人问:2021年最有前途的职业是什么?数据分析师一定名列前茅!
在大数据时代的今天,数据分析作为一个热门行业,曾被Times时代杂志誉为“21世纪最热门五大新兴”行业之一。据统计,目前在世界五百强的企业中,有百分之九十的企业都建立了数据分析部门,未来中国对数据分析师的需求更是呈现上升趋势。
在这种趋势之下,数据分析已经不单单是数据分析师的“专业本领,”意味着成为我们每一个职场人士都需要掌握的技能。
对于职场已入瓶颈,或者想谋求更好发展的互联网人而言,转行数据分析正是一个不可多得的机遇。
在转行数据分析之前,小编先从从业者的角度带着大家梳理一下数据分析,方便大家根据自己的实际情况做出选择。

01人人都可以转行数据分析吗?
首先我可以明确地告诉大家,零基础转行数据分析是可行的。
但过程并非是一帆风顺的,需要经过很多努力。但是如果你不愿意吃学习的苦;怀着三天打鱼,两天晒网的心态;那么我建议你趁早放弃。
自从大数据的概念兴起后,数据分析师随之而来,很多职场人士都想在这个香饽饽上咬一口,但是你真的了解过这个行业吗?
数据分析作为新兴行业,根据岗位职责总体可以概括为以下两个方向:

640.webp (24).jpg

我们先来聊聊业务岗位的数据分析师,此方向更加看重逻辑思维,比如你思考框架的完整性、思维的灵活性,对数据要有敏锐的嗅觉。除此之外,你还需要掌握一些行之有效的数据分析方法,并且能够灵活的与自身工作相结合。比如:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等等。

640.webp (22).jpg

另一个则是技术方向的数据分析师,此方向更看重数据技术,比如统计学基础、数据库操作(SQL等)、编程语言(Python、R等)、机器学习等等。你需要对业务有很深的理解,这样才能对业务数据进行清洗、建模、分析。此方向的数据分析师薪资虽然高,但难度也是也极大的,对于刚刚入门数据分析的朋友,我更加推荐业务岗位的数据分析师。

640.webp (23).jpg

如果你真的对数据分析感兴趣,就要付出行动,而不是把它停留在脑海里。前段时间刷微博看到了一段很有意思的话,分享给大家。

  • 15岁觉得游泳难,放弃游泳,
  • 18岁遇到一个你喜欢的人约你去游泳,你只好说“我不会”。
  • 18岁觉得英文难,放弃英文,28岁出现一个很棒但要会英文的工作,你只好说“我不会”。
  • 人生前期越嫌麻烦,越懒得学,后来就越可能错过让你动心的人和事,错过新风景。


02数据分析师的日常工作有哪些?

在聊完数据分析的岗位职责划分之后,我想再和大家聊聊数据分析日常需要做哪些工作?

1.日常数据监控

数据分析师必须会监控数据和收集数据,利用数据得出有效的结论,并提供更好的决策方案。数据获取主要有两种方式:内部数据和外部获取。内部数据又分为两种方式,一种是通过公司的数据库和数据表直接获取;

另一种则是收集数据,你必须要通过整理公司的大量文件,从中收集到你所需要的数据。而外部获取则主要是检索,通过搜索引擎、行业报告还有技术爬取等手段获取到数据。

2.评估业务指标

最近搞的一个运营活动效果好不好?

我们该如何衡量这个标准呢?如果是微信的运营者,他会通过自己的用户量、阅读量,来作为这个平台的参数指标。

这部分内容在开始之前就需要数据分析师来全盘考虑,依据日常运营指标,来制定全盘的运营计划。并根据方案来布置需要监控/收集数据的位置,这是一个系统的工程。

3.业务优化

没有一款产品是完美的,只要被生产出来,就一定有它可以提升的空间。

当我们拿到一款产品,并找到它的发展目标。那么,我们就可以根据产品的生命周期,不断地监控、发现、优化产品的不足。

4.业务决策

当我们在帮助一款产品做决策时,很多小伙伴第一反应就是A/B测试。的确,这是很重要的一方面,但绝不是全部。

在决策过程中,我们更要注重根据产品需要解决的问题,从而去设立对应问题的优先级。哪些是应该优先处理的?哪些特性的改变,可以快速改善产品?

这个时候就需要我们数据分析师发挥作用了,协助产品做测试,从而判断问题的优先级。通过4个紧急、重要象限,来帮助产品做决策。

5.长远战略

现在的年轻人都喜欢什么啊?

这类问题往往不是那么迫切,但是为了公司的长远发展和自身影响力等,还是会接触到的。这里最关键的问题是如何从中挖掘出最有价值、最符合公司长远发展的问题,从而制定出符合公司个性化的产品。

成长就是在不断认识自我的状态下发展,希望这些东西可以帮助到正在迷茫中的朋友。总体而言,数据分析适合大多数人来学习,但是也需要付出一些努力。

试听课程地址:https://edu.c da.cn/course/explore/audition_class
a87e8e635d68747470733a2f2f6262732d7069632e64617461636f757273652e636e2f666f72756d.png


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析 零基础 Explore python Course

已有 1 人评分学术水平 收起 理由
kongqingbao280 + 5 精彩帖子

总评分: 学术水平 + 5   查看全部评分

沙发
Studio-R 在职认证  发表于 2021-11-9 10:15:29 |只看作者 |坛友微信交流群

回帖奖励 +10 个论坛币

常见的数据分析应用场景如下:

1 .市场营销

营销响应分析建模(逻辑回归,决策树)

净提升度分析建模(关联规则)

客户保有分析建模(卡普兰梅尔分析,神经网络)

购物蓝分析(关联分析Apriori)

自动推荐系统(协同过滤推荐,基于内容推荐,基于人口统计推荐,基于知识推荐,组合推荐,关联规则)

客户细分(聚类)

流失预测(逻辑回归)

2 .风险管理

客户信用风险评分(SVM,决策树,神经网络)

市场风险评分建模(逻辑回归和决策树)

运营风险评分建模(SVM)

欺诈检测(决策树,聚类,社交网络)

使用道具

藤椅
Studio-R 在职认证  发表于 2021-11-9 10:15:52 |只看作者 |坛友微信交流群
三 、数据分析过程

1. 向业务部门进行调研,了解业务需要解决的问题,将业务问题映射成数据分析工作和任务。

2.调研企业内外部数据,找到分析需要的数据,将数据汇聚到一个特定的区域,数据集市或数据仓库,探索性分析

3.数据清洗,包括检查数据的一致性,处理异常值和缺失值,删除重复数据等

4.数据转换,例如数据分箱(Binning),将字符型变量转化为数字型变量,按照数据所需维度进行汇总

5.建立模型,按照业务需求建立不同模型(例如客户流失预警、欺诈检测、购物篮分析、营销响应等)

6.模型结果解释和评估,业务专家进行业务解释和结果评价

使用道具

板凳
Studio-R 在职认证  发表于 2021-11-9 10:16:17 |只看作者 |坛友微信交流群
二、 数据分析之前的各项准备工作

数据分析团队各成员确定之后,将进行下一项工作,就是找到有价值的数据进行分析了。数据是分析的基础,因此数据的质量、数据的相关度、数据的维度等会影响数据分析的结果影,其中GIGO(垃圾进垃圾出)对于数据分析结果影响最大。

1 .数据源选择

数据分析团队面对大量的数据源,各个数据源之间交叉联系,各个数据域之间具有逻辑关系,各个产品统计口径不同,不同的时间段数值不同等。这一系列问题多会影响数据分析结果,因此确定数据源选择和数据整理至关重要。

DBA可以基于数据分析需要,找到相关数据,建立一张数据宽表,将数据仓库的数据引入到这张宽表当中,基于一定的逻辑关系进行汇总计算。这张宽表作为数据分析的基础,然后再依据数据分析需要衍生出一些不同的表单,为数据分析提供干净全面的数据源。宽表一方面是用于集中相关分析数据,一方面是提高效率,不需要每次分析时都查询其他的数据表,影响数据仓库效率。

2. 数据抽样选择

简单的数据分析可以调用全体数据进行分析,数据抽样主要用于建模分析,抽样需考虑样本具有代表性,覆盖各种客户类型,抽样的时间也很重要,越近的时间窗口越有利于分析和预测。在进行分层抽样时,需要保证分成出来的样本比例同原始数据基本一致。

3 .数据类型选择

数据类型分为连续型和离散型,建模分析时需要确定数据类型。进行业务收入趋势分析、销售额预测分析、RFM分析时,一般采用连续型变量。信用评级、分类预测时一般采用离散变量。

4 .缺失值处理

数据分析过程中会面对很多缺失值,其产生原因不同,有的是由于隐私的原因,故意隐去。有的是变量本身就没有数值,有的是数据合并时不当操作产生的数据缺失。

缺失值处理可以采用替代法(估值法),利用已知经验值代替缺失值,维持缺失值不变和删除缺失值等方法。具体方法将参考变量和自变量的关系以及样本量的多少来决定。

5. 异常值检测和处理

异常值对于某些数据分析结果影响很大,例如聚类分析、线性回归(逻辑回归)。但是对决策树、神经网络、SVM支持向量机影响较小。

一般异常值是指明显偏离观测值的平均值,例如年龄为200岁,平均收入为10万元时,有个异常值为300万元。第一个异常值为无效异常值,需要删掉,但是第二个异常值可能属于有效异常值,可以根据经验来决定是否保留或删掉。

6 .数据标准化

数据标准化的目的是将不同性质、不同量级的数据进行指数化处理,调整到可以类比的范围。例如在建立逻辑回归模型时,性别的取值是0或以,但是收入取值可能就是0-100万,跨度较大,需要进行标准化。

一般可以采用最佳/最大标准化(Min-Max标准化法)将数值定在0和1之间,便于计算。Z分数法和小数定标标准化法也可以采用。

7 .数据粗分类(Categorization)处理

归类和分类的目的是减少样本的变量,常有的方法由等间距分类,等频数分类。可以依据经验将自变量分成几类,分类的方法可以不同,建议采用卡方检验来决定采用哪种分类方法。连续型变量可以用WOE变化方法来简化模型,但降低了模型的可解释性。

8 .变量选择

数据分析过程中会面对成百上千的变量,一般情况下只有少数变量同目标变量有关,有助于提高预测精度。通常建模分析时,有意义的变量不会超过10-15个,称他们为强相关变量(聪明变量)。可以利用变量过滤器的方法来选择变量。

一般IV值大于0.3代表变量的预测力较强,可以采用。

使用道具

报纸
Studio-R 在职认证  发表于 2021-11-9 10:16:38 |只看作者 |坛友微信交流群
一 、数据分析师中的角色和职责

数据分析团队师应该在科技部门内部还在业务部门内部一直存在争议。在业务部门内部,对数据场景比较了解,容易找到数据变现的场景,数据分析师对业务提升帮助较大,容易出成绩。但是弊端是仅仅对自己部门的业务数据了解,分析只是局限独立的业务单元之内,在数据获取的效率上,数据维度和数据视角方面缺乏全局观,数据的商业视野不大,对公司整体业务的推动发展有限。业务部门的数据分析团队缺少数据技术能力,无法利用最新的大数据计算和分析技术,来实现数据分析和建模。数据分析和计算依赖于科技部门,效率较低,无法打通各个环节和实现效率和收益最优。

1. 数据库(仓库)管理员DBA

DBA最了解企业内部的数据和可用的数据资源,包括数据的存储细节和数据字典,另外其对数据的采集、清洗和转化起到关键作用。

DBA为数据科学家和数据分析师提供加工好的原始数据,这些数据是数据分析和建模的基础,DBA做了数据分析工作中最重要的基础工作,完成了大量的脏活和累活。

2 .业务专家

业务专家的优势是数据的商业敏感度,了解业务需求,可以将业务需求转化为数据需求,进一步找到数据应用场景。另外业务专家也可以通过对数据的分析,找到新的商业机会,同业务部门一起制定商业计划,利用数据分析推动业务增长。

业务专家的经验对于数据分析和建模是非常关键的,他们可能是风险管理人员、欺诈监测专家、投资专家等。数据建模来源于业务经验和业务知识,正是业务专家的专业分析找到了业务规律,从而找到了建模方向,并对建模工作给出建议和解释。

3. 数据科学家

过去统计分析依赖于统计分析工具,大数据时代之后,数据量级的提升和数据类型的复杂程度,让很多传统的统计分析工具无法完成分析计算。这个时候,数据科学家出现了,他们可以利用自己的专业技能帮助业务专家和数据分析人员进行建模和计算。

过去数据统计分析建模常用SPSS,SAS,MATLAB等工具,现在基于大数据平台的分析建模可以使用Spark+Scala/Python/R/Java。数据科学家了解模型和算法,可以直接承担建模和调优工作,懂得选择合适的算法来进行计算,提高效率。

4. 数据分析师

数据分析师站在数据和商业的角度来解读数据,利用图标和曲线等方式向管理层和业务人员展现分析结果,揭示数据分析产生的商业机会和挑战。

数据分析师将杂乱的数据进行整理后,将数据以不同的形式展现给产品经理、运营人员、营销人员、财务人员、业务人员等。提出基于数据的结果和分析建议,完成数据从原始到商业化应用到关键一步,数据分析师的数据敏感度、商业敏感度、分析角度、表达方式对于商业决策很重要。

5 .运营专家

数据分析结果和商业决策出来之后,运营专家负责实现商业决策。通过有计划的运营活动,将数据分析的结果应用到实际的商业活动之中,运营专家是实现数据变现最后一公里的关键人物。

运营专家属于业务人员,实际上参与业务运营活动,利用数据分析结果,实现业务场景和数据场景的结合,实现数据商业化应用。

使用道具

地板
CDA网校 学生认证  发表于 2021-11-9 10:43:42 |只看作者 |坛友微信交流群

使用道具

7
gudure 学生认证  发表于 2021-11-9 10:44:00 |只看作者 |坛友微信交流群

回帖奖励 +10 个论坛币

使用道具

8
xujingjun 发表于 2021-11-9 13:16:02 |只看作者 |坛友微信交流群

回帖奖励 +10 个论坛币

使用道具

9
军旗飞扬 发表于 2021-11-9 13:26:33 |只看作者 |坛友微信交流群

回帖奖励 +10 个论坛币

使用道具

10
三重虫 发表于 2021-11-9 13:49:40 |只看作者 |坛友微信交流群

回帖奖励 +10 个论坛币

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 10:10