楼主: aongao
5186 32

怎么培养数据分析的能力? [推广有奖]

  • 5关注
  • 31粉丝

VIP

教授

52%

还不是VIP/贵宾

-

TA的文库  其他...

新能源&可持續發展

農業&经济

威望
1
论坛币
33743 个
通用积分
5631.2235
学术水平
153 点
热心指数
194 点
信用等级
114 点
经验
89598 点
帖子
626
精华
2
在线时间
1101 小时
注册时间
2014-1-20
最后登录
2022-4-13

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
先从问题本身来回答一下,培养数据分析的能力,简单说就是 理论+实践


理论:是进行分析的基础
1)基础的数据分析知识,至少知道如何做趋势分析、比较分析和细分,不然拿到一份数据就无从下手;

2)基础的统计学知识,至少基础的统计量要认识,知道这些统计量的定义和适用条件,统计学方法可以让分析过程更加严谨,结论更有说服力;

3)对数据的兴趣,以及其它的知识多多益善,让分析过程有趣起来。

实践:可以说90%的分析能力都是靠实践培养的
1)明确分析的目的。如果分析前没有明确分析的最终目标,很容易被数据绕进去,最终自己都不知道自己得出的结论到底是用来干嘛的;

2)多结合业务去看数据。数据从业务运营中来,分析当然要回归到业务中去,多熟悉了解业务可以使数据看起来更加透彻;

3)了解数据的定义和获取。最好从数据最初是怎么获取的开始了解,当然指标的统计逻辑和规则是必须熟记于心的,不然很容易就被数据给坑了;

4)最后就是不断地看数据、分析数据,这是个必经的过程,往往一个工作经验丰富的非数据分析的运营人员要比刚进来不久的数据分析师对数据的了解要深入得多,就是这个原因。

最后,相关书籍的话,不要脸的自己推荐一下,新书《网站分析实战—如何以数据驱动决策,提升网站价值》已经开始预售,应该马上就有货了,如果有兴趣的话可以关注下。

第一步:数据准备:(70%时间)
获取数据(爬虫,数据仓库)
验证数据
数据清理(缺失值、孤立点、垃圾信息、规范化、重复记录、特殊值、合并数据集)
使用python进行文件读取csv或者txt便于操作数据文件(I/O和文件串的处理,逗号分隔)
抽样(大数据时。关键是随机)
存储和归档

第二步:数据观察(发现规律和隐藏的关联)
单一变量:点图、抖动图;直方图、核密度估计;累计分布函数
两个变量:散点图、LOESS平滑、残差分析、对数图、倾斜
多个变量:假色图、马赛克图、平行左边图

第三步:数据建模
推算和估算(均衡可行性和成本消耗)
缩放参数模型(缩放维度优化问题)
建立概率模型(二项、高斯、幂律、几何、泊松分布与已知模型对比)

第四步:数据挖掘
选择合适的机器学习算法(蒙特卡洛模拟,相似度计算,主成分分析)
大数据考虑用Map/Reduce
得出结论,绘制最后图表

循环到第二步到第四步,进行数据分析,根据图表得出结论完成文章。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析 reduce 机器学习算法 蒙特卡洛模拟 python 能力

已有 2 人评分经验 学术水平 热心指数 信用等级 收起 理由
daazx + 12 + 2 + 5 + 1 精彩帖子
狂热的爱好者 + 12 + 2 + 2 + 2 精彩帖子

总评分: 经验 + 24  学术水平 + 4  热心指数 + 7  信用等级 + 3   查看全部评分

沙发
aongao 发表于 2014-6-30 09:00:19 |只看作者 |坛友微信交流群
“无尺度网络模型”的作者艾伯特-拉斯洛·巴拉巴西认为——人类93%的行为是可以预测的。数据作为人类活动的痕迹,就像金矿等待发掘。但是首先你得明确自己的业务需求,数据才可能为你所用。

1. 数据为王,业务是核心
了解整个产业链的结构
制定好业务的发展规划
衡量的核心指标有哪些

有了数据必须和业务结合才有效果。首先你需要摸清楚所在产业链的整个结构,对行业的上游和下游的经营情况有大致的了解。然后根据业务当前的需要,指定发展计划,从而归类出需要整理的数据。最后一步详细的列出数据核心指标(KPI),并且对几个核心指标进行更细致的拆解,当然具体结合你的业务属性来处理,找出那些对指标影响幅度较大的影响因子。前期资料的收集以及业务现况的全面掌握非常关键。

2. 思考指标现状,发现多维规律
熟悉产品框架,全面定义每个指标的运营现状
对比同行业指标,挖掘隐藏的提升空间
拆解关键指标,合理设置运营方法来观察效果
争对核心用户,单独进行产品用研与需求挖掘

发现规律不一定需要很高深的编程方法,或者复杂的统计公式,更重要的是培养一种感觉和意识。不能用你的感觉去揣测用户的感觉,因为每个人的教育背景、生活环境都不一样。很多数据元素之间的关系没有明显的显示,需要使用直觉与观察(数据可视化技术来呈现)。

3. 规律验证,经验总结
发现了规律之后不能立刻上线,需要在测试机上对模型进行验证。

P.S.数学建模能力对培养数感有一定的帮助

推荐两个论坛:

数学建模与数学应用论坛(Mathematical Modeling and Mathematical Applications Forum)

数学中国 (数学建模)-最专业的数学理论研究、建模实践平台


已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
352693585 + 5 + 5 + 5 + 5 精彩帖子

总评分: 论坛币 + 5  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

使用道具

藤椅
cglee 发表于 2014-6-30 09:07:32 |只看作者 |坛友微信交流群

回帖奖励 +2

支持一下了

使用道具

板凳
cglee 发表于 2014-6-30 09:08:18 |只看作者 |坛友微信交流群

回帖奖励 +2

90%的分析能力都是靠实践培养的
已有 2 人评分经验 学术水平 热心指数 收起 理由
1263t + 1 + 1 精彩帖子
aongao + 10 + 1 + 1 分析的有道理

总评分: 经验 + 10  学术水平 + 2  热心指数 + 2   查看全部评分

使用道具

报纸
vanessatan 发表于 2014-6-30 09:08:43 |只看作者 |坛友微信交流群

回帖奖励 +2

支持一下了
已有 1 人评分论坛币 热心指数 收起 理由
aongao + 5 + 1 鼓励积极发帖讨论

总评分: 论坛币 + 5  热心指数 + 1   查看全部评分

使用道具

地板
凤凰天马 发表于 2014-6-30 09:10:01 |只看作者 |坛友微信交流群

回帖奖励 +2

对呀,靠实践
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
1263t + 1 + 1 + 1 精彩帖子
aongao + 1 鼓励积极发帖讨论

总评分: 学术水平 + 1  热心指数 + 2  信用等级 + 1   查看全部评分

使用道具

7
jenvah0309 发表于 2014-6-30 09:10:23 来自手机 |只看作者 |坛友微信交流群

回帖奖励 +2

aongao 发表于 2014-6-30 08:59
先从问题本身来回答一下,培养数据分析的能力,简单说就是 理论+实践


哎学起来吧!
已有 2 人评分论坛币 学术水平 热心指数 收起 理由
1263t + 1 + 1 精彩帖子
aongao + 5 + 1 鼓励积极发帖讨论

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 2   查看全部评分

使用道具

8
请把我叫醒 发表于 2014-6-30 09:18:19 |只看作者 |坛友微信交流群

回帖奖励 +2

支持哈!
已有 1 人评分论坛币 热心指数 收起 理由
aongao + 5 + 1 鼓励积极发帖讨论

总评分: 论坛币 + 5  热心指数 + 1   查看全部评分

使用道具

9
line_us 发表于 2014-6-30 09:19:36 |只看作者 |坛友微信交流群

回帖奖励 +2

本论坛为公益性网站,目前没有任何广告赞助。为了获得网站的部分资金支持以及防止恶意注册滥发广告,故注册需要购买邀请码,价格仅为1元人民币。望广大网友谅解并且给予我们支持。另外,验证邮件可能在你的垃圾邮件里面,请注意!

使用道具

10
vanessatan 发表于 2014-6-30 09:27:10 |只看作者 |坛友微信交流群

回帖奖励 +2

我认为培养数据分析的能力 理论+经验

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 14:18