969 0

[数据挖掘工具] 对待数据,你为什么不如数据分析老司机? [推广有奖]

  • 0关注
  • 66粉丝

教授

55%

还不是VIP/贵宾

-

威望
1
论坛币
13016 个
通用积分
68.7278
学术水平
26 点
热心指数
25 点
信用等级
15 点
经验
8650 点
帖子
615
精华
0
在线时间
170 小时
注册时间
2016-12-6
最后登录
2017-4-8

楼主
数据分析闯天下 在职认证  发表于 2016-12-11 19:32:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
对待数据,你为什么不如数据分析老司机?

先来一个小笑话:科学家卸掉了螃蟹的左腿,并对它喊道“走”,螃蟹迅速爬走了。科学家又卸掉了螃蟹的右腿,仍对它喊道“走”,螃蟹没有爬走。因此聪明的科学家得出结论,螃蟹的耳朵是长在右腿上的。


再来看一个简单的例子:


经济危机时,根据统计,某国家50%人的财富增长了10%,另一半人则减少了50%。

QQ截图20161211193037.png

新手是这样解读的:整个国家的财富减少了40%。

  

而老司机这样问:增长的人财富基数是多少,减少的人基数又是多少?

  

没错,如果增长的那一半人原有财富是100,而减少的人原有财富是2,那么整体来看,财富不仅没有减少,反而增加了8%。

  

别被数据给骗了。

  

对待数据,如果你还不是老司机,那你应该怎么做?怎样才能做好大数据分析? 

 

1、明确分析数据的目的

咱们要分析一个数据,首先要明确自己的目的,为什么要收集和分析这样一份数据,才能够把握好接下来应该收集哪些数据,应该怎么收集数据,应该分析哪些数据等。

2、到哪里获取数据

当你制定了目标,那么现在会很明确要找哪些数据。这些数据在从内部资源获取不到的情况下,可以通过下面的几种方法:1.花钱购买(有专门的机构出售数据,如果你并不需要十分精细的或大篇幅的,或许可以看第二种方法)。2.网站下载(统计局官网、行业网站如房地产交易网等、大海洋数据超市)。3.自行获取(网页爬虫、网页采集器)。

3、数据处理

无论你通过什么方式获取数据,最终都要经过符合你需求的处理,删除不相干的干扰项,但也别忽视相关项。

  

例子:某二手车交易网的用户数据调查发现,有13%的用户月交易数量评价达到9次,且多为年龄在40-50岁之间的男性。

  

因此你得出结论,中年男性最爱频繁换车。但实际上,这13%的用户很可能是二手车行的老板,相信再喜欢换车的人也不能一个月更换9辆车。

  

所以用户的工作性质不可忽视,存在相关性的因素更不能轻易刨除。

4、记得你的立场

数据的因果关系和相关性非常迷人,导致许多数据分析者做着做着就忘记了自己的初衷和立场。你不需要挖出全部的数据相关性,只需要记得你在做以什么研究为目的的数据分析。

例子:你在做公司的业绩分析,需要从数据的角度提出员工业绩的影响因素,在挖掘的过程中,你进而发现公司盈利逐年变低是支出的不断超额,你的老板会对你说声谢谢,不过他需要你操心的只是业绩。




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析 大数据分析 二手车交易 数据调查 数据处理 数据分析 数据因果关系 数据分析目的 如何做好大数据分析 数据挖掘

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 21:57