楼主: 胖胖小龟宝
1528 1

如何正确进行数据分析 [推广有奖]

大师

21%

还不是VIP/贵宾

-

TA的文库  其他...

龟宝的档案室

威望
3
论坛币
793110 个
通用积分
21962.7815
学术水平
2211 点
热心指数
2133 点
信用等级
1424 点
经验
979400 点
帖子
10001
精华
25
在线时间
4757 小时
注册时间
2012-7-27
最后登录
2020-12-21

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
先给大家看几条关于互联网的新闻,第一条是百度网页搜索份额达到73.2%,百度处理了1096亿条网页搜索请求,与去年相比提升了0.6个百分点。报告发布后,有出现了很多博客就根据这个数字来攻击Google,说它做的不好。来看第二条,还是同一份数据,里面提到百度搜索请求提升了0.5个百分点,google搜索请求提升了3.5个百分点,google成为增长最快的搜索引擎。

这两个新闻都用了数据,而且是一样的数据,但如果只看第一条和第二条后得出的结论是截然不同的。那看第三条,同样是关于市场份额的数据,百度市场份额下降2.1%,google增加5.6,二者差距缩小至7.7%。同样的几条新闻看下来,都是和搜索引擎市场份额相关的数字,但如果是一个对搜索引擎市场不熟悉的人看到,最后就会得出一个非常混乱的结论。

为什么三篇新闻引用了同样的数据却得出了不同的结果?下面来解析下关于如何分析数据的几个原则。

第一,独立的看一个数据是没有意义的。

接着上面的讲,百度和google市场份额问题,在第一条新闻中说到百度市场份额上升0.6%,给人感觉是百度上升,自然而然就暗示百度上升、google下降。第二条报道比较全面,它的含义是其他搜索引擎份额都在下降,google和百度都在增长,而且google增长的更快。这说明我们不能孤立的看一个数字。

在比如把搜狐和新浪全放在一起对比的话,会很不合理,搜狐有网游、无线、广告,而新浪主要是无线和广告,3:2显然不合理,单独拉出来比较才有比较合理的。

第二,数据的口径必须有可比性。

对于本文前面提到的搜索引擎市场份额的例子,有的按搜索请求来定义,有的按收入来定义,把不同的数据放在一起比是没意义的。如果一个数据不能自然而然的看出来,就应该看下他的定义。即使同样的定义,不同的公司来做,得出的结果也不尽相同。重要的是我们一定要保证口径一致的前提下进行比较。

第三,数据收集方式的差异

各个网站上经常出现热点事件报道后的调查,例如360和QQ你选择卸载谁的调查,其实结果往往不能反映真实情况,因为一般而言,只有对这个新闻关心的人才来表达如何看新闻,才来投票,用他们的投票结果来代表整体的意见,从而引导另一批不明真相的群众跟随主流观点。网络调查的结果很容易被厂商利用,用以宣传自己抨击对手。

来自:http://lusongsong.com/reed/254.html

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析 Google搜索 Google songs 市场份额 数据分析 数据收集 数据口径

沙发
1144196136 发表于 2014-5-22 16:40:48 来自手机 |只看作者 |坛友微信交流群
胖胖小龟宝 发表于 2014-5-22 14:25
先给大家看几条关于互联网的新闻,第一条是百度网页搜索份额达到73.2%,百度处理了1096亿条网页搜索请求,与 ...
学习了,赞一个

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-14 21:45