1351 2

数据分析师入门之从0开始学数据分析 [推广有奖]

  • 0关注
  • 4粉丝

讲师

25%

还不是VIP/贵宾

-

威望
0
论坛币
970 个
通用积分
6.4818
学术水平
3 点
热心指数
4 点
信用等级
0 点
经验
4236 点
帖子
811
精华
0
在线时间
1 小时
注册时间
2014-8-28
最后登录
2017-12-12

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

数据分析师入门从0开始学数据分析


大家好,我是零一。我是一名数据分析师,8年的电商从业经验,擅长电商领域的数据分析和挖掘,常用的工具有Excel、PowerBI、Python、R等。


点击进入21世纪大数据人才汇聚领域』

点击进入21世纪数据分析精英聚集地』

点击进入21世纪大数据高薪就业领地』


今天开始给大家带来基础系列教程。

本系列文章适合以下情况的读者:

1丶淘宝店铺运营或者店长,目前还不会做数据分析,渴望提升自己

2丶打算在淘宝开店的朋友,目前尚在学习中

3丶其他对数据分析感兴趣的朋友,尚在入门阶段

本文是第一篇会比较基础,涉及的概念也少,旨在让读者动手了解工具。

我们直奔主题

数据分析的概念必须搞清楚。简单点说,数据分析是将数据进行清洗后,把隐藏在数据背后的信息提炼出来。

另外,值得一说的是:

数据分析是获取新知识的新途径。

可以看出来,专业一点的数据玩家的思路会非常清晰,而且会以目的为导向,建议大家参考分析师的思路。

数据分析的过程已经有非常多的前人做出了总结,我还是直接引用:

明确分析目的和内容——数据收集——数据处理——数据分析——数据展现——报告撰写

做任何事情都要有目的,做数据分析也不例外,而且明确目的在数据分析里面上升到了一个非常重要的高度,甚至决定了你后面所做的一切有没有价值。

做数据分析必须运用工具,没有工具几乎无从开展,大家看下一般数据分析有哪些工具

可以看到:

底层是数据库,在数据量大的情况下,需要动用到数据库,最常用的是MySql。

报告层是Crystal Reports(动态和可操作的报表,没用过)

分析层是分析的工具,从左到右分别是Excel(Office套装里面的一员,据说可以和SAS媲美的数据工具之一),UCINET(社会网络关系分析,没用过),SAS(最古老最专业的数据分析工具),SPSS(IBM的工具,以简单易用闻名),clementine(已经被IBM收购属于SPSS系列),现在比较流行的是R和PYHTON

最后是表现层,也就是做报告的一系列工具,我只接触过PPT、水晶易表和Power BI,一般会用PPT就可以了,如果想酷炫一点可以用Power BI。

接下来讲的数据分析,选择的是大家比较熟悉的Excel,Excel做深入分析的时候比较麻烦也有局限性,但就上手指数来说,Excel是排第一的。数据量在一亿条以内是足够的了。

建议使用的版本是MS Excel 2013或2016

第一步

我们要明确分析的目的和内容。因为是实例,我假设

目的:了解淘宝美容行业的市场情况

内容:1丶行业分析,2丶属性分析(采用折线图和饼图直观反映行业趋势和容量)

第二步

数据收集,一般手动收集,也可以用工具收集。

这里共享免费的专业工具(零一工具箱)给大家做练习,假如没有生e经,那没关系,下面用到的数据源一样会共享给大家,拿着数据源就可以一步一步跟着操作。

数据来源:生e经(必须有开通生e经,并能查看相应行业数据)

数据宽度:24(月)

因为生e经按月展示数据,因此这里的数据宽度,就是月份数。

打开表格,然后,按下列图片次序操作

耐心等待(等待时间和抓取的月份丶网速有关系),会在软件中出现结果,那么可以把这些数据导出。

导出的文件可以保持在本地,方便下次提取。

第三步

数据处理,简单举例,可以跟着做。

做下简单的处理,注意第一步需要选取整列。

接着,我们插入数据透视表,鼠标点一下我们的数据,任意一个单元格都可以,只要在数据范围内,如图,我点在E10单元格。点数据透视表,会自动匹配整个数据框。我们点确定即可。

点确定后,效果如下图所示

用鼠标,将字段拉到下面的相应位置即可

第四步

数据分析

我们现在就已经完成了数据透视表,通过这个透视表,就可以比较直观的对比各行业间的差异,但是都是数字,不免有些晕,或许用图表来展示会更加直观

点一下数据透视表,然后点插入——折线图,这里选择第一个样式即可(其他样式可以自己尝试)

结果如图所示

上图我们只能看见季度却不能直观的看见每个月的情况,在图表上的加号单击即可看见月份

接着,我想看一下各行业的容量占比,重点看裤子这个行业占比多少,就以2016年的数据来统计占比。还是插入数据透视表,选择饼图,先设置好字段,然后再选择2016.

如图下图所示:

再选择年份,如下图所示:

这里看不到占比,而且也不知道哪个行业,这就需要我们设置一下图表。右击图表——添加数据标签

出现标签后,我们再右击一下标签,设置数据标签格式

按下图红框设置即可

然后改下标题,稍微把图表的尺寸拖大一点

这样,就比较直观了,裤子在2016年中,销量占了整个市场的20%。那么我想再仔细看看裤子行业的销量走势。依然先插入并设计数据透视表。

然后,插入折线图

结果如下图:

两年的销量走势对比,可以看出2016年比2015年增长了不少。增长需要涉及到环比增长和同比增长两个概念,今天先不讲。我们通过目测就已经看出来,但是这个结论还不是最终结论,只是简单建立在数据层面的初步结论,还要通过淘宝去验证,搞清楚销量的增长是来自哪里。假设是某几家品牌促销的结果,那么这个数据对于我们而言,意义就不一样了。或许我们自己是这个行业的一个品牌商,则需要把后面的分析重点转移到研究这几家品牌的营销研究上面来,弄清楚对手究竟如何改变了这个市场。

属性分析里面包含了SKU,操作方法跟上面类似,这里就不演示了。

第五步

数据展现

把我们以上得到的结果,进一步优化,更加直观丶有序地展现出来。

第六步

撰写报告(非商业严谨报告,以实用为主)

把所看到的,所想到的,通过文字的方式记录下来,方便自己或者他人阅读,了解我们的分析思路。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析师 数据分析

沙发
军旗飞扬 发表于 2017-11-29 22:01:24 |只看作者 |坛友微信交流群
谢谢分享

使用道具

藤椅
皮皮lu 发表于 2018-1-10 12:06:41 |只看作者 |坛友微信交流群
确实如题目所示,适合新手入门,只是说了个类似把大象装冰箱总共分几步的流程;不过发到这个论坛有点水了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 20:21