楼主: Data-零一
1667 2

[CDA数据分析师学习之路] 从0开始学电商数据分析-13 [推广有奖]

  • 0关注
  • 38粉丝

本科生

60%

还不是VIP/贵宾

-

威望
0
论坛币
1090 个
通用积分
0
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
702 点
帖子
47
精华
0
在线时间
69 小时
注册时间
2014-4-8
最后登录
2019-1-3

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

大家好,我是零一,经过深思熟虑,我把制作分析模型作为高阶的内容。学完高阶的预期效果是可以独立用Excel制作分析模型,并且还要掌握多一个分析工具。


鉴于本人的知识水平有限,依旧求拍砖,谢谢!


很喜欢一个小伙伴发的说说,我稍微改了下:学海无涯,分享是岸赞同的转起!


最近的感慨是这社会浮躁的人真多啊!总想着快速致富或者达到目的,却不想万丈高楼平地起。


好!我们开始。


首先给大家介绍一些相关的数据分析工具:

开源工具有R、Rapidminer、Weka等等

闭源工具有Spss Statistics、Spss Modeler、Sas、Excel等等

(在我的网盘里面都有得下载)


开源是免费的工具,源码是可以从网上下载下来的,一般只有英文版本。闭源工具是一些商业软件,都是需要破解才能正常使用,否则就购买版权。


首先是Modeler,它比EXCEL是要简单方便,图也是可以编辑的,这里除了做图之外还有很多模型,这些都是在实际数据挖掘里面都会应用到。Modeler是专门做商业数据分析与挖掘的工具.


用Modeler设计好数据流,也是可以达到分析自动化的目的,并且分析的方法会更加丰富。

1.png

Statistics也是SPSS系列的工具,主要是做统计分析的,跟SAS一样都是业界内非常古老的软件。SAS现在已经是一套系统了,体积有10G+。相应的也比较繁琐。


EXCEL特点是易学难精。它是非常强大的,虽然容易入门,但不容易精通。它可以解决大部分的数据分析需求,也是界面化操作,但可以用VBA编程语言拓展功能。

2.png

RapidMiner只有英文版本,也是界面化操作且具有流程化,也是非常强大的一款工具,它在某些方面要比Modeler要强大很多。

3.png

R语言需要有一定的编程基础的,可扩展性非常强。我非常喜欢的一款工具,相对来说比较难一点的。可以整出很炫丽的图,非常的强大。

4.png

5.png

我个人喜欢的工具是EXCEL,R,Rapidminer。如果除了EXCEL外,让我推荐,我建议大家可以考虑SPSS Modeler。因为这个是最简单的工具,有中文版本,它的特点就是简单易学,又是界面操作,专业度强且是流程化的工具。

=======================================================

下面,我们来学习用EXECL 2013为大家演示做一个分析模型。


这里是我提前抓取的数据。把数据全部选中,点击插入表格后,数据表格周围会出现流动的蚂蚁线,会有一个创建表的对话框弹出,我们直接点确定就OK了。

6.png

然后我们再点击插入数据透视表,一样也会出现流动的蚂蚁线,我们点确定就OK。

7.png

点击确定后我们发现,出现了一个全新的界面。

8.png

到了这一个界面,我们再把子行业成交量拖到行标签,成交量拖到数值。再选中插入饼图,会成为下面的一个样式。

9.png

接着把右边的图例给删除,右击添加数据标签,选中设置数据标签格式,会出现一个图例选项,我们选中类别名称跟百分比。之后,我们这个饼图就做好了,做好后,我们可以将它进行调整到美观跟清晰大小。另外加上图表的配色这些都是可以自定义的哦。图标的名称更改都是可以自行进行设置。


第一步:删除图例

10.png

第二步:右击图片,选中添加数据标签

11.png

第三步:点中数据,选中设置数据标签格式

12.png

第四步:选中类别名称跟百分比

13.png

第五步:修改图标标题

14.png

到这里就已经完成了单个的占比图,如果要看每个月的占比情况,可以选择堆积条形图。

15.png

这张图就是堆积条形图,每个月都是100%,反映每个月下,各个分类的占比情况,色块越大代表占比越大。可以清晰看出某个子行业全年的占比走势。

16.png

17.png

把行业数据(子行业和属性)展示出来,配合饼图、折线图(参考初阶第一篇)和堆积条形图可以做出漂亮的分析模型。下面教大家做个按键,来实现半自动刷新。


首先插入一个ActiveX控件,选择命令按钮

18.png

右击命令按钮设置属性

19.png

修改命令按键显示的文字

20.png

进入设置代码

21.png

敲入ThisWorkbook.RefreshAll这段代码,然后关闭工程编辑器,并退出设计模式(在设计模式下,命令按键是不起作用的。

22.png

点击【设计模式】退出设计模式

23.png

下面,我们来试下刷新数据

先把旧的数据删除(不包含列名),注意是删除表行,不是按delete(我相信虽然我说了,但还是有一大堆朋友会按delete,然后来找我,怎么跟你的不一样。我表示这个问题我会自动屏蔽)

24.png

然后,把新的数据粘贴入表格里面

25.png

点击一下刷新图表,即可刷新

26.png

下图是刷新后的结果

27.png

另外,可以插入日程表,来实现切换时间维度,比如分季度查看每个记录的数据报表(数据源必需有日期格式的数据,否则不能插入日程表)

28.png

29.png

30.png

31.png

32.png

另外也可以配合切片器(参考初阶第三篇)来实现维度的切换,整个报表会更加智能。


========================================================


下面我们来做一份有关店铺的转化率,访问深度,等纬度进行分析。


这是一份从量子导出的店铺数据分PC和无线两个终端,分别在两个CSV文件里面

33.png

34.png

先简单处理下数据,把周总和、平均值删除。另外把“-”给替换成0


接着,用我写好的模块。来处理这些数据。


进入Visual Basic,导入我写好的模块。(模块在我网盘)

35.png

36.png

37.png

然后新建一个sheet

38.png

运行我写好的模块

39.png

40.png

执行宏后会看到标准的数据结构

41.png

把日期的格式给设置一下

42.png

效果:

43.png

然后重复前面的操作,插入表格-插入数据透视表-插入图表-插入切片器和日程表

稍微排版一下,工作表名:分析报表

44.png

45.png

这样子一个简单的监控分析模型就做好了,这里没有任何的分析方法,只是实现了数据展现,方便分析师对各种数据维度进行对比。


另外,用数据分析,来看下最基本的各个维度的相关性。


首先打开Excel自带的分析工具库

46.png

勾选分析工具库后,可以在数据选项卡中找到这个工具库

47.png

48.png


49.png

关于相关性的知识可以参考中阶第九篇

50.png

另外,我们也可以将相关性可视化展示。


这时用到的是原始的数据结构,将数据转换成表格,工作表名:相关性源数据

51.png

然后设置自定义名称
52.png
X轴的值
53.png
Y轴的值
54.png

插入散点图


55.png
设置数据
56.png
57.png
58.png
59.png

确定后就可以看到散点图(读法依旧参考中阶第九篇)


现在我们要实现全维度的变换观察,插入表单控件的组合框


60.png
准备好列表(把表头复制了后转置粘贴即可)
61.png

设置控件


62.png
63.png

第一个控件设置好,复制多一个,只需要把单元格链接的105改成106就可以了,分别指向两个单元格,前面我们定义的名称,X是根据A105的值变化,Y是根据A106的值变化。


将A105和A106数值隐藏起来

64.png

简单排版一下

65.png

这个散点图,只要把源数据替换,就会自动刷新(原理是表格的功能特性)


整个模型的效果:

66.png

所有的中间层数据表我都隐藏了,可以通过取消隐藏来查看中间层数据

67.png





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
西门高 发表于 2017-7-26 16:46:32 |只看作者 |坛友微信交流群
谢谢分享

使用道具

藤椅
WGQ1995 发表于 2017-7-26 20:55:13 |只看作者 |坛友微信交流群
手把手教你用Vensim建模.pdf 不错的文档

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 04:13