【连载】从零开始,教你做电商数据分析第十一篇-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 考研考博>>

考研

>>

【连载】从零开始,教你做电商数据分析第十一篇

【连载】从零开始,教你做电商数据分析第十一篇

发布:Lay.Terry | 分类:考研

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

经管之家新媒体交易平台

提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯"等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

提供微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

CDA数据分析行业专题课首次开班——本期专题“电商数据分析集训”本次主讲老师:零一,详情请点击:https://www.cda.cn/dianshang.html大家好,我是零一,经过深思熟虑,我把制作分析模型作为高阶的内容。学完高阶的预 ...
免费学术公开课,扫码加入


CDA数据分析行业专题课首次开班——本期专题“电商数据分析集训”
本次主讲老师:零一,详情请点击:https://www.cda.cn/dianshang.html

大家好,我是零一,经过深思熟虑,我把制作分析模型作为高阶的内容。学完高阶的预期效果是可以独立用Excel制作分析模型,并且还要掌握多一个分析工具。


鉴于本人的知识水平有限,依旧求拍砖,谢谢!


很喜欢一个小伙伴发的说说,我稍微改了下:学海无涯,分享是岸!赞同的转起!


最近的感慨是这社会浮躁的人真多啊!总想着快速致富或者达到目的,却不想万丈高楼平地起。


好!我们开始。


首先给大家介绍一些相关的数据分析工具:

开源工具有R、Rapidminer、Weka等等

闭源工具有Spss Statistics、Spss Modeler、Sas、Excel等等

(在我的网盘里面都有得下载)


开源是免费的工具,源码是可以从网上下载下来的,一般只有英文版本。闭源工具是一些商业软件,都是需要破解才能正常使用,否则就购买版权。


首先是Modeler,它比EXCEL是要简单方便,图也是可以编辑的,这里除了做图之外还有很多模型,这些都是在实际数据挖掘里面都会应用到。Modeler是专门做商业数据分析与挖掘的工具.


用Modeler设计好数据流,也是可以达到分析自动化的目的,并且分析的方法会更加丰富。


http://www.paidai.com/uploadpath/2014-5/20145111124_486754.png


Statistics也是SPSS系列的工具,主要是做统计分析的,跟SAS一样都是业界内非常古老的软件。SAS现在已经是一套系统了,体积有10G+。相应的也比较繁琐。


EXCEL特点是易学难精。它是非常强大的,虽然容易入门,但不容易精通。它可以解决大部分的数据分析需求,也是界面化操作,但可以用VBA编程语言拓展功能。


http://www.paidai.com/uploadpath/2014-5/201451111216_187607.png


RapidMiner只有英文版本,也是界面化操作且具有流程化,也是非常强大的一款工具,它在某些方面要比Modeler要强大很多。


http://www.paidai.com/uploadpath/2014-5/201451111225_204954.png


R语言需要有一定的编程基础的,可扩展性非常强。我非常喜欢的一款工具,相对来说比较难一点的。可以整出很炫丽的图,非常的强大。


http://www.paidai.com/uploadpath/2014-5/201451111235_556920.png

http://www.paidai.com/uploadpath/2014-5/201451111240_995628.png


我个人喜欢的工具是EXCEL,R,Rapidminer。如果除了EXCEL外,让我推荐,我建议大家可以考虑SPSS Modeler。因为这个是最简单的工具,有中文版本,它的特点就是简单易学,又是界面操作,专业度强且是流程化的工具。

=======================================================

下面,我们来学习用EXECL 2013为大家演示做一个分析模型。


这里是我提前抓取的数据。把数据全部选中,点击插入表格后,数据表格周围会出现流动的蚂蚁线,会有一个创建表的对话框弹出,我们直接点确定就OK了。


http://www.paidai.com/uploadpath/2014-5/201451111344_820846.png


然后我们再点击插入数据透视表,一样也会出现流动的蚂蚁线,我们点确定就OK。


http://www.paidai.com/uploadpath/2014-5/201451111410_573804.png


点击确定后我们发现,出现了一个全新的界面。


http://www.paidai.com/uploadpath/2014-5/20145111159_819218.png

到了这一个界面,我们再把子行业成交量拖到行标签,成交量拖到数值。再选中插入饼图,会成为下面的一个样式。


http://www.paidai.com/uploadpath/2014-5/201451111520_139428.png


接着把右边的图例给删除,右击添加数据标签,选中设置数据标签格式,会出现一个图例选项,我们选中类别名称跟百分比。之后,我们这个饼图就做好了,做好后,我们可以将它进行调整到美观跟清晰大小。另外加上图表的配色这些都是可以自定义的哦。图标的名称更改都是可以自行进行设置。


第一步:删除图例


http://www.paidai.com/uploadpath/2014-5/201451111536_853371.png


第二步:右击图片,选中添加数据标签


http://www.paidai.com/uploadpath/2014-5/20145111162_647581.png


第三步:点中数据,选中设置数据标签格式


http://www.paidai.com/uploadpath/2014-5/201451111610_501176.png


第四步:选中类别名称跟百分比


http://www.paidai.com/uploadpath/2014-5/201451111641_483769.png


第五步:修改图标标题


http://www.paidai.com/uploadpath/2014-5/201451111651_885152.png


到这里就已经完成了单个的占比图,如果要看每个月的占比情况,可以选择堆积条形图。


http://www.paidai.com/uploadpath/2014-5/201451111723_036196.png

这张图就是堆积条形图,每个月都是100%,反映每个月下,各个分类的占比情况,色块越大代表占比越大。可以清晰看出某个子行业全年的占比走势。


http://www.paidai.com/uploadpath/2014-5/201451111813_443410.png

http://www.paidai.com/uploadpath/2014-5/201451111740_609468.png


把行业数据(子行业和属性)展示出来,配合饼图、折线图(参考初阶第一篇)和堆积条形图可以做出漂亮的分析模型。下面教大家做个按键,来实现半自动刷新。


首先插入一个ActiveX控件,选择命令按钮


http://www.paidai.com/uploadpath/2014-5/201451111832_650292.png


右击命令按钮设置属性


http://www.paidai.com/uploadpath/2014-5/201451111841_494763.png


修改命令按键显示的文字


http://www.paidai.com/uploadpath/2014-5/201451111852_871703.png


进入设置代码


http://www.paidai.com/uploadpath/2014-5/20145111199_992868.png


敲入ThisWorkbook.RefreshAll这段代码,然后关闭工程编辑器,并退出设计模式(在设计模式下,命令按键是不起作用的。


http://www.paidai.com/uploadpath/2014-5/201451111923_210513.png


点击【设计模式】退出设计模式


http://www.paidai.com/uploadpath/2014-5/201451111931_370520.png


下面,我们来试下刷新数据

先把旧的数据删除(不包含列名),注意是删除表行,不是按delete(我相信虽然我说了,但还是有一大堆朋友会按delete,然后来找我,怎么跟你的不一样。我表示这个问题我会自动屏蔽)


http://www.paidai.com/uploadpath/2014-5/2014511111025_265260.png


然后,把新的数据粘贴入表格里面


http://www.paidai.com/uploadpath/2014-5/2014511111036_512499.png


点击一下刷新图表,即可刷新


http://www.paidai.com/uploadpath/2014-5/2014511111059_781393.png


下图是刷新后的结果


http://www.paidai.com/uploadpath/2014-5/2014511111051_713179.png


另外,可以插入日程表,来实现切换时间维度,比如分季度查看每个记录的数据报表(数据源必需有日期格式的数据,否则不能插入日程表)


http://www.paidai.com/uploadpath/2014-5/2014511111152_588204.png

http://www.paidai.com/uploadpath/2014-5/2014511111159_997995.png

http://www.paidai.com/uploadpath/2014-5/2014511111612_640315.pnghttp://www.paidai.com/uploadpath/2014-5/2014511111618_709571.pnghttp://www.paidai.com/uploadpath/2014-5/2014511111636_347636.png


另外也可以配合切片器(参考初阶第三篇)来实现维度的切换,整个报表会更加智能。


========================================================


下面我们来做一份有关店铺的转化率,访问深度,等纬度进行分析。


这是一份从量子导出的店铺数据分PC和无线两个终端,分别在两个CSV文件里面


http://www.paidai.com/uploadpath/2014-5/201451111170_297941.pnghttp://www.paidai.com/uploadpath/2014-5/201451111177_837638.png


先简单处理下数据,把周总和、平均值删除。另外把“-”给替换成0


接着,用我写好的模块。来处理这些数据。


进入Visual Basic,导入我写好的模块。(模块在我网盘)


http://www.paidai.com/uploadpath/2014-5/201451111199_831566.png

http://www.paidai.com/uploadpath/2014-5/2014511111948_086633.png

http://www.paidai.com/uploadpath/2014-5/201451111200_057311.png


然后新建一个sheet


http://www.paidai.com/uploadpath/2014-5/2014511112011_183778.png


运行我写好的模块


http://www.paidai.com/uploadpath/2014-5/2014511112022_747274.png

http://www.paidai.com/uploadpath/2014-5/2014511112042_451247.png


执行宏后会看到标准的数据结构


http://www.paidai.com/uploadpath/2014-5/201451111216_095524.png


把日期的格式给设置一下


http://www.paidai.com/uploadpath/2014-5/2014511112126_481637.png


效果:


http://www.paidai.com/uploadpath/2014-5/2014511112144_995740.png


然后重复前面的操作,插入表格-插入数据透视表-插入图表-插入切片器和日程表

稍微排版一下,工作表名:分析报表


http://www.paidai.com/uploadpath/2014-5/201451111226_270690.png

http://www.paidai.com/uploadpath/2014-5/2014511112214_889886.png


这样子一个简单的监控分析模型就做好了,这里没有任何的分析方法,只是实现了数据展现,方便分析师对各种数据维度进行对比。


另外,用数据分析,来看下最基本的各个维度的相关性。


首先打开Excel自带的分析工具库


http://www.paidai.com/uploadpath/2014-5/201451111233_422602.png


勾选分析工具库后,可以在数据选项卡中找到这个工具库


http://www.paidai.com/uploadpath/2014-5/2014511112343_650474.pnghttp://www.paidai.com/uploadpath/2014-5/2014511112359_708973.png

http://www.paidai.com/uploadpath/2014-5/2014511112430_672638.png

关于相关性的知识可以参考中阶第九篇


http://www.paidai.com/uploadpath/2014-5/2014511112421_818850.png


另外,我们也可以将相关性可视化展示。


这时用到的是原始的数据结构,将数据转换成表格,工作表名:相关性源数据


http://www.paidai.com/uploadpath/2014-5/2014511112455_047581.png


然后设置自定义名称


http://www.paidai.com/uploadpath/2014-5/201451111294_059821.png


X轴的值

http://www.paidai.com/uploadpath/2014-5/2014511112828_042094.png


Y轴的值

http://www.paidai.com/uploadpath/2014-5/2014511112838_960925.png


插入散点图


http://www.paidai.com/uploadpath/2014-5/2014511112934_733613.png


设置数据


http://www.paidai.com/uploadpath/2014-5/2014511113012_147670.png

http://www.paidai.com/uploadpath/2014-5/2014511113032_782041.png

http://www.paidai.com/uploadpath/2014-5/2014511113043_734786.png

http://www.paidai.com/uploadpath/2014-5/201451111319_011381.png


确定后就可以看到散点图(读法依旧参考中阶第九篇)


现在我们要实现全维度的变换观察,插入表单控件的组合框


http://www.paidai.com/uploadpath/2014-5/2014511113417_358306.png


准备好列表(把表头复制了后转置粘贴即可)


http://www.paidai.com/uploadpath/2014-5/2014511113445_454688.png


设置控件


http://www.paidai.com/uploadpath/2014-5/2014511113527_383596.png

http://www.paidai.com/uploadpath/2014-5/2014511113541_894367.png


第一个控件设置好,复制多一个,只需要把单元格链接的105改成106就可以了,分别指向两个单元格,前面我们定义的名称,X是根据A105的值变化,Y是根据A106的值变化。


将A105和A106数值隐藏起来


http://www.paidai.com/uploadpath/2014-5/2014511113940_536389.png


简单排版一下


http://www.paidai.com/uploadpath/2014-5/2014511113953_703759.png


这个散点图,只要把源数据替换,就会自动刷新(原理是表格的功能特性)


整个模型的效果:


http://www.paidai.com/uploadpath/2014-5/2014511114254_856703.png


所有的中间层数据表我都隐藏了,可以通过取消隐藏来查看中间层数据


http://www.paidai.com/uploadpath/2014-5/2014511114011_055708.png


「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-3039769-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。