楼主: Data-零一
2981 3

[CDA数据分析师学习之路] 从0开始学电商数据分析-20 [推广有奖]

  • 0关注
  • 38粉丝

本科生

60%

还不是VIP/贵宾

-

威望
0
论坛币
1090 个
通用积分
0
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
702 点
帖子
47
精华
0
在线时间
69 小时
注册时间
2014-4-8
最后登录
2019-1-3

楼主
Data-零一 发表于 2017-8-24 15:28:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

1.jpg

大家好,我是零一。我是一名数据分析师,8年的电商从业经验,擅长电商领域的数据分析和挖掘,常用的工具有Excel、PowerBI、Python、R等。


最近看到某Excel教程,发现老师用的是WPS,是真的把我惊呆了。Excel是微软Office套件里面的其中一个软件,WPS Office是中国金山的软件,而且WPS里面并没有Excel,WPS名字英文全称是WordProcessing System(文字处理系统),后面3个字母分别代表3个软件 W-Word WPS文字;P-PointWPS演示;S-Sheet WPS表格。所以别混淆Excel和WPS表格两者的概念,Excel可以说是一个系统,WPS表格只能说是一个软件。


甚至连老师都混淆视听,这日子没法过了呀!

我最近还发现很多言论在煽动:淘宝已死,微商当立。


看到这类言论我就想笑,同时也悲哀。笑的是他们胡说八道,悲哀的是这种吓唬人的营销手法确实有用,同时也悲哀我的朋友圈已经失去了养分。

做什么事情都会很难,今天无论是做淘宝还是做微商,都难。但我可以肯定的说一句,只要你选择了任一条路,并为之努力,你都能收获。有一碗鸡汤是这样煲的:凡全副精神专注一事,终身必有成就。

到今天我自己都还选择要做淘宝,所以你们懂的。

好,镜头切回来。


这个时候问题就来了。有人就会问了,你不是说选择比努力更重要吗?按你这么讲选什么都一样了,不和你之前说的矛盾吗?

选择比努力更重要指的是方向的重要性,淘宝和微商都是渠道,而且他们都有自己的份额,而且现在淘宝还是大份额的。渠道上你有精力的话甚至可以全网铺开,但是,最重要的是你选择的方向,从商业的方向来讲,需要我们抉择的是我们的商业模式,说白了就是挣钱的方式。


有人要短平快,有人要做品牌,也有从来没思考过这个问题的。

有人选择运营品类,有人选择运营人群(社群)

可以说每个人的选择不同,但没有对错,以前我也讲过,资源适配的问题,在不同的条件下选择不同的方式,或许比一条筋的要好得多。这个大家就仁智之见吧。


上次说这篇要讲讲PowerPivot,我们下面就进入主题吧。


首先PowerPivot只支持MicrosoftOffice Excel 2010/2013/2016 这3个版本


PowerPivot是一个内存数据库,它真的是运行在内存上面的,所以速度要快得多,但同时也占用内存资源。同时它也是一个列数据库


列数据库顾名思义就是数据按列的方式存储,不同于行数据库,行数据库是逐行存储,列数据库要远远快于行数据库,原因就是列数据库是并发的查询,如果有10列,那列数据库会同时10列一起查找,是并发的。


而行数据库是逐行逐列向下扫描。

2.jpg

3.jpg


举个例子,同样10*10的一个数据块,包含100个单元的数据。假设每检索1个单元的数据用时间是1个单位的时间,如果用行数据库检索整个数据块,需要用100个单位的时间,每1个单元时间运算1个单元的数据。用列数据库只需要10个单位的时间,每1个单位的时间,可以运算10个单元的数据。


如下图所示,行数据库是Z字型的查询方式。100个单元格共花费100个单位的时间。

4.png


如下图所示,列数据库,每列并行运算。100个单元格共花费10个单位的时间。

5.png


PowerPivot是微软用来来填补Excel工作表和BI之间的空隙,让Excel能够处理大量的数据,并给其他BI组件提供数据模型的支持。


Excel 2010是需要额外下载安装PowerPivot的,下载链接

http://www.microsoft.com/zh-cn/download/details.aspx?id=7609

Excel 2013/2016/365 首次插入PowerView时,就会启用PowerPivot。

6.png


PowerPivot会有自己独立的选项卡。

7.png


下面简单介绍一下PowerPivot的基础应用。

示例工具版本:Excel 2013

示例数据集:淘宝搜索结果数据


第一步:将数据添加到数据模型,点击功能键后,输入数据范围。

8.png

9.png

下图是PowerPivot的界面

10.png


在这个界面下,处理的数据量要远远大于Excel的工作表(百万级别)。

在PowerPivot下使用数据透视表和数据透视图都会非常便捷。

11.png


支持单个的表和图,也支持图表混合,两图和四图。常见的排版方式是3图1表(使用水平两图和水平1图1表组合而成),效果如下

12.png


下面我们利用这个数据集插入图和表(1图1表)

13.png


插入图表后,数据透视表字段设置如下

14.png


数据透视图字段设置如下,轴(类别)就是信息图的横坐标,这个设置非常重要,下文的下钻/上钻就是依据这个设置的次序。

15.png


把信息图的横坐标折叠起来,并做一些简单的排版和美化后,如下图所示

16.png


下面我们来体验一下数据模型的下钻功能。双击横坐标轴的1.00-9.99,它就会进入下一层店铺类型

17.png


双击一下淘宝,就会进入下一层所在地

18.png


这个过程就是数据下钻,同理也支持上钻,双击淘宝即可回到上一刻的界面。


下钻/上钻在BI软件里面算是比较普通的功能,但能在Excel里面实现,意义是不同的。从数据爬取到清洗,再到分析,再到展现,都可以在Excel里面实现,下钻的应用场景很多,比如我锁定到价格100-200的区间,看里面风格,又锁定到甜美的风格,看卖家的地域,又锁定到广州的卖家,看他们采用的材质,等等。


另外,PowerPivot还可以和PowerView协作创建报表。

19.png

20.png

也可以和Power Map协作创建地域信息图。

21.png


以上,是PowerPivot在数据展现上的应用,PowerPivot不仅仅是这些。


作为一个数据库,它可以连接MySql、MsSql、BD2、Oracle等主流的数据库,而且,解决了一个痛点,当我们在其他数据库里面的数据大于百万的时候,一往Excel导就会出错,那么之前采用的方法可能会是用其他的软件来处理这些数据,也可能是分批导入Excel里面,但是,整个Excel运行会奇慢无比。


PowerPivot通过连接数据库,能很好的解决以上的问题了。

22.png


PowerPivot还有自己的一套语言,DAX语言,中文名字叫数据分析表达式语言。

看下面一个实例,在PowerPivot里面计算成交量总和。

23.png


我们可以看到,每个字段都会在一对中括号里面[],我们前面说过,PowerPivot是一个列数据库,所以每一个列字段都是一个实例,我们可以直接引用列字段的名字。


成交量总和:=SUM([30天成交])


成交量总和:是我自己命名的一个字段,当然也可以不命名。直接输入

=SUM([30天成交])


等号后面就和Excel的公式基本上是一样的用法,不同的是,Excel里面引用的是范围,比如 A1:A100,这种形式,但在DAX的世界里面,没有这种自定义的范围,只能是以列的形式来引用。在Excel里插入表格后也是可以用DAX语言的。


PowerPivot还可以和SharePoint协作,在SharePoint上发布报表,数据分析师可以让老板通过IE浏览器看老板该看的报表,让员工看员工该看的报表,并且可以实时更新。


今天就扯到这里吧。下一篇,可能会分享SharePoint,仅可能啊,我感觉我越写受众越少了,现在净分享大家用不到的东西。我自己也无奈,但我总不能往回写吧?哈哈!随缘吧!老文章点击阅读原文就可以看了。


示例源数据在我网盘里面。不知道我网盘在哪里的,在这:https://pan.baidu.com/s/1c1HlyLi#list/path=%2F



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


已有 1 人评分经验 收起 理由
zl89 + 100 精彩帖子

总评分: 经验 + 100   查看全部评分

沙发
西门高 发表于 2017-8-25 09:03:52
谢谢分享

藤椅
小青竹2017 在职认证  发表于 2017-9-1 13:56:36
电商同行,点个赞~!

板凳
gongtian 发表于 2017-10-6 12:44:02 来自手机
Data-零一 发表于 2017-8-24 15:28
大家好,我是零一。我是一名数据分析师,8年的电商从业经验,擅长电商领域的数据分析和挖掘,常用的工具有E ...
谢谢楼主

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-28 14:31