楼主: Data-零一
2506 5

[CDA数据分析师学习之路] [21天小白学成大师]NO5. 学会用EXCEL做预测 [推广有奖]

  • 0关注
  • 38粉丝

本科生

60%

还不是VIP/贵宾

-

威望
0
论坛币
1090 个
通用积分
0
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
702 点
帖子
47
精华
0
在线时间
69 小时
注册时间
2014-4-8
最后登录
2019-1-3

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本系列文章作者是我二徒弟,一个80后,学历不高,同时运营着3家1688店铺。全套文章21篇,虽然标题是21天小白学成大师,但还真不是一天一更,平时比较忙,更新就要耐心等候了。

需要预测的场景太多这里就不一一赘述了,在师傅的指导下,我对excel的认知水平又提升了一大截,学会了用excel做多元回归分析。这个预测方法不仅适用绝大部分行业,并且也适用没有业务基础的小白操作。附上师父的一句教诲:相信相信的力量。下面进入主题:

1.打开一张多字段数据的excel表格

导盲犬:excel中每一列就是一个字段,其第一个单元格内容就是字段名。

1.png

→剪切20%的数据做为测试集,剩余的80%数据做为训练集。→将需要预测的列剪切并复制在其它变量的前面,也就是第2列,这里我们对“无线端下单金额“进行预测,确定影响它的相关因子。


导盲犬:将需要预测的数据放在首列是为了保持预测时的连续性,另外相关因子的数量最多为16个。

2.png

→数据→数据分析


3.png

→Y值所在区域:预测值所在列的第一行开始至最后一行;X值所在区域:其余变量所在列的第一行开始至最后一行→勾选标志→勾选残差→确定
4.png

导盲犬:残差=实际y值-预测y值,利用条件格式筛选掉残差>两个标准误差的异常值。
5.png

→选中所有残差→开始→条件格式


6.png

→突出显示单元格规则→大于

7.png

→输入2倍标准误差值→确定

8.png

→找出异常值所在行

9.png

→返回数据源将异常值所在行删除即第10行和第39行(注:原数据因为有标题,所以残差异常值所在第9行相当于源数据第10行,又因为第一次删除后导致后面的行数均会上移一行,所以残差异常值所在第39行相当于源数据39行)

→数据→数据分析

10.png

→回归→确定
11.png


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:用excel EXCEL xcel exce cel

沙发
Data-零一 发表于 2017-7-5 10:26:58 |只看作者 |坛友微信交流群

→Y值所在区域:预测值所在列的第一行开始至最后一行;X值所在区域:其余变量所在列的第一行开始至最后一行→勾选标志→勾选残差→确定

12.png

→筛选出<0.05的P值


导盲犬:统计学家普遍的共识,p<0.05的时候,自变量对预测y才有用.

13.png

→开始→条件格式
14.png

→突出显示单元格规则→小于→0.05→确定

为了预测更加准确,这里还需考虑多重共线性,利用半相关矩阵检查。

导盲犬:如果说两个或多个自变量是高度相关的,很可能产生多重共线性。

15.png

→返回数据源→数据→数据分析→相关系数→确定

除预测值外的所有数据)→标志位于第一行→确定

16.png

→开始→条件格式→突出显示单元格规则

17.png

→大于→0.998→确定

18.png

→删除字段下单父订单数、无线端支付父订单数。

导盲犬:所谓多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
19.png

→源数据→数据→数据分析→回归→确定

20.png

→观察R方与P值

导盲犬:所有自变量共同作用具有显著性的结论,通俗的讲,只有R方大于0.6的时候,预测y才有意义。

21.png

→选中所有变量的P值→开始→条件格式→突出显示单元格规则→小于

22.png

→0.05→确定→删除其它P值>0.5的变量

23.png

→源数据→数据→数据分析→回归→确定

24.png

→Y值所在区域:预测值所在列的第一行开始至最后一行;X值所在区域:其余变量所在列的第一行开始至最后一行→勾选标志→确定

25.png

→观察R值和P值,均符合要求。

26.png

→得出公示:预测值无线端下单金额=-84341.91323+无线端下单买家数*365.259139-392.2248391*无线端支付买家数+1.200575347*无线端支付金额

导盲犬:Intercept为截距的意思。

→返回测试集验证

27.png

通过验证发现预测的点跟测试集的点高度吻合,该模型可以使用。

预测是商业分析的核心,企业之所以能产生利润主要就是因为企业获得了信息差,而预测就是帮助企业创造信息差。因此,预测能力是最能体现数据分析师价值的点。

作者联系方式(微信):anzhi1111(暗之)


快速问答——

问:零一工具箱的下载地址在哪?

答:https://pan.baidu.com/s/1c1HlyLi

问:零一工具箱是否收费?

答:零一工具箱是一款提供给电商运营轻量级的免费工具。

问:零一会是一个什么样的机构?

答:零一会是一个专业数据人才培养基地。

问:零一会有哪些业务?

答:培训孵化——通过系统的培训,一对一小班指导培养数据化运营人才,毕业后就业仍然会享受信息和知识的互通。

人才认证与输送——学习期满颁发权威机构专业证书,为企业输送数据分析师和数据运营人才。

电商运营——为企业提供代运营服务,提高店铺业绩。



10.png (180.03 KB)

10.png

使用道具

藤椅
zichuang 发表于 2018-8-12 15:53:57 来自手机 |只看作者 |坛友微信交流群
Data-零一 发表于 2017-7-5 10:26
本系列文章作者是我二徒弟,一个80后,学历不高,同时运营着3家1688店铺。全套文章21篇,虽然标题是21天小白 ...
懵逼了

使用道具

板凳
wangyong8935 在职认证  发表于 2018-10-5 12:52:01 |只看作者 |坛友微信交流群
关注

使用道具

报纸
wangyangguang 发表于 2018-10-10 20:58:13 |只看作者 |坛友微信交流群
感谢分享。

使用道具

地板
jellyvoo 发表于 2018-10-12 21:14:29 |只看作者 |坛友微信交流群
链接失效了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 09:36