需要预测的场景太多这里就不一一赘述了,在师傅的指导下,我对excel的认知水平又提升了一大截,学会了用excel做多元回归分析。这个预测方法不仅适用绝大部分行业,并且也适用没有业务基础的小白操作。附上师父的一句教诲:相信相信的力量。下面进入主题:
1.打开一张多字段数据的excel表格
导盲犬:excel中每一列就是一个字段,其第一个单元格内容就是字段名。
→剪切20%的数据做为测试集,剩余的80%数据做为训练集。→将需要预测的列剪切并复制在其它变量的前面,也就是第2列,这里我们对“无线端下单金额“进行预测,确定影响它的相关因子。
导盲犬:将需要预测的数据放在首列是为了保持预测时的连续性,另外相关因子的数量最多为16个。
→数据→数据分析
→Y值所在区域:预测值所在列的第一行开始至最后一行;X值所在区域:其余变量所在列的第一行开始至最后一行→勾选标志→勾选残差→确定
导盲犬:残差=实际y值-预测y值,利用条件格式筛选掉残差>两个标准误差的异常值。
→选中所有残差→开始→条件格式
→突出显示单元格规则→大于
→输入2倍标准误差值→确定
→找出异常值所在行
→返回数据源将异常值所在行删除即第10行和第39行(注:原数据因为有标题,所以残差异常值所在第9行相当于源数据第10行,又因为第一次删除后导致后面的行数均会上移一行,所以残差异常值所在第39行相当于源数据39行)
→数据→数据分析
→回归→确定