创建线性模型,方程式和可视化分析
线性模型(线性回归)可能是您学习并创建的第一个模型,使用该模型预测目标的连续值。您一定对完成模型感到高兴。您可能还被教导了其功能背后的理论-最小化经验风险,均方损失,梯度下降,学习率等。
好吧,这很棒,突然间我被叫来向经理解释我创建的模型,所有这些术语对他来说都是行话,当他要求模型可视化时(如图1.0所示)适合超平面(红线)和数据点(蓝点)。我不知道如何在python代码中创建脚趾而僵住了。
好吧,这就是本文的第一部分是关于在Python的Jupyter笔记本中创建基本线性模型可视化。
让我们开始使用以下随机数据:
X?
1个2
23
311
413
528
632
750
859
985
方法1:手动配方
导入我们的库并创建数据框:
线性模型-导入库
目前,有两种方法可以执行此可视化:
1.)使用数学知识
2.)对scikit使用Linear_regression属性可学习Linear_model。
让我们开始使用Math ????。
只需遵循以下步骤就不那么困难了,首先,我们为y(因变量/目标)和X(因变量/特征)之间的线性关系定义方程:
y = mX + c
y =目标
X =功能
a =斜率
b = y截距常数
要创建模型的方程式,我们必须获取m和c的值,我们可以使用以下方程式从Y和X中获得该值:
线性模型公式
斜率,一个被解释为所述产品每个单独的x值之间的差的总和之间和其平均值和t他求和各个个别的Y点和之间的差的其平均值然后除以由每个单独的x的平方的总和及其意思。
截距只是y的平均值 减去 斜率与x的平均值的乘积
要花很多钱。可能要一遍又一遍地阅读,直到获得为止,尝试阅读图片
????那是唯一的挑战;如果您了解它,那么恭喜,让我们继续前进。
现在使用numpy库以“ eazy-pizzy”的方式在python代码中编写代码,将其检出????。
线性模型-总和与均值
现在我们有了a和b,我们只需将其插入方程式中即可-> y = 9.95 -1218.56x
现在让您大吃一惊,您是否知道这是模型的方程式。我们只是创建了一个模型,而没有使用scikit Learn。我们现在将使用第二种方法(即scikit学习线性回归软件包)进行确认
方法2:使用scikit-learn的线性回归
Wˉˉ e'll被 导入线性回归从scikit学习,配合在该模型然后确认斜率和截距的数据。步骤如下图所示。
因此您可以看到几乎没有区别,现在让我们将其可视化,如图1所示。
线性模型-预测图
图形
红线是用于预测的最佳拟合线,蓝点是我们的初始数据。有了这个,我有事要报告给经理。我特别针对每个功能对目标进行了此操作以增加洞察力。
现在,我们已经实现了创建模型并显示其绘制图形的目标
涉及较大数据时,此技术可能很耗时,并且仅在可视化具有特定功能的最佳拟合线以进行分析时才应使用。除非提出要求,否则在建模过程中并没有必要,错误和计算可能会占用您的时间和计算资源,尤其是在使用3D和更高数据的情况下。但是获得的见识是值得的。
我希望您喜欢这篇文章(如果是的话)很棒,也可以告诉我如何以任何方式进行改进。我还有很多要分享的地方,尤其是关于回归(线性,物流和多项式)。
题库


雷达卡



京公网安备 11010802022788号







