楼主: 于家崎
1250 1

[学习笔记] 【学习笔记】数据分析Python统计 最小二乘法 (1)多元回归中,ols 可以处理 ... [推广有奖]

  • 0关注
  • 0粉丝

硕士生

34%

还不是VIP/贵宾

-

威望
0
论坛币
940 个
通用积分
22.6174
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
700 点
帖子
124
精华
0
在线时间
1 小时
注册时间
2020-6-10
最后登录
2020-8-27

楼主
于家崎 发表于 2020-8-18 18:29:14 来自手机 |只看作者 |坛友微信交流群|倒序 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据分析Python统计
最小二乘法
(1)多元回归中,ols 可以处理多个自变量的情况,寻求残差平方和最小化;
(2)将数据视为矩阵,利用线性代数寻求系数最优化,对内存要求很高;
(3)大数据场景下,存在线性和内存约束问题。
(4)小数据情况的常用算法;
正则化法——约束
(1)一方面寻求最小化模型误差,另一方面可以减少模型复杂度(取 L1 绝对值),如自
变量个数很多的时候,选择较少的重要变量来表示模型。
(2)有利于消除共线性和过拟合现象。
(3)高维及数据稀疏问题得以极大的缓解,但内存问题仍然是主要的缺点;
(4)lasso、岭回归和弹性网模型是经常使用的机器学习模型。一般避免使用普通的线性
回归;岭回归和弹性网模型较为常用(共线稀疏等问题),lasso 在特征选择上侧重较少的重
要变量的场景。
梯度下降法——迭代
(1)以迭代的方式,最小化模型误差,有效处理多维问题;
(2)参数学习率 alpha 控制每次迭代的步长;
(3)大型的行和列不会写入内存,极大地缓解内存压力。
(4)擅长结合正则功能处理稀疏数据问题。
(5)机器学习算法需要面对的问题:稀疏、过拟合、大型行列的速度问题、数据质量等
问题,往往需要梯度下降及其拓展的各种算法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python 最小二乘法 最小二乘 学习笔记 数据分析

沙发
512661101 发表于 2020-8-18 23:51:42 来自手机 |只看作者 |坛友微信交流群

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 18:01