1466 5

[问答] 异常值处理与logitech回归(R语言) [推广有奖]

已卖:397份资源

副教授

80%

还不是VIP/贵宾

-

威望
0
论坛币
4634 个
通用积分
54.5929
学术水平
2 点
热心指数
2 点
信用等级
0 点
经验
51765 点
帖子
807
精华
0
在线时间
825 小时
注册时间
2016-7-17
最后登录
2025-10-28

楼主
我要我的滋味sd 发表于 2020-11-5 16:28:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1.是不是我先不管我的异常值(离群点),直接先做回归,最后确定回归模型后再来看是否有强影响点,再来处理异常的观测值……
2.我现在就是卡在异常值和回归这里了,不知道先处理哪一个? 回归之前不应该进行数据预处理,把异常值处理了吗?但是也有边回归边处理的?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:logit Tech R语言 Log 异常值

沙发
llb_321 在职认证  发表于 2020-11-6 03:02:32
所谓异常值,大概包括NA、NaN、离群点、极值这些吧。NA、NaN一般是需要预处理的,但是离群点我们在回归并检验之前其实也不知道具体是哪个或哪些样本,那么我们如何处理才算合理呢?而数据是否异常,不能从离散程度判断,而是从现实合理性判断。如果现实是合理的存在,那为啥要处理掉呢?
另外当样本量够大时,离群点影响也会很小,只要回归方程和变量系数通过显著性检验就可以。
换个角度,回归本身只是找出大致的关系表达,是存在误差的,这其实也是过拟合和欠拟合的平衡问题。
回归之前做方差齐性、共线性检验,回归过程中做变量筛选,就可以了。
已有 2 人评分论坛币 收起 理由
我要我的滋味sd + 5 精彩帖子
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 15   查看全部评分

藤椅
nieqiang110 学生认证  发表于 2020-11-7 12:22:03
llb_321 发表于 2020-11-6 03:02
所谓异常值,大概包括NA、NaN、离群点、极值这些吧。NA、NaN一般是需要预处理的,但是离群点我们在回归并检 ...
lib_321老师说的好

板凳
nuomin 发表于 2020-11-7 21:35:16
先处理异常值,再回归

报纸
我要我的滋味sd 发表于 2020-11-7 22:02:29
llb_321 发表于 2020-11-6 03:02
所谓异常值,大概包括NA、NaN、离群点、极值这些吧。NA、NaN一般是需要预处理的,但是离群点我们在回归并检 ...
谢谢你 很有用

地板
我要我的滋味sd 发表于 2020-11-7 22:02:41
nuomin 发表于 2020-11-7 21:35
先处理异常值,再回归
好的 谢谢

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-16 05:51