楼主: 2609951752
1826 7

[回归分析求助] 关于数据缩尾处理还是截尾处理 [推广有奖]

  • 1关注
  • 0粉丝

高中生

72%

还不是VIP/贵宾

-

威望
0
论坛币
25 个
通用积分
16.0788
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
285 点
帖子
7
精华
0
在线时间
72 小时
注册时间
2022-4-29
最后登录
2025-5-25

楼主
2609951752 学生认证  发表于 2024-12-17 17:57:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位老哥们,我在做回归分析的时候,对数据用缩尾处理时有一个回归结果不显著,用截尾处理时都显著,那么请问用截尾处理可以吗,我问了导师说可以,但是我看论文基本都是用的缩尾。还有一个问题是截尾时产生的缺失值要不要drop掉呀
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:drop 回归分析 回归结果 缺失值

沙发
赵安豆 发表于 2024-12-18 15:29:40
在进行回归分析前对数据进行预处理是常见的步骤,其中“缩尾”和“截尾”处理分别指的是对极端值(异常值)的不同处理方式:

- **缩尾**处理:通常是指将超出一定范围的异常值拉回到这个范围内。例如,可以使用winsorizing的方法,将极大或极小值替换成一个界线内的最大或最小值。

- **截尾**处理:则是直接删除那些被视为异常的数据点,即不包括在分析中。

你遇到的情况是缩尾后某些回归结果变得不显著,而截尾后则显著。这可能是由于被截掉的点对模型产生了较大的影响,但在统计学上,选择哪一种处理方式取决于多个因素:

1. **理论背景**:首先要考虑数据异常值的原因和你的研究假设。如果这些异常值有合理的解释,并且与你所研究的问题相关,那么应该尽可能保留它们的信息。

2. **数据分析目标**:如果你关心的是总体趋势而非个别极端情况的影响,则缩尾可能更合适。如果认为异常点是由于测量错误或非典型事件造成,截尾可以考虑。

3. **数据分布特性**:数据是否遵循你假设的分布模型?如果不是,异常值的存在可能是合理的,并且应该在分析中予以保留和解释。

关于你的导师提到“可以”使用截尾处理,这表明从实用性和解决当前问题的角度来看是可行的。但是,在发表研究结果时,你应当明确说明采取了何种数据预处理方法及其理由,让读者或审稿人能够理解并评价这种方法对分析结果的影响。

对于**截尾产生的缺失值是否需要drop掉**的问题:

- 如果你的模型能够很好地处理缺失值(例如某些机器学习算法),或者你可以用合适的方法填充这些缺失值,则不一定非要删除。
- 但是,在回归分析中,如果数据点被截去,意味着该观测不再适合作为有效信息用于后续的统计分析。因此,在传统的统计方法中,通常会将这些被截掉的数据点从样本中移除。

最后,无论采取何种预处理方式,都应当在研究报告或论文中详细记录和解释所采取的方法及其理由,以保证研究的透明度和可重复性。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



藤椅
wdlbcj 学生认证  发表于 2024-12-18 18:52:37
你需要看看为什么截尾会有不一样的结果
是不是数据中有很离谱的极端值影响了实证结果

板凳
2609951752 学生认证  发表于 2024-12-18 21:53:31
wdlbcj 发表于 2024-12-18 18:52
你需要看看为什么截尾会有不一样的结果
是不是数据中有很离谱的极端值影响了实证结果
那截尾导致的缺失值怎么办呀

报纸
babylaugh 发表于 2024-12-19 08:45:22
点赞分享

地板
是没什么 发表于 2024-12-19 10:04:25
谢谢分享!

7
swordwangke 发表于 2024-12-19 22:07:24 来自手机
2609951752 发表于 2024-12-17 17:57
各位老哥们,我在做回归分析的时候,对数据用缩尾处理时有一个回归结果不显著,用截尾处理时都显著,那么请 ...
楼上很专业,点赞分享了~~

8
銘静旺 发表于 2026-1-17 18:01:09 来自手机
2609951752 发表于 2024-12-17 17:57
各位老哥们,我在做回归分析的时候,对数据用缩尾处理时有一个回归结果不显著,用截尾处理时都显著,那么请 ...
薇杏欧魏醒欧:mtjm00 。stata指导,答疑,处理包括但不限于:内生性检验;工具变量法;heckman两步法;处理效应模型;双重差分法did;安慰剂检验;倾向得分匹配;psm-did;平行趋势检验等。可以帮忙解决stata命令运行报错,解决实证检验分析相关问题。还可以帮忙调节正向或者负向的显著性!也可以帮忙调整平行趋势检验!薇杏魏醒:mtjm00

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-27 08:13