楼主: lihancheng
1811 2

[问题求助] 缩尾需要几次,以及需要在什么时候缩尾 [推广有奖]

  • 1关注
  • 0粉丝

高中生

45%

还不是VIP/贵宾

-

威望
0
论坛币
940 个
通用积分
0.0702
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
422 点
帖子
16
精华
0
在线时间
47 小时
注册时间
2022-8-23
最后登录
2025-3-18

楼主
lihancheng 学生认证  发表于 2024-3-21 08:55:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求问看到很多视频提到缩尾,但是缩尾到底是在算出一个变量后进行缩尾,还是将所有变量整合到一个表中再进行缩尾,因为在stata中merge表格进行合并后,变量的描述性统计会不同,缩尾后的结果也不一样。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Merge Stata 描述性统计 tata 描述性

沙发
统计爱我 发表于 2024-3-23 10:39:02
将所有变量整合到一个表中再进行缩尾

藤椅
赵安豆 发表于 2025-2-7 21:45:25
在数据分析中,“缩尾”通常指的是“Winsorizing”,也就是对数据集中的极端值(即异常大的或异常小的观测值)进行处理的一种方法。具体做法是将一定百分比的数据点替换为该数据范围内的某个边界值,而不是直接删除这些数据点。例如,你可能会选择保留中间90%的数据,而把最上端和最下端各5%的数据分别设置为95th和5th百分位数的值。

关于你的问题:

1. **缩尾需要进行几次?**
   缩尾的次数主要取决于数据集的特点以及分析的需求。一般情况下,在对整个数据集进行了初步的缩尾处理后,如果发现某些变量仍存在明显的异常值或偏态,则可能需要针对特定变量再次进行缩尾处理。

2. **什么时候进行缩尾?**
   通常建议在进行任何模型估计之前先进行缩尾处理,以减少极端值对分析结果的影响。但值得注意的是,在做合并操作(如使用Stata中的merge)前还是后进行缩尾,这取决于你的具体研究设计:
   - 如果你希望保持所有数据源的一致性,并且担心合并后的表格中出现新的异常值,那么可以在合并之前分别对每个数据集进行缩尾处理。
   - 如果你认为在数据整合后能更好地识别和处理整个样本中的极端值,则可以选择在merge操作之后再进行缩尾。

总的来说,在决定如何以及何时进行缩尾时,重要的是要基于数据的实际情况、研究问题的需求以及统计方法的假设来做出判断。同时,保持分析过程的透明性和可重复性也是十分重要的,因此确保记录下所有预处理步骤的具体细节。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注ck
拉您进交流群
GMT+8, 2025-12-22 07:22