楼主: orzA24
9330 6

[一般统计问题] 数据应该先缩尾还是先合并? [推广有奖]

  • 0关注
  • 0粉丝

已卖:1份资源

硕士生

5%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
2.5004
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
395 点
帖子
17
精华
0
在线时间
248 小时
注册时间
2016-12-31
最后登录
2025-12-25

楼主
orzA24 发表于 2019-10-5 14:16:51 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在处理数据时遇到了一个问题:我要把企业的财务数据和我研究的自变量因变量合并起来分析,合并之后有很多回归的时候用不到的变量;这时候是应该先缩尾处理单个的数据,然后再合并,还是应该先合并删掉缺失值,再进行缩尾?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:变量合并 财务数据 处理数据 自变量 因变量

沙发
hyu9910 在职认证  发表于 2019-10-5 14:36:58
我觉得可以大概考察数据的特点。 如果将要合并的样本数据组的特点各不相同差异大,那么可以分开处理异常值后再合并,来保证准确性。 如果将要合并的样本数据组的关键特点相似,那么可以考虑先合并再用统一的标准来统一处理;这样做不会丧失正确性也比较便捷。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Brilliantenkey + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

藤椅
orzA24 发表于 2019-10-5 15:11:20
hyu9910 发表于 2019-10-5 14:36
我觉得可以大概考察数据的特点。 如果将要合并的样本数据组的特点各不相同差异大,那么可以分开处理异常值后 ...
谢谢您的建议,可以请教下“数据的特点”大概指哪些方面吗?我的数据里,控制变量是一些财务数据,和企业产权性质的虚拟变量,这样算是差异大的数据吗?

板凳
hyu9910 在职认证  发表于 2019-10-5 17:21:45
orzA24 发表于 2019-10-5 15:11
谢谢您的建议,可以请教下“数据的特点”大概指哪些方面吗?我的数据里,控制变量是一些财务数据,和企业 ...
根据你的问题,我讨论的是你要“合并”成一个变量的几个变量。

关于“数据的特点”,我指的是你要进行“缩尾”处理的相关数据特点。 譬如,如果你要去除异常值的话,样本数据组的异常值分布,跟合并之后的异常值分布,是否大致相同?

如果觉得概念上理解有困难的话,先分组“缩尾”得到你认为统计上合适的分组数据,再合并也许是容易理解的做法。
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
orzA24 + 5 + 1 + 1 + 1 好的意见建议

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

报纸
orzA24 发表于 2019-10-5 18:30:07
hyu9910 发表于 2019-10-5 17:21
根据你的问题,我讨论的是你要“合并”成一个变量的几个变量。

关于“数据的特点”,我指的是你要进行 ...
大概明白您的意思了,不过我指的合并仅仅是指把数据合并起来;我的困惑就在于,先缩尾处理后,再进行合并,这时的样本分布与合并前可能不一样,因为有缺失值。我一开始的理解是假如先进行缩尾,得到了较原来而言正常分布的样本,那么假如有缺失值也在可接受范围内。但后来又觉得是不是应该合并后再分析…

非常感谢您的建议!

地板
xujingjun 发表于 2019-10-6 09:33:12

7
whm22 发表于 2023-5-23 21:57:02
orzA24 发表于 2019-10-5 18:30
大概明白您的意思了,不过我指的合并仅仅是指把数据合并起来;我的困惑就在于,先缩尾处理后,再进行合并 ...
请问您最后是先合并还是先缩尾呀?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 03:41