楼主: Raneeran
3128 2

[问答] 数据集中有大量变量带有0值,该如何处理? [推广有奖]

  • 0关注
  • 0粉丝

已卖:14份资源

大专生

23%

还不是VIP/贵宾

-

威望
0
论坛币
149 个
通用积分
1.0750
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
79 点
帖子
5
精华
0
在线时间
88 小时
注册时间
2019-2-24
最后登录
2022-3-28

楼主
Raneeran 发表于 2020-6-16 14:12:49 |AI写论文
80论坛币
我现在有这样一个问题,有一组分类数据,共278个变量,分为两类,样本量是1388,在这些数据中,有许多变量(大约占有一半)中含有很多0值,如下图所示。

这种情况下,我想继续做分类研究,如采取LDA或者QDA等进行分类预测,该如何进行呢?
谢谢大家!

关键词:数据集 分类数据 样本量 多变量 LDA

沙发
Raneeran 发表于 2020-6-16 14:14:29
图片在这里,新人发帖,不太知道为什么没有显示。

1592288022014.jpg (173.35 KB)

1592288022014.jpg

藤椅
nieqiang110 学生认证  发表于 2020-6-16 15:19:03
根据研究问题以及数据采集的情况,推断哪些是缺省值,哪些是0值。如果是0值,肯定不能改。如果是缺省值,采用插值法处理,具体方法比较多。
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-21 22:04