楼主: 问问问什么
2200 7

[数据] 数据最低值(检测限)不同,如何处理数据 [推广有奖]

  • 0关注
  • 0粉丝

大专生

95%

还不是VIP/贵宾

-

威望
0
论坛币
15 个
通用积分
1.0500
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
273 点
帖子
17
精华
0
在线时间
113 小时
注册时间
2018-11-28
最后登录
2024-9-27

楼主
问问问什么 发表于 2019-12-5 11:18:38 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  我有一份5000人的数据,是12-16年每个人的经济收入,但是当时收集数据的时候,12-14年将低于1万作为最低线,低于这个数值的标注为了too low,而15年则是低于2万的标注为了too low,16年的是5000千。现在这五年的数据要放在一起分析,但是由于最低线的不同导致数据分析有些问题,请问这种情况,应该怎么处理?对我的数据要做怎么的处理呢?

  谢谢大家!!拜托拜托,查阅了许多资料都没找到这种问题怎么解决,万分感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:处理数据 数据分析 收集数据 万分感谢 怎么处理 最低线 纵向数据 数据预处理

沙发
问问问什么 发表于 2019-12-5 15:07:02
自顶一下,不要沉呀

藤椅
kuangsir6 发表于 2019-12-5 21:03:09
统一标准后再进行转换。

板凳
问问问什么 发表于 2019-12-5 21:27:16
kuangsir6 发表于 2019-12-5 21:03
统一标准后再进行转换。
因为各年最低线以下没有记录具体的数值,只标注了“too low”,所以没法统一呢,如果都划到2万的话,会导致这组人达到了3千多,剩下的1千多人的数据平均值就会很高,两条线之间差异过大,导致混杂影响过大。

报纸
楚天江南客 学生认证  发表于 2019-12-6 20:34:59
对门坐着好多大牛!

地板
问问问什么 发表于 2019-12-8 20:40:48
楚天江南客 发表于 2019-12-6 20:34
对门坐着好多大牛!
额,对门是哪里?

7
阿扁V5 学生认证  发表于 2019-12-17 18:16:50
简单的把这些low的过滤掉不行吗

8
问问问什么 发表于 2019-12-18 11:13:39
阿扁V5 发表于 2019-12-17 18:16
简单的把这些low的过滤掉不行吗
这样很多数据就缺失了,是不可取的方法,最好是不要去掉

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-9 06:21