楼主: tooof
710 1

[问答] 对于事实上的极大值和缺失值怎么处理呢? [推广有奖]

  • 0关注
  • 0粉丝

本科生

51%

还不是VIP/贵宾

-

威望
0
论坛币
1749 个
通用积分
18.4580
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
367 点
帖子
19
精华
0
在线时间
155 小时
注册时间
2017-1-8
最后登录
2023-10-14

10论坛币
问题1:事实上的极大值处理例如有一个字段:最近一次转账距今天数
实际取数时,在365天内有过转账行为的客户,最近一次转账距今天数都是正确的,范围在[0,365];但是对于一年内没有转账的客户,因为系统底层抽数原因统一将值填充为了99999,而且这部分客户的占比很大,请问如何处理这部分的数据呢?


问题2:对于事实上的缺失值
A:例如有一个字段:现金管理类理财金额占总理财金额的比例
这个字段对于未持有理财产品的客户没有意义,因为这个客户本身连理财都没有(也就是说总理财金额为0)。那这个时候,该字段是应该直接空缺么?

B:例如有一个字段:本月发放工资金额
这个字段只对于代发工资客户标志=1的客户才有意义(这些客户才有可能发放工资),那么对于那些代发工资客户标志=0的客户,本月发放工资金额为缺失值,请问需要把这个值设为0还是保持缺失值状态呢?

关键词:怎么处理 缺失值 理财产品 现金管理 管理类
沙发
skyfx 发表于 2019-10-10 17:00:12 |只看作者 |坛友微信交流群
这三个问题中的数值如何设置,都是跟你后续的业务逻辑相关的呀。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 17:50