楼主: myccc
1056 1

[问答] 关于权重设置问题 [推广有奖]

  • 2关注
  • 0粉丝

本科生

66%

还不是VIP/贵宾

-

威望
0
论坛币
663 个
通用积分
0
学术水平
3 点
热心指数
6 点
信用等级
1 点
经验
866 点
帖子
74
精华
0
在线时间
112 小时
注册时间
2011-11-18
最后登录
2019-7-24

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
坏样本过少,需要增加坏样本浓度,取截至到13年12月为止的数据,坏样本的比例为2%,为了增加浓度,各取10万用户。
在这样的权重下建模,我验证集和测试集都在这个时间段内,但当我落地应用到14年的数据时,坏样本的比例会发生变化,在之前情况下的样本权重,怎么应对与后续不同不同比例的总体数据?

求教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:权重设置 测试集 时间段 样本 用户 时间段

沙发
bakoll 发表于 2015-1-29 22:10:59 |只看作者 |坛友微信交流群
样本分布不同需要对样本样本数据进行预处理,不知你是建立什么模型,如果是方差分析比较均值之类的正好不同分组来分析,但感觉你是取得观测值,个人想法用14年的乘以一个以前年度浓度均值与14浓度均值比来转化一下

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 07:16