楼主: Jacobi123
4834 4

[实际应用] sas中抽样建模时的权重 [推广有奖]

  • 0关注
  • 0粉丝

高中生

90%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
209 点
帖子
27
精华
0
在线时间
42 小时
注册时间
2011-6-22
最后登录
2016-6-5

楼主
Jacobi123 发表于 2012-10-23 13:42:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近在做一个决策树模型,目标找出最合适的顾客。顾客总数大约在180万左右,但是模型中的已知有购买行为(目标)的顾客只有4000多人。
两者相差较悬殊,因此采取对180万人进行抽样后建模。
用9.3的em进行分层抽样(目标顾客全抽,除目标顾客抽16000人)和建模。
模型的结果,似乎就是针对这20000人进行的。
那么sas在建模的时候是否会考虑到,抽样时造成的各指标之间权重的问题(我想应该没有)?该如何做呢?
在这种目标顾客占整体数量较小的情况下,一般怎么处理?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:分层抽样 怎么处理 树模型 决策树 建模

沙发
Jacobi123 发表于 2012-10-23 13:44:40
最好能推荐下相关文献资料,谢谢啦~~

藤椅
ziyenano 发表于 2012-10-23 14:07:08
过度抽样,人为加大训练样本中目标用户的比率,通常比率不要太低就行,保证模型能够提取购买用户的特征;
用测试样本,通过增益图或者提升图来判别模型的优劣;
模型训练完成后,对剩余用户进行打分,得分高的用户认为是有购买倾向高的用户。



































板凳
我要考东财 发表于 2012-10-28 23:39:54
二楼说的很有道理!

报纸
xxxuuulll 发表于 2013-2-18 17:47:48
寻找响应高的用户做销售!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-26 21:55