楼主: siweily
3412 17

[问题] 分类模型问题 [推广有奖]

  • 2关注
  • 0粉丝

高中生

32%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
198 点
帖子
21
精华
0
在线时间
22 小时
注册时间
2012-10-23
最后登录
2013-12-19

楼主
siweily 发表于 2013-7-29 15:58:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现在用SAS要做一个分类模型,已经有的历史营销总条数58093条,其中营销成功314条,营销不成功的57779条.
现在要建模做预测模型,感觉营销成功与不成功的数据量差的比较多。这种情况下是不是要把营销不成功的数据量减少一些?
如果要减少,多少合适 ?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:感觉营销 预测模型 模型 历史

沙发
kuangsir6 发表于 2013-7-29 16:44:28
可以用SPSS Clementine 的平衡节点处理。

藤椅
siweily 发表于 2013-7-29 17:49:10
kuangsir6 发表于 2013-7-29 16:44
可以用SPSS Clementine 的平衡节点处理。
我用的是SAS
没有用过spss

板凳
kuangsir6 发表于 2013-7-29 18:13:15
siweily 发表于 2013-7-29 17:49
我用的是SAS
没有用过spss
那把少的部分复制几倍后再进行挖掘。

报纸
proc_zhu 发表于 2013-7-29 21:01:23
kuangsir6 发表于 2013-7-29 18:13
那把少的部分复制几倍后再进行挖掘。
会不会人为放大成功客户的属性特征
挖矿是个技术活

地板
kuangsir6 发表于 2013-7-29 21:26:07
proc_zhu 发表于 2013-7-29 21:01
会不会人为放大成功客户的属性特征
不会!
这样挖掘成功客户的模型的,只是结果没有纯粹的同样大小的数据效果好。
否则,算法对于比例过小的成功客户会忽略的。

7
kuangsir6 发表于 2013-7-29 21:33:22
例如,假设某个数据集只有两个值(low 或high),并且90% 的观测值为low,而只有10% 的观测值为high。很多建模技术处理此类偏倚数据都有困难,因为它们倾向于只学习这些low 的结果,而忽略high 的结果(因为这些结果少的可怜)。如果数据平衡很好,low和high 结果具有大致相同的数量,那么模型将更有可能找出分辨这两个组的模式。

8
siweily 发表于 2013-7-30 10:05:26
kuangsir6 发表于 2013-7-29 21:33
例如,假设某个数据集只有两个值(low 或high),并且90% 的观测值为low,而只有10% 的观测值为high。很多建 ...
我这个数据量差别太大了。那我应该扩大多少呢.刚我试着扩大同一个数量级,发现模型完全变了.
这样扩大对模型也是影响比较大的吧

9
kuangsir6 发表于 2013-7-30 10:09:53
siweily 发表于 2013-7-30 10:05
我这个数据量差别太大了。那我应该扩大多少呢.刚我试着扩大同一个数量级,发现模型完全变了.
这样扩大对 ...
再看看我上面的回答。
模型变了才是正常的,否者还要“平衡”干什么。

10
siweily 发表于 2013-7-30 10:12:03
发现了一个问题,把数据量扩大后,判断非营销成功的错误率还是比较高.接近一半都是错的.这个有没有什么方法调整

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 13:44