分类模型问题 - 经管之家

2关注
0粉丝

高中生

32%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 0 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 198 点
帖子: 21
精华: 0
在线时间: 22 小时
注册时间: 2012-10-23
最后登录: 2013-12-19

楼主

siweily 发表于 2013-7-29 15:58:17 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

现在用SAS要做一个分类模型，已经有的历史营销总条数58093条，其中营销成功314条，营销不成功的57779条.
现在要建模做预测模型，感觉营销成功与不成功的数据量差的比较多。这种情况下是不是要把营销不成功的数据量减少一些?
如果要减少，多少合适？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：感觉营销预测模型模型历史

相关帖子

沙发

kuangsir6 发表于 2013-7-29 16:44:28

可以用SPSS Clementine 的平衡节点处理。

藤椅

siweily 发表于 2013-7-29 17:49:10

kuangsir6 发表于 2013-7-29 16:44
可以用SPSS Clementine 的平衡节点处理。

我用的是SAS
没有用过spss

板凳

kuangsir6 发表于 2013-7-29 18:13:15

siweily 发表于 2013-7-29 17:49
我用的是SAS
没有用过spss

那把少的部分复制几倍后再进行挖掘。

报纸

proc_zhu 发表于 2013-7-29 21:01:23

kuangsir6 发表于 2013-7-29 18:13
那把少的部分复制几倍后再进行挖掘。

会不会人为放大成功客户的属性特征

挖矿是个技术活

地板

kuangsir6 发表于 2013-7-29 21:26:07

proc_zhu 发表于 2013-7-29 21:01
会不会人为放大成功客户的属性特征

不会！
这样挖掘成功客户的模型的，只是结果没有纯粹的同样大小的数据效果好。
否则，算法对于比例过小的成功客户会忽略的。

7楼

kuangsir6 发表于 2013-7-29 21:33:22

例如，假设某个数据集只有两个值（low 或high），并且90% 的观测值为low，而只有10% 的观测值为high。很多建模技术处理此类偏倚数据都有困难，因为它们倾向于只学习这些low 的结果，而忽略high 的结果（因为这些结果少的可怜）。如果数据平衡很好，low和high 结果具有大致相同的数量，那么模型将更有可能找出分辨这两个组的模式。

8楼

siweily 发表于 2013-7-30 10:05:26

kuangsir6 发表于 2013-7-29 21:33
例如，假设某个数据集只有两个值（low 或high），并且90% 的观测值为low，而只有10% 的观测值为high。很多建 ...

我这个数据量差别太大了。那我应该扩大多少呢.刚我试着扩大同一个数量级，发现模型完全变了.
这样扩大对模型也是影响比较大的吧

9楼

kuangsir6 发表于 2013-7-30 10:09:53

siweily 发表于 2013-7-30 10:05
我这个数据量差别太大了。那我应该扩大多少呢.刚我试着扩大同一个数量级，发现模型完全变了.
这样扩大对 ...

再看看我上面的回答。
模型变了才是正常的，否者还要“平衡”干什么。

10楼

siweily 发表于 2013-7-30 10:12:03

发现了一个问题，把数据量扩大后，判断非营销成功的错误率还是比较高.接近一半都是错的.这个有没有什么方法调整

[问题] 分类模型问题 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

[问题] 分类模型问题 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群