楼主: langrenwanghu
1203 5

[问题] 项目求教!!请DM分析高手刺激 [推广有奖]

  • 1关注
  • 1粉丝

硕士生

54%

还不是VIP/贵宾

-

威望
0
论坛币
346 个
通用积分
0
学术水平
1 点
热心指数
2 点
信用等级
1 点
经验
2115 点
帖子
213
精华
0
在线时间
93 小时
注册时间
2012-8-4
最后登录
2017-5-26

楼主
langrenwanghu 发表于 2014-6-10 09:57:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
          最近在做一个电信项目,分析宽带离网用户的行为特征。我从数据库取了26个字段,其中客户属性有5个,产品属性有11个,消费情况(在网时间、ARPU、投诉情况等)有8个,其他字段有4个。
        宽带离网用户占全部宽带用户的1%,现在为了找出离网用户的行为特征,觉得主要要用聚类和关联规则挖掘方法,因为这两种方法是探索未知事物内部规律的基本方法。但是关联规则涉及到用户是用产品组合情况,这种情况我已经用SQL语句实现了(也就是找出用户有哪些产品组合,比如有宽带+CDMA的组合、宽带+IPTV+固话组合等),所有关联规则pass掉,现在主要考虑聚类方法。问题有
1.如果用全量数据做聚类分析,得到的聚类种类都是非离网用户的行为特征(因为离网用户占1%),这就分析不出离网用户的特征。
2.如果将离网用户和非离网用户筛选出来,分别用同种模型做聚类分析,那么离网用户和非离网用户各自得到比较多的聚类数,
这些聚类数不好比较(比方说用离网用户做聚类分析得到8个类,用非离网用户做聚类分析得到7个类,非离网用户和离网用户就不好比较).
      所有现在很纠结!!不知道如何去分析!!
请高人赐教!!在下不甚感激!!
    现在考虑一个方法,对离网用户和非离网用户做平衡化处理,然后用处理后的数据做聚类分析,不知道这种方法是否可行??!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:关联规则挖掘 sql语句 聚类分析 关联规则 产品组合 项目

沙发
kuangsir6 发表于 2014-6-10 14:01:25
用C5.0的规则集建模

藤椅
langrenwanghu 发表于 2014-6-11 08:38:05
kuangsir6 发表于 2014-6-10 14:01
用C5.0的规则集建模
C.5要制定输入和输出,我现在想探索离网用户的行为特征,这些用户都是离网的,没有输出字段。

板凳
langrenwanghu 发表于 2014-6-11 08:38:56
没人回应,貌似高手稀少。。

报纸
kuangsir6 发表于 2014-6-11 12:26:17
langrenwanghu 发表于 2014-6-11 08:38
C.5要制定输入和输出,我现在想探索离网用户的行为特征,这些用户都是离网的,没有输出字段。
你前面不是说过,有不离网的吗?,离网用户占1%吗?

地板
hgz2373294 发表于 2014-6-11 21:54:59
个人看法离网聚类分析意义不大.离网前特征和因子分析可能更重要.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-4 22:18