楼主: langrenwanghu
2237 1

[数据挖掘理论与案例] 发现数据挖掘是一个迭代的过程,是一个探索的过程 [推广有奖]

  • 1关注
  • 1粉丝

硕士生

54%

还不是VIP/贵宾

-

威望
0
论坛币
346 个
通用积分
0
学术水平
1 点
热心指数
2 点
信用等级
1 点
经验
2118 点
帖子
214
精华
0
在线时间
93 小时
注册时间
2012-8-4
最后登录
2017-5-26

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
     目前在做电信的数据挖掘工作,对于一个具体问题,如C网离网分析,我们要做建模的话,首先要甄选建模字段。但是对于具体主题而言,它涉及到的字段非常的多。对于如何精简字段,可以通过 特征变量选择来甄选,但是这种效果不是很好。较好的方式是这样做的。            1.先用统计的方法,看看各个字段对目标变量的影响。
            统计对于不好的字段要删减,还有头脑风暴后选一些字段进来。
            2.训练集、验证集的框定。
            3.模型调优
            4.发布模型

            



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 变量选择 头脑风暴 特征变量 训练集 主题 电信 模型 如何 统计

沙发
songlinjllive 发表于 2014-8-8 22:11:20 来自手机 |只看作者 |坛友微信交流群
langrenwanghu 发表于 2014-8-8 17:59
目前在做电信的数据挖掘工作,对于一个具体问题,如C网离网分析,我们要做建模的话,首先要甄选建模字 ...
黑暗中摸索

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 20:08