项目背景
中心拥有固定电话业务、宽带业务、无线宽带业务、IPTv业务、电视业务、信息业务、GPS业务等。缴费方式分为公费和自费;缴费方法:现金、POS机等;站别分为中心站、港西站、南部站;客户面对油区各类人群。但目前没有科学的手段进行收入的预测。领导对收入的把控越来越弱。
项目目标
数据挖掘技术作为一种深层次的数据分析方法,能够充分运用人工智能、数理统计分析、模式识别等技术,从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中、潜在有用的信息和知识(主要是数据中存在的内在关联性、特征或趋势)。
利用大数据技术,通过科学的方法和大数据技术,搭建各个业务收入预测模型,应用于实际工作中。从而辅助领导的经营决策。
项目思路
1 深入理解业务收入数据
与财务科、市场部、业务部相结合,利用专家法以及对梳理三年预测指标与实际值差额原因,梳理出影响业务收入的关键因素。
2 针对业务特点选择适当算法
客户群分类一通过RFM模型将客户群体分类,分析客户群对收入的贡献率。
R一最近一次缴费之间的间隔;
F一客户完成缴费的次数;
M一客户缴费金额。
业务发展分析:分析近三年的业务量变化;
维度:时间、地区、业务类型、缴费方式;
指标:净增量、净减量。
客户续买率分析:分析近三年的客户续买率变化;
维度:时间、地区、业务类型、站别、客户群体;
指标:续买率。
业务之间关联关系分析:分析固话、宽带、电视业务收入之间是否存在关联关系。
3 建立并优化业务收入预测模型
客户分类利用RFM模型和聚类分析;
客户续买率和业务发展趋势利用自回归移动平均法、指数平滑法、支持向量机、最小二乘法、回归分析、神经网络业务收入之间关系利用关联分析、因子分析。
预测模型搭建
利用SPSSModele:挖掘工具,搭建数据挖掘流程,通过建立节点,过滤数据,应用工具自带模型,调整参数等搭建相关模型。
1提取分析历史数据
根据业务的特点,提取三年的业务收入数据,共计98万条,作为测试样本。
固话业务涉及字段包括:用户ID、所属站别、地区、基本费用、月租费用、局内通话时长/费用、市话通话时长/费用、长途通话时长/费用;
宽带业务涉及字段包括:用户ID、所属站别、地区、套餐费用;
GPS业务涉及字段包括:用户ID、所属站别、地区、套餐费用;
电视业务涉及字段包括:用户ID、所属站别、地区、套餐费用。
2模型搭建
根据客户消费习惯、客户分类、地区业务发展情况进行模型搭建。把数据导入到SPSSModele:软件中,建立由源节点、记录选项节点、字段选项节点、图形节点、建模节点组成的业务流程。
该项目首次以历史的业务收入数据为基础,结合业务发展趋势分析、客户分析,探索影响业务收入的关键因素。利用大数据挖掘技术建立业务收入模型,用科学的方法,从而得出收入预测值。