一、引言
数据挖掘一词,在1995年首届国际知识发现与数据挖掘大会上被首次提出后,由于管理数据大量积累,市场竞争对信息知识的迫切需要,数据挖掘迅速成为研究热点。数据挖掘是在大型的数据库中,自动发现有用知识的过程。这些知识可以被表示为概念、规则、规律、模式等。
客户关系管理把客户和客户关系作为研究的核心,在研究中,对客户信息的分析处理是首要任务,数据挖掘是完成这一任务不可或缺的重要技术方法。
二、客户关系管理与数据挖掘
信息是客户关系的基础,客户关系管理面临的问题是怎样从大量的数据中获取所需要的信息,尤其是决策者需要的信息,用短语把这些问题可以分别表示为:分类、聚类、预测、关联分析等任务,数据挖掘能为完成这些任务提供有效方法,肯桩以下几方面提供技术支持:
(一)潜在客户分析。潜在客户是指那些通过正常方式接近,使其有可能成为客户的某人或群体。潜在客户分析一般包括:识别好的潜在客户;为接近潜在客户选择合适的沟通渠道;针对不同的潜在客户群,选择适当的营销策略等,面对的任务是分类或聚类。
(二)选择广告宣传分析。针对不同的客户群体,分析其主要特征,进而使用与其特征匹配的广告宣传策略。同时还要分析客户的匹配程度,以改进广告宣传,提高宣传质量,同样涉及分类或聚类任务。
(三)顾客忠诚度分析。顾客忠诚度一般指客户在较长的一段时间内对企业产品或服务保持的选择偏好与重复性购买。“在当今激烈的市场竞争中,客户忠诚已经成为企业的一种重要资产,对企业客户忠诚度的测量是一个分类过程,在客户忠诚度分析的基础上,企业可以通过增强对忠诚客户的服务,获取更高的利润,同时还可以通过培育和管理客户忠诚来有效地管理客户关系。
(四)客户细分分析。客户细分是客户关系管理的核心概念之一,是企业在明确的战略、业务模式和特定的市场中,根据客户的属性、行为、需求、偏好以及价值等因素对客户进行分类,并提供有针对性的产品、服务和营销模式的过程,正确的客户细分能够有效的降低成本,获得更强、收益更大的市场渗透。
(五)关联分析。数据间的关联是数据库中存在的一种重要的可识别的知识,关联分析的目的是找出数据库中隐藏的关联网,这种关联网可以帮助企业了解客户购买商品间的关联,进而选择相应的营销策略。
三、常用的数据挖掘技术及其应用
根据客户关系分析中的问题,数据挖掘可以提供如下算法与技术:
(一)集合论技术
1.粗糙集技术。粗糙集理论是一种描述不完整性和不确定性的数学理论,这一理论从新的角度出发,对知识进行了定义,它把知识看作论域的划分,并引用数学中的等价关系来定义知识。利用粗糙技术能够揭示不精确数据间的关系,发现对象和属性间的依赖,评价属性对分类的重要性,去除冗余数据,对信息系统进行约简,生成决策规则,以便对客户做出分类。
2.概念树技术。在数据库中不同的数据都具有许多不同的属性,根据这些属性可以对数据进行分类,然后对每一个属性进行概念提升。这样可以对客户的属性进行提升,逐级找到有效分类的属性,进而对客户进行分类。
(二)仿生技术
1.神经网络技术。神经网络是指由简单计算单元组成的广泛并行互联的网络,能够模拟生物神经系统的结构和功能。组成神经网络的单个神经元的结构简单,功能有限。但是,有大量神经元构成的网络系统可以具有强大功能,在分类、聚类中神经网络技术有着良好表现。
2.遗传算法。遗传算法是模拟生物进化过程的计算模型,是生物遗传学与计算机科学相互结合、相互渗透而形成的新的计算方法。根据遗传是生物从其亲代继承特性和性状这一现象,基本遗传算法模仿生物进化中的遗传繁殖机制,只使用了选择、交叉和变异三种基本遗传算子,操作过程简单、容易理解。经过数据训练,可以很好的解决数据的分类、聚类等问题。
(三)统计分析技术
1.回归分析。回归分析是一种有指导学习技术,它通过创建一个数学方程来概化一组数值数据,该方程将一个或多个输入属性与一个输出属性关联起来,进而解决客户分类问题。
2.差异分析。尽管数据挖掘主要致力于寻找数据中的未知特征,但在实践中也经常需要检验特定的假设,这就是差异分析。差异分析中典型的方法是方差分析,即通过分析样本数据中不同来源的变异对总体的贡献的大小,确定模型中的自变量是否对因变量有重要的影响,从而确定客户关系中的影响因素。
3.因子分析。因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,然后以较少的几个因子反映原事物的大部分信息。运用这种研究技术,可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)。运用这种研究技术,还可以为市场细分做前期分析。
4.聚类分析。聚类分析是通过事物本身的特征研究个体分类的方法,其基本做法是直接比较样本中各事物之间的性质,把性质相近的归为一类,而将性质差别比较大的分为不同的类,类与类间个体差异很大。在商业领域,聚类可以帮助市场经营人员分析客户数据库,发现不同类型的客户群,按购买习惯分类并刻画客户群的特征。
5.判别分析。判别分析是根据已掌握的一批分类明确的样本,建立较好的判别函数,再根据判别函数对未知所属类别的事物进行分类的一种分析方法,与聚类方法不同的是,判别分析是有指导的学习,它可以在客户分类、营销策略的选择中使用。
(四)关联规则算法技术
关联规则反映一个事物与其他事物之间的相互依存性和关联性,如果两个或多个事物之间存在一定的关联关系,那么其中一个事物就能够通过其他事物预测到。关联规则算法技术较早提出于超市购物篮的分析,人们希望在海量商业交易记录中发现感兴趣的数据关联关系,通过发现顾客放入篮中的不同商品之间的关系来分析顾客的购买习惯,以便帮助商家安排营销策略。
作者:李明东 荣立 来源:《发展》2009年第11期