您现在的位置是:首页 > IT基础架构 > 软件与服务 >
基于数据挖掘技术的客户细分研究
摘要随着客户关系管理(CRM)系统应用的逐步推广,企业“以产品为中心”到“以客户为中心”的经营模式的战略转变,客户细分作为客户关系管理系统的核心功能作用受到了充分的重视。该文综合分析了现有的客户细分方法,并着重对数据挖掘技术在客户细分领域的应用进行阐述。...
1引言
随着社会信息化进程的加快和全球经济一体化的快速推进,世界范围内的企业都在经历着一场深刻的变革。以“产品为中心”的竞争优势正在减弱,以客户为中心、以服务为目标的市场战略成为企业成功的关键保证之一。哈佛商学院的FredriekReiehheld在他的一本著作中提到“在客户保持率上5%的提高,企业的盈利能力将上升75%。”目前一种新型的管理机制——客户关系管理CRM(CustomerRelationshipManagement)正在成为企业制胜的法宝,成为企业保持市场竞争力的重要手段和必不可少的环节。随着客户关系管理研究的逐渐深入,作为重要组成部分的客户细分成为了研究焦点。
2客户细分方法简介
2.1客户细分的基本概念
客户细分(CustomerSegmentation)作为客户关系管理的核心概念之一。是指企业在明确的战略、业务模式和特定的市场中,根据客户的属性:行为、需求、偏好以及价值等因素对于客户进行分类,并提供针对的产品、服务和营销模式的过程。
根据帕累托定律(2/8定律),20%的顾客给企业带来80%的销售利润。区分这两类客户,保持和发展这20%的最大利润客户对企业来说尤为重要。通过客户细分,企业可以更好的识别不同客户群体对企业的价值及需求,以此指导企业的客户关系管理,达到吸引客户、保持客户、建立客户忠诚的目的。
2.2传统客户细分方法及其局限性
2.2.1基于人口统计视角的客户细分
人口统计细分是将市场按人口统计变量如客户的年龄、性别、收入、地区、职业、职位、受教育程度、家庭成员数量等要素为基础划分成不同的群体,细分的依据就是客户的需求主要是由其社会和经济背景决定的。该方法现实运作中需要借助在线分析技术和数据挖掘技术来收集和处理庞大的人口信息。然而经济和市场的全球化、全国化以及信息技术的迅猛发展,逐渐削弱了客户与地理特征的关联性,降低了市场的稳定性和这种细分方法的有效性,并且这些仅将外在特征作为细分的依据,不足以预测客户未来购买行为。
2.2.2基于客户行为的客户细分
基于客户行为的细分就是依据客户以往和现在的行为来预测将来的行为,其实现是通过分析数据库中已有客户的消费行为模式来将客户分类。营销人员通过对客户行为的测量,就能确定那些是急需改进的因素,而不是把各细分市场分均化,这样就可以体现出关系营销战略的优先顺序法则。基于客户行为进行客户细分的主要方法有RFM分析和客户价值矩阵分析等。该方法无法对潜在客户进行定义和评价,也无法满足客户资信程度等复杂分析需求,即使对于现有客户,它也难以反映客户的满意度、忠诚度等,企业还得结合其它的数据分析工作来全面评估客户。
2.2.3基于客户生命周期的客户细分
客户的生命周期指一个客户和一个企业之间不同的关系阶段。由于客户和企业的关系是随时间不断地发展变化的,处于不同关系阶段的客户有不同的特征和需求,所以依据客户生命周期进行客户细分也就成为一种重要的细分方法。将客户关系的发展划分为考察期、形成期、稳定期、退化期四个阶段,称为四阶段模型。这种细分方法能够使企业针对客户所处阶段进行有针对性营销,促使客户向稳定期发展,或者延长稳定期。该方法不足之处在于难以识别相同生命周期阶段的客户差异,还需结合有关客户属性综合评估客户价值。
2.2.4基于客户价值的客户细分
基于价值的客户细分的基础是客户为企业带来的盈利能力和价值,主要方法有:利润分类法和客户价值细分理论。利润分类法的依据就是大家都比较熟悉”二八法则”,对企业来说,最主要是要识别能带来绝大部分利润的20%的客户。客户价值细分理论选择了“客户当前价值”和“客户增值价值”两个维度指标。但是这两个细分维度的计算是以客户关系稳定为基本前提的,但绝对稳定的客户关系是不存在的,所以影响了细分的质量。很多人提出了对客户生命周期价值模型的扩展,比如增加客户发展潜力和增加客户忠诚维度等。
3基于数据挖掘的客户细分
3.1数据挖掘算法在客户细分中的应用
3.1.1贝叶斯分类
贝叶斯分类是一种统计学分类方法,它以贝叶斯定理为基础。朴素贝叶斯分类是统计学分类方法,它们可以预测类成员关系的可能性,如给定数据项属于一个特定类的概率。
下面简要介绍一下朴素贝叶斯分类预测的工作过程:
1)每个数据项用一个n维属性值X={x1,X2,…,xn}表示,分别描述对n个属性A1,A2,…,An的数据项的n个度量。
2)类别标记属性C={c1,c2,…,cm}。给定一个未知类别标记的数据项X,分类法将预测X属于哪一类,即是说,朴素贝叶斯分类将未知的数据项分配给类c值独立于数据项的分类属性。这里,如果标记属性ci的先验概率未知,则通常假定这些标记属性ci是等概率的,即P(c1)=P(c2)=…=P(cm),并据此只对P(XIc.)最大化。
3)对未知数据项X分类,对每个c,计算P(X|ci)P(ci)。数据项x被划分到标记属性ci中,当且仅当P(X|ci)P(ci)>P(X|cj)P(cj),1≤j≤m,j≠i。
3.1.2决策树
当数据挖掘的任务是对记录的分类或者未知结果的预测时,决策树方法是一个好的选择。决策树就是一个类似流程图的树型结构,其中树的每个内部结点代表对一个属性值的测试.其分支就代表测试的每个结果,而树的每个叶结点就代表一个类别,树的最高层结点就是根结点。从决策树的根结点到叶结点的一条路径就形成了对相应对象的类别预测。决策树可以很容易转换为分类规则。典型的决策树算法有ID3算法和C4.5算法。
决策树数据分类操作通常有两个步骤:
1)根据给定的训练集,找到合适的映射函数H:f(X)→C的表示模型。这一步通常称为模型训练阶段。
2)使用上一步训练完成的函数模型预测数据的类别,或利用该函数模型,对数据集中的每一类数据进行描述,形成分类规则。
3.1.3聚类方法
将聚类应用于客户细分.一般按照以下步骤进行:
1)判断数据是否有聚类趋势,若有则继续执行以下的步骤,否则认为该数据集不适合聚类分析:
2)选择一种聚类算法用于待聚类的客户数据D,将D划分为若干个类C={C1,C2,…,Cp}。其中D=C1∪C2∪…∪Cp;
3)对每一个Ci,i=1,2,…,p,根据其中成员的特点,归纳出能描述其特征的一条或几条规则。设D上的所有的规则集合为R={r1,r2,…,rq},由于一个类可能有多条规则,所以通常q≥p;
4)评判归纳出的规则。建立评价函数Eval(r),对R中的每条规则进行评价,这个函数是领域相关的,不同情况下的Eval(r)也不同。经过评判,若聚类结果具有较高的可信度,则将聚类结果应用于实际应用,否则,选择其它的聚类算法再进行分析。
3.1.4人工神经网络
人工神经网络是一种基于动物神经系统的生理属性的分析和算法模型,由一些相互联系的神经元组成。这些神经元的功能在于处理和传递信息,其连接方式直接决定着信息在网络中传递和信息的属性。Boone和Roehm研究了用Hopfield人工神经网络技术进行客户细分的Hopfield和Kagmar(HK)聚类方法。他们认为Hopfield网络中的每个神经元同所有其他神经元都相连,信息能够以多个方向在神经元间流动,因而比其他人工神经网络更具优势。
3.2客户细分的实现过程模型
4结束语
目前国内基于数据挖掘的客户细分技术在电信行业、金融行业的应用已经取得了很大的成果,但还存在一些不足之处,主要体现在如下几个方面:
1)常见的以客户价值指标作为细分标准的模型大多从企业的收益和所付出的成本两个方面考量客户价值,而极少甚至根本不涉及客户风险因素,这使模型不能准确地全面反映客户的特征。
2)客户细分的理论和实践存在较大的分歧,最明显的就是前者比较注重细分技术的更新而忽视实践过程中方法与实际环境的衔接过程。客户细分在理论研究上较多,而真正能投入使用的模型较少。有些投入使用的模型在构成因子设计上还存在一些不够科学、不够完善的地方,这在一定程度上使模型实际应用价值受到影响。
3)对客户细分的通用模型研究较多,而针对行业应用的模型研究较少,尤其是针对某一具体企业的模型研究更少。这使软件在企业中的广泛应用受到了限制。
4)现有的分类方法大都是确定性的分类方法,即条件属性与分类结果间存在着确定的映射关系。然而由于受心理和环境等因素的影响,客户行为中往往存在着很多的非确定性和随机性,传统的确定性分类模型无法客观地反映出这种非确定性和随机性。
5)由于一些反应客户行为规律的数据存在着无规律或规律难以获取的时变性,因此一些不考虑时间因素的分类方法或将时间因素作为内生变量的分类方法难以取得良好的分类效果。
6)市场的易变性不允许存在一劳永逸的细分方法,市场细分的实施又需要高额成本,使得企业面临着艰难选择,然而很多理论研究并不考虑实施过程中的成本-收效问题。
7)采用不同的细分方法或者是同一种方法的不同技术手段分析同一个问题往往会产生不同的结果,对这些结果之间的比较还没有形成有效、统一的标准。
这些不足为细分方法的选用和实施设置了一定的障碍,但也为进一步研究指出了方向。
(本文不涉密)
责任编辑: