充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

浅析决策树的数据挖掘在电信CRM中的应用



    随着时代的进步,社会主义的蓬勃发展,我国的市场经济体制已经逐步形成了,国内的电信行业的市场环境已经发展得越来越合理了,但是,还应该看到的是,发展是一把双刃剑,国内的电信市场竞争也因此变得越来越剧烈了,而更重要的是,随着世界经济的全球化进程以及市场的国际化,我国还加入了世界贸易组织。这就在一定程度上要求我国的电信企业在经营管理等各个方面能够和国际接轨,赶超国际水平,在国际化竞争中脱颖而出,才能实现我国的更有力的进步,向着强国富国的中国梦前进。众所周知的是,我国传统的电信企业在以前都仅仅是以产品为核心,与此同时尽量控制成本的运营模式的,而在经营模式方面,也只是以销售地点、柜台式服务以及产品和价格为主要着力点,在当今的时代要求下,我国的电信企业必须要向着以客户和市场为中心的转变,更要在客户的消费心理和价值取向方面做一番功夫的研究,才能在世界市场的竞争中立于不败之地。而本文要说的决策树的数据挖掘(也就是DM)在电信企业中的有效应用。

一、在电信CRM 中使用数据挖掘的重要意义

    众所周知的是,随着社会主义的发展,人民生活水平的提高,电信业务也迅猛地增长,而在激增的数据背后,却隐藏着越来越重要的数据信息,最后随着数据的累积,乃至出现了“数据丰富知识贫乏”的现象,也就是说,数据分析技术的发展,跟不上数据分析复杂度的需要。经过几代人的努力,决策树的数据挖掘技术就在此时应运而生。数据挖掘技术和传统的数据分析有着很大的区别。

    首先,数据挖掘技术在挖掘信息之前没有任何假设的环节,在这样的情况下所发现的知识和信息,具有有效性、实用性以及事先未知性的特点。因此理所当然地,在CRM 中应用数据挖掘技术可以为客户数据分析提供更有效的决策支持。

    另一方面,还应指出的是,现存的数据仓库的数据存储结构其实更适合于做数据的挖掘,甚至可以做比数据挖掘提供的数据更加细的数据,还可以对事务的、文本的、空间的甚至是多媒体的数据进行分析。

二、决策树挖掘模型的建立

    数据的准备、模型的建立、模型验证以及模型评价是数据挖掘一般情况下的步骤。

    首先,数据准备就包括对数据进行取样、特征探索、分析以及预处理。

    其次,可以看出的是,建立模型是一个反复不断的过程,所挖掘的类型和模型的类型应该是一样的。

    另外,决策树、神经网络、时间序列分析以及数理统计分析等方面都可以成为模型类型。

    最后,模型的验证以及评价则是主要通过对结果和模式或者模型的分析和验证来达到评价模型是否对决策支持信息有价值的目的。不然的话就要建立新的模型。

    一旦建立了模型并且也通过了验证,那么在实施模型上可以使用两种方法:

    第一,把该模型提供给分析或者业务人员做参考,并尽量进行全程的察看和分析,然后对该模型提出行动方案或者建议;

    第二,把该模型运用到不同的数据集上。

    本文主要是对电信的CRM 数据里不同种类的客户进行一个简单的分类,并且对客户的类型进行一个简单的预测。而以下则是主要对“客户流失”的类型进行一个简单的分析,从而达到对建立决策树挖掘模型的过程进行一个简单的论述。

    (一)分析决策树应用

    在电信的CRM 数据中,主要是以客户的年龄、所在的城市以及性别为依据对客户进行简单的分类,而在该分类的基础上对客户的类型进行预测,进而可以争取更多的新用户,与此同时还要过滤掉一大批已经没有什么发展潜力的用户,要达到这样的一个目的,可以说,决策树是比较直观易懂的,在设计分类模型的时候,可以运用决策树的算法来进行,与此同时还需要做的工作就是要提取该分类中隐藏的规则,在这种情况下,就能对客户类型进行预测。因此,显而易见的是,客户类型就是决策树要挖掘的目标。

    (二)选择决策树的构造算法

    决策树构造的最原始的算法应该是ID3 算法,这种算法仅仅能处理内存里面的数据,有着很弱的可伸缩性,而值得庆幸的是,当下的决策树的构造算法有好多种,并且也不再是仅仅能在内存中处理,还能处理内存以外的数据,包括处理离散和连续的属性值,不仅如此,这些算法的处理速度也实现了大大的提高,因此,这些构造算法具有很强的实用性。而SLIQ 算法和SPRINT 算法就是其中的两种。

    (三)决策树的工作过程

    一般情况下,决策树的工作过程是:在构造决策树的时候,使用一个带有类标记的训练数据集,接着还使用另外的一个测试数据集来检验所生成的决策树是否正确,如果该决策树具有足够高的正确性的话,就可以使用该决策树去预测未知类型的数据类型。需要指出的是,一般情况下某个属性的一次检测是用一个内部节点来作为代表的。在这样的基础下,在输入新的被决策的记录的时候,就可以对该记录隶属于哪个类进行预测。以下是一个由训练样本归纳判断树的基本算法的描述。

    算法:用给定的训练数据产生一棵判定树。

    输入:训练样本samples,用离散数值属性表示;候选的属性集合为attribute_list。

    输出:一棵判定树。

    方法:

     决策树

三、在电信客户信息决策实现决策应用

    通常情况下,客户行为分析可以保存客户输入的年龄、性别以及所属的城市,因此就可以是使用这些信息作为基于决策树的数据挖掘的输入属性,并且根据用户所使用业务的多少,把客户分成三种客户类型:成熟客户、一般客户以及非客户。所以,就能寄期望于从中掌握客户的年龄、性别以及所属的城市和客户类型之间形成的一个隐藏的内在函数关系,最后,就能把输入属性设置为年龄、性别和所在的城市,最终实现预测客户的类型(成熟客户、一般客户和非客户)。值得注意的是,在输入的属性设置为年龄、性别和所属的城市的时候,要实施有效的策略进行防止决策树的过度增长。比如当叶子节点的样本数量大于一定的阀值之后,就要对该叶子结点实行停止分裂,并且用多数表决的方法对该叶子进行类标记。

四、结语

    在电信CRM 中运用基于决策树的数据挖掘的数据分析技术对客户类型进行挖掘,与此同时达到对客户类型进行预测的目的,是具有十分重要的实用价值的,不仅可以为运营公司在制定个性化的服务以及新业务的时候提供一个十分有价值的决策性参考,还可以通过预测用户类型来实现吸引新客户,保持老客户的目的。因此,这对提高整个电信运营企业的市场竞争力具有十分重要的意义和深远影响。另外,还需要指出的是,当今的决策树的数据挖掘、数据分析技术其实还有许多需要完善的地方,通过当今高科技技术人员的不懈努力,一定能完善得更好,从而发挥更大的潜力和价值。




 

评分:0

我来说两句