您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > BP神经网络在电信业营销响应中的应用
BP神经网络在电信业营销响应中的应用摘要:随着电信业务的发展和体制改革的不断深化,国内电信行业内部各大运营商之间的竞争日趋激烈,这一趋势在国内移动通信业内表现的尤为突出。移动通信运营商为了获取更多的客户资源、占有更大的市场份额,往往采取“简单”的价格竞争和“此起彼伏”的广告宣传战,其弊端显而易见。这就要求运营商要采取以客户为中心的策略,根据客户的实际需求提供多样化、层次化、个性化的服务解决方案。因此,客户关系管理(CRM)成了电信运营商增加收入和利润,提高客户满意度、忠诚度的有效工具。在客户关系管理的流程中,为了准确、及时地进行经营决策,必须充分获取并利用相关的数据信息对决策过程进行辅助支持。近几年迅速发展起来的数据挖掘技术就是实现这一目标的重要手段。本文通过BP神经网络对电信业营销响应进行预测分析。关键字:电信;BP神经网络;数据挖掘1引言营销响应模型是电信企业使用最频繁的一种预测模型。目标变量是预测谁会对某种产品或服务的宣传进行响应,因变量是客户及其行为的各种属性,如:客户年龄,客户收入,客户最近一次购买产品的时间,客户最近一个月的购买频率等。利用响应模型来预测哪些客户最有可能对营销活动进行响应,这样,当以后有类似的活动时,利用响应模型来预测出最有可能的响应者,从而对他们采取相应的营销活动。而对响应度不高的客户就不用对他们进行营销活动,从而减少活动成本,提高投资回报率。2BP神经网络的主要原理BP神经网络在1986年由Rumelhant和McClelland提出,在目前是应用最为广泛、取得的成就最多的神经网络之一。它的学习算法是多层网络的“逆推”,基本思想是,学习的过程由信号的正向传递和误差的反向传播两个过程组成的,在正向传递过程中,训练样本由输入层输入,根据一定的规则经由隐含层处理后传到输出层,如果输出层输出的信号与期望的输出不符,则转到下一个过程,也就是误差的反向传播。误差的反向传播是将实际输出与期望输出之间的误差以某种形式通过隐含层再向输入层反传,并且在反传的过程中,将误差分摊给各层的所有单元,用来获得各层单元的误差信号,用这个误差信号去修正各单元的连接权,然后再进行信号的正向传递,这种信号正向传递和误差的反向传播过程是周而复始地进行,连接权值也相应不断地进行调整,这个过程就是网络学习训练的过程,直到网络输出的误差足够小或者达到了我们的预设值,或者进行到预设的学习次数,网络的学习训练才结束。2.1BP网络结构在以下的推导当中,我们把神经网络的输入用表示;神经网络的实际输出用表示;神经网络的期望输出用表示;第i层的第j个神经元到第i+1层的第k个神经元的连接权值用表示;第i层的第j个神经元输出用表示;第i层的第j个神经元的阈值用表示;第i层的第j个神经元总输入用表示;第i层神经元的节点数用表示。2.2BP网络算法标准BP算法BP网络的正向传播BP网络的后退算法基本的思想是如果j这个神经元处于输出层,那么就是网络的实际输出,我们把它记为yj,通过yj与期望的输出dj之间的误差反传来修改权值。误差的定义为jjjedy网络的目标函数为:网络的权值是按照E函数梯度下降的方向修正的这里面的01是学习效率。3.基于BP神经网络算法,建立挖掘模型3.1样本提取首先,只有那些能够很大程度的影响输出并且能够检测或提取的变量才可以作为输入量。其次,各输入量之间尽量不要有太大的关联或者互不关联,我们可以根据输入、输出量的性质将它们分为两类:语言变量和数值变量,后者又分为离散变量和连续变量,语言变量只有转化为离散变量时才能被网络所处理。最后,我们大多数情况下无法直接得到送给神经网络的输入量,而是经常需要从原始数据中用信号处理或特征提取技术,去提取那些能够反映其特征的参数作为网络的输入。所以,在建立营销模型的过程中也不应该盲目的将数据信息全部选取,也应该有针对性的选择样本数据,这样不仅可以提高效率也可以减少资源浪费,如:高消费群体、高流量群体、高话务量群体等都应该作为相关营销产品的首选。3.2样本评估在设计训练样本集的过程中,网络的性能需要和训练所用的样本有着很好的相关性,样本的规模和质量对于一个网络来说是非常重要的。对于样本的数目来说,电信行业具有样本数繁多的网络特点,其内在规律可以通过训练出的结果很好的显示出来,但是困难在于样本的获取上,并且一个有着很多样本数的网络,它的精度提高有很大的困难。在一般的情况下,网络的映射关系复杂度与网络的规模是成正比的,训练样本数一般是网络连接权的总数的5~10倍,而在很多情况下,很难达到这样的要求。其次,在我们选择和组织样本时,需要选取比较有代表性的样本,均衡样本的类别,需要交叉着输入不同类别的样本的组织。是否有着很好的泛化能力是训练出的网络测试的标准。就是将收集到的样本随机分为两部分,一部分用来训练,另外的一部分作为测试集,而不能用样本训练集中的数据测试,一个测试集样本的误差远远大于训练样本的误差,那么这个网络的泛化能力就很不好。212jjjEdy当我们设计初始权值的时候,由于训练时间的长短与初始化的方法密切相关,因此从误差的哪一点开始进行是由网络权值的初始化决定的。由于神经元作用函数关于原点对称,在零点附近的每个节点的净输入的输出都在作用函数中点,这个位置的变化最灵敏,并且远离作用函数的饱和区。所以必须要使网络的学习加快,方法是选取足够小的初始权值和使初始值为+1和-1的权值数相等。3.3模型建立本文在模型建立过程中,选取客户年龄(age)、客户收入(salary)、客户最近一次购买产品的时间(last_time)、客户最近一个月的购买频率(frequency)作为数据集的四个属性,设定规则条件,满足相关条件的为A类,否则为B类,条件定义如下:((1000≤salary<3000)∩(0≤frequency0.3))∪((3000≤salary<10000)∩(0.3≤frequency1))根据所研究属性的取值特点,每个属性的编码方式如下表所示:表1属性编码表属性输入单元数目取值范围age4[18,30),[30,45),[45,60),[60,100)salary4[500,1000),[1000,3000),[3000,5000),[5000,10000]last_time3[201101,201106),[201106,201201),[201201,201202]frequency3[0,0.3),[0.3,0.5),[0.5,1]BP网络分三层,第一层为输人层,根据表1的编码模式,节点数为14个,对应属性的输人单元数目;第二层为中间层,即隐层,初始设定节点数为4个;第三层为输出层,节点数为一个.整个网络共有60个连接。如下图所示,展示出上述四个属性与目标活动的初始距离程度:现采用遗传算法对BP网进行进化,收敛条件为:样本的学习误差平方和0.0001。经过约550代进化后,适应度值最大的个体满足收敛条件。此时,BP网络变得简化了,隐层节点数为2个,连接数减为16个,大大提高了收敛速度。在实验中采用了300个样本,实验的结果表明,提取规则时的准确率为96.25%,说明采用的方法是有效的。如下图所示清晰的展现出了四个属性与目标营销活动的距离程度,最终将选择与目标值最接近的两个属性做进一步属性特征研究。3.4实验结果通过以上实验过程,我们可以清晰的看到预测的结果,根据预测结果可以有针对性的采取精准化营销策略,进而实现客户的价值提升。利用神经网络算法对电信业营销响应进行预测分析,能够有效的解决电信业中的许多问题,神经网络算法有多种,在具体实践过程中可以有针对性的进行选择,本文只选用了其中一种方法,在研究过程中有不足之处望大家批评指正。4.结束语本文首先介绍了电信业的发展现状,并结合电信营销活动的特征介绍了BP神经网络的原理、结构、算法。基于BP神经网络算法的基础上,本文结合电信业客户属性建立了行之有效的挖掘模型,通过样本选取、样本评估、模型建立、数据分析等阶段最终挖掘出符合预期营销活动的属性群体。参考文献【1】KantardzicM.DataMiningConcepts,Models,Methods,andAlgorithms[M].[S.1.]:IEEEPressPublishingHouse,2002.【2】谭立云,凯丽比努尔,塔西普拉提,等.数据挖掘中的数据预处理方法研究[M].合肥:中国科技大学出版社,2004.【3】余建英,何旭宏.数据统计分析与SPSS应用[M].北京:人民邮电出版社,2003.【4】陈刚,刘发生.基于BP神经网络的数据挖掘算法.计算机与现代化,2006:10(20-22).
本文标题:BP神经网络在电信业营销响应中的应用
链接地址:https://www.777doc.com/doc-2903999 .html