您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 股票报告 > 基于支持向量机的营销风险预测分析
1基于支持向量机的营销风险预测分析张云起1王嘉鋆21山东工商学院工商管理学院2青岛科技大学管理学院[摘要]支持向量机(SupportVectorMachine,SVM)方法是在统计学习理论(SLT)基础上提出的一种新的学习方法。通过对大量来源可靠的营销信息资料进行系统了解和分析,采用支持向量机的思想,建立风险预测分析模型,对这些资料和数据进行处理,得到关于风险发生的类别及其程度的有关信息,为选择营销风险处理方法、进行正确的风险管理决策提供依据。[关键词]支持向量机,营销风险,风险预测1引言所谓营销风险,就是指企业在市场营销活动中,由于各种事先无法预料的不确定性因素带来的影响,使企业营销的实际收益与预期收益发生一定的偏差,从而有蒙受损失和获得额外收益的机会或可能性。企业营销风险的随机性、复杂性、变动性等特性决定了在建立数学模型用于风险分析时困难重重。在营销风险管理程序中,营销风险衡量是对特定的营销风险测定其风险事故发生的概率及其损失程度,直接影响营销风险管理的成败及准确性。营销风险衡量分为营销风险预测和营销风险测量两大部分,一般需要运用概率论和数理统计方法。本文仅就营销风险预测做研究探讨。[1]2基于SVM分类的风险预测理论支持向量机(SVM)用于模式识别的基本思想是将一个超平面作决策平面,不但能将分类中的两类样本正确分开,而且使分类间隔最大,即将优化问题转化为一个凸型的二次规划问题,由标准的拉格朗日乘子法解得即为全局最优解,且具有很高的精度。SVM的主要思想是:首先考虑一个两类模式分类问题,设输入模式集{}iX,miXR,i=1,…,n为样本数(以下同),m为样本维数;输出集RYYii},{,且iY=-1或1,代表类别标号,目的是寻找一个超平面,实现该分类函数将空间YX划分为两个子空间,不同的模式样本属于不同的子空间,且距该超平面最近的样本到超平面的距离达到最大,则称该超平面为最优超平面(图1)。其中距离超平面最近的样本称为支持向量(SupperVector),所对应得到的模型称为支持向量机。[2]图1线形二类划分的最优超平面正向集最大的分类间隔负向集0bxwwx+b=02此时,训练得到的最优超平面的分类函数为:支持向量()))(sgn())sgn(()(bxxybxwxfiii(1)其中:w支持向量iiixy(2))(21srxxwb(3)srxx,分别对应两类中的任一支持向量,即对应的i0。从以上公式中可观察到,由分类函数)(xf的正负即可判定样本的类别。支持向量数目少,但要包含分类所需的信息,改变某个支持向量会改变分类函数。大部分训练样本不是支持向量,它们的改变不会对分类函数有影响。[3]对应的Lagrange函数为:niiiniiiiiibxwywwbwL11]1)([)(21),,((4)从上面的讨论过程中不难看出,具体应用SVM的步骤为:(1)从较多的训练样本数据中选择支持向量。方法:①选择适当的核函数;②确定规范化参数C的值;③将学习样本和对应的函数代入(4)式,通过求解Lagrange优化方程,求出的非零且小于C的Lagrange算子对应的样本即为支持向量。(2)写出最优分界面方程,从而由支持向量构建基于SVM的系统。方法:利用(2)和(3)式,分别求出bw和即可得最优分界面方程。(3)对未知类别样本进行测评。方法:将未知类别样本代入最优分类面的分类函数,即可得值(1或-1)。[4][5]3营销风险预测指标体系的构建3.1营销风险预测指标体系的建立思路企业营销风险预测分析指标体系,是由各方面相互联系、能敏感地反映营销活动状态及存在问题的具体指标构成的有机整体。企业营销风险预测指标建立在科学性、广泛性、可比性、相对独立性、定性和定量指标相结合等原则的基础上,从分析测定营销风险基本因素入手,影响营销风险的主要因素分为宏观环境风险因素和微观环境风险因素。但本文所进行的基于支持向量机的市场营销预测分析是对市场营销风险进行定量分析,故只选取微观环境风险指标为所需的指标。笔者按照营销微观环境的六要素,分为顾客风险、供应商风险、市场竞争风险、竞争对手风险、产品销售风险、营销管理风险六大类,总共20个子因素指标,构成了一个预测指标体系。3.2用主成分分析法筛选营销风险预测指标主成份分析(PrincipalComponentsAnalysis)是利用降维的思想把多指标转化成少数几个综合指标的多元统计方法。这种方法的核心就是通过主成分分析,选择m个分量myyy,...,21,以3每个主分量iy的方差贡献率作为权数构造综合评价函数mmyyyF...2211(5)其中),...,2,1(miyi为第i个主成分的得分,当计算出每个样本的主成分得分后,可由主成分得分衡量每个样本在第i个主成分所代表的的程度及地位。当把m个主成分得分代入(5)式后,即可计算出每个样本的综合评价得分。以这个得分的大小排队,即可自然排列出每个指标名次。3.3用时差分析法确定营销风险预测指标在营销风险评价指标中有些指标是先行指标,有些指标是一致性指标,有些则是滞后指标。只有先行指标才可以用于风险预测,一致性和先行指标用于评价,滞后指标不能用于评价和预测。本文选用时差分析法最终确定所需的营销风险预测指标。采用时差相关分析方法对指标进行筛选,可以利用相关系数验证经济时间序列先行、一致或滞后的关系。时差相关系统的计算方法是以一个重要且能够敏感反映当前经济活动中的经济指标作为基准指标,一般选择一致指标作为基准指标,然后使被选择指标超前或滞后若干期,计算它们的相关系数。由于篇幅所限,仅将最终确立的营销风险预测指标(如表2所示),包含6个子因素列表以示,其中每一个子因素都能显著的代表其对应的一大类风险,对营销风险预测的结果既有足够的全面性,又可避免因过多因素而带来的过计算问题。[6]表2最终确立的营销风险预测指标风险因素指标指标名称顾客风险X1赊销比率供应商风险X2供货合同履约率市场竞争风险X3相对市场占有率(自身)竞争对手风险X4促销费用率(对手)产品销售风险X5产品销售率营销管理风险X6个人目标完成率4、基于支持向量机的营销风险预测分析应用4.1基于支持向量机的营销风险预测分析算法概括地说基于支持向量机的营销风险预测算法,就是首先通过用内积函数定义的非线性变换将输入空间变换到一个高维空间,在这个空间中求(广义)最优分类面。SVM分类函数形式上类似于一个神经网络,输出的是中间节点的线性组合,每个中间节点对应一个支持向量,如图2所示,具体的算法步骤为:步骤1在营销风险识别和分析的基础上,综合前人对营销风险分析的研究,建立一套表达营销风险水平的指标体系。步骤2在以往类似营销活动中,取一定数量结果已有定论的营销活动作为样本,建立样本集。步骤3按要求选择适合的核函数K),(iiyx,并确定相应的参数。核函数的选取在SVM方法中是一个较为困难的问题,至今尚没有一定的理论方面的指导。核函数的作用相当于使样本投影到一个很高维的空间中,将其转化为一个线性回归问题然后再构造最优回归曲线。因此,核函数的选取直接影响了曲线的泛化能力。步骤4利用训练样本,通过学习训练获得企业风险预测中的决策支持向量及有关参数值,并用验证集样本进行准确性验证。步骤5根据待预测企业的风险指标属性值预测该企业的总体风险水平,为进一步开展风险应对和风险管理打下基础。[7][8][9]4图2基于支持向量机的营销风险预测分析4.2基于支持向量机的营销风险预测分析实例(1)营销风险预测分析指标数据本文以某白酒企业的营销风险预测为例,调查选择该企业36期相关营销数据为对象,考察其营销风险情况。其中存在营销风险7期,限于本文仅将企业相应时期分为存在营销风险的时期和不存在营销风险的时期,故剩下29期低于存在营销风险的衡量范围,即为不存在营销风险时期。这些数据经过统计软件编写计算程序,对精确值指标FA综合处理后得出(本文省略)。为了进一步验证基于SVM的营销风险预测方法的概化能力,这里将该白酒企业36期划分为两个子样本集合,根据前述,每一个样本为一个六维向量,训练样本集合由24期构成,包括19期不存在营销风险与5期存在营销风险;剩下的12期组成测试样本集合,求其是否存在风险。判别结果:1代表不存在营销风险,-1代表存在营销风险。该问题抽象为属性集X到分类集Y的映射,即X×Y→[0,1]6×{1,-1}。利用开发工具MATLAB7.0将企业数据资料进行数据处理。[10](2)支持向量机参数的选择及结果该模型的问题属于非线性变化,因此,本文主要比较径向基函数(RBF)和多项式核函数,通过调整不同核函数中的参数值及惩罚因子C,观察支持向量个数的变化情况、正确判断率,以确定合适的核函数及相应参数建立起的支持向量机作为营销风险预测工具。[11][12]①核函数取径向基函数(RBF)22exp),(iixxxxK(5)其中:2为用户选择的常数。当kernel=rbf(0.1);C=100.0时,得到结果:有10个支持向量,回带数据正确判断率为58.3%,得到最优超平面如图3所示。00.20.40.60.8100.20.40.60.81classoneclasstwosupportvectorclassonemargindecisionboundaryclasstwomarginl-o-oerror图3当kernel=rbf(0.1);C=100.0时得到最优超平面x1x2xsK(x1,x)K(x2,x)K(xs,x)α1y1α2y2αsys………………5当kernel=rbf(0.2);C=100.0时,得到结果:有8个支持向量,回带数据正确判断率为66.7%,得到最优超平面如图4所示。00.20.40.60.8100.20.40.60.81classoneclasstwosupportvectorclassonemargindecisionboundaryclasstwomarginl-o-oerror图4当kernel=rbf(0.2);C=100.0时得到最优超平面当kernel=rbf(0.1);C=50.0时,得到结果:有9个支持向量,回带数据正确判断率为62.5%,得到最优超平面如图5所示。00.20.40.60.8100.20.40.60.81classoneclasstwosupportvectorclassonemargindecisionboundaryclasstwomarginl-o-oerror图5当kernel=rbf(0.1);C=50.0时得到最优超平面②核函数取多项式核函数qiicxxxxK])([),((6)其中q为多项式的阶数,、c为用户选择的常数。当kernel=polynomial(1);C=50.0时,得到结果:有7个支持向量,回带数据正确判断率为51.3%,得到最优超平面如图6所示。00.20.40.60.8100.20.40.60.81classoneclasstwosupportvectorclassonemargindecisionboundaryclasstwomarginl-o-oerror图6当kernel=polynomial(1);C=50.0时得到最优超平面6通过如上比较,可以看出选择当kernel=rbf(0.2);C=100.0的支持向量机进行学习,得到的正确率最高,效果最好。[13][14]因此,利用学习得到的结果,将待判定的数据输入该支持向量机,可以得到营销风险的判别,得到结果:在12期构成的测试样本中,有9期不存在营销风险;3期存在营销风险,见表3。表3某白酒企业基于SVM的营销风险预测结果企业期数X1X2X3X4X5X6y是否存在风险252580703650501无265084803075751无277088893680801无287580962090100-1有291007810020100100
本文标题:基于支持向量机的营销风险预测分析
链接地址:https://www.777doc.com/doc-4503909 .html