您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 理学 > 2017数学建模论文
1“拍照赚钱”的任务定价摘要小四宋体关键词:支持向量机主成分分析1.问题重述“拍照赚钱”是用户下载APP,注册成为APP的会员,然后从APP上领取需要拍照的任务,赚取APP对任务所标定的酬金的过程。APP成为该平台运行的核心,而APP中的任务定价又是其核心因素。如果定价不合理,有的任务就会无人问津,而导致商品检查的失败。本题给出附件一:已结束项目的任务数据;附件二:会员信息数据:附件三:新项目任务数据(只有任务的位置信息)。1.研究附件1中的项目,任务定价规律,分析任务的未完成原因。2.为附件1中的项目设计新的任务定价方案,和原方案进行比较。3.实际情况时,多个任务可能因为位置较为集中,导致用户会争相选择,一种考虑是将这些任务联合在一起打包发布。在这种考虑下,如何修改前面的定价模型,对最终任务完成的情况有什么影响?4.对附件三中的新项目给出自己的任务定价方案,并评价该方案的实施效果。22.基本假设1)2)3)4)5)3.符号说明序号符号符号说明1X1维度2X2经度3X3任务标价4X4任务完成情况5Q1原方案成本6Q2新方案成本789104.问题(1)的模型建立、求解34.1问题分析对于问题一,我们主要研究了附件一中的四项数据(任务gps维度、任务gps经度、任务标价、任务执行情况)。通过初步观察任务的gps经纬度都和任务标价、任务执行情况相关,为了进行详细分析,我们采用了主成分回归分析法。4.2模型准备主成分分析的目的主要是用较少的变量转化成彼此相互独立或不相关的变量,通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一种降维方法。主成分分析的结果受量纲的影响,如果改变量纲,则会由于各变量的单位可能不同而导致结果不一样,而回归分析是不存在这样的情况的,所以可以先把各变量的数据标准化,使用相关系数矩阵进行分析。我们使用主成分回归分析,是为了克服最小二乘(LS)估计在数据矩阵中存在多重共线性时表现出的不稳定性。我们选择其中一部分重要的主成分作为新的自变量,丢弃了一部分影想不大的自变量,实际上达到了降维的目的,然后用最小二乘法对选取主成分后的模型参数进行估计,最后再变成原来的模型求出参数的估计。4.3模型建立与求解4.3.1:数据的初步处理由于附件一所给数据量纲不同,且数值差过大,我们对该数据进行了统一处理,处理如下(下表只显示部分处理数据,详细请看支撑材料):表1附件一部分数据任务号码任务gps纬度任务gps经度任务标价任务执行情况A000122.56614113.9808660A000222.68621113.940565.50A000322.57651113.957265.51A000422.56484114.2446750A000522.55889113.950765.504A000622.559114.2413750使用Excel求得任务经纬度和任务标价平均值后,分别除以所有该项目数据,得到如下(部分)结果:表二附件一处理后数据任务号码任务gps纬度任务gps经度任务标价任务执行情况A00010.9818819961.0039047610.9549896040A00020.9871060931.003549710.9477548340A00030.982333191.0036965580.9477548341A00040.9818253691.0062276441.0852154590A00050.9815663431.0036395260.9477548340A00060.9815711871.0061989861.0852154590平均值22.98254238119.537538569.1107784.3.2主成分分析回归模型4.3.2.1完成情况(X4)分析首先我们利用Matlab软件求出任务gps维度X1,任务gps经度X2,任务标价X3的相关系数矩阵r和矩阵的特征值那么大,特征向量n,特征值贡献率表3X1,X2,X3相关系数矩阵X1X2X3X11.0000-0.52060.0855X2-0.52061.0000-0.0597X30.0855-0.05971.0000相关系数矩阵的三个特征值依次为nameda1.54010.98110.4787特征向量[0.6969,-0.6924,0.1868][-0.1069,0.1573,0.9817][0.7091,0.7042,-0.0357]各个特征值的贡献率51.337632.704415.9581前两个特征值的和所占比例(累积贡献率)达到:51.3376+32.7044,由此略去5第三个成分。保留前两个成分(特征值)对应的两个特征方程为:Z1=x1+x2+x3Z2=x1+x2+x3对附件1处理后的数据直接做线性回归得经验回归方程得:y=-20.056232+10.673738*x1+8.624116*x2+1.383294*x3作主成分回归分析,得到回归方程Y=【0.1580,0.1672】【z1,z2】化成标准化变量的回归方程为Y=0.0922-0.08310.1936x1x2x3恢复到原始的自变量,得到主成分回归方程:y=7.246556+4.192986*x1-12.250940*x2+1.436457*x3由上可得,任务完成情况的好坏与维度和任务标价成正比关系,与经度成反比关系,且经纬度x1,x2前的系数明显大于定价x3前的系数,由此,经度越高,维度越低的任务完成情况越好,定价将略微影响任务的完成情况,定价越高完成情况越好4.3.2.2任务标价(X3)分析与完成情况分析相仿求出相关系数矩阵r与矩阵的特征值那么大表4X1,X2,X4相关系数矩阵rX1X2X4X11.0000-0.52060.2202X2-0.52061.0000-0.0749X40.2202-0.07491.0000特征值1.59500.94670.4583特征向量[0.6876-0.64390.3356][-0.09350.37980.9203][0.72000.6642-0.2009]各个特征值的贡献率53.166031.557715.27636前两个特征值的和所占比例(累积贡献率)达到:53.1660+31.5577,由此略去第三个成分。保留前两个成分(特征值)对应的两个特征方程为:Z1=x1+x2+x3Z2=x1+x2+x3对附件1处理后的数据直接做线性回归得经验回归方程y=1.449027+0.160356*x1-0.625815*x2+0.026279*x3作主成分回归分析,得到回归方程Y=0.10370.1650z1z2化成标准化变量的回归方程为Y=0.0559-0.00410.1867x1x2x3恢复到原始的自变量,得到主成分回归方程y=0.723047+0.342375*x1-0.081159*x2+0.025162*x3由上可得,任务的定价与维度和任务标价成正比关系,与经度成反比关系,且经纬度x1,x2前的系数明显大于任务的完成情况x4前的系数,由此,经度越高,维度越低的任务定价越高,任务的完成情况略微影响任务定价。4.3.2.3模型的初步检验由以上两个主成分回归分析方程可得,高定价的情况下,任务的完成情况较好。我们做出任务完成和任务未完成的标价与地理位置(任务gps经纬度)散点图:7图3标价与地理位置散点图(任务完成)图4标价与地理位置散点图(任务未完成)其中在高标价段,任务完成的个数明显较未完成的个数多,由此可见主成分回归方程可信度较高。由上可得任务定价规律:在经度高,的地区,定价较高;在经度低,维度高的地区,8定价较低。未完成的原因:与定价规律相似,在经度高,维度低的地区,完成度较高;在经度低,维度高的地区,完成度较低。结合定价规律可得,未完成的原因是由于在该地区的定价稍微偏低引起的。5.问题(2)的模型建立、求解5.1问题分析与求解为附件一中的项目设计新的任务定价方案,并和原方案进行比较。由第一问可得任务定价与任务完成情况之间关系不大,但两者都与任务的经纬度有关(也就是与任务的地理位置有关),当任务地理位置的纬度高经度低时,任务的完成度和任务的定价都较高,这种安排很不合理。由此我们得出新的任务定价方案,在纬度高经度低时(任务完成度情况好),降低定价;在纬度底经度高时(任务完情况不好),提高定价。该方案的与原方案比较(1)完成情况不好的地方通过提高定价,刺激该地区人群尽力完成任务(2)完成情况好的地方通过降低定价,舒缓该地区的竞争。(3)通过降低完成情况较好的地方的任务定价,可同时降低公司总的支出金额(需要付给用户的总金额)如下计算原方案和新方案公司的支出金额:方案的总支出金额=任务定价*任务完成情况(详细计算可见支撑材料fujian1.xls)原方案Q1=seigemax3*x4=36446新方案:我们将维度大于平均值,经度小于平均值的地区任务提高5元,把维度小于平均值,经度大于平均值的地区任务定价降低5元,而后计算支出总金额Q2=(11)7298.5+(10)5943+(00)5173.5+(01)10631=29046Q2Q1由此可见通过这种不同地区升降价的方案,可以在提高任务完成率的情况下,又降低了公司的成本96.问题(3)的模型建立、求解6.1问题分析在实际中多个任务可能会因为位置集中而使用户争相选择,给出一种考虑将任务打包发布。在这种考虑下修改前面的定价模型,并分析出其对任务完成情况的影响对此类实际性的问题,通常的数据分析不能够很好的解释其中的影响,为此我们对这一问题进行了Matlab任务发布模拟,由此先计算出任务的完成度。6.2任务发布模拟模型6.2.1模型准备首先我们对一些实际情况进行假设不打包的情况下:(1)任务发布的时间随机(6:30-8:30随机发布)(2)预定时间早于任务发布时间的,那些会员都有机会抢得任务,其他会员不得选择任务(3)会员抢得的任务几率与配额数相关(4)会员完成情况(成功概率)与信誉度有关打包的情况下:(1)任务发布的时间随机(6:30-8.30随机发布)(2)预定时间早于任务发布时间的,那些会员都有机会抢得任务,其他会员不得选择任务10(3)打包任务仅发给预定限额(或信誉)较高的会员一人(4)会员完成情况(成功概率)与信誉度有关6.2.2模拟模型的建立与求解为了精确模拟中的参数我们将经纬度等分化为100000个区域每个区域的经纬度范围在【.0.0.0.0】之内。通过Matlab求出任务密度分布和会员密度分布如下图图5任务密度分布11图6会员密度分布由上两图可得,会员密度分布和任务密度分布类似,在模拟中可直接考虑任务多的情况打包K为打包界限(当任务大于K值时,进行打包)。基于以上模型我们可以得出任务完成的概率,由于模拟中的随机因素,我们需要取多次值求取平均,来确定两种情况下(不打包或打包)任务完成的平均概率。模拟数据如下:由上两表可得在以原先定价的情况下,如果进行打包,将会导致任务12平均完成情况的升高。在此继续分析K值(打包界限)变化时的情况:由上可得,当K值增大时完成概率显著降低,而K值过小不符合实际情况,在此取值K=3。基于问题一的模型方程Y1Y2同时通过问题二的分析我们可以得出:当任务完成率上升时,任务定价也随之上升,考虑到问题一二中地域和成本的影响,应当适当的调低任务定价,又由Y1,Y2可得,调低定价将降低完成率,由此该拍照app可以在收入提高的前提下,使得任务完成率保持在与之前相同的水平。问题四:我们需要先分析任务的密度分布,分布如下图:13图6任务密度分布由第三问分析可得,该密度分布与会员分布十分相似,可以使用第三问的模拟,分析6.3模型建立与求解6.3.1模型建立6.3.2模型求解7.模型的科学性分析7.1问题(1)的科学性分析7.2问题(2)的科学性分析7.3问题(3)的科学性分析8.模型评价、推广8.1模型优点(1)(2)(3)148.2模型缺点(1)8.3模型推广(1)9.参考文献[1]司守奎,孙兆亮
本文标题:2017数学建模论文
链接地址:https://www.777doc.com/doc-3738461 .html