您好,欢迎访问三七文档
1线性回归实例选讲--牙膏的销售量1.问题建立牙膏销售量与价格、广告投入之间的模型;预测在不同价格和广告费用下的牙膏销售量.收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其他厂家同类牙膏的平均售价.9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803.851销售量(百万支)价格差(元)广告费用(百万元)其他厂家价格(元)本公司价格(元)销售周期2明确问题一牙膏的销售量•确定关系:–牙膏销售量——价格、广告投入•内部规律复杂数据统计分析–常用模型回归模型×数学原理软件•30个销售周期数据:–销售量、价格、广告费用、同类产品均价销售周期公司价(元)它厂价(元)广告(百万元)价差(元)销售量(百万支)13.853.805.50-0.057.3823.754.006.750.258.51………………293.803.855.800.057.93303.704.256.800.559.2632.基本模型011yx201222yxx55.566.577.577.588.599.510x2y-0.200.20.40.677.588.599.510x1yy~公司牙膏销售量x1~其它厂家与本公司价格差x2~公司广告费用解释变量(回归变量,自变量)被解释变量(因变量)多元回归模型22322110xxxy4Matlab统计分析•rcoplot(r,rint)残差及其置信区间作图•MATLAB7.0版本s增加一个统计量:剩余方差s2[b,bint,r,rint,stats]=regress(y,X,alpha)statisticstoolbox01122nnyxxx解释变量:矩阵显著性水平:0.05系数估计值置信区间残差向量y-xb置信区间被解释变量:列检验统计量:R2,F,p随机误差:正态分布均值为零回归系数x=]1[2221xxx3.模型求解由数据y,x1,x2估计x=[ones(size(x1)),x1,x2,x2.^2];[b,bint,r,rint,stats]=regress(y,x)程序54.结果分析参数参数估计值置信区间17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p0.0001s2=0.0490012320112232yxxx,故x22项显著但可将x2保留在模型中即:212217.321.313.700.35yxxxy的90.54%可由模型确定、F远超过F检验的临界值、p远小于=0.05显著性:整体显著x2:2置信区间包含零点,但右端点距零点很近——x2对因变量y的影响不太显著;3显著6控制价格差x1=0.2元,投入广告费x2=6.5百万元销售量预测区间为[7.8230,8.7636](置信度95%)上限用作库存管理的目标值下限用来把握公司的现金流若估计x3=3.9,设定x4=3.720112232ˆˆˆˆˆ8.2933yxxx(百万支)销售量预测22322110ˆˆˆˆˆxxxy价差x1=它厂价x3-公司价x4估计x3,调整x4控制x1预测y得则可以95%的把握知道销售额在7.83203.729(百万元)以上75.模型改进x1和x2对y的影响独立20112232yxxx20112232412yxxxxx参数参数估计值置信区间17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p0.0001s2=0.04260123参数参数估计值置信区间29.1133[13.701344.5252]11.1342[1.977820.2906]-7.6080[-12.6932-2.5228]0.6712[0.25381.0887]-1.4777[-2.8518-0.1037]R2=0.9209F=72.7771p0.0001s2=0.049030124x1和x2对y的影响有交互作用比较:置信区间,R28比较:两模型销售量预测控制价格差x1=0.2元,投入广告费x2=6.5百万元21422322110ˆˆˆˆˆxxxxxy22322110ˆˆˆˆˆxxxy2933.8ˆy(百万支)区间[7.8230,8.7636]区间[7.8953,8.7592]3272.8ˆy(百万支)预测区间长度更短略有增加yˆ9x2=6.5x1=0.2-0.200.20.40.67.588.59x1yˆ-0.200.20.40.67.588.59x1yˆ56787.588.599.510x2yˆ567888.599.51010.5x2yˆ20112232ˆˆˆˆˆyxxx20112232412ˆˆˆˆˆyxxxxx6.比较:两模型与x1,x2的关系yˆ10讨论:交互作用影响•价格差x1=0.1•价格差x1=0.32221.06712.07558.72267.30ˆ1xxyx2223.06712.00513.84535.32ˆ1xxyx21422322110ˆˆˆˆˆxxxxxy5357.72x广告投入y(x2大于6百万元)价格差较小时增加的速率更大56787.588.599.51010.5x1=0.1x1=0.3x2yˆ1.03.011ˆˆxxyy价格优势y价格差较小广告作用大x1x22122214777.16712.06080.71342.11133.29ˆxxxxxy11多元二项式回归命令:rstool(x,y,’model’,alpha)nm矩阵显著性水平(缺省时为0.05)n维列向量由下列4个模型中选择1个(用字符串输入,缺省时为线性模型):linear(线性):mmxxy110purequadratic(纯二次):njjjjmmxxxy12110interaction(交叉):mkjkjjkmmxxxxy1110quadratic(完全二次):mkjkjjkmmxxxxy,111012完全二次多项式模型22521421322110xxxxxxyMATLAB中有命令rstool直接求解00.20.47.588.599.5105.566.57yˆ)ˆ,ˆ,ˆ,ˆ,ˆ,ˆ(ˆ543210从输出Export可得鼠标移动十字线(或下方窗口输入)可改变x1,x2,左边窗口显示预测值及预测区间yˆRstool(x,y,’model’,alpha,’xname’,’yname’)13牙膏的销售量建立统计回归模型的基本步骤•根据已知数据从常识和经验分析,辅之以作图,决定回归变量及函数形式(先取尽量简单的形式).•用软件(如MATLAB统计工具箱)求解.•对结果作统计分析:R2,F,p,s2是对模型整体评价,回归系数置信区间是否含零点检验其影响的显著性.•模型改进,如增添二次项、交互项等.•对因变量进行预测.14非线性回归实例选讲--酶促反应问题研究酶促反应(酶催化反应)中——嘌呤霉素(处理与否)——对反应速度与底物(反应物)浓度之间关系的影响.•酶促反应–由酶作为催化剂催化进行的化学反应–生物体内的化学反应绝大多数属于酶促反应–酶促反应中酶作为高效催化剂使得反应以极快的速度(103~1017倍)或在一般情况下无法反应的条件下进行–酶是生物体内进行各种化学反应最重要的因素15•建立数学模型,反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系•设计了两个实验–酶经过嘌呤霉素处理–酶未经嘌呤霉素处理•实验数据:底物浓度(ppm)0.020.060.11反应速度处理764797107123139未处理6751848698115底物浓度(ppm)0.220.561.10反应速度处理159152191201207200未处理131124144158160/方案1600.511.5050100150200250经嘌呤霉素处理xy00.511.5050100150200250未经嘌呤霉素处理xyxy011/222(半速度点)分析Michaelis-Menten模型xxxfy21),(待定系数=(1,2)基本模型酶促反应的速度底物浓度酶促反应的基本性质底物浓度较小时,反应速度大致与浓度成正比;底物浓度很大、渐进饱和时,反应速度趋于固定值数据分析17解决方案一:线性化模型经嘌呤霉素处理后实验数据的估计结果参数参数估计值(×10-3)置信区间(×10-3)15.107[3.5396.676]20.247[0.1760.319]R2=0.8557F=59.2975p0.00018027.195ˆ/1ˆ1104841.0ˆ/ˆˆ122xxy21xy111121对1,2非线性对1,2线性x12118线性化模型结果分析x较大时,y有较大偏差1/x较小时有很好的线性趋势,1/x较大时出现很大的起落0102030405000.0050.010.0150.020.0251/y1/xxy112100.511.5050100150200250xxy21xy线性化:参数估计时x较小(1/x很大)的数据控制了回归参数的确定改进:非线性模型19beta的置信区间[beta,R,J]=nlinfit(x,y,’model’,beta0)回归分析:非线性statisticstoolbox解释变量:矩阵模型的函数M文件名参数估计值残差参数初值被解释变量:列估计预测误差的Jacobi矩阵betaci=nlparci(beta,R,J)解决方案二:非线性化模型MATLAB统计工具箱20[beta,R,J]=nlinfit(x,y,’model’,beta0)%beta的置信区间MATLAB统计工具箱functiony=f1(beta,x)y=beta(1)*x./(beta(2)+x);xxy21x==…………;y=…………;beta0=[195.80270.04841];[beta,R,J]=nlinfit(x,y,’f1’,beta0);betaci=nlparci(beta,R,J);beta,betacibeta0~线性化模型估计结果Matlab程序21半速度点(达到最终速度一半时的底物浓度x值)为00.511.5050100150200250o~原始数据+~拟合结果非线性模型结果分析参数参数估计值置信区间1212.6819[197.2029,228.1609]20.0641[0.04570.0826]xxy21其他输出命令nlintool给出交互画面00.20.40.60.81-50050100150200250最终反应速度为6831.212ˆ10641.0ˆ2给出交互画面拖动画面的十字线,得y的预测值和预测区间画面左下方的Export输出其它统计结果。剩余标准差s=10.933722在同一模型中考虑嘌呤霉素处理的影响,用未经嘌呤霉素处理的模型附加增量的方法。混合反应模型xxy2112221211)(xxxxy)(底物浓度示性变量x2示性变量:x2=1表示经
本文标题:数学建模统计模型
链接地址:https://www.777doc.com/doc-6501820 .html