您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 数学模型培训案例分析(概率统计模型)
数学建模竞赛培训—概率统计模型钱夕元xyqian@ecust.edu.cn统计数据与模型选择收集数据—问题驱动(ApplicationDriven)人工收集:普查、调查、实验、观察….机器收集:网络、商务、遥感…..大数据时代(BigData)数据增加呈指数型:数据复杂、多样数据缩减和压缩缩减:用新的思路指导模型选择、预测和分类;压缩:了解数据结构有助于压缩储存和较好地重现统计数据类型统计数据分类按计量层次分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据实验的数据统计数据与模型选择数据预处理标准化缺失值异常值数据形式与分析一部分变量描述或预测另一部分变量人为设定因变量或自变量回归分析、判别分析等探究数据变量之间的关系聚类分析、因子分析历史数据预测未来时间序列分析观测若干次而不是长期纵向数据(面板数据)分析统计数据与模型选择寻找适合的模型探索性分析(ExploratoryDataAnalysis,EDA)横截面数据:因变量为数值类型回归分析、多元回归分析、逐步回归……非线性回归、分位数回归横截面数据:因变量为分类数据广义线性回归:logistic、probit回归判别分析、决策树、支持向量机多元数据各变量间关系:多元分析主成分分析、因子分析、聚类分析、典型相关分析时间序列数据AR、MA、ARMA、ARCH、GARCH、SV……概率统计模型案例分析概率模型回归模型Logistic模型Logistic回归概率模型2002MCM(B)飞机票超额预订问题航空公司通常可以让乘客免费预订机票。预订了机票的乘客,有可能会因为种种原因,不来乘飞机,这样,当飞机起飞时,就会有一些空位子白白浪费掉为了减少损失,航空公司往往采取超额预订飞机票的办法,即:允许乘客预订的机票数超过飞机上的座位数。但是,这样做,又会发生预订了机票的乘客乘不上飞机,被“挤掉”的情况。对于被“挤掉”的乘客,航空公司必须给予一定的赔偿。2002MCM(B)飞机票超额预订问题问题:航空公司应该采取怎样的超额预订策略,才能使自己损失最小,利润最大?问题分析:飞行费用:燃料费,人员工资,机场使用费,飞机保养费等,这些几乎都与乘客数无关,因此,作为近似,每次飞行的费用是一个常数;利润=机票费的收入-赔偿金-飞行费用;利润最大化:可以不必考虑飞行费用,只要(扣除赔偿金后)机票费的收入达到最大就可以了。2002MCM(B)飞机票超额预订问题模型假设:g——每张机票的价格(不考虑座位的等级,g是一个常数)b——给每个被“挤掉”的乘客的赔偿金M——飞机上的座位总数N——让乘客预订的机票数(由于是超额预订,所以必有N≥M)2002MCM(B)飞机票超额预订问题ξ——实际来乘飞机的乘客数ξ是一个随机变量,0≤ξ≤N)η——(扣除赔偿金后)机票费的收入η与ξ有关,是ξ的函数,也是一个随机变量0gMf()gMb(M)MN当时当时2002MCM(B)飞机票超额预订问题设ξ的概率分布为:η的数学期望,即航空公司(扣除赔偿金后)机票费的平均收入为:(目标函数)0NkEEf()f(k)P{k}}{kPNk,,2,1,001MNkkMgkP{k}[gMb(kM)]P{k}2002MCM(B)飞机票超额预订问题以每张机票的价格g为单位计算的(扣除赔偿金后)机票费平均收入为:gENMkMkkPMkgbMkkP10}{)]([}{NMkNMkNMkMkkPMkgbMkkPkkPkkP1110}{)]([}{}{}{NMkNkkPMkgbMkkkP10}{)]()[(}{。NMkkPMkgbE1}{)()1(2002MCM(B)飞机票超额预订问题实际来乘飞机的乘客数ξ服从什么分布?分析:共有N个乘客预订了机票,设每个预订了机票的乘客实际来乘飞机的概率都是p;作为近似,设每个乘客是否来乘飞机是相互独立的;N重贝努里试验(二项分布):~b(N,p)101kkNkNP(k)Cp(p),k,,...,N2002MCM(B)飞机票超额预订问题易知:NpEgENMkkPMkgbE1}{)()1(NMkkNkkNppCMkgbNp1)1()()1(原问题转化为:在M,b/g,p已知的情况下,求N使得上式取得最大值。2002MCM(B)飞机票超额预订问题最优化问题:由于变量N出现在求和上限和组合表达式中,难以用解析方法求解可以用逐个计算数值、比较大小的办法,求出它的最优解例如:M=300,b/g=0.2,p=0.99可见:当N=305时,达到最大值N301302303304305306307Eη/g297.93298.69299.18299.41299.44299.35299.192002MCM(B)飞机票超额预订问题固定M=300,选择不同的b/g,p0.990.980.970.950.940.13053103133173210.23053093123163200.33043083113153190.43043073113143180.5304307310314317pgb2002MCM(B)飞机票超额预订问题讨论:赔偿金与机票价的比值b/g,对于超额预订策略的影响不是很大;预订机票的乘客实际来乘飞机的概率p对超额预订策略有很大的影响:p稍微减少一点,N就可以增加很多。推广:考虑机票价分成各种等级;赔偿金不是简单地与机票价格成正比;各种乘客来不来乘飞机的概率不一样;各个乘客是否来乘飞机不相互独立;2002MCM(B)飞机票超额预订问题类似地:报童问题;产品加工(1997全国数模A题);马科维茨的均值--方差组合模型(MarkowitzMean-VarianceModel)在一定的风险水平上,投资者期望收益最大;在一定的收益水平上,投资者希望风险最小。(1990年诺贝尔经济学奖)回归模型1990年上海A题—脑血流量测定问题描述:为了测定脑血流量,让受试者吸入含有放射性同位素的气体。放射性同位素随血流进入头部,又由脑血流带出。同时,吸入肺部的放射性同位素由呼出气体带出。对头部的放射性计数率和呼出气的放射性计数率同时进行测试,测得一批数据(参见数据文件)已知头部计数率下降的速率与当时头部的计数率成正比,比例系数称为脑血流量系数。头部计数率上升的速率与当时呼出气的计数率成正比。要求建立数学模型,求出脑血流量系数。编号时间头部计数率呼出气计数率编号时间头部计数率呼出气计数率11.0015342231205.75225221.2515281534216.00199131.5014681054226.25175141.751378724236.50155152.001272498246.75137162.251162342257.00121072.501052235267.25107082.75947162277.5094093.00848111287.75830103.2575776298.00730113.5067452308.25650123.7559936318.50570134.0053125328.75500144.2547117339.00440154.5041712349.25390164.753698359.50350175.003266369.75310185.2528843710.0270195.5025531990年上海A题—脑血流量测定问题分析:其中:x(t)是时刻t时头部的计数率,y(t)是时刻t时呼出气的计数率1990年上海A题—脑血流量测定根据题意:)()(d)(dtpxtkyttx其中,k,p,q为常数.p为所求的脑血流量系数同时,根据放射性衰变原理,呼出气的放射性计数率减少的速率与当时呼出气的计数率成正比)(d)(dtqytty1990年上海A题—脑血流量测定联立得微分方程组:)(d)(d)()(d)(dtqyttytpxtkyttx初始条件:00)0()0(yyxx[x,y]=dsolve('Dx=k*y-p*x','Dy=-q*y','x(0)=x0','y(0)=y0','t')1990年上海A题—脑血流量测定解得:y=[223115341054724498342235162111765236251712864321111]';t=[1.001.251.501.752.002.252.502.753.003.253.503.754.004.254.504.755.005.255.505.756.006.256.506.75]';[b,bint]=regress(log(y),[ones(24,1)t]);0000()e()e()eqtptqtkykyxtxpqpqyty需估计未知参数:x0,y0,q,k,p对于y0,q:对第2式两边取对数,可化成线性回归1990年上海A题—脑血流量测定结果为:08411914361ˆˆy.,q.非线性回归(用全部数据):y=[2231153410547244983422351621117652362517128643211110000000000000]';t=[1.001.251.501.752.002.252.502.753.003.253.503.754.004.254.504.755.005.255.505.756.006.256.506.757.007.257.507.758.008.258.508.759.009.259.509.7510.0]';[b,r,J]=nlinfit(t,y,'yout',[8400,1.44]')functiony=yout(b,t)y=b(1)*exp(-b(2)*t);结果为:0100001500ˆˆy,q.1990年上海A题—脑血流量测定代入x(t)的表达式,估计x0,k,p441.500001010()e()ee()e1.51.5qtpttptkykykkxtxxpqpqpp非线性回归(可以变成线性吗?):031225040050x.,k.,p.X=[15341528146813781272116210529478487576745995314714173693262882552251991751551371211079483736557504439353127]'t=[1.001.251.501.752.002.252.502.753.003.253.503.754.004.254.504.755.005.255.505.756.006.256.506.757.007.257.507.758.008.258.508.759.009.259.509.7510.0]';[b,r,J]=nlinfit(t,x,‘xout',[5000,2,3]')functionx=xout(b,t)y0=10000;q=1.5;x=y0*b(2)/(b(3)-q)*exp(-q*t)+(b(1)-y0*b(2)/(b(3)-q))*exp(-b(3)*t);1990年上海A题—脑血流量测定线性、非线性回归或参数估计Matlab命令;结果统计分析;模型选择变量选择(逐步回归)预测评价异常点分析……Logistic模型(阻滞增长模型)2007年全国A题—中国人口预测中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。我国人口发展经历了多个阶段,近年来中国的人口发展出现了一些新的特点,例如,老龄化进
本文标题:数学模型培训案例分析(概率统计模型)
链接地址:https://www.777doc.com/doc-2331800 .html