您好,欢迎访问三七文档
?Lasso?——RobertTibshirani(1994)主讲人:林毓聪什么是Lasso?什么是Lasso?Lasso是最小二乘的一个改进核心是加入了惩罚项效果是变量选择开创了一个近二十年的领域喂饱了不少统计学家谈谈变量选择什么是变量选择?在回归模型中,选择最能够解释Y的解释变量的过程,称为变量选择。不做变量选择的后果:一、严重的多重共线性二、计算量大三、数据成本昂贵常见的变量选择方法:前进法、后退法、逐步回归法Lasso一张图理解LASSO!读心电脑的核心科技——视路建模什么是视路(visualpathway):(P1486.3)光反射入眼球产生视觉信号视觉信号被视网膜记录在案信号通过中转站(LGN)被传输到初级视觉皮层V1然后传到V2和V4于是我们希望建模,通过收集到部分数据即可知道你心中所想的三维动图(movie)Voxel(体素[vɔk'səl])一个体素约为,有几千个非干扰的神经元。(P1487.4;P1492.4)一个体素需要由多个特征特征features决定,可以被表示成26000维的向量。即:Voxel=c(Feature1,F2,F3……Fp)feature=c(位置,方向,滤器频率,观测间隔)若能找到一个模型,st(F1,F2……Fp)体素Model体素预测模型建立(encodingmodel)对于每一个给定的体素:给定λ,把样本分成V-1训练集与1个测试集,通过V-1个训练集带入Lasso,得到𝛽(𝜆)将𝛽(𝜆)放入测试集得估计值𝑌𝜏V个集合轮流做测试集,共得到V个预测值𝑌𝑘,𝜏(k=1,2…V)取方差即可得到平均预测误差取最小的预测误差的λ为模型的平滑参数把λ带入Lasso模型求解𝛽,得到最终模型(𝛽,𝜆)预测结果呈现(一):由图中可以看出,CV与ESCV的预测值与真实值的相关系数差距不大根据精确计算,CV.corr=0.506,ESCV.corr=0.499,仅差距1.3%预测结果呈现(二):精确计算发现,ESCV.ms=24.3features;CV.ms=58.8features,即Lasso+CV从26000维features中筛选出58.8个,解释能力为50.6%,Lasso+ESCV筛选出24.3features,解释能力为49.9%,降维能力超强!到这就算学会Lasso了吗?如何对Lasso式子的参数进行估计?Lasso具有oracle性质吗?是否能在Lasso基础上进行罚函数的拓展?R语言上如何运行Lasso?
本文标题:1-lasso介绍
链接地址:https://www.777doc.com/doc-5304284 .html