ppt-2013-Deconvolutional Networks

DeconvolutionalNetworksMatthewD.ZeilerGrahamW.TaylorRobFergusDept.ofComputerScience,CourantInstitute,NewYorkUniversityMattZeiler Overview• “Generative”imagemodel• Convolutionalformofsparsecoding• Poolingwithlatentvariables(what/where)– Integratedintocostfunction(diﬀerentiable)• LearnfeaturesforobjectrecognitionTalkOverview• Singlelayer– ConvolutionalSparseCoding– GaussianPooling• Multiplelayers– Multi-layerinference– Filterlearning• Relatedwork• ExperimentsTalkOverview• Singlelayer– ConvolutionalSparseCoding– GaussianPooling• Multiplelayers– Multi-layerinference– Filterlearning• Relatedwork• ExperimentsRecap:SparseCoding(Patch-based)• Over-completelineardecompositionofinputusingdictionaryDictionaryInput • regularizationyieldssolutionswithfewnon-zeroelements:• Outputissparsevector:yyDD1C(y,D)=argminpλ2Dp−y22+|p|1p=[0,0.3,0,...,0.5,...,0.2,...,0]ConvolutionalNetworks• Feed-forward:– Convolveinput– Non-linearity– Pooling• Supervised• Encoder-onlyInputImageConvolution(Learned)Non-linearityPoolingLeCun et al. 1998 FeaturemapsDeconvolutionalNetworks• Feed-back:– Unpoolfeaturemaps• Usinginferredlatentvariables– Convolveunpooledmaps• Learnedﬁlters• Unsupervised– Mustreconstructinput– Sparsityconstraint• Decoder-only– HavetoinferfeaturesInputImageConvolution(learned)Unpooling(latentvars.)FeaturemapsSparsityConstraint[Zeileretal.CVPR’10,ICCV’11] SingleLayerArchitecture* Σ InputimageyConvLayer1UnpoolLayer1UnpooledMapz1,1FeatureMapp1,11stLayerFilters|.|0.5 θ1,1f11,1 fC1,1 f1B,1 fCB,1 UnpoolingVars * UnpooledMapzK,1|.|0.5 θK,1UnpoolingVars * * Top Down • Decompositionofinputimage• Over-completeàper-elementsparsityconstraintGaussianUnpooling FeatureMapp!(1):µx,µy,x,y!(2):µx,µy,x,y!(3):µx,µy,x,y!(4):µx,µy,x,y(Un)poolingVariables!NeighborhoodN1N2N4Unpooledfeaturemapzxy• Eachunpoolingregionhasitsown2DGaussian • Gaussianweightsscaledbyfeaturemapactivation• Diﬀerentiablerepresentation(What) (Where) SingleLayerCostFunctionλ2FUθp−y22+|p|αInputImage FeatureMaps Reconstruction Sparsity(per-element) Reconstructedimage ˆy=kzk∗fkUnpooling[withGaussianparametersθ] zk=Uθpk12(featuremapindex) ˆy=kzk∗fkzk=Uθpkλ2FUθp−y22+|p|αSingleLayerCostFunctionInputImage FeatureMaps Reconstructedimage Unpooling[withGaussianparametersθ] Inferforeachimage Learned(shareacrossallimages) \frac{\lambda}{2} \| \textcolor{green}{F} U_{\textcolor{red}{\theta}} \textcolor{red}{p} -‐ y \|_2^2 + |\textcolor{red}{p}|_\alpha \hat{y}= \sum_k z_k * \textcolor{green}{f_k} \textcolor{red}{z_k} = U_{\textcolor{red}{\theta}} \textcolor{red}{p_k} 12(featuremapindex) SingleLayerInference• FeatureMapsp(What)– Fixconvolutionﬁltersfandpoolingvariablesθ – Convolutionalformofsparsecoding– UseISTA[Beck&TeboulleSIAMJ.ImagingSciences2009]:• Gradientsteponreconstructionterm(Quadratic)• Gradientsteponsparsityterm• Projecttobenon-negative• Poolingvariablesθ (Where)– Fixconvolutionﬁltersfandfeaturemapsp– Chainruleofderivativestoupdatemean&precisionofeachGaussianpoolingneighborhoodSingleLayerExample16FeatureMaps UnpooledFeatureMaps InputImage Unpooling Reconstruction Filters Convolution&Sum EffectofPoolingVariablesPixel-spaceprojectionsofsamplefeaturemapactivations Filtercoeﬃcients ReconstructionExamples TalkOverview• Singlelayer– ConvolutionalSparseCoding– GaussianPooling• Multiplelayers– Multi-layerinference– Filterlearning• Relatedwork• ExperimentsStackingtheLayers• Takepooledmapsasinputtonextlayer• Jointinferenceoveralllayers– Onlypossiblewithdiﬀerentiablepooling• Objectiveisreconstructionerrorofinputimage– Notlayerbelow,likemostdeepmodels• Sparsity&poolingmakemodelnon-linear– Noexplicitnon-linearities(e.g.sigmoid)OverallArchitecture(2layers)* Σ InputimageyConvLayer1ConvLayer2UnpoolLayer1UnpooledMapz1,1FeatureMapp1,11stLayerFilters2ndLayerFilters|.|0.5 z1,2 p1,2UnpoolLayer2θ1,2θ1,1zB,2 f11,1 fC1,1 f1B,1 fCB,1 UnpoolingVars * UnpooledMapzB,1FeatureMappB,1|.|0.5 θB,1UnpoolingVars * * Σ Σ Σ Σ * * * * * * pB,2θB,2f11,2 f1B,2 θ1,θ2p2• Considerlayer2inference:– Wanttominimizereconstructionerrorofinputimage,subjecttosparsity.– Updatefeaturemapsattop(p2)andpoolingvariables(θ1,θ2)frombothlayers• Updatefeatures(ISTA):1.Reconstructinput2.Computeerror3.Forwardprop.error4.Gradientstep5.Shrinkage• UpdateGaussianpoolingvariables:Combinetop-downwithbottom-uperrorChainruleto• Noexplicitnon-linearitiesbetweenlayers– Butstillgetverynon-linearbehaviorMulti-layerJointInferenceLayer1featuresp1ReconstructedinputyLayer2unpooledfeaturesz2L0.5SparsityLayer1unpooledfeaturesz1UnpoolVarsθ1Uθ1 Pθ1 F1 FT1 F2 FT2 ^ R2 R2 T Layer2featuresp2UnpoolVarsθ2Uθ2 Pθ2 ˆy−y22FilterLearning∂C∂F=zTλ(Fz−y)→0• Goal:updateconvolutionalﬁltersf• Fixedfeaturemapsp&poolingvariablesθ àfrominferenceonalltrainingimages• Over-constrainedleast-squaresproblem• UseConjugateGradients• NormalizetounitL2length&projectpositive• Learnﬁlterslayer-by-layer• Jointtrainingdoesn’tseemtoworkTwoLayerExamp

ppt-2013-Deconvolutional Networks

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

【西门子自动化课程】 (19)

铁路电子商务的安全性探讨

最全面的家具专卖店各类家具培训知识

水利水电工程项目建议书编制暂行规定

金融市场与金融工具3(XXXX)

药理学考试大纲

A集团公司技术创新体制分析（二）-----企业创新与技术创新

XX第一品牌策划案（DOC 3页）

双龙煤矿民爆物品管理制度1

组织边界的确定过程

相关文档

相关搜索

ppt-2013-Deconvolutional Networks

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

【西门子自动化课程】 (19)

铁路电子商务的安全性探讨

最全面的家具专卖店各类家具培训知识

水利水电工程项目建议书编制暂行规定

金融市场与金融工具3(XXXX)

药理学 考试大纲

A集团公司技术创新体制分析（二）-----企业创新与技术创新

XX第一品牌策划案 （DOC 3页）

双龙煤矿民爆物品管理制度1

组织边界的确定过程

相关文档

相关搜索

药理学考试大纲

XX第一品牌策划案（DOC 3页）