神经网络与深度学习讲义20151211

DRAFT编译时间：2015-12-1122:00《神经网络与深度学习》讲义NotesonArtiﬁcialNeuralNetworksandDeepLearning邱锡鹏xpqiu@fudan.edu.cn2015年12月11日DRAFT编译时间：2015-12-1122:00目录第一章绪论11.1总结和深入阅读.................................2第二章数学基础32.1向量.......................................32.1.1向量的模................................32.1.2向量的范数...............................32.2矩阵.......................................42.3矩阵的基本运算.................................42.3.1常见的矩阵...............................52.3.2矩阵的范数...............................52.4导数.......................................62.4.1常见的向量导数............................62.4.2导数法则................................62.5常用函数....................................72.5.1logistic函数...............................72.5.2softmax函数..............................72.6总结和深入阅读.................................9第三章机器学习概述103.1机器学习概述..................................10DRAFT编译时间：2015-12-1122:00II目录3.1.1损失函数................................123.1.2机器学习算法的类型..........................133.1.3机器学习中的一些概念.........................143.1.4参数学习算法..............................163.2线性回归....................................183.3线性分类....................................203.3.1两类分类................................203.3.2多类线性分类..............................223.4评价方法....................................263.5总结和深入阅读.................................27第四章感知器284.1两类感知器...................................294.1.1感知器学习算法............................294.1.2收敛性证明...............................304.2多类感知器...................................324.2.1多类感知器的收敛性..........................344.3投票感知器...................................354.4总结和深入阅读.................................36第五章人工神经网络385.1神经元......................................395.1.1激活函数................................395.2前馈神经网络..................................415.2.1前馈计算................................415.3反向传播算法..................................425.4梯度消失问题..................................455.5训练方法....................................465.6经验.......................................46邱锡鹏：《神经网络与深度学习》讲义编译时间：2015-12-1122:00目录III5.7总结和深入阅读.................................47第六章卷积神经网络486.1卷积.......................................486.1.1一维场合................................486.1.2两维场合................................496.2卷积层：用卷积来代替全连接.........................496.3子采样层....................................526.4卷积神经网络示例：LeNet-5..........................536.5梯度计算....................................546.5.1卷积层的梯度..............................556.5.2子采样层的梯度............................566.6总结和深入阅读.................................56第七章循环神经网络577.1简单循环网络..................................587.1.1梯度...................................597.1.2改进方案................................607.2长短时记忆神经网络：LSTM.........................617.3门限循环单元：GRU..............................617.4总结和深入阅读.................................62参考文献63索引65邱锡鹏：《神经网络与深度学习》讲义编译时间：2015-12-1122:00第一章绪论一个人在不接触对方的情况下，通过一种特殊的方式，和对方进行一系列的问答。如果在相当长时间内，他无法根据这些问题判断对方是人还是计算机，那么就可以认为这个计算机是智能的。—AlanTuring[1950]，《机器能思维吗？》让机器具备智能是人们长期追求的目标，但是关于智能的定义也十分模糊。AlanTur-ing在1950年提出了著名的图灵测试：“一个人在不接触对方的情况下，通过一种特殊的方式，和对方进行一系列的问答。如果在相当长时间内，他无法根据这些问题判断对方是人还是计算机，那么就可以认为这个计算机是智能的”。要通过真正地通过图灵测试，计算机必须具备理解语言、学习、记忆、推理、决策等能力。这也延伸出很多不同的学科，比如机器感知（计算机视觉、自然语言处理），学习（模式识别、机器学习、增强学习），记忆（知识表示）、决策（规划、数据挖掘）等。所有这些分支学科都可以看成是人工智能（ArtiﬁcialIntelligence，AI）的研究范畴。其中，机器学习（MachineLearning，ML）因其在很多领域的出色表现逐渐成为热门学科。机器学习的主要目的是设计和分析一些学习算法，让计算机从数据中获得一些决策函数，从而可以帮助人们解决一些特定任务，提高效率。对于人工智能来说，机器学习从一开始就是一个重要的研究方向，并涉及了概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。人工神经网络（ArtiﬁcialNeuralNetwork，ANN），也简称神经网络，是众多机器学习算法中比较接近生物神经网络特性的数学模型。人工神经网络通过模拟生物神经网络（大脑）的结构和功能，由大量的节点（或称“神经元”，或“单元”）和之间相互联接构成，可以用来对数据之间的复杂关系进行建模。Rosenblatt[1958]最早提出可以模拟人类感知能力的数学模型，并称之为感知器（Per-ceptron），并提出了一种接近于人类学习过程（迭代、试错）的学习算法。但感知器因其DRAFT编译时间：2015-12-1122:002第一章绪论结构过于简单，不能解决简单的异或（XOR）等线性不可分问题，造成了人工神经领域发展的长年停滞及低潮。直到1980年以后，GeoﬀreyHinton、YannLeCun等人将反向传播算法（Backpropagation，BP）引入到多层感知器[WilliamsandHinton,1986]，人工神经网络才又重新引起人们的注意，并开始成为新的研究热点。但是，2000年以后，因为当时计算机的计算能力不足以支持训练大规模的神经网络，并且随着支持向量机（SupportVectorMachines，SVM）等方法的兴起，人工神经网络又一次陷入低潮。直到2006年，HintonandSalakhutdinov[2006]发现多层前馈神经网络可以先通过逐层预训练，再用反向传播算法进行精调的方式进行有效学习。并且近年来计算机计算能力的提高（大规模并行计算，GPU），计算机已经可以训练大规模的人工神经网络。随着深度的人工神经网络在语音识别[Hintonetal.,2012]和图像分类[Krizhevskyetal.,2012]等任务上的巨大成功，越来越多的人开始关注这一个“崭新”的研究领域：深度学习。目前，深度学习技术在学术界和工业界取得了广泛的成功，并逐渐受到了高度重视。深度学习（DeepLearning，DL）是从机器学习中的人工神经网络发展出来的新领域。早期所谓的“深度”是指超过一层的神经网络。但随着深度学习的快速发展，其内涵已经超出了传统的多层神经网络，甚至机器学习的范畴，逐渐朝着人工智能的方向快速发展。本书主要介绍人工神经网络与深度学习中的基础知识、主要模型（卷积神经网络、递归神经网络等）以及在计算机视觉、自然语言处理等领域的应用。1.1总结和深入阅读若希望全面了解人工神经网络和深度学习的知识，可以参考如下材料：1.IanGoodfellow,AaronCourville,andYoshuaBengio.Deeplearning.BookinpreparationforMITPress,2015.URL⃝inMachineLearning,2(1):1–127,2009另外，网站也给出很好的教程，比如等。邱锡鹏：《神经网络与深度学习》讲义编译时间：2015-12-1122:00第二章数学基础2.1向量在线性代数中，标量（Scalar）是一个实数，而向量（Vector）是指n个实数组成的有序数组，称为n维向量。

神经网络与深度学习讲义20151211

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

基于QTP的自动化测试

城市环境总体规划大气-成都总规研讨会

K1356+340中桥桥面系施工方案

《数控加工编程与操作》理论考试模拟试题与答案

室内煤气和天然气泄漏报警装置

QC080000涉及标准讲解（PPT48页)

X年最新各行业薪酬报告

《北京市医师定期考核管理暂行办法》

集团公司安全教育管理办法

领导层检查表

相关文档

相关搜索