基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

天行九歌

2018-11-19

神经网络

神经网络可以理解为一个输入X到输出Y的映射函数，f(X)=Y，其中这个映射f就是我们所要训练的网络参数W，我们只要训练出来了参数W，那么对于任何输入x，我们就能得到一个与之对应的输出y。只要f不同，那么同一个x就会产生不同的y，我们当然是想要获得最符合真实数据的y了，那么我们就要训练出一个最符合真实数据的映射f，那么训练最符合真实数据f的过程就是神经网络的训练过程，神经网络的训练可以分为两个步骤：一个是前向传播，另外一个是反向传播。

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

神经网络

神经网络的前向传播

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

神经网络从输入层到输出层

前向传播就是从输入层开始（Layer1），经过一层层的Layer，不断计算每一层的z和a，最后得到输出y^的过程。

我们可以将神经网络分解为许多个神经元，每个神经元接收上一层的输入进行简单的逻辑回归操作，全部神经元从输入层开始到输出层依次进行逻辑回归的过程我们可以简单的理解为神经网络的前向传播。

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

单个神经元的逻辑回归

前向传播是从神经网络的输入层开始，逐渐往输出层进行前向传播，上一层的神经元与本层的神经元有连接，那么本层的神经元的激活等于上一层神经元对应的权值进行加权和运算，最后通过一个非线性函数（激活函数）如ReLu，sigmoid等函数，最后得到的结果就是本层神经元的输出。神经网络逐层逐神经元通过该操作向前传播，最终得到输出层的结果。

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

前向传播公式

我们通过公式可以看出来前向传播是从Layer1层到Layer4层，最终的a(4)就是神经网络的前向传播输出y^。

神经网络的反向传播

前向传播计算出了预测值y^，就可以根据y^和真实值y的差别来计算损失L(y^,y)，反向传播就是根据损失函数L(y^,y)来反方向地计算每一层的z、a、w、b的偏导数（梯度），从最后一层逐层向前去改变每一层的权重，也就是更新参数，其核心是损失L对每一层的每一个参数求梯度的链式求导法则。

现在我们有一个如下所示的神经网络，我们对其进行反向传播，来看一下反向传播的是怎样进行的?

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

反向传播示例

计算反向传播，我们首先需要通过前向传播的y^（output）和真实样本y（target）计算此时神经网络的损失，这个神经网络有两个输出，所以我们的损失应该是两个输出神经元损失的和：

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

神经网络的总损失E——L(y^,y)

我们先来看一下参数w5对整体误差产生了影响，可以用整体误差对w5求偏导，总体误差对w5求偏导的链式规则如下所示：

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

对参数w5求偏导

我们如图所示可以看到总损失E对W5求偏导，我们可以直接使用总损失对W5求偏导，它的效果和Eo1对W5求偏导是一样的，因为Eo2和W5并没有链式连接，所以Eo2对W5的偏导数为0。

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

对w5求偏导的链式法则

其中：

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

链式法则分解

我们对其进行整合：

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

对w1求导进行整合

这样我们就将损失对w5的偏导数求出来了，我们在来看一下总损失E对w1的偏导数的计算过程

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

对参数w1求偏导

我们知道反向传播的核心是链式求导，我们可以看到Eo1和Eo2都可以将损失传递给w1，所以我们可以分为两条链来对w1求偏导，一条链是Eo1对w1求偏导，另外一条链是Eo2对w1求偏导。

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

对w1求偏导

其中：

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

链式法则分解

对w5求偏导进行整合

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

w5求偏导进行整合

我们分别对w1和w5求偏导数，现在我们已经知道了如何对神经网络权重参数求解偏导数，这就是神经网络的反向传播算法，求出偏导数之后，我们下面的任务就是进行梯度下降从而更新参数。

基于经典的前向传播算法和反向传播算法共同完成神经网络的训练

梯度下降

神经网络就是通过不断的前向传播和反向传播不断调整神经网络的权重，最终到达预设的迭代次数或者对样本的学习已经到了比较好的程度后，就停止迭代，那么一个神经网络就训练好了。

反向传播算法神经网络算法算法

天行九歌

0 关注 0 粉丝 0 动态

相关推荐

TensorFlow从0到1之TensorFlow实现反向传播算法（21）

反向传播算法是神经网络中研究最多、使用最多的算法之一，它用于将输出层中的误差传播到隐藏层的神经元，然后用于更新权重。学习 BPN 算法可以分成以下两个过程：。在输出层，计算误差和损失函数。这两个过程重复迭代直到收敛。现在已经有方程了，看看如何在Tensor

bluewelkin 2020-06-08

多元函数链式法则与反向传播算法的实例推演

　　反向传播算法基于多元函数链式法则，以下记录多元函数链式法则的证明与反向传播算法的实例推演。　　如果函数$u=\varphi$及$v=\psi$都在点$t$可导，函数$z = f(u,v)$在对应点$(u,v)$具有连续偏导数（重点），那么复合函数$z

wulaxiaohei 2020-06-06

CS231n-反向传播算法BP(2)

在前几篇文章中，我们学习到如何在训练集上设置权重，并由此计算出损失，其中loss是有两部分组成，分别是数据损失项和正则化项目。我们最终想要得到损失函数关于权重矩阵w的梯度表达式，然后进行优化。我们采用梯度下降算法，进行迭代运算，计算梯度进行权重的更新，并一

Happyunlimited 2020-02-02

读懂反向传播算法（bp算法）

反向传播算法可以说是神经网络最基础也是最重要的知识点。基本上所以的优化算法都是在反向传播算出梯度之后进行改进的。同时，也因为反向传播算法是一个递归的形式，一层一层的向后传播误差即可，很容易实现。不要被反向传播吓到，掌握其核心思想就很容易自己手推出来。我们知

dushine00 2020-01-08

机器学习分享——反向传播算法推导

反向传播是“误差反向传播”的简称，是一种与最优化方法结合使用的，用来训练人工神经网络的常见方法。该方法对网络中所有权重计算损失函数的梯度。这个梯度会反馈给最优化方法，用来更新权值以最小化损失函数。我们对此进行了汉化，并提供了相关的代码。这样误差反向传播法就

mori 2019-07-01

吴恩达机器学习笔记-反向传播算法练习

直观感受反向传播的概念上篇文章讲述了神经网络的反向传播算法的基本概念，现在来详细的对此算法进行一些讲解。回忆一下神经网络的代价函数：。直观的说，$\delta_j^$项表示在第l层中第j个单元的误差。更正式的说，$\delta$的值实际上是代价函数的导数。

dushine00 2019-06-28

机器学习系列12：反向传播算法

采用如下方法，先进行前向传播算法，然后再进行反向传播算法，反向传播算法与前向传播算法方向相反，它用来求代价函数的偏导数。这种算法的思想就是运用导数估计值去对导数真实值进行检验，去检查反向传播算法运行时是否存在 bug。

rioalian 2019-06-01

改进反向传播算法实现高效训练，端到端的目标跟踪结构

呜啦啦啦啦啦啦啦大家好，本周的AI Scholar Weekly栏目又和大家见面啦！AI Scholar Weekly是AI领域的学术专栏，致力于为你带来最新潮、最全面、最深度的AI学术概览，一网打尽每周AI学术的前沿资讯。周一更新，做AI科研，每周从这一

seekerhit 2019-04-29

零基础深度学习入门：由浅入深理解反向传播算法

自从机器学习被引入到递归的非线性函数中以来，对相关内容的应用得到了充足的发展。在这种情况下，训练正确的神经网络是建立可靠模型最重要的方面。这种训练通常与"反向传播"一词联系在一起，这个术语对大多数新手来说是非常模糊的。这也是本文所存在的

wenxuegeng 2019-01-30

反向传播算法揭秘

机器学习最重要的一个方面是它能够识别输出中的误差范围，并能够随着越来越多的数据集通过其神经网络输入而更精确地解释数据。通常被称为反向传播，它是一个不像你想象的那么复杂的过程。有多个任务组成了这台机器，以便你最终得到你想要的。您还可以调整作为此过程一部分的每

zidingxiangyu 2018-11-07

基于机器学习的梯度检验技术验证神经网络的反向传播是否正常运行

假如此时的神经网络的损失函数如上所示，θ0处的导数，也就是上图中的蓝色直线的斜率，我们可以看到蓝色直线和红色直线的斜率很相似。所以我们可以认为J(θ)在θ处的导数几乎可以使用红色直线的斜率表示，红色直线的斜率为：。实际上，这个式子很好地表示了θ0点导数的近

葫芦与瓢 2018-12-03

Python实现的人工神经网络算法示例【基于反向传播算法】

本文实例讲述了Python实现的人工神经网络算法。分享给大家供大家参考，具体如下：。注意：本程序使用Python3编写，额外需要安装numpy工具包用于矩阵运算，未测试python2是否可以运行。本程序实现了《机器学习》书中所述的反向传播算法训练人工神经网

HTML学堂码匠 2017-11-11

反向传播算法推导

神经网络中权重 \ 的改变将影响到一个个下一层，到达输出层，最终影响代价函数。符号说明\网络层数\输出层第 \(j\) 类 label\第 \(l\) 层神经元个数\激励函数\第 \(l\) 层第 \(j\) 个单元与第 \ 层第 \(i\) 个单元之间的

SimonSsAlgo 2018-05-15

使用反向传播算法训练多层神经网络的原理【译】

里面通过通俗易懂的图示方式介绍了神经网络中的前向和后向传播的整个过程。图片来自原文，如果有侵权我会自行删除。这篇文章描述了采用反向传播算法的多层神经网络的训练过程。第一个单元是权重系数和输入型号的乘积和。

PaperWeekly 2018-02-25

天行九歌

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号