反向传播解析

天行九歌

2018-10-06

关注关注

反向传播是训练人工神经网络，特别是深度神经网络的常用方法。需要反向传播来计算梯度，我们需要调整权重矩阵的权重。通过计算损失函数的梯度来调整神经网络的神经元（即节点）的权重。为此目的，使用梯度下降优化算法。它也被称为误差的反向传播。

一个比喻可能会有帮助:想象你自己被放在一座山中，不一定是在山顶，在晚上被大雾包围。让我们进一步想象这座山在一个岛上，你想达到海平面。

你必须往下走，但你几乎看不到任何东西，可能只有几米。你的任务是找到你的路，但是你看不到路。你可以用梯度下降法。这意味着你正在检查你当前位置的陡度。你将沿着最陡的下降方向前进。
你只走了几步，然后又停下来重新定位自己。这意味着您正在再次应用前面描述的过程，即您正在寻找最陡的下降。

反向传播解析

这样下去，你将到达一个没有进一步下降的位置，每个方向都向上。你可能已达到最低处（全局最低），但你也可能陷入一个盆地。

总之，如果在这个理论岛上随机放置很多次，你会发现向下到海平面的方法。这就是我们训练神经网络时要做的。

实际的反向传播程序

假设我们从一个简单的（线性）神经网络开始：

反向传播解析

使用与权重关联的以下示例值：

反向传播解析

我们有标签，即每个输出值o的目标值或期望值t。误差是目标和实际输出之间的差异：

反向传播解析

我们稍后将使用平方误差函数，因为它具有更好的算法特性。

反向传播解析

我们将看一下输出值o1o1，它取决于值w11w11，w21w21，w31w31和w41w41。假设计算值（o1o1）为0.92，期望值（t1t1）为1.在这种情况下，误差是

反向传播解析

根据此误差，我们必须相应地更改传入值的权重。我们有四个权重，所以我们可以均匀地分散误差。然而，根据权重值，按比例进行比较更有意义。这意味着我们可以计算w11w11中误差e1e1的分数：

反向传播解析

这意味着在我们的示例中：

反向传播解析

隐藏和输出层之间的权重矩阵中的总误差如下所示：

反向传播解析

左矩阵中的分母始终相同。这是一个缩放因子。我们可以删除它，以便计算变得更简单：

反向传播解析

该示例已经证明了线性神经网络的基本场景的反向传播。

现在让我们回顾一下在线神经网络的反向传播（即具有激活函数）。

误差函数的推导描述了斜率。当我们希望下降时，推导描述了当权重w改变时误差E如何变化：

反向传播解析

好吧，假设在所有输出节点ojoj（j = 1，... nj = 1，... n）上的误差函数E，其中n是输出节点的数量是：

反向传播解析

我们可以在推导中加入这个

反向传播解析

我们可以彼此独立地计算每个输出节点的误差，并且我们除去了总和。这是节点j的误差，例如：

反向传播解析

应用链式法则，我们在微积分中学过的微分，在上一项中，来简化

反向传播解析

假设一个Sigmoid激活函数，其微分很简单:

反向传播解析

基本神经网络训练数学:

反向传播解析

****

综上所述：

反向传播解析

权重

天行九歌

0 关注 0 粉丝 0 动态

关注关注

不用SMOTE算法，我们如何处理多类不平衡数据？

机器学习中的一个常见问题是处理不平衡数据，其中目标类中比例严重失调，存在高度不成比例的数据。如果不能处理好这个问题，模型将会成为灾难，因为使用类不平衡数据建模会偏向于大多数类。处理不平衡数据有不同的方法，最常见的是过采样和创建合成样本。SMOTE是一种从数

FromCybertron 2020-10-06

卷积神经网络中的参数共享/权重复制

参数共享或权重复制是深度学习中经常被忽略的领域。但是了解这个简单的概念有助于更广泛地理解卷积神经网络的内部。卷积神经网络能够使那些通过网络馈送的图像在进行仿射变换时具有不变性。这个特点提供了识别偏移图案、识别倾斜或轻微扭曲的图像的能力。仿射不变性的这些特征

fengzhimohan 2020-07-23

为什么说神经网络可以逼近任意函数？

本文主要介绍神经网络万能逼近理论，并且通过PyTorch展示了两个案例来说明神经网络的函数逼近功能。大多数人理解"函数"为高等代数中形如"f=2x"的表达式，但是实际上，函数只是输入到输出的映射关系，其形式是多样的。

JianshuMOOC 2020-07-22

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

每个在自定义层中使用Keras函数式API的用户都要注意了！使用用Keras的Functional API创建的权重，可能会丢失。这一话题在Reddit机器学习板块上被热议，引起不少TensorFlow用户共鸣。也就是说，原本需要训练的权重现在被冻结了。让

Niteowl 2020-07-15

利用Keras中的权重约束减少深度神经网络中的过拟合

权重约束提供了一种方法，用于减少深度学习神经网络模型对训练数据的过度拟合，并改善模型对新数据的性能。有多种类型的权重约束，例如最大和单位向量规范，有些需要必须配置的超参数。如何使用Keras API创建向量范数约束。约束是按层指定的，但是在层中应用和强制执

zhongkeli 2020-07-14

keras读取h5文件load_weights、load代码操作

关于保存h5模型、权重网上的示例非常多，也非常简单。主要有以下两个函数：。load_model代码包含load_weights的代码，区别在于load_weights时需要先有网络、并且load_weights需要将权重数据写入到对应网络层的tensor中

jiuniangyuanzikk 2020-06-14

数据分析中样本类别分布不均衡问题

所谓不均衡指的是不同类别的样本量差异非常大。从数据规模上分为大数据分布不均衡和小数据分布不均衡两种。大数据分布不均衡：数据规模大，其中的小样本类的占比较少。但从每个特征的分布来看，小样本也覆盖了大部分或全部特征。例如：1000万条数据，其中占比50万条的少

Cocainebai 2020-06-08

k8s学习-集群调度

Scheduler 是 kubernetes 的调度器，主要的任务是把定义的 pod 分配到集群的节点上。听起来非常简单，但有很多要考虑的问题：。Sheduler 是作为单独的程序运行的，启动之后会一直持续链接API Server，获取PodSpec.No

kjh00abc 2020-05-31

CSS2

background-repeat : repeat | no-repeat | repeat-x | repeat-y. background: transparent url repeat-y scroll center top ;CSS层叠性最后的执

福叔 2020-05-31

分布式负载均衡算法

负载均衡算法分为两类：一种是静态负载均衡，一种是动态负载均衡。将请求按顺序轮流地分配到每个节点上，不关心每个节点实际的连接数和当前的系统负载。采用源地址哈希法进行负载均衡，同一IP地址的客户端，当后端服务器列表不变时，它每次都会落到到同一台服务器进行访问。

seekerhit 2020-05-17

负载均衡

过载保护+异构服务器的负载均衡，怎么设计？负载均衡是指，将请求/数据分摊到多个操作单元上执行，关键在于均衡。然而，后端的服务器有可能硬件条件不同，能否根据异构服务器的处理能力来动态、自适应进行负载均衡，以及过载保护呢?负载均衡、故障转移、超时处理等细节也都

tinydu 2020-04-18

【机器学习】Bagging与Boosting算法原理小结

集成学习本身不是一个单独的机器学习算法，是通过构建并结合多个机器学习器来完成学习任务的思想。通常的集成学习的方法指的是同质个体学习器。同质个体学习器使用最多的模型是CART决策树和神经网络。

卖小孩的咖啡 2020-04-11

CNN卷积概念理解

CNN在做卷积的时候，每一层的输出是通过卷积的前向传播算法和反向传播算法，结合真实的标签，将前向传播的结果无限逼近具有真实标签，在此过程中不断的更新权重，形成具有真实标签类别信息的权重矩阵。利用训练高的权重矩阵去计算预测的输入数据，并产生一个结果，这个结果

卖小孩的咖啡 2020-03-23

空间权重矩阵的那些事(八)-球面距离权重矩阵

前段时间有人向我咨询了根据经纬度计算球面距离的方法，希望我出一篇文章，所以就有了这篇文章。必要文件可通过后台回复「地理经纬度」获取。我首先想到的是matlab的「jplv7」工具箱里的「distance」函数，下面是具体的程序内容：。% PURPOSE:

Canethui 2020-03-08

40纳秒完成图像分类，图像传感器自带神经网络登上Nature

AI芯片还可以怎么搞？登上Nature的研究带来新启发。整个过程既耗能又费时，就像眼睛把图像传给大脑。试想一下，如果人类眼睛可以直接处理图像——不用劳烦大脑，那视觉图像信息的处理速度岂不是可以大大提升？今天，Nature这篇新研究开拓性在于，直接让“眼睛”

fengzhimohan 2020-03-05

深度学习入门-chapter2_1

感知机的多个输入信号都有各自固有的权重，这些权重发挥着控制各个信号的重要性的作用。单层感知机的局限性在于只能分割表示线性空间，

minushuang 2020-02-26

了解css的两大特性

为什么只选择了body元素，但是所有元素的字体颜色都被改了，就是因为css属性具备继承性。继承性是指被包在内部的标签将拥有外部标签的样式性，即子元素可以继承父元素的属性。important（重要的），用来提升权重，并且它的权重是无限大的

lcyangcss 2020-02-15

CS231n-反向传播算法BP(2)

在前几篇文章中，我们学习到如何在训练集上设置权重，并由此计算出损失，其中loss是有两部分组成，分别是数据损失项和正则化项目。我们最终想要得到损失函数关于权重矩阵w的梯度表达式，然后进行优化。我们采用梯度下降算法，进行迭代运算，计算梯度进行权重的更新，并一

Happyunlimited 2020-02-02

负载均衡算法 - 基本实现

最近在比赛一个项目 , 是给Dubbo写一个负载均衡接口 , 其实dubbo已经实现了下面四种, 所以他做的不是这个单面负载均衡, 需要做双向负载均衡 , 负载均衡的权重取决于服务端,所以有些时候我们不知道如何计算权重, 权重受到很多因素影响 ,所以就需要

蜗牛慢爬的李成广 2020-02-02

安科网

反向传播解析

天行九歌

实际的反向传播程序

天行九歌

相关推荐

不用SMOTE算法，我们如何处理多类不平衡数据？

卷积神经网络中的参数共享/权重复制

为什么说神经网络可以逼近任意函数？

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

利用Keras中的权重约束减少深度神经网络中的过拟合

推荐算法集锦（补充）——近邻选择与算法拓展

keras读取h5文件load_weights、load代码操作

数据分析中样本类别分布不均衡问题

k8s学习-集群调度

CSS2

分布式负载均衡算法

负载均衡

【机器学习】Bagging与Boosting算法原理小结

CNN卷积概念理解

空间权重矩阵的那些事(八)-球面距离权重矩阵

40纳秒完成图像分类，图像传感器自带神经网络登上Nature

深度学习入门-chapter2_1

了解css的两大特性

CS231n-反向传播算法BP(2)

负载均衡算法 - 基本实现

天行九歌