机器学习系列25：随机梯度下降算法

Qunicy

2019-07-09

如今机器学习的数据集动则几千万或上亿，如果运用我们之前学过的 Batch 梯度下降算法，就会发现效率很低，因为在梯度下降时，每次循环都要对所有的数据进行求和，这会浪费大量的时间。有没有更好的方法去处理大数据呢？答案是有的。我们在处理大数据时，会选择随机梯度下降算法（Stochastic gradient descent）。

下面是随机梯度下降算法的代价函数：

机器学习系列25：随机梯度下降算法

之后是随机梯度下降算法：

机器学习系列25：随机梯度下降算法

首先需要随机打乱所有的数据集，然后就到了算法的核心，这个算法有两层循环，外循环通常来说有 1-10 次，具体次数视问题而定；内循环遍历所有的数据集一次，相比 Batch 梯度下降算法 ，它不需要每次循环都遍历一遍数据集。

我们可以把 Batch 梯度下降算法和随机梯度下降算法运行过程画在一张图上：

机器学习系列25：随机梯度下降算法

红色的路线为 Batch 梯度下降算法的收敛路线，粉色为随机梯度下降算法的收敛路线。可以看到，随机梯度下降算法不一定每次都会进行收敛，但总体会朝着收敛的方向进行，最终收敛到全局最小处。

机器学习梯度下降随机算法算法梯度 jpg

安科网

机器学习系列25：随机梯度下降算法

Qunicy

Qunicy

相关推荐

关于机器学习算法的16个技巧

选择困难终结者：不同问题之下的机器学习算法

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何通过7个步骤构建机器学习模型

机器学习新风暴：如何用ML模型预测房价？

关于机器学习管道需要了解什么?

为什么所有的机器学习模型有90％从没有投入生产

LinkedIn开源Dagli，发布Java机器学习函数库

全面解读谷歌云人工智能如何为机器学习提供帮助

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

需要知识的后深度学习时代，如何高效自动构建知识图谱

10个丰富自我的机器学习项目

机器学习如何颠覆金融行业

24个提高知识和技能极限的机器学习项目

IT自动化和人工智能将在2021年走向何方？

无监督机器学习的重要指南

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

理解AI：为什么要在人工智能系统中寻求可解释性呢？

机器学习的未来就在这里：高斯过程和神经网络是等价的

Python 用5行代码学机器学习—线性回归

Qunicy