【ML-9-3】支持向量机--SMO算法原理

chenfei0

2020-02-24

目录

SVM优化目标函数
SMO算法的基本思想
SMO算法目标函数的优化
SMO算法两个变量的选择及计算阈值b和差值E
SMO算法流程总结

一、SVM优化目标函数

在SVM的前两篇里，我们优化的目标函数最终都是一个关于α向量的函数。而怎么极小化这个函数，求出对应的α向量，进而求出分离超平面我们没有讲。本篇就对优化这个关于α向量的函数的SMO算法做一个总结。

序列最小优化算法(Sequential minimal optimization, SMO)是一种用于解决SVM训练过程中所产生的优化问题的算法。于1998年由John Platt发明。

【ML-9-3】支持向量机--SMO算法原理

假定存在一个β*=(β1,β2,...,βm)是我们最终的最优解，那么根据KKT条件我们可以

计算出w和b的最优解，如下：

【ML-9-3】支持向量机--SMO算法原理

进而我们可以得到最终的分离超平面为:

【ML-9-3】支持向量机--SMO算法原理

拉格朗日乘子法和KKT的对偶互补条件为：

【ML-9-3】支持向量机--SMO算法原理

β、μ和C之间的关系为：

【ML-9-3】支持向量机--SMO算法原理

根据这个对偶互补条件，我们有如下关系式：

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

根据上式，我们得到以下式子，也就是说我们找出的最优的分割超平面必须满足下列的目标条件(g(x)):

【ML-9-3】支持向量机--SMO算法原理

拉格朗日对偶化要求的两个限制的初始条件为：

【ML-9-3】支持向量机--SMO算法原理

二、SMO算法的基本思想

从而可以得到解决问题的思路如下：

首先，初始化后一个β值，让它满足对偶问题的两个初始限制条件；
然后不断优化这个β值，使得由它确定的分割超平面满足g(x)目标条件；而且在优化过程中，始终保证β值满足初始限制条件。

备注：这个求解过程中，和传统的思路不太一样，不是对目标函数求最小值，而是让g(x)目标条件尽可能的满足。

上面优化式子比较复杂，里面有m个变量组成的向量β需要在目标函数极小化的时候求出。直接优化时很难的。利用启发式的方法/EM算法的思想，每次优化的时候，只优化两个变量，将其它的变量看成常数项，这样SMO算法就将一个复杂的优化算法转换为一个比较简单的两变量优化问题了。

整理可以发现β值的优化必须遵循以下两个基本原则：

每次优化的时候，必须同时优化β的两个分量；因为如果只优化一个分量的话，新的β值就没法满足初始限制条件中的等式约束条件了。
每次优化的两个分量应该是违反g(x)目标条件比较多的。也就是说，本来应当是大于等于1的，越是小于1违反g(x)目标条件就越多。

为了后面表示方便，我们定义：

【ML-9-3】支持向量机--SMO算法原理

认为β1、β2是变量，其它β值是常量，从而将目标函数转换如下：

【ML-9-3】支持向量机--SMO算法原理

三、SMO算法目标函数的优化

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

考虑β1和β2的取值限定范围，假定新求出来的β值是满足我们的边界限制的，即如下所示，可以通过看图，也可以通过代数计算得出：

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

当y1≠y2的时候，β1-β2=k；由于β的限制条件，我们可以得到：

【ML-9-3】支持向量机--SMO算法原理

当y1=y2的时候，β1+β2=k；由于β的限制条件，我们可以得到：

【ML-9-3】支持向量机--SMO算法原理

结合β的取值限制范围以及函数W的β最优解，我们可以得带迭代过程中的最优解为

【ML-9-3】支持向量机--SMO算法原理

然后根据β1和β2的关系，从而可以得到迭代后的β1的值：

【ML-9-3】支持向量机--SMO算法原理

求解β的过程中，相关公式如下：

【ML-9-3】支持向量机--SMO算法原理

四、SMO算法两个变量的选择及计算阈值b和差值E

可以发现SMO算法中，是选择两个合适的β变量做迭代，其它变量作为常量来进行优化的一个过程，那么这两个变量到底怎么选择呢?

每次优化的时候，必须同时优化β的两个分量；因为如果只优化一个分量的话，新的β值就没法满足初始限制条件中的等式约束条件了。
每次优化的两个分量应该是违反g(x)目标条件比较多的。也就是说，本来应当是大于等于1的，越是小于1违反g(x)目标条件就越多。

4.1、第一个β变量的选择

SMO算法在选择第一个β变量的时候，需要选择在训练集上违反KKT条件最严重的样本点。一般情况下，先选择0<β<C的样本点(即支持向量)，只有当所有的支持向量都满足KKT条件的时候，才会选择其它样本点。因为此时违反KKT条件越严重，在经过一次优化后，会让变量β尽可能的发生变化，从而可以以更少的迭代次数让模型达到g(x)目标条件

【ML-9-3】支持向量机--SMO算法原理

4.2、第二个β变量的选择

在选择第一个变量β1后，在选择第二个变量β2的时候，希望能够按照优化后的β1和β2有尽可能多的改变来选择，也就是说让|E1-E2|足够的大，当E1为正的时候，选择最小的Ei作为E2；当E1为负的时候，选择最大的Ei作为E2。

备注：如果选择的第二个变量不能够让目标函数有足够的下降，那么可以通过遍历所有样本点来作为β2，直到目标函数有足够的下降，如果都没有足够的下降的话，那么直接跳出循环，重新选择β1；

4.3、计算阈值b和差值E

在每次完成两个β变量的优化更新之后，需要重新计算阈值b和差值Ei。

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

同样的当β2的取值为: 0<β2<C的时候，我们也可以得到

【ML-9-3】支持向量机--SMO算法原理

最终计算出来的b为：

【ML-9-3】支持向量机--SMO算法原理

当更新计算阈值b后，就可以得到差值Ei为：

【ML-9-3】支持向量机--SMO算法原理

五、SMO算法流程总结

5.1、输入线性可分的m个样本数据{(x1,y1),(x2,y2),...,(xm,ym)}，其中x为n维的特征向量，y为二元输出，取值为+1或者-1；精度为e

【ML-9-3】支持向量机--SMO算法原理

【ML-9-3】支持向量机--SMO算法原理

5.2、按照β1k和β2k的关系，求出β1k+1的值：

【ML-9-3】支持向量机--SMO算法原理

5.3、按照公式计算bk+1和Ei的值；

【ML-9-3】支持向量机--SMO算法原理

5.4、检查函数y(i)*Ei的绝对值是否在精度范围内，并且求解出来的β解满足KKT相关约束条件，那么此时结束循环，返回此时的β解即可，否则继续迭代计算β2new,unt的值。

??

??

??

??

支持向量机算法

chenfei0

0 关注 0 粉丝 0 动态

相关推荐

手推支持向量机

在学长没说之前我其实也是鄙视支持向量机的，甚至都不咋用过，但是我看大家都会，那我也来手推一下好了，哈哈~找到一个最佳的分割平面~

dushine00 2020-08-09

如何使用支持向量机学习非线性数据集

支持向量机是监督机器学习模型，可对数据进行分类分析。实际上，支持向量机算法是寻找能将实例进行分离的优秀超平面的过程。如果数据像上面那样是线性可分离的，那么我们用一个线性分类器就能将两个类分开。正如我们所看到的，即使来自不同类的数据点是可分离的，我们也不能简

mogigo00 2020-05-21

支持向量机

在最初接到这个算法时，我们可能会一头雾水：这个名词好奇怪[问号脸]，怎么“支持”？本篇文章从“不适定问题”开始介绍SVM的思想，通过支撑向量与最大间隔引申到如何将其转换为最优化问题，并数学推导求解有条件限制的最优化问题。相信学完本篇之后，大家一定会对SVM

rein0 2020-05-03

python实现支持向量机之具体实现

Uses cvxopt to solve the quadratic optimization problem.Kernel function. Can be either polynomial, rbf or linear.The degree of t

jhshanyu00 2020-05-03

python实现支持向量机之理论基础（一）

支持向量机是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机；SVM还包括核技巧，这使它成为实质上的非线性分类器。SVM的的学习策略就是间隔最大化，可形式化为一个求解凸二次规划的问题，也等价于正则化的合页损失函

winmeanyoung 2020-05-01

[白话解析] 深入浅出支持向量机(SVM)之核函数

本文在少用数学公式的情况下，尽量仅依靠感性直觉的思考来讲解支持向量机中的核函数概念，并且给大家虚构了一个水浒传的例子来做进一步的通俗解释。在学习核函数的时候，我一直有几个很好奇的问题。Why 为什么线性可分很重要?Why 为什么低维数据升级到高维数据之后，

seekerhit 2020-01-30

SIGAI机器学习第十八集线性模型2

之前讲过SVM，是通过最大化间隔导出的一套方法，现在从另外一个角度来定义SVM，来介绍整个线性SVM的家族。线性支持向量机简介L2正则化L1-loss SVC原问题L2正则化L2-loss SVC原问题L2正则化SVC对偶问题L1正则化L2-loss SV

sxyhetao 2019-12-03

机器学习之支持向量机

支持向量机是建立在统计学习理论的 VC 维理论和结构风险最小原理基础上的，根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折中，以期获得最好的泛化能力。支持向量机的基本思想，简单地说，是通过某种事先选择的非线性映射，将输入向量映射到一个高维特征空

卖小孩的咖啡 2019-11-07

半监督学习（五）——半监督支持向量机

　　今天我们主要介绍SVM分类器以及它的半监督形式S3VM，到这里我们关于半监督学习基础算法的介绍暂时告一段落了。之后小编还会以论文分享的形式介绍一些比较新的半监督学习算法。　　支持向量机相信大家并不陌生吧？　　新的决策边界可以很好地将无标签数据分成两类，

卖小孩的咖啡 2019-11-01

机器学习中的算法(2)-支持向量机(SVM)基础

SVM对于大部分的普通人来说，要完全理解其中的数学是非常困难的，所以要让这些普通人理解，得要把里面的数学知识用简单的语言去讲解才行。我就是属于绝大多数的普通人，为了看明白SVM，看了不少的资料，这里把我的心得分享分享。

luozaifei 2016-06-13

机器学习A-Z～支持向量机

本文将介绍机器学习中一个非常重要的算法，叫做SVM，中文翻译支持向量机。首先看一组例子来解释这个算法。有一组数据如图所示，有红色的点和蓝色的点，代表了两种分类的数据，现在我们要做的是如何将这两种数据准确的分隔开来。那么svm要做的就是找到最佳的一条直线。那

AmbiRF 2019-07-01

机器学习之——机器学习中的算法(2)-支持向量机(SVM)基础

SVM对于大部分的普通人来说，要完全理解其中的数学是非常困难的，所以要让这些普通人理解，得要把里面的数学知识用简单的语言去讲解才行。我就是属于绝大多数的普通人，为了看明白SVM，看了不少的资料，这里把我的心得分享分享。

刘利新西安 2015-12-17

机器学习实战_支持向量机（二）

支持向量机SVM的目标非常简单，找到一条直线划分两个类别，并让种类别之间保持了一条尽可能宽敞的街道，其被称为最大间隔分类。我们注意到添加更多的样本点在“街道”外并不会影响到判定边界，因为判定边界是由位于“街道”边缘的样本点确定的，这些样本点被称为“支持向量

雅言敦行 2019-06-27

机器学习实战_支持向量机（一）

支持向量机支持向量机的思路和logistic回归的不同点：一个考虑局部，一个考虑全局。Y∈{+1， -1}是样本的标签，分别代表两个不同的类。这里我们需要用这些样本去训练学习一个线性分类器（超平面）：f=sgn，也就是wTx + b大于0的时候，输出+1，

yonezcy 2019-06-27

机器学习系列19：将核函数应用于支持向量机

当我们在已知参数的情况下，如何用带有核函数的支持向量机去训练假设函数呢?我们最小化下面这个函数的时候，就可以得到参数向量：。现在还有两个系数没有选择，C 和 σ^2 。现在我们用数据实际观察一下 C 对 SVM 的影响。特征 f 变化激烈，因此表现为高方差

不系之舟讨论群0 2019-06-18

机器学习系列17：支持向量机

支持向量机是一种强大的机器学习算法，和神经网络相比，它在学习复杂的非线性方程时，能够提供更清晰和更加强大的方式。为了学习支持向量机，我们可以先从逻辑回归开始，看看如何经过小小的改动能得到支持向量机。我们把这个图像稍微修改一下，趋势与逻辑回归相似，就变成了支

itaquestion 2019-06-15

机器学习：支持向量机(SVM)算法

支持向量机，作为传统机器学习的一个非常重要的分类算法，它是一种通用的前馈网络类型，最早是由Vladimir N.Vapnik 和 Alexey Ya.Chervonenkis在1963年提出，目前的版本是Corinna Cortes 和 Vapnik在19

HandsomeFuHS 2019-05-07

SVM（支持向量机）算法原理和实际应用

SVM算法是有监督的数据挖掘算法，是一种二分类算法, 在非线性分类方面有明显优势；选择一个svm实现lib或软件，将准备好的这些向量和label带入训练，调整参数得到效果满足要求的模型。

SystemArchitect 2018-08-13

从大间隔分类器到核函数：全面理解支持向量机

在这篇文章中，我们希望读者能对支持向量机的工作方式有更高层次的理解。因此本文将更专注于培养直觉理解而不是严密的数学证明，这意味着我们会尽可能跳过数学细节而建立其工作方式的直观理解。因此 Statsbot 团队将在不使用高深数学的前提下向各位读者介绍 SVM

黄刚的技术 2017-10-08

“学”、“习”二合一：监督学习——支持向量机（SVM）入门

当你正在处理文本分类问题，当你正在改进你的训练集，也许你已经尝试使用Naive Bayes。但是现在你对数据集分类有信心，并希望进一步了解整个数据集的特征。我想支持向量机：一种快速可靠的分类算法，可以在有限的数据量下帮你做的更好。SVM算法背后的思想很简单

PeterHuang0 2017-06-30

chenfei0

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号