支持向量机（SVM）（五）--软间隔,支持向量机通俗导论(理解SVM的三层境界)

支持向量机（SVM）（五）--软间隔

摘要：

当我们在上一节中谈到线性SVM时，文章末尾提到，当线性是可分离的时，我们可以找到一个支持向量来获得b，但当出现以下示例时，一些异常点导致了线性不可分割性。在这种情况下，SVM提出了一个软区间。与硬区间相比，线性SVM被简单地视为硬区间。那么，从超平面一侧的样本到超平面的函数距离至少为1。当减去$xi$时，这意味着允许一些样本穿过支持向量并开始朝向另一侧$xi$也可以理解为当它位于另一侧时，从离群值到支持向量的函数距离。

上一节讲线性SVM时，文末提到在线性可分的情况下，找到一个支持向量，可求得b

但是当出现下图实例时，一些异常点导致的线性不可分

支持向量机（SVM）（五）--软间隔第1张

针对这种情况SVM提出了软间隔（soft margin），相对于硬间隔来说，简单将线性SVM看做硬间隔。

回顾硬间隔时优化目标：

min $frac{1}{2}left | w_{2} ight |_{2}^{2}$

$s.t y_{i}(wcdot x_{i}+b)≥1$

在软间隔中，我们给每个样本点的函数距离减去了一个松弛变量（ slack variable）：

$y_{i}(wcdot x_{i}+b)≥1-xi $

且$xi≥0$

Tips：

如何理解软间隔的几何含义？

原本我们希望有所的点到超平面的几何距离≥1，最后简化为函数距离。（这里不懂回顾线性SVM）

那么在超平面一侧的样本到超平面的函数距离最小为1，当减去$xi$时，表明允许部分样本跨越支持向量，向着另一侧出发。

$xi$还可以理解为离群点在另一侧时，该点到支持向量的函数距离。这样就引入了线性不可分问题。

支持向量机（SVM）（五）--软间隔第2张

文末有详细的讨论过程。

但是这个松弛变量的加入是有代价的，我们在优化目标中加入了惩罚项（这里惩罚项可以看做是正则化）

min $frac{1}{2}left | w_{2} ight |_{2}^{2}+Csum xi _{i}$

$s.t y_{i}(wcdot x_{i}+b)≥1-xi$

$xi≥0$

这里C>0，C越大表示我们对误分类惩罚越大，C可以根据样本点中重要程度调整。

优化目标函数：

$L(w,b,xi ,alpha ,mu )=frac{1}{2}left | w ight |_{2}^{2}+Csum xi _{i}-sum alpha _{i}left [ y_{i}(wcdot x_{i}+b)-1+xi _{i} ight ]-summu _{i} xi _{i}$

其中$mu _{i}>0, alpha _{i}>0$.（此处为什么大于零不懂去看KKT条件）

优化目标变成：

支持向量机（SVM）（五）--软间隔第3张

和线性SVM一样，对$w,b,xi $求偏导

$frac{partial L}{partial w}=0Rightarrow w = sum a_{i}y_{i}x_{i}$

$frac{partial L}{partial b}=0Rightarrow b = sum a_{i}y_{i}$

$frac{partial L}{partial xi }=0Rightarrow C-alpha _{i}-mu _{i}Rightarrow C=alpha _{i}+mu _{i}$

带入L中，推导过程如下图（又是不知羞耻的盗图QAQ）：

支持向量机（SVM）（五）--软间隔第4张

发现一件神奇的事情，这里最后的化解结果和线性SVM一模一样，当然总得有不一样的地方，就是约束条件

现在的优化目标如下：

$underset{a}{max}=-frac{1}{2}sum sum a_{i}a_{j}y_{i}y_{j}x_{i}cdot x_{j}+sum a_{i}$

　　　　　　　　$s.t sum a_{i}y_{i}=0 （1）$

　　　　　　　 $C=alpha _{i}+mu _{i} （2）$

　　　　　　　 $mu _{i}>0, alpha _{i}>0 （3）$

由约束条件2和3可以得到$0leqslant alpha _{i}leqslant C$

最后的优化目标成为：

$underset{a}{min}=frac{1}{2}sum sum a_{i}a_{j}y_{i}y_{j}phi(x_{i}) cdotphi(x_{j})-sum a_{i}$

　　　　　　　　$s.t sum a_{i}y_{i}=0$

　　　　　　　　$0leqslant alpha _{i}leqslant C$

与线性SVM相比仅仅多了一个约束条件$0leqslant alpha _{i}leqslant C$，然后根据SMO算法得到$alpha _{i}$，最后求w，b。

对松弛变量的简单理解：

在$L(w,b,xi ,alpha ,mu )=frac{1}{2}left | w ight |_{2}^{2}+Csum xi _{i}-sum alpha _{i}left [ y_{i}(wcdot x_{i}+b)-1+xi _{i} ight ]-summu _{i} xi _{i}$中，

根据软间隔最大化时KKT条件的对偶互补条件

支持向量机（SVM）（五）--软间隔第5张

（下图与文中Tips中的图不一样的地方是这里用的是离群点的几何距离）

支持向量机（SVM）（五）--软间隔第6张

参考：

http://www.cnblogs.com/pinard/p/6100722.html

https://www.bilibili.com/video/av23933161/?p=26

免责声明：文章转载自《支持向量机（SVM）（五）--软间隔》仅用于学习参考。如对内容有疑问，请及时联系本站处理。

支持向量机（SVM）（五）--软间隔

相关文章

线性支持向量机 (3)

libsvm代码阅读：关于svm_train函数分析（转）

Halcon学习笔记之支持向量机（一）

PythonOpencv-分类器—SVM，KNearest，RTrees，Boost，MLP

超详细SVM（支持向量机）知识点

线性支持向量机（1）

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表