svm支持向量机系列(4) --软间隔支持向量机

摘要:
1.硬区间表示示例的主要内容是每个点必须正确分离,这样在确保每个点正确分离之后,就会产生问题,这就是过度拟合的发生。为了解决过拟合问题,引入了软区间支持向量机,允许少量点出错。

1、主要内容

  硬间隔表示实例中的每个点都必须被正确分开, 这样在保证每个点都被正确分开后会造成一个问题就是过拟合的出现,为了解决过拟合问题,引入软间隔的支持向量机,允许少部分的点出错。上节课中讲了kernel技巧,就是将内积和特征转换这两步合成一个步骤来做,移除计算过程中对特征数量d的依赖:

  svm支持向量机系列(4) --软间隔支持向量机第1张

2、软间隔的定义

  svm的过拟合问题

  1 转换太过于powerfull

  2 坚持要将数据完美分开

  svm支持向量机系列(4) --软间隔支持向量机第2张

  为了解决上述的过拟合问题,我们需要放弃某些样本点,允许其出错;

  svm支持向量机系列(4) --软间隔支持向量机第3张

  结合pocket和hard-margin svm结合起来得出下面的问题:

  C越大对错误容忍越小,反之C越小对错误的容忍就越大。

  svm支持向量机系列(4) --软间隔支持向量机第4张

  对于上式可以整理成以下的形式:

  svm支持向量机系列(4) --软间隔支持向量机第5张

  对于上述式子,优化问题和条件中都存在符号函数,上式不是一个QP问题不能使用二次规划程序去解,同时不能区分错误的程度;

  svm支持向量机系列(4) --软间隔支持向量机第6张

  为了解决不能使用二次规划没有对偶形式不能使用kernel的缺陷也不能记录错误大小的缺陷使用下面的式子进行替换:

  svm支持向量机系列(4) --软间隔支持向量机第7张

  上面的式子中,使用边界违反最为错误的衡量,边界违反变量ξn >= 0,对于所有的数据点都成立,如果 ξn = 0,那么表示这个点没有错误, 1 > ξn > 0则表示该点依然在正确分类但是处在margin内部,ξn > 1,则表示该点是错误的,同样依据 ξn 的范围可以判断该点处在margin内还是margin外。

  使用上式之后,非QP问题转化成了QP问题:

  条件中:增加上了N个ξn 的一次限制;

  目标中:二次问题加上一个一次问题还是一个二次问题;

  综上:penalize:惩罚,对什么不利; violation :违反

  svm支持向量机系列(4) --软间隔支持向量机第8张

3、软间隔的对偶问题

  原始问题:

  svm支持向量机系列(4) --软间隔支持向量机第9张

  对偶问题使用拉格朗日乘子法进行对偶形式的推导:

  svm支持向量机系列(4) --软间隔支持向量机第10张

   使用KKT条件进行化简:

  1、化简αn和ξn

  对条件求微分为0:

   svm支持向量机系列(4) --软间隔支持向量机第11张

  将微分为0 的部分带入:

  svm支持向量机系列(4) --软间隔支持向量机第12张

  2、剩余部分化简

  对于上式和硬间隔的对偶形式相同:

  svm支持向量机系列(4) --软间隔支持向量机第13张

  最后可以得到:

  svm支持向量机系列(4) --软间隔支持向量机第14张

  对于上述问题也是一个凸函数,同样可以使用二次规划问题,与硬间隔唯一不同的就是 αn有了一个上限,限制条件:

  svm支持向量机系列(4) --软间隔支持向量机第15张

4、核函数软间隔支持向量机

  svm支持向量机系列(4) --软间隔支持向量机第16张

  与硬间隔不同之处在于限制条件:拉格朗日乘子不再是简单的大于0, 还存在一个上限C;那么此时的KKT条件发生了变化,如何从KKT条件去解b?

  svm支持向量机系列(4) --软间隔支持向量机第17张

  在硬间隔中:找到一个sv就可以去解b:

  svm支持向量机系列(4) --软间隔支持向量机第18张

  对于软间隔:

  svm支持向量机系列(4) --软间隔支持向量机第19张

  因此可以找到一个free sv然后进行b的求解,但是不是都有free sv,一般都会有,没有的话就是一个范围:

  svm支持向量机系列(4) --软间隔支持向量机第20张

5、软间隔支持向量机的实例

  svm支持向量机系列(4) --软间隔支持向量机第21张

  此时,对错误不敏感,因此会出现错误;

  svm支持向量机系列(4) --软间隔支持向量机第22张

  此时c = 10表示对错误的容忍度降低,尽量保证每个都被正确分类,此时却无很少;

  svm支持向量机系列(4) --软间隔支持向量机第23张

  c=100 对错误很敏感,保证每一个都正确分类,可能产生过拟合现象。

  综上c的三个不同的取值表明即使是软间隔的支持向量机也会产生过拟合的现象,因此在实际的使用中一定要注意参数的选择;

  svm支持向量机系列(4) --软间隔支持向量机第24张

  αn的物理含义:

  可以根据αn的取值的不同进行数据的分析,分析数据在边界内还是边界外以及是否是sv是否是 free sv:

  svm支持向量机系列(4) --软间隔支持向量机第25张

  形容bounded vector 当 c = α

6、模型的选择

  svm支持向量机系列(4) --软间隔支持向量机第26张

  选择的另一个方法:使用sv的数据去估计错误的上限;

  svm支持向量机系列(4) --软间隔支持向量机第27张

  使用支持向量的数量进行模型的选择时,需要注意得到的只是一个上限:

  svm支持向量机系列(4) --软间隔支持向量机第28张

  svm支持向量机系列(4) --软间隔支持向量机第29张

7、fun time

  svm支持向量机系列(4) --软间隔支持向量机第30张

   svm支持向量机系列(4) --软间隔支持向量机第31张

免责声明:文章转载自《svm支持向量机系列(4) --软间隔支持向量机》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Nhibernate 一对一关系映射(主键映射)php的cookie和session相同主域名共享下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

线性支持向量机 (3)

线性可分问题的支持向量机学习方法,对线性不可分训练数据是不适用的,因为这时上述方法中的不等式约束并不能都成立,因此这时候需要将硬间隔最大化,使其变成软间隔最大化。 假定给定特征空间上的训练数据集:T={(x1,y1),(x2,y2),...(xn,yn)},xi为第i个特征向量,yi为xi的类标记,一般情况下,线性不可分的数据主要在于存在部分特异点,除去这...

支持向量机(SVM)

一、概念   1、分离超平面:空间内能够将数据分为不同类别的平面   2、线性可分:不同类别数据能够被一个超平面完全分开   3、损失项:模型在数据上违反自身分类原则的程度(是一个求和项)    4、损失系数:损失项的系数(是一个超参数,由模型给定)   5、损失函数L = min (1/2*(||w||)2) + C*max(Σi max(0,1-y(i...

关于SVM数学细节逻辑的个人理解(二):从基本形式转化为对偶问题

第二部分:转化为对偶问题进一步简化 这一部分涉及的数学原理特别多。如果有逻辑错误希望可以指出来。 上一部分得到了最大间隔分类器的基本形式: 其中i=1,2,3...m 直接求的话一看就很复杂,我们还需要进一步简化。 这里就需要介绍拉格朗日乘子法。介绍它还是从最最简单的形式说起: 一.关于优化问题的最基本的介绍优化问题这里面有很多东西,我先给出参考过的资...

opencv3.1线性可分svm例子及函数分析

https://www.cnblogs.com/qinguoyi/p/7272218.html //摘自:http://docs.opencv.org/2.4/doc/tutorials/ml/introduction_to_svm/introduction_to_svm.html#include <opencv2/core/core.hpp>...

PCL行人检测

首先我们知道Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功,HOG+SVM进行行人检测的方法是法国研究人员Dalal在2005的CVPR上提出的,而如今虽然有很多行人检测算法不断提出,但基本都是以HOG+SVM的思路为主,那么PCL中也是利用这一思想来进行行人的检测, 总体思路: 1、提取正负样本hog特征 2、投入...

文本分类学习 (五) 机器学习SVM的前奏-特征提取(卡方检验续集)

前言: 上一篇比较详细的介绍了卡方检验和卡方分布。这篇我们就实际操刀,找到一些训练集,正所谓纸上得来终觉浅,绝知此事要躬行。然而我在躬行的时候,发现了卡方检验对于文本分类来说应该把公式再变形一般,那样就完美了。 目录:  文本分类学习(一)开篇  文本分类学习(二)文本表示  文本分类学习(三)特征权重(TF/IDF)和特征提取           ...