基于OpenCV的手势识别系统设计与开发-CFANZ编程社区

Support vector machines

Knowledge tree

前面章节讲到划分超平面，来区分红豆和绿豆

如何找到最优的超平面

结论：我们试图找到一个超平面，这个超平面可以使得与它最近的样本点的距离必须大于其他所有超平面划分时与最近的样本点的距离。

在SVM中，这叫间隔最大化。

此时我们可以说，我们找到了最优的超平面，但随着时代的变迁，红豆绿豆也发生了变化，比如下图的

那么接下来，我们要考虑的是，怎么进行低维和高维之间的转换。

当有人拿着棍子指着你时，你只能看到棍子的横截面，是一个点，它是一维的。我们无法将两个点区分开来。因为她们重叠了。
当有人拿着棍子指着其它地方，我们能看到整个棍子，这时候是二维的。我们可以一把刀劈开，把红豆和绿豆区分开。所以，红豆和绿豆虽然在一维的时候不能分开，但在二维时线性可分了。
也可能二维不可分，如下图
这时候我们可以把棍子看作三维中的棍子，有体积的。如果把棍子立在地上，很有可能红豆靠南侧，绿豆靠北侧，我们像劈柴一样从上至下即可劈开（分开），也一样是线性可分。
如果三维还不能线性可分，那就升到思维

总会从某一个维度开始，它变成线性可分了，即只要不断的增加维度（特征）总能区分开来

同时，我们发现高维中的超平面，映射到低维空间中时，可能会变成曲线或其它的划分形式。

这也就是为什么，在SVM中我们同样使用超平面来划分，SVM可以划分非线性的数据集。

它本质上仍然是线性超平面，不过是高维中的线性超平面。

那么升维一定会线性可分吗？

会不会升到无穷维了仍然线性不可分？

答案是不会的，首先要明白，我们的数据集一定是基于真实的某种分布，分为A类的样本和B类的一定在本质上有区别。只要有区别，就一定可以区分开来，一定在某个高维度上线性可分。

另外，总能上升到有个维度空间中线性可分，无限上升的同时有没有可能在N+1维度又不可分了？

不会，随着维度的上升，我们获得的信息越来越多。当第N维的数据已经足够划分时，更多的信息量并不会出现又不可分的情况。

Summarization

Support vector machines

函数间隔：

几何间隔：

这里使用的是几何间隔，前面讲到这里就不重复了

最大间隔分离超平面：

目前讲的是线性超平面

式子如下：

进行推导

2.求minL(w,b,α)对α的极大，即是对偶问题

3.求max转换成min：

接下来就是求解α的问题了，但是我们还得解决另外的一个问题

Maximum soft interval

目前的问题：

式子中间有xi核xj的点积

例如在手写数字数据集中，训练集有6万个样本，6万乘6万勉强能接受

但如果每个样本有784维，6万样本两两做点积，是非常慢的。如果x是更高的维度呢？

梳理一下：

由于公式的需要，我们需要计算xi和xj的点积
此外，我们需要将样本映射到高维去，加入映射函数ø(x)，那么ø(xi)和ø(xj)的维度数目进一步扩大，它们的点积会让运算变得极其复杂
我们希望存在一个函数K(xi,yi)=ø(xi)×ø(xj)，但函数K的计算方式更简单。也就是说，我们将样本通过函数升维得到ø(xi)和ø(xj)，接下来要计算它们的点积，能不能有个简单的计算公式，计算出来的结果和ø(xi)×ø(xj)一样？那样我们就不用再去算ø(xi)和ø(xj)的结果了，直接用简单方式计算不是更好吗？

这个简便方式，就是核函数

在SVM中，我们通常使用高斯核: