通俗解释高中生能听懂的SVM本质和原理
当年SVM怎么被发明的? 任何机器学习都是套一个数学模型,然后求解数学模型的待求解参数。 SVM使用的是怎样的一个模型呢? 。现在把我们作为一发明者,看看下面这张图。知道一个算法原理最好的方法是研究它是怎么想出来的,不然直接看公式可能马上就记住了,但是过了段时间就会忘因为没有理解。 如果是下面这张图,我们怎么划分开这两组数据?最简单的方式就是 用一条直线 。现在我们已经发明了一种算法(事实上别人已经发明了,这种用一条直线划分开两组数据的算法叫做 线性回归 )。 既然一条直线能解决这个分类问题为何别人还要想发明其他算法呢?我们看看用一条直线划分数据进行分类这个算法的缺点 。我们看上面那个图和下面这个图有什么区别? 这两个图都能实现将两个数据划分开。但是上面那个图的直线,总是看起来很别扭好像差了点什么 。我们还是比较喜欢下面这种直线。 那下面这个图的直线有什么特征呢?怎么用数学量化这个特征呢?又如何指导算法让算法尽可能的选下面这种直线作为划分界线呢 ?解决这三个问题这就是SVM发明的初衷 用来划分两个分类的更好的直线有哪些特征?如何量化这些特征? 我们对比前面两张图,我们会发现 那个直线刚刚好就在数据中间。而不会贴着数据边缘 。那么 直线不会贴着数据边缘这句话怎么用数学来量化呢 ? 用理工科的思维就是问: 1. 边缘是什么? 2. 怎么量化直线与边缘的距离? 答: 边缘是