机器学习之SVM支持向量机笔记
数学理论部分 1.svm支持向量机是什么? 如下图所示,SVM的目标就是寻找一条图中的黑线,使得这条线到两个分类的距离最大,即寻找最大间隔 2.超平面:我们定义那条黑线为超平面,函数公式为 ƒ(x)= w T x + b ,当ƒ(x)= w T x + b=0时为黑线处,大于或者小于分别表示一个类别。 3.分类:根据超平面我们可以进行如下定义,完成分类 【注】我们将类别 y i 定义为正负一是为了方便计算边界条件 ,就拿1分类举例,因为y i 为1,所以 yi(w T x + b )>=1仍然成立,这个分类的边界为 yi(w T x + b)=1,我们顺利的将标签y与特征x均放入了一个公式当中。 4.距离计算: 样本点到超平面距离为 ,样本之间的间隔为 4.1推导样本点到平面距离: 方法一: , ,两个公式联立可得 ,||w||为范数,是所有元素平方和再开方,w是一个方向向量 方法二:利用中学的距离公式,点到直线的距离公式 ,现在已知直线是ƒ(x)= w T x + b,所以 4.2推导:从3中可以知道分类的边界是 yi(w T x + b)=1,而 yi=1,所以w T x + b=1,于是单边间距为 ,总间距为 5.拉格朗日乘数法:对于多元函数 ƒ(x,y)在约束条件φ(x,y)情况下求极值可以使用拉格朗日乘数法,首先加入一个拉格朗日乘数λ,构造出拉格朗日函数 ,对 x、y