KNN算法

橙三吉。 提交于 2019-11-30 10:19:25

可以看到k-近邻算法就是通过距离来解决分类问题。这里我们解决的二分类问题,整个算法结构如下:
l 算距离
给定测试对象𝐼𝑡𝑒𝑚,计算它与训练集中每个对象的距离。
依据公式计算𝐼𝑡𝑒𝑚 与𝐷&,𝐷(,……𝐷*之间的相似度,得到𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷& , 𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷( , 𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷* .
l 找邻居
圈定距离最近的k个训练对象,作为测试对象的近邻。
将𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷& , 𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷( , 𝑆𝑖𝑚 𝐼𝑡𝑒𝑚,𝐷* 排序,若是超过相似度阈值𝑡,则放入邻居集合𝑁𝑁.
l 做分类
根据这k个近邻归属的主要类别,来对测试对象进行分类。
自邻居集合𝑁𝑁中取出前k名,查看它们的标签,对这k个点的标签求和,以多数决,得到𝐼𝑡𝑒𝑚可能类别。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!