knn四种选择
auto
ball tree
kd tree
brute(暴力选择)
KNeighborsClassifier(更常用,适用于均匀采样数据)
RadiusNeighborsClassifier(非均匀采样数据)
权重参数weights选项:
uniform(数据的权重全部统一)
distance(与距离成反比)
自定义
维度超过20维使用Ball Tree,20维以下使用KD tree
当数据集小于30的时候,会自动使用brute
intrinsic dimensionality(本征维数)的意思就是
一条数据中非零数据有多少,当维度很大的数据中,本征维度很小的话,那么ball tree和kd tree很小
当K的值和N可比拟时,使用Brute进行暴力搜索更加划算。
KNN官方文档中KNN的各章节内容汇总如下:
来源:CSDN
作者:东方朔盗仙桃
链接:https://blog.csdn.net/appleyuchi/article/details/96318421