常用图像分类功能包
点击上方 “ 小白学视觉 ”,选择加" 星标 "或“ 置顶 ” 重磅干货,第一时间送达 为了能够有效地识别位置,我们需要提取表征图像的特征,之后将相同的特征分成一组,并搜索相似的图像。当然位置识别也可以应用于其他程序,例如在图像恢复我们也需要查找相似图像。 Bag of Feature是一种图像特征提取方法。它借鉴了文本分类(Bag of Words)的思想,从图像中提取出许多具有代表性的 关键词 ,形成字典,然后对每个图像中出现的关键词数量进行计数,以获得图片的特征向量。 获得特征向量后,我们通过聚类算法得到这些特征向量的聚类中心。将这些聚类中心组合在一起,形成 字典 。 对于图像中的每个特征,我们可以在字典中找到最相似的聚类中心,计算这些聚类中心的出现次数,并获得一个称为 Bag 的矢量表示。因此,对于区别越大的图片此矢量的区分度越大。 索引本地特征 为了获得词汇量,我们需要大量数据,即需要足够大的数据集。然后,对于每个图像,通常使用 SIFT 提取特征和描述符特征,并将其映射到描述符空间中。 提取特征后,使用一些聚类算法对这些特征向量进行聚类。最常用的聚类算法是 k-means 。它将样本数据的自然类别分为k个聚类,以便每个点都属于与最近的聚类中心相对应的聚类。用作聚类标准的类满足使聚类中心与属于该中心的数据点之间的平方距离之和最小的要求。 K