磨染的初心——计算机视觉的现状(3.1):图像分割
磨染的初心——计算机视觉的现状(3.1):图像分割 为了通过材质、形状、结构识别目标,对图像进行分割应该是必然的选择 。在这一点上计算机视觉研究者们算是勉强达成了共识,图像分割甚至被很多研究者列为计算机视觉的基本任务之一了。很多图像分割算法被提了出来,归纳起来可以分为基于阈值的方法、基于聚类的方法、基于区域的方法、基于图割的方法、活动边界模型和水平集、基于卷积神经网络的方法。 基于阈值的方法里,有全局一个阈值的,也有对图像不同区域使用不同阈值的。此类方法的关键在于确定阈值,然而 对于大多数图像即使遍历所有的取值也无法找到实现合理分割的阈值 ,因此该算法常用于符号识别、指纹识别和分割遥感领域中的各种指数图像(水体指数、植被指数、干旱指数、热红外影像)。 凡是认真思考或者亲身尝试过的,都会承认基于聚类的方法的分割结果难以令人接受。 所有的聚类算法都直接或者间接假设了类别内部的样本密度高于类别边界的样本密度 。观察过一些图像的直方图后就会发现, 像素在像元值空间的分布形状通常都类似钟型曲线(只有一个凸起),也就是说按照聚类算法的假设应该将全部像素聚为一类 。即使同时使用多个图像通道,这种情况也没有什么改观。没有或者难以使用空间信息是基于聚类的方法的直接缺陷, 导致分割结果形状复杂、越过显而易见的边界 。通常基于聚类的方法都作为其他算法的预处理步骤,在图像处理领域用于压缩颜色数量。