深度聚类评估指标(Purity、NMI、RI、ARI)

做~自己de王妃 提交于 2020-02-01 08:30:01

深度聚类评估指标(Purity、ACC、NMI、RI、ARI)

Purity, NMI, RI 等上述指标均需要给定 truth label 才能对 cluster label 进行评价,但是均不要求后者的类标与前者一致。那什么时候需要进行类标签的 best map 呢?例如,我们需要对预测结果和真实值之间统计聚类正确的比例时就需要进行最佳类标的重现分配,这样才能保证统计的正确。

Purity

定义

在这里插入图片描述

例子

在这里插入图片描述

NMI

定义

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

例子

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

RI

定义

在这里插入图片描述

例子

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

一个求混淆矩阵的 Python 实现

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

label = [0,0,1,0,1,0,0,1]
pred = [0,0,0,0,0,1,1,1]
bins = np.array([0,0.5,1]) # 表示x,y轴每个 bin 的坐标范围
tn, fp, fn, tp = plt.hist2d(label, pred, bins=bins, cmap='Blues')[0].flatten() # flatten 按列展开

ARI

定义

在这里插入图片描述

例子

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!