巴氏距离

统计--Bhattacharyya distance(巴氏距离)

丶灬走出姿态 提交于 2020-01-14 15:51:27
转自维基: https://en.wikipedia.org/wiki/Bhattacharyya_distance 在 统计中 , Bhattacharyya距离用于 度量 两个 概率分布 的相似性 。它与 Bhattacharyya系数 密切相关,后者是两个 统计 样本或总体之间重叠量的度量。两项措施均以1930年代在 印度统计研究所 工作的 统计学家 Anil Kumar Bhattacharya的 名字命名。 [1] 该系数可用于确定所考虑的两个样本的相对接近度。它用于度量 分类 的类的可分离性,并且被认为 比马哈拉诺比斯距离 更可靠,因为当两个类的标准偏差相同时,马哈拉诺比斯距离是Bhattacharyya距离的特例。因此,当两个类别具有相似的均值但标准差不同时,马氏距离将趋于零,而巴氏距离则根据标准差之间的差异而增长。 因此,这个公式对于每个具有来自两个样本的成员的分区更大,对于其中两个样本的成员有较大重叠的每个分区更大。分区数目的选择取决于每个样本中的成员数目;过少的分区会因为高估重叠区域而失去准确性,过多的分区会因为在人口稠密的样本空间中创建没有成员的单独分区而失去准确性。 如果由于每个分区的乘法为零而没有重叠,那么Bhattacharyya系数将为0。这意味着完全分离的样本之间的距离不会仅由该系数暴露。 Bhattacharyya系数用于极性码的构造[5]。