有label的数据很少,大部分是没有label的数据 使用unlabel数据来帮助估计数据分布 step1: 使用初始化的model,对unlabel数据进行每类的概率计算 step2: 通过对上一步得到unlabel数据的概率,更新model 迭代进行,直到收敛 用熵来表示label概率的分布情况,是否集中 来源:CSDN作者:炼丹师链接:https://blog.csdn.net/py184473894/article/details/104307868 标签 大数据 label