朴素贝叶斯
条件概率 乘法公式 全概率公式 根据小偷们的资料,计算村子今晚失窃概率的问题:P(Ai)表示小偷 i 作案的概率,P(B|Ai)表示小偷 i 作案成功的概率,那么P(B)就是村子失窃的概率 贝叶斯公式(又称逆概公式) P(Ai)>0,则对任一事件B,只要P(B)>0,有 若村子今晚失窃,计算哪个小偷嫌疑最大的问题(嫌疑最大就是后验概率最大) 假设小偷1和小偷2在某村庄的作案数量比为3:2,前者偷窃成功的概率为0.02,后者为0.01,现村庄失窃,求这次失窃是小偷1作案的概率。 【分析】A1={小偷1作案},A2={小偷2作案},B={村庄失窃} 总结: 先验概率P(A):在不考虑任何情况下,A事件发生的概率 条件概率P(B|A):A事件发生的情况下,B事件发生的概率 后验概率P(A|B):在B事件发生之后,对A事件发生的概率的重新评估 全概率:如果A和A'构成样本空间的一个划分,那么事件B的概率为:A和A'的概率分别乘以B对这两个事件的概率之和。 朴素贝叶斯的直观理解 案例: 有一个训练集包含100个人,其中有60个非洲人(黑卷 47,黑直 1,黄卷 11,黄直 1),有40个亚洲人(黑卷 1,黄卷 4,黄直*35),请训练朴素贝叶斯模型。 肤色x1={黑,黄}, 发型x2={卷,直}; 地区label={亚,非} 先计算先验概率: 亚洲人的比例m,非洲人的比例 模型构建