贝叶斯深度学习笔记

百般思念 提交于 2019-12-16 02:53:38

参考资料:
贝叶斯深度学习-博客园

1. 贝叶斯公式:

p(zx)=p(x,z)p(x)=p(xz)p(z)p(x)(1) p(z | x)=\frac{p(x, z)}{p(x)}=\frac{p(x | z) p(z)}{p(x)} \tag{1}
其中,

  • p(zx)p(z|x) 为后验.
  • p(x,z)p(x,z) 为联合概率.
  • p(xz)p(x|z) 为似然.
  • p(z)p(z) 为先验
  • p(x)p(x) 为 evidence (可以理解为事件的观测值).

引入全概率公式p(x)=p(xz)p(z)dzp(x)=\int p(x | z) p(z) d z, 式1可以变换为
p(zx)=p(xz)p(z)p(xz)p(z)dz(2) p(z | x)=\frac{p(x | z) p(z)}{\int p(x | z) p(z) d z}\tag{2}

2. 贝叶斯深度学习的训练

给定一个训练集D={(x1,y1),(x2,y2),,(xm,ym)}D=\left\{\left(\boldsymbol{x}_{1}, y_{1}\right),\left(\boldsymbol{x}_{2}, y_{2}\right), \ldots,\left(\boldsymbol{x}_{m}, y_{m}\right)\right\}, 用 DD 训练一个贝叶斯神经网络, 则贝叶斯公式可以写为如下形式:
p(wx,y)=p(yx,w)p(w)p(yx,w)p(w)dw(3) p(w | \boldsymbol{x}, y)=\frac{p(y | \boldsymbol{x}, w) p(w)}{\int p(y | \boldsymbol{x}, w) p(w) d w} \tag{3}
其中, p(w)p(w) 通常初始化为标准高斯分布, 当 ww 已知时, p(yx,w)p(y | \boldsymbol{x}, w) 容易求得.

然而, 分母分母这个积分要在 ww 的取值空间上进行,我们知道神经网络的单个权重的取值空间可以是实数集 RR,而这些权重一起构成的空间将相当复杂,基本没法积分。所以问题就出现在分母上。

目前贝叶斯训练主要用变分推断(variation inference).

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!