对 GAN 的 value function 的理解
上式分为两个步骤: 第一步:调整discriminative model D的权重,使得V中两项取得最大值 第二步:调整generative model G的权重,使得V中第二项取得最小值 首先,分析log D(x)的含义: D(x)表示discriminative model D对一个原始样本的评分,评分越高,表示D越趋向于相信该样本是一个真实样本 D(G(z))表示discriminative model D对一个生成样本的评分,评分越高,表示D越趋向于把一个生成样本当成了一个真实样本 因此,网络训练过程总结如下: 第一步:训练D,使得上述两个期望最大 第一项期望值最大,表示D将一个真实样本给出一个高的评分 第二项期望值最大,表示D将一个生成样本给出一个低分 第二步:训练G,使得期望值的第二项最小 第二项期望值最小,即:找到一个G,使其生成的样本能够在discriminative model D中获得一个较高的评分 图:GAN的训练收敛过程 蓝色表示D 绿色表示G 黑色表示原数据 2019年8月18日 于南湖畔 来源: https://www.cnblogs.com/sddai/p/11373612.html