大规模计算时代:深度生成模型何去何从
©PaperWeekly 原创 · 作者|Chunyuan Li 单位|Microsoft Research Researcher 研究方向|深度生成模型 人工智能的核心愿望之一是开发算法和技术,使计算机具有合成我们世界上观察到的数据的能力, 比如自然语言,图片等等。 每当我们建立一个模型来模仿这种能力时,该模型就称为 生成模型 (Generative Models)。 如果该模型涉及深度神经网络,则该模型是 深度生成模型 (Deep Generative Models, 简称 DGMs)。 作为深度学习中自我监督学习 (self-supervised learning)技术的一个分支,DGM 特别专注于 刻画数据的生成过程 。这篇文章回顾了 DGM 的历史,定义和现状,并分享最新的一些研究结果。最终希望启发大家去思考一个共同的主题: 如何在大规模预训练时代推进或应用深度生成模型。 历史回顾和基础知识:三种类型的深度生成模型和一个通用技巧 生成模型(Generatitve Models)在传统机器学习中具有悠久的历史,它经常与另外一个主要方法(判别模型,Discriminative Models)区分开。我们可以通过一个故事 [1] 学到它们有何不同:有两兄弟,他们具有不同的特殊能力,一个具有深入洞察事物内在的能力,而另一个善于学习所见事物之间的差异。在故事里,前者代表生成模型