小赵带你读论文系列14-阿里妈妈之Deep Interest Network for Click-Through Rate Prediction
前言 鬼才知道我为什么要学管理经济学和管理数学,学不进去了,算了看看论文读读代码放松一下。 这是阿里 DIN 系列的第一篇文章,文章读起来不是很难,不过工业上实现会考虑时延就很麻烦,主要的工作我觉得像是引入了 Attention 机制(他自己解释说有点差别)。以往都是根据用户的 Profile,Behavior Sequence 做一个用户的 Embedding ,然后根据这个 Embedding 来和待推荐的商品作比较,最终输出用户点击该商品的概率。阿里觉得不好,第一,这种对待所有商品用户的 Embedding 都一成不变,这显然不行。第二,单纯扩大 Embedding 的 size 来获取更多的信息,这样会浪费大量的计算成本并且有过拟合现象。以往的推荐形式如下图: 主体内容 第一, 阿里妈妈觉得待推荐的物品是否会被点击和用户的历史行为有着显著的关系,那么我们能不能使用用户的历史行为(也代表了用户的兴趣,Deep Interest大概从这里命名)来表征用户对于不同商品的兴趣呢,换句话说,我能不能使得用户对于不同的商品有不同的 Embedding 呢。然后他就把待推荐物品和用户历史点击行为进行 Attention ,他死不承认用 Attention 的一个原因大体就是他的 Attention 没有做正则化,以及他的 Attention weights 的 sum=1 。模型构建如下