内容推荐算法:异构行为序列建模探索
很多秃头小可爱沉迷熬夜逛淘宝,以下是 来自宇宙洪荒之力的最新线报: 男生比女生多 天蝎座多 夜间小裙子搜索量位居第一 ...... 尤其,每晚有1700万人在淘宝只逛不买,他们到底在干什么? 看完视频和下方文章,你就知道为什么上头了。 前言 来洋淘, 更有young! 洋淘轻应用的内容均是手淘用户的真实购后分享, 在这里,你可以个性化地浏览他人的美好生活, 并鼓励自我表达与分享。 图1. 洋淘轻应用截图, 左) 为双列流, 右) 为详情页 在推荐任务上,同导购产品相比,洋淘场景有着自身的特性: 新用户冷启严峻,六成以上的用户无洋淘场景内的历史内容点击; 老 用户内容兴趣也稀少,历史内容点击数不超过10,反观商品点击数却高达数倍; 用户在电商与内容两个 domain 的兴趣差异较大。 统计日志发现,电商兴趣对洋淘场景下内容点击样本的覆盖度仅为 30% 。 于是,如何把跨域的异构行为用好,提升用户的浏览深度就显得弥足珍贵。我们从 召回 , ctr预估 两大关键环节均作了探索与创新, 大幅提升了推荐效果, 取得了显著的业务收益。 向量召回模型In_Match 前文提到内容兴趣不够用,我们首先基于i2i尝试了商品与内容的混合协同,取得了一定的收益。然后基于电商兴趣的标题作相关内容的严格相似召回,却收益为负,这说明跨域的兴趣不可生搬硬套,也与前文的兴趣差异统计相吻合。