第三章 推荐系统冷启动问题
如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐系统结果满意从而愿意使用推荐系统就是冷启动问题.
3.1 冷启动问题简介
冷启动问题主要分为以下三类:
(1) 用户冷启动 主要解决如何给新用户做个性化推荐的问题
(2) 物品冷启动 主要解决如何将新的物品推荐给可能对其感兴趣的用户
(3) 系统冷启动 主要解决如何在新开发的网站上设计个性化推荐系统
主要解决方法:
(1) 提供非个性化的推荐(用的比较多的是热门推荐)
(2) 利用用户注册时提供的年龄、性别等数据做粗粒度的个性化
(3) 利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐好友喜欢的商品
(4) 要求用户在登录时对一些物品进行反馈,收集用户对这些物品的兴趣信息
(5) 对于新加入的物品,可以利用内容信息,将它们推荐给喜欢过和它们相似的物品的用户。
(6) 在系统冷启动时,可以引入专家的知识,通过一定的高效方式迅速建立起物品的相关度表。
3.2 利用用户注册信息
用户注册信息分为三种:
(1) 人口统计学信息 包括用户的年龄、性别、职业、民族、学历和居住地。
(2) 用户兴趣的描述
(3) 从其他网站导入的用户站外行为数据
基于注册信息的个性化推荐系统基本流程如下:
(1) 获取用户的注册信息;
(2) 根据用户的注册信息对用户分类;
(3) 给用户推荐他所属分类中用户喜欢的物品。
核心问题为计算具备每种特征的用户喜欢的物品,p(f,i)可以简单地定义为物品 i 在具有 f 的特征的用户中的热门程度: