推荐系统实践(七)
第七章 推荐系统实例 7.1 外围架构 数据收集和存储 需要实时存取的数据存储在数据库和缓存中,而大规模的非实时地存取数据存储在分布式文件系统中(HDFS)中。 7.2 推荐系统架构 用户和物品的联系如下所示: 如果认为用户喜欢的物品也是一种用 户特征,或者和用户兴趣相似的其他用户也是一种用户特征,那么用户就和物品通过特征相联系。基于上述的理解我们可以把推荐系统的核心任务拆分位两个部分1 > 如何给用户生成特征 > 如何根据特征找到物品 推荐系统的需求有很多,可以根据不同的需求设计不同的推荐引擎,通过不同的推荐引擎来满足客户的需求。 7.3 推荐引擎的架构 推荐引擎使用一种或几种用户特征,按照一种推荐策略生成一种类型物品的推荐列表。一个规则引擎的概念图如下所示: > A部分从缓存中拿到用户的行为数据,通过分析用户的行为获取特征向量 > B部分将特征向量结合特征-物品矩阵生成初始的推荐列表 > C部分对初始的列表进行处理,从而生成最终的推荐结果。 生成用户特征向量 用户的特征一般有两种:一种是注册的时候获取的,另一种是通过用户的行为计算出来的。 计算用户特征向量主要考虑: > 用户行为的种类 一般的标准是用户付出代价越大的行为权重越大 > 用户行为产生的时间 近期行为权重大 >