
本文从推荐系统入门的角度来探讨一些关于推荐系统我们应该关心的内容,或许可以为你的学习带来一些启发。
文章先介绍网站或商家希望通过应用推荐系统达成什么目标,再介绍衡量一个优秀的推荐系统从哪些方面,通过结合这两方面给寻找研究方向的同学一些启发(PS,因为前段时间学弟为了自己的科研方向一直很纠结,导师特意让我准备了一些分享。)也希望给想要从推荐系统入门的同学一些帮助。
推荐系统的目标
推荐系统我们都已经非常熟悉,现有的生活中推荐系统无处不在,无需我们去清晰的定义推荐系统做了什么工作。但是值得思考的一个点是,推荐系统的目的是什么,为什么推荐系统会如此受欢迎?
最近在阅读机械工业出版社翻译的第二版《推荐系统》时,受到了一些启发,推荐系统的目的应该包含这几点:
增加物品销量。这个是显而易见的,我们身边所有的电商网站,基本上都应用了推荐系统来达到提高销量的目的。只要对比于没有采用推荐系统的情况下,使用推荐系统销量有提高,就认为是提高了这项指标。
销售更多种类的物品。如何理解提高销售种类的这个概念呢,我们身边经常会有这样一种情况,我们最近有了购买手机的这个需求,浏览了一些手机,推荐内容被手机充满,浏览购物平台全是手机。这就相当于我们接触更多种类商品的这个需求没有被满足。所以对推荐系统而言,需要让用户有机会接触到更多种类的物品,可以满足用户多元化的需求,这也应该是推荐系统的一个目标。
增加用户满意度。应用一个优秀的推荐系统,一般可以给网站或APP带来良好的用户反馈,让用户愿意在网站或APP上停留。例如好几年前,头条刚刚出来的时候,我一个朋友给我安利,说头条贼有意思,自己可以刷一天
。头条当初本质上还是一个新闻平台,但是通过应用推荐系统提高了用户的满意度。
增加用户忠诚度。依靠用户和网站之间的交互,网站可以对用户的画像越来越精确,用户也可以获取到越来越满意的内容,这样就可以通过提高用户忠诚度来使得用户成为长期用户。
更好地理解用户需求。这条更想表达的意思是,通过理解用户需求,分析用户需求,并将收集到的知识重新用于其他用途。例如通过对用户需求的分析,服务提供商可以通过预测来控制库存或调整生产方案。

图片来自 www.duitang.com
关注的性能指标
下面介绍一下我们关注的指标,在项亮的《推荐系统实践》一书中,第1章就列出了一个好的推荐系统应该关注于哪些指标。我们简单的聊一下这些指标:
准确率。准确率是指对用户推荐的物品中,被用户选择的概率。任何一篇做推荐系统的paper,我们基本上都会在最后的实验部分看到对准确率的验证。这也是衡量一个推荐系统的性能,推荐出来的商品用户是否满意的重要指标。
覆盖率。覆盖率表明了在所有待推荐物品中,有多少物品被推荐过,换言之,就是有多少物品占用过推荐资源。
新颖性。也就是推荐给用户的物品中有多少是他们以前没有接触过的。
惊喜度。精细度与新颖性不同的地方在于,不一定是用户没有接触过的,可能是一个老电影,但是对用户而言,这部电影投其所好,那么就认为是让用户感受到惊喜的。
信任度。信任度的衡量很难直接计算,但是依然可以采用简单的问卷调查之类进行。另外一方面,信任度可以用用户对网站的忠诚度来间接判断。提高信任度最主要的方法就是增加推荐系统的透明度,也就是给用户的推荐提供解释,让用户明白为什么给他推荐了这物品。
★° .★° .★° .★° .分割线 .★° .★° .★° .★°
总结
在这里分析这些指标,一方面是让大家明白我们在做推荐系统相关的研究时,需要关注哪些指标。如果大家在学生期间找方向,在不同指标上的研究,也完全可以作为大家的一个研究点。我个人在硕士期间,曾经很长时间一直在研究,如何在不降低准确率的情况下提高覆盖率,这也是在推荐系统的知名会议 RecSys 上特有的一个专题。(这里简单介绍一下 RecSys,是推荐系统领域非常著名的一个会议,但是没有被 CCF 收录,所以国内投稿的人不是很多,但是专门做推荐系统的人都会关注,在公众号后期我也会去做一些 RecSys 上的 paper 分享以及复现。)回到正题,提到这些指标的另外一方面,我们可以看到这些指标和我们前文提到的推荐系统的一些目的,其实是有直接或间接的联系的,这些指标的提出,在不同程度上是为了来衡量这些推荐系统的目标任务的完成度。所以我们可以很明显的看到,很多指标之间有一个 trade-off 的关系,如何权衡之间的冲突,如何在算法方向的设计,来使得某些指标同步提高,都是研究热点。
最后关于推荐系统,我个人觉得,不仅仅在推荐领域,所有的应用到机器学习算法的方向,很大程度上系统的表现不仅仅局限于算法的设计。在我的实习过程中,发现很多系统性能上的提高来自于从业务角度的考虑所做的一些调优。这些我们在后面的文章中继续分享。
★° .★° .★° .★° .分割线 .★° .★° .★° .★°
最后的最后,简单的说一下创建这个公众号的想法。这个公众号是希望自己从头复习自己在推荐系统上的理解,并记录下来,未来可以作为回顾。希望同样对推荐系统感兴趣的朋友们可以关注,前辈们有什么建议也可以留言。
公众号的定位是机器学习算法,主要应用方向为推荐系统,会尽力保持原创,所以更新频率不会太快暂时计划是周更。如果对文章满意请长按下面的二维码 ↓↓↓ 点个关注吧

本文分享自微信公众号 - 机器学习与推荐系统(ml-recsys)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
来源:oschina
链接:https://my.oschina.net/u/4594119/blog/4443326