#研发解决方案介绍#Recsys-Evaluate(推荐评测)
郑昀 基于刘金鑫文档 最后更新于2014/12/1 关键词: recsys 、推荐评测、Evaluation of Recommender System、piwik、flume、kafka、storm、redis、mysql 本文档适用人员:研发 推荐系统可不仅仅是围着推荐算法打转 先明确一下,我们属于工业领域。很多在学术论文里行之有效的新特奇算法,在工业界是行不通的。当年我们做语义聚合时,分词、聚类、相似性计算、实体词识 别、情感分析等领域最终还都采用了工业界十几年前乃至于几十年前就流行的成熟算法。如果算法不能决定命运,那什么是关键呢? 算法+规则库+人工干预 (整理语料、标识、调参数等),大都是脏活儿累活儿。 或者叫, 特征+算法+人工干预 ,用 特征缩小数据范围 或降维。 我在2009年曾经 写道 : 在语义的世界里,可以近似地说:万事万物都是特征提取。 你只要找到特征,事情就好办。…… ……你期望毕其功于一役吗?自然语言处理的真实应用里是很难有什么场景找到一个通吃特征的。都是一层一层特征叠加的。 一层特征去掉一部分垃圾数据。如此反复,终成正果。注意方法论。 梁斌 在2012年微博说道: 统计粗且糙,乃大锤。规则细而精,乃小锤。先大场后细棋。 规则库怎么来的? 得建设一些方便观测的外围系统,才能发现特征、建立规则、调整参数、观察效果 。所以与此类似,做了推荐服务后