推荐系统

推荐!程序员整理的系统管理员资源大全

倾然丶 夕夏残阳落幕 提交于 2019-12-07 02:14:10
备份 备份软件 Amanda -客户端-服务器模型备份工具 Bacula - 另一个客户端-服务器模型备份工具 Backupninja -轻量级,可扩展的元数据备份系统 Backuppc -客户端-服务器模型备份工具和文件共享方案。 Burp -网络备份和还原程序 Duplicity -使用rsync算法加密的带宽-效率备份 Lsyncd -监控一个本地目录树的变化,然后产生一个进程去同步变化。默认使用rsync。 Rsnapshot -文件系统快照工具 SafeKeep -使用rdiff-backup,集中的,基于pull的备份 TarSnap - 具有一个开源客户端的安全备份服务 UrBackup -另一个客户端-服务器备份系统 DREBS - AWS EBS支持策略的备份脚本 克隆 克隆软件 Clonezilla -分区和磁盘镜像/克隆程序 Fog - 另一个计算机克隆解决方案 Redo Backup -简单的备份,恢复和还原 云计算 AppScale – 兼容Google App引擎的开源云计算软件. Archipel -使用Libvirt管理和监视虚拟机 CloudStack -创建,管理和部署基础云服务的云计算软件 Cobbler -Cobbler是一个Linux安装服务器,允许快速地构建网络安装环境 Eucalyptus -兼容AWS的开源私有云软件 Mesos

不懂推荐算法也能设计推荐系统

喜你入骨 提交于 2019-12-06 17:26:45
本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系统了吗?其实,产品人员可以从产品侧挖掘自己的长处。 下面,以商业化应用推荐为例,讨论如何在不熟悉推荐算法的前提下设计推荐系统。 01 解决什么问题 收入: 推荐用户感兴趣的应用,提高收入。 改善用户体验: 对于用户不感兴趣的应用,少推荐,减少整体的广告显示,提升用户体验(毕竟,多数情况下,商业化与体验是矛盾的)。 02 设定目标 这是比较难的。需要了解当前的推荐策略 与 优化后的策略,才能制定出来。要么你熟悉推荐算法,要么知晓行业数据。建议是:如果没有明确的依据,不要拍脑袋。 03 有什么数据 用户画像,是一个谈到烂的话题。但小体量的公司很难把用户画像落地,因为需求是简单的:根据用户画像,用户的喜欢做……但在实际执行中,很难建立一个数据模型处理万千的数据并应用到推荐场景当中。 下面讨论数据情况,有哪些维度的数据,直接决定数据模型。 1. 基础数据 无论贵公司是以APK还是SDK的方式

Improving Sequential Recommendation with Knowledge-Enhanced Memory Networks(知识图谱)

。_饼干妹妹 提交于 2019-12-06 13:04:35
本文作者:杨昆霖,2015级本科生,目前研究方向为知识图谱,推荐系统,来自中国人民大学大数据管理与分析方法研究北京市重点实验室。 引言 经常上购物网站时,注意力会被首页上的推荐吸引过去,往往本来只想买一件小商品,但却被推荐商品耗费不少时间与金钱。有时候会在想,虽然推荐商品挺吸引人的,但是它究竟为什么给出这些推荐,背后的原因却往往不得而知。本文将介绍的这篇SIGIR 2018论文提出了新的序列化推荐模型KSR(Knowledge-enhanced Sequential Recommender),利用了知识图谱与记忆网络,在提高推荐结果准确性的同时,还能捕捉更为细致的用户偏好,提高推荐系统的可解释性。 问题背景 相信推荐系统对大家并不陌生,众多互联网公司也花了大功夫在构建推荐系统上。为了给出精准的推荐,首先需要把握用户在想什么,对什么感兴趣,而这往往不是一成不变的,会随着用户在平台上的活动而日益变化。鉴于此,相较于以往的协同过滤等推荐方式,学术界提出基于时序神经模型的序列化推荐系统,利用循环神经网络RNN来捕捉用户兴趣点随着时间的动态变化。 在序列化推荐建模中,通常将用户过去的交互记录作为输入,利用隐状态向量来编码各个交互记录,以此来表示用户在序列中体现的偏好。但是,这种方法有两个不足之处: 只考虑了用户序列偏好,却忽视了细致的用户偏好,如用户具体喜欢某个物品的哪个属性等;

CCF 201909-4 推荐系统

纵然是瞬间 提交于 2019-12-06 12:52:37
CCF 201909-4 推荐系统 试题编号: 201909-4 试题名称: 推荐系统 时间限制: 5.0s 内存限制: 512.0MB 问题描述: 算法设计   由于我们需要选出得分最大的K件商品,得出相同的先按类号从小到大排序,再按编号从小到大排序。那么我们可以将所有商品放入到一个set变量bbt中进行自动排序。另外,同类商品编号必然不同,不同类商品编号可能相同,所以我们可以用类号+编号来唯一标识一件商品。由于商品的编号在10^9 以内,而类号在以内,我们可以用类号∗109+编号 类号*10^9+编号类号∗10 ^9+编号来作为一件商品唯一的id,显然每件商品和其id是一一对应的。这样的id可以用long long类型存储,且按id从小到大排序就相当于题目要求的“先按类号从小到大排序,再按编号从小到大排序”的排序原则。如果我们得到一件商品的id,那么这件商品的类号=id/10^9,编号=id%10^9 。   于是我们可以定义一个商品类dat,其中定义两个成员变量:id和score。为了方便set排序,需要在类内重载<运算符,保证商品先按得分从大到小排序,再按id从小到大排序。但是这又需要考虑另一个问题,题目中需要对商品进行添加和删除,添加和删除操作都是通过商品的id来操作的,我们显然无法在set中我们需要给出id和score两个变量才能查找到一件商品

推荐!国外程序员整理的系统管理员资源大全 ()

你说的曾经没有我的故事 提交于 2019-12-06 11:54:44
推荐!国外程序员整理的系统管理员资源大全 2015-1-19 12:24 发布者: admin 微博分享 受其他程序员汇编 php 资源,kahun 在 Github 发起系统管理员相关的开源资源整理。 内容分类包括:备份/克隆软件、云计算/云存储、协作软件、配置管理、日志管理、监控、项目管理…… 当然也有系统管理员相关书籍。 备份 备份软件 Amanda -客户端-服务器模型备份工具 Bacula - 另一个客户端-服务器模型备份工具 Backupninja -轻量级,可扩展的元数据备份系统 Backuppc -客户端-服务器模型备份工具和文件共享方案。 Burp -网络备份和还原程序 Duplicity -使用rsync算法加密的带宽-效率备份 Lsyncd -监控一个本地目录树的变化,然后产生一个进程去同步变化。默认使用rsync。 Rsnapshot -文件系统快照工具 SafeKeep -使用rdiff-backup,集中的,基于pull的备份 TarSnap - 具有一个开源客户端的安全备份服务 UrBackup -另一个客户端-服务器备份系统 DREBS - AWS EBS支持策略的备份脚本 克隆 克隆软件 Clonezilla -分区和磁盘镜像/克隆程序 Fog - 另一个计算机克隆解决方案 Redo Backup -简单的备份,恢复和还原 云计算 AppScale

TOP 10 开源的推荐系统简介

删除回忆录丶 提交于 2019-12-06 11:24:35
最 近这两年推荐系统特别火,本文搜集整理了一些比较好的开源推荐系统,即有轻量级的适用于做研究的SVDFeature、LibMF、LibFM等,也有重 量级的适用于工业系统的 Mahout、Oryx、EasyRecd等,供大家参考。PS:这里的top 10仅代表个人观点。 #1. SVDFeature 主页: http://svdfeature.apexlab.org/wiki/Main_Page 语言:C++ 一个feature-based协同过滤和排序工具,由上海交大Apex实验室开发,代码质量较高。在KDD Cup 2012中获得第一名,KDD Cup 2011中获得第三名,相关论文 发表在2012的JMLR中,这足以说明它的高大上。 SVDFeature 包含一个很灵活的Matrix Factorization推荐框架,能方便的实现SVD、SVD++等方法, 是单模型推荐算法中精度最高的一种。SVDFeature代码精炼,可以用 相对较少的内存实现较大规模的单机版矩阵分解运算。另外含有Logistic regression的model,可以很方便的用来进行ensemble。 #2. LibMF 主页: http://www.csie.ntu.edu.tw/~cjlin/libmf/ 语言:C++ 作者 Chih-Jen Lin 来自大名鼎鼎的台湾国立大学

10 基于CNN的电影推荐系统

做~自己de王妃 提交于 2019-12-06 10:22:22
本文从深度学习卷积神经网络入手,基于 Github 的开源项目来完成 MovieLens 数据集的电影推荐系统。 什么是推荐系统呢? 什么是推荐系统呢?首先我们来看看几个常见的推荐场景。 如果你经常通过豆瓣电影评分来找电影,你会发现下图所示的推荐: 如果你喜欢购物,根据你的选择和购物行为,平台会给你推荐相似商品: 在互联网的很多场景下都可以看到推荐的影子。因为推荐可以帮助用户和商家满足不同的需求: 对用户而言:找到感兴趣的东西,帮助发现新鲜、有趣的事物。 对商家而言:提供个性化服务,提高信任度和粘性,增加营收。 常见的推荐系统主要包含两个方面的内容,基于用户的推荐系统(UserCF)和基于物品的推荐系统(ItemCF)。两者的区别在于,UserCF 给用户推荐那些和他有共同兴趣爱好的用户喜欢的商品,而 ItemCF 给用户推荐那些和他之前喜欢的商品类似的商品。这两种方式都会遭遇冷启动问题。 下面是 UserCF 和 ItemCF 的对比: CNN 是如何应用在文本处理上的? 提到卷积神经网络(CNN),相信大部分人首先想到的是图像分类,比如 MNIST 手写体识别,CAFRI10 图像分类。CNN 已经在图像识别方面取得了较大的成果,随着近几年的不断发展,在文本处理领域,基于文本挖掘的文本卷积神经网络被证明是有效的。 首先,来看看 CNN 是如何应用到 NLP 中的

基于Web日志挖掘的个性化推荐系统(附源码)

孤者浪人 提交于 2019-12-06 05:42:39
个性化推荐系统 实现该系统主要是使用的编程语言主要是R,然后配合css在样式上进行一定优化,使用shiny开发的一款web程序,主要实现的核心功能是基于spark的ALS算法的课程个性化推荐系统。首页界面如下图所示: 该系统中的所有课程名称,课程图片以及课程链接均从百度传课爬取进行汇总得到的,因此点击每个图片均可以跳转至该课程在百度传课的页面。 该系统中实现的主要功能有: 首页推荐。 课程搜索。 课程分类。 个性化推荐。 热点分析。 首页推荐 当一个新用户或未登录的用户进入到该学习平台时,系统无法得知用户的具体信息,因此对用户的兴趣爱好还一无所知,所以无法使用常规的推荐算法进行推荐。一般在这个时候,只是向用户推荐那些普遍反映比较好的物品之前。面对这种情况,该项目通过Web日志分析,提取浏览次数较多的课程在首页进行推荐。 首页推荐是从预处理好的数据中提取用户访问的课程ID,然后统计这些课程ID出现的次数,根据出现的次数以降续进行排序,向用户推荐最热门,也是访问次数最多的课程。 课程搜索 搜索功能可以帮助用户快速查找到所有与搜索关键字相关的课程,这些课程名称数据是使用R语言从Web日志中提取出来的,因此可以搜索出所有存在于Web日志中的课程。该搜索引擎是基于正则表达式来完成。通过grepl函数在课程数据中的课程名中进行正则表达式匹配,可以搜索到所有包含关键字的课程,并获取其序列号

《高考志愿填报App中的个性化推存方法研究与应用》论文笔记(十四)

浪子不回头ぞ 提交于 2019-12-06 03:21:01
一、基本信息 标题:高考志愿填报App中的个性化推存方法研究与应用 时间:2018 来源: 江西财经大学 关键词: 个性化推荐; 高考; App开发; 二、研究内容 1.主要内容 通过对国内高考 APP 个性化推荐功能进行分析,大部分 APP 都个性化推荐功能都含有不同程度的付费项,并且存在界面不友好,数据不准确等问题,论文提出一套基于高校投档线分数预测基础之上的推荐报告生成算法,并提出通过对推准率(推荐报告中排名前列的高校为考生能够上的高校的概率)和推全率(推荐报告中考生能够进入的高校总数与考生能够进入的所有高校总数的比例)的研究论证推荐算法。并在用户使用招生类 APP 模拟投档功能的基础之上提出个性化广告推荐算法,通过用户使用模拟投档功能产生的行为数据为用户建模,并通过模型推荐广告信息。 2. 论文结构 第一章:介绍论文课题的研究背景,阐述个性化推荐系统的发展状况,对论文的研究思路总体结构进行介绍。 第二章:分别对高考体制改革的趋势与现状进行介绍。就现含有的高考招生类App 的应用进行介绍和比较。并对个性化推荐功能的研究情况和应用进行介绍。 第三章:是对面向考生的个性化高校推荐算法进行详细的介绍和实验,包括对用户的需求分析和算法的设计。 第四章:是基于考生填报数据的个性化招生广告推荐算法的详细介绍和实验室,包括考生使用招生类 App

主流推荐算法

霸气de小男生 提交于 2019-12-06 01:42:50
主流推荐算法大致可分为: 基于内容(相似度)的推荐 基于用户(User)/物品(Item)相似度的协同过滤 热点新闻推荐(你看到的那些头条新闻) 基于模型的推荐(通过输入一些用户特征进入模型,产生推荐结果) 混合推荐(以上十八般兵器一起耍!) 信息源:用户画像、物品画像、群体数据、知识模型。 1、内容算法推荐之爆款 2、四种推荐算法摘录 融合四种信息源的混合推荐方法可以弥补各自算法的缺陷。 问题1、基于内容的推荐算法和基于项目相似度的协调过滤之区别 基于内容的推荐算法 对于个性化阅读来说,一个item就是一篇文章。根据上面的第一步,我们首先要从文章内容中抽取出代表它们的属性。常用的方法就是利用出现在一篇文章中词来代表这篇文章,而每个词对应的权重往往使用信息检索中的tf-idf来计算。比如对于本文来说,词“CB”、“推荐”和“喜好”的权重会比较大,而“烤肉”这个词的权重会比较低。利用这种方法,一篇抽象的文章就可以使用具体的一个向量来表示了。第二步就是根据用户过去喜欢什么文章来产生刻画此用户喜好的 profile了,最简单的方法可以把用户所有喜欢的文章对应的向量的平均值作为此用户的profile。比如某个用户经常关注与推荐系统有关的文章,那么他的profile中“CB”、“CF”和“推荐”对应的权重值就会较高。在获得了一个用户的profile后