挂号信

搜索推荐业务场景下的特征系统搭建

匿名 (未验证) 提交于 2019-12-02 23:52:01
前提:今天受朋友的邀约,结合自己在推荐搜索系统下的经验,对企业级别特征工程应该如何进行设计,进行了一次分享,下面将这次分享的内容记录下来,以便有需要的朋友进行查看 一、融合众多推荐系统、搜索系统下的,特征系统的总结 1:一个好的特征搜索推荐业务特征体系一定要全面来进行设计,全面体现在这样几个板块上 (1) :分商户、用户来 进行提取(商户特征、用户特征、上下文特征) (2) :分类别来进行提取,比如静态特征、动态特征、交叉特征、向量特征等 (3) :离线特征、实时特征 其中 1 2 是比较有交叉的一种描述,在实际中一般会同时考虑 2:详细介绍 (1) :分商户、用户来进行提取(静态特征、动态特征、交叉特征、向量特征) (2): (3): (4): 3:前面讲的是搜索推荐业务场景下通用的特征提取内容框架,下面我从抖音、快手、oppo浏览器、阿里妈妈这些业务场景下做具体分析 二、实际业务出发 1:阿里妈妈 搜索广告转化预测 (1):数据格式 (2):特征设计 上面这些就是阿里妈妈在淘宝天猫业务场景下的数据特点,可以划分为这样几部分,对于这样的数据,我的特征设计格式会是下面这样 2:快手短视频预估分析 (1):数据格式 用户与作品的交互数据,每个字段的含义如下 a. 视觉特征( visual.zip ): 作品的视觉特征以 numpy 格式存储于单独的文件中,可以通过 numpy