crf

深度学习在搜索业务中的探索与实践

馋奶兔 提交于 2020-04-17 03:51:09
【推荐阅读】微服务还能火多久?>>> 本文根据美团高级技术专家翟艺涛在2018 QCon全球软件开发大会上的演讲内容整理而成,内容有修改。 引言 2018年12月31日,美团酒店单日入住间夜突破200万,再次创下行业的新纪录,而酒店搜索在其中起到了非常重要的作用。本文会首先介绍一下酒店搜索的业务特点,作为O2O搜索的一种,酒店搜索和传统的搜索排序相比存在很大的不同。第二部分介绍深度学习在酒店搜索NLP中的应用。第三部分会介绍深度排序模型在酒店搜索的演进路线,因为酒店业务的特点和历史原因,美团酒店搜索的模型演进路线可能跟大部分公司都不太一样。最后一部分是总结。 酒店搜索的业务特点 美团的使命是帮大家“Eat Better,Live Better”,所做的事情就是连接人与服务。用户在美团平台可以找到他们所需要的服务,商家在美团可以售卖自己提供的服务,而搜索在其中扮演的角色就是“连接器”。大部分用户通过美团App找酒店是从搜索开始的,搜索贡献了大部分的订单,是最大的流量入口。在美团首页点击 “酒店住宿”图标,就会进入上图右侧的搜索入口,用户可以选择城市和入住时间并发起搜索。 酒店搜索技术团队的工作不仅有搜索排序,还有查询引导、推荐等工作,查询引导如搜索智能提示、查询纠错等。之所以还有推荐的工作,是因为很多用户在发起搜索时不带查询词,本质上属于推荐,此外还有特定场景下针对少无结果的推荐等

ffmpeg 常用命令汇总

纵然是瞬间 提交于 2020-04-12 10:11:30
引言 开源音视频处理工具FFMPEG以其强大的功能而在音视频领域著称,从音视频格式转换、裁剪、拼接、提取字幕到提取视频流,编解码等无所不能,本页汇集整理FFmpeg常用命令。更多影音视频相关技术干货:请关注工重号:影音探长 常用命令示例 ffmpeg -h // 帮助 ffmpeg -version // 版本信息 ffmepg -devices // 查看可用设备 ffmpeg -i input.mp4 // 查看视频信息 ffmpeg 命令行参数解析 00:00:46.61 视频时长 3949kb/s 码率 h264:视频编码格式 avc1:苹果公司开发的复合h264规范的格式 yuv420p:视频颜色编码方式 960x400:分辨率 SAR 1:1 :图像采集时,采集的宽高点阵的点数比值 DAR:图像宽高比 PAR:像素的长宽比 23.98 fps: 帧率 23.98 tbr: 帧率 24k tbn: 文件层的时间精度1S=24k,一秒增加24k 47.95 tbc:视频层的时间精度1S=47.95,一秒增加47.95 aac:音频编码格式 mp4a: stereo:立体声 fltp:音频帧格式 常用命令示例 不显示FFmpeg的banner信息 $ ffmpeg -i video.mp4 -hide_banner 基本格式转换 ffmpeg.exe -i input.mkv

直播背后的技术

こ雲淡風輕ζ 提交于 2020-04-06 03:47:18
当下直播行业正在如火如途进行中,但是我们对直播所使用到的技术,应该有所了解。 直播有三个阶段分别为建流、推流、拉流 建流:通常rtmp协议用 rtmp 模块实现的,这是一个nginx第三方模块很强大,很多第三方的直播SDK应该都是基于其实现的。 推流:就是主播端用到的 拉流:就是观看用户用的 推送和拉取用 ffmpeg 开源软件就可以做到,只不过界面有点简陋,所以第三方厂商对其也进行了封装成了SDK。 众所周知,直播对于带宽消耗很大,虽然服务端和客户端可以自建,但是旁大的带宽消耗是大部分企业无法承受的,所以选择第三方SDK是最好的归宿,因为他们有高额带宽、有CDN、有超大存储。 ffmpeg 简单用法 高质量录屏 ffmpeg -f gdigrab -i desktop -preset ultrafast -crf 10 playback.mp4 无损录屏 ffmpeg -video_size 1920x1080 -framerate 30 -f gdigrab -i desktop -c:v libx264 -qp 0 -preset ultrafast playback .mp4 直播 ffmpeg -f gdigrab -s 500x300 -i desktop -c:v libx264 -b:v 2M -qp 0 -crf 10 -preset ultrafast -f

Convolutional Networks for Image Semantic Segmentation

余生颓废 提交于 2020-04-05 16:50:26
感谢分享。http://yhlleo.github.io/2016/10/19/CNN-SemanticSeg/ 把前段时间自己整理的一个关于卷积神经网络应用于图像语义分割的PPT整理发布在本篇博客内,由于部分内容还在研究或发表过程中,就只上传PPT前两部分的内容。 今天给大家介绍卷积神经网络在图像语义分割上的一些方法和应用。 PPT的目录包括,语义分割的简单介绍,然后介绍一些我的研究和具体的应用,最后简单说一下我最近的一些研究工作。 图像语义,也就是图像理解,图像作为一种信息记录方式,每张图像都会传达出一些信息,就像一个故事。比如左边的图像,我们可以简单地分析出,有一只黑白斑纹的小猫,趴在一个木质的小木桌上,一只爪子按着一个有线鼠标,另一只放在一个打开的黑色的笔记本电脑上,旁边好像还站着个人。但是怎么能让计算机理解这些呢?这是个很难的问题,即便现在我们通过深度学习进行目标检测,可以得到图像场景中可能有哪些目标,但是要实现这样更深层次的理解,还是非常困难。 目标检测和语义分割,是两种理解图像语义的基础方法,主要是为了解决,图像中有什么,在哪里的问题。虽然看起来解决的问题很相似,但是却差异很大。 从输出结果来看,目标检测网络更加宽松,只要给定一个包含目标的最小窗口区域就可以,可以说它是window级别的方法,得到粗检测结果;而分割网络更加细致,强调像素级的精细化检测结果

概率图模型学习笔记:HMM、MEMM、CRF

孤街浪徒 提交于 2020-03-17 14:40:46
作者:Scofield 链接:https://www.zhihu.com/question/35866596/answer/236886066 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 so far till now, 我还没见到过将CRF讲的个明明白白的。一个都没。就不能不抄来抄去吗? 我打算搞一个这样的版本,无门槛理解的。 ——20170927 陆陆续续把调研学习工作完成了,虽然历时有点久,现在put上来。评论里的同学也等不及了时不时催我,所以不敢怠慢啊…… 总结的还算比较体系化,蛮长的,请读者慢慢看,肯定有收获的。 (好痛苦,这么多公式都要在知乎上重输;是在MD上写的,在知乎上没想到格式这么难看……) ——20180129 概率图模型学习笔记:HMM、MEMM、CRF 一、Preface 二、Prerequisite 2.1 概率图 2.1.1 概览 2.1.2 有向图 vs. 无向图 2.1.3 马尔科夫假设&马尔科夫性 2.2 判别式模型 vs. 生成式模型 2.3 序列建模 三、HMM 3.1 理解HMM 3.2 模型运行过程 3.2.1 学习过程 3.2.2 序列标注(解码)过程 3.2.3 序列概率过程 四、MEMM 4.1 理解MEMM 4.2 模型运行过程 4.2.1 学习过程 4.2.2 序列标注(解码)过程 4.2.3

条件随机场CRF HMM,MEMM的区别

孤街醉人 提交于 2020-03-14 03:45:47
http://blog.sina.com.cn/s/blog_605f5b4f010109z3.html 首先,CRF,HMM(隐马模型),MEMM(最大熵隐马模型)都常用来做序列标注的建模,像词性标注,True casing。但 隐马模型一个最大的缺点就是由于其输出独立性假设,导致其不能考虑上下文的特征,限制了特征的选择, 而最大熵隐马模型则解决了这一问题,可以任意的选择特征, 但由于其在每一节点都要进行归一化,所以只能找到局部的最优值,同时也带来了标记偏见的问题(label bias),即凡是训练语料中未出现的情况全都忽略掉 ,而条件随机场则很好的解决了这一问题,他并不在每一个节点进行归一化,而是 所有特征进行全局归一化,因此可以求得全局的最优值。 目前,条件随机场的训练和解码的开源工具还只支持链式的序列,复杂的尚不支持,而且训练时间很长,但效果还可以。 这三个模型都可以用来做序列标注模型。但是其各自有自身的特点,HMM模型是对转移概率和表现概率直接建模,统计共现概率。而MEMM模型是对转移 概率和表现概率建立联合概率,统计时统计的是条件概率。MEMM容易陷入局部最优,是因为MEMM只在局部做归一化,而CRF模型中,统计了全局概率,在 做归一化时,考虑了数据在全局的分布,而不是仅仅在局部归一化,这样就解决了MEMM中的标记偏置的问题。 举个例子,对于一个标注任务,

EasyDL自然语言处理简介

随声附和 提交于 2020-03-06 17:38:29
任务简介 EasyDL专业版平台将支持代码级的NLP任务包括文本分类任务和短文本匹配任务。同时平台集成了ERNIE2.0预训练模型,可以选择ERNIE-Base、ERNIE-Large、ERNIE-Tiny三种类型的预训练模型。 预训练模型ERNIE ERNIE 是一个从海量无监督数据中学习大量知识的超大预训练模型,通过将 ERNIE 模型中的这些知识迁移到上层特定任务相关的网络从而显著提升任务效果;基于 ERNIE 来 Finetune 特定任务就好比是站在巨人的肩膀上看世界,起点会显著高于从 0 开始训练特定任务的深度学习模型;您可以通过 ERNIE官网 查看最新动态和相关信息。 不同版本的ERNIE特点 Base 模型的网路结构主体由 12 层 transformer block 构成,此版本的预测精度、预测性能、训练速度相对均衡 Large模型拥有更大的参数量,以及更好的 Finetune 效果,Large模型网络结构主体由 24 层Transformer Block构成,此版本的预测精度突出 Tiny模型有更浅的模型,在实际真实数据中有超过4倍的预测提速,预测精度逼近Base版 文本分类 文本分类任务中,平台提供的网络有:BOW、CNN、GRU、TextCNN、LSTM、BiLSTM; 同时,平台提供了BOW、CNN、GRU、TextCNN、LSTM

EasyDL专业版服务介绍

喜夏-厌秋 提交于 2020-03-06 13:51:00
目录 专业版简介 专业版使用流程 专业版产品特性 专业版简介 EasyDL专业版 是EasyDL在2019年10月下旬全新推出的针对 AI初学者 或者 AI专业工程师 的企业用户及开发者推出的AI模型训练与服务平台,目前支持视觉及自然语言处理两大技术方向,内置百度海量数据训练的预训练模型,可灵活脚本调参,只需少量数据可达到优模型效果。 适用人群 专业AI工程师且追求灵活、深度调参的企业或个人开发者 支持定制模型类型 支持视觉及自然语言处理两大技术方向 视觉 :支持图像分类及物体检测两类模型训练 任务类型 预置算法 图像分类 Resnet(50,101)、Se_Resnext(50,101)、Mobilenet Nasnet 物体检测 FasterRCNN、YoloV3、mobilenetSSD 自然语言处理 :支持文本分类及短文本匹配两类模型训练,内置百度百亿级数据所训练出的预训练模型ENNIE. ERNIE(艾尼)是百度自研持续学习语义理解框架,该框架可持续学习海量数据中的知识。基于该框架的ERNIE2.0预训练模型,已累计学习10亿多知识,中英文效果全面领先,适用于各类NLP应用场景。 了解ERNIE 任务类型 预置网络 文本分类 BOW、CNN、GRU、TextCNN、LSTM、BiLSTM 短文本匹配 SimNet(BOW、CNN、GRU、LSTM)、FC 序列标注 CRF

Machine Learning系列--CRF条件随机场总结

对着背影说爱祢 提交于 2020-03-02 22:57:08
根据《统计学习方法》一书中的描述,条件随机场(conditional random field, CRF)是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔科夫随机场。 条件随机场是一种判别式模型。 一、理解条件随机场 1.1 HMM简单介绍 HMM即 隐马尔可夫模型 ,它是处理序列问题的统计学模型,描述的过程为:由隐马尔科夫链随机生成 不可观测的状态随机序列 ,然后各个状态分别生成一个观测,从而产生观测随机序列。 在这个过程中,不可观测的序列称为状态序列(state sequence), 由此产生的序列称为观测序列(observation sequence)。 该过程可通过下图描述: 上图中, $X_1,X_2,…X_T$是隐含序列,而$O_1, O_2,..O_T$是观察序列。 隐马尔可夫模型由三个概率确定: 初始概率分布 ,即初始的隐含状态的概率分布,记为$\pi$; 状态转移概率分布 ,即隐含状态间的转移概率分布, 记为$A$; 观测概率分布 ,即由隐含状态生成观测状态的概率分布, 记为$B$。 以上的三个概率分布可以说就是隐马尔可夫模型的参数,而根据这三个概率,能够确定一个隐马尔可夫模型$\lambda = (A, B, \pi)$。 而隐马尔科夫链的三个基本问题为: 概率计算问题 。即给定模型$\lambda = (A,

使用PaddleHub语义预训练模型ERNIE优化信息抽取

↘锁芯ラ 提交于 2020-03-02 17:00:28
注意 本项目代码需要使用GPU环境来运行: 并且检查相关参数设置, 例如use_gpu, fluid.CUDAPlace(0)等处是否设置正确. 本项目将演示,如何使用PaddleHub语义预训练模型ERNIE完成从快递单中抽取姓名、电话、省、市、区、详细地址等内容,形成结构化信息。辅助物流行业从业者进行有效信息的提取,从而降低客户填单的成本。 PART A. 背景介绍 A.1 物流信息抽取任务 如何从物流信息中抽取想要的关键信息呢?首先需要定义下想要的结果应该如何表示。 比如现在拿到一个快递单,可以作为我们的模型输入,例如“张三18625584663广东省深圳市南山区学府路东百度国际大厦”,那么序列标注模型的目的就是识别出其中的“张三”为人名(用符号 P 表示),“18625584663”为电话名(用符号 T 表示),“广东省深圳市南山区百度国际大厦”分别是 1-4 级的地址(分别用 A1~A4 表示,可以释义为省、市、区、街道)。 如下表: 抽取字段 简称 抽取结果 姓名 P 张三 电话 T 18625584663 省 A1 广东省 市 A2 深圳市 区 A3 南山区 详细地址 A4 百度国际大厦 A.2 序列标注模型 我们可以用序列标注模型来解决快递单的信息抽取任务,下面具体介绍一下序列标注模型。 在序列标注任务中,一般会定义一个标签集合,来表示所以可能取到的预测结果