Semantic

WSDM Cup 2020检索排序评测任务第一名经验总结

安稳与你 提交于 2020-03-26 17:02:00
3 月,跳不动了?>>> 1.背景 第13届“国际网络搜索与数据挖掘会议”( WSDM 2020 )于2月3日在美国休斯敦召开,该会议由SIGIR、SIGKDD、SIGMOD和SIGWEB四个专委会共同协调筹办,在互联网搜索、数据挖掘领域享有很高学术声誉。本届会议论文录用率仅约15%,并且WSDM历来注重前沿技术的落地应用,每届大会设有的WSDM Cup环节提供工业界真实场景中的数据和任务用以研究和评测。 今年的 WSDM Cup 设有3个评测任务,吸引了微软、华为、腾讯、京东、中国科学院、清华大学、台湾大学等众多国内外知名机构的参与。美团搜索与NLP部继去年获得了 WSDM Cup 2019第二名 后,今年继续发力,拿下了WSDM Cup 2020 Task 1:Citation Intent Recognition榜单的第一名。 本次参与的是由微软研究院提出的Citation Intent Recognition评测任务,该任务共吸引了全球近600名研究者的参与。本次评测中我们引入高校合作,参评团队Ferryman由搜索与NLP部-NLP中心的刘帅朋、江会星及电子科技大学、东南大学的两位科研人员共同组建。团队提出了一种基于BERT和LightGBM的多模融合检索排序解决方案,该方案同时被WSDM Cup 2020录用为 专栏论文 。 2.任务简介 本次参与的任务一(WSDM

Word Embedding 稳定性研究

白昼怎懂夜的黑 提交于 2020-03-23 21:48:42
3 月,跳不动了?>>> 我们在production的系统里面会遇到一个问题,模型如何处理新进来的数据。重新训练的话下游的prediction可能会非常不一样,但是我们不知道到底怎么不一样。之前在MLSys 2020 看到了这个关于稳定心的文章,所以跟大家分享一下。这个paper尝试总结retraining对embedding的影响到底有多大,原文在这里 https://proceedings.mlsys.org/static/paper_files/mlsys/2020/104-Paper.pdf ​ proceedings.mlsys.org 既然我们要讨论稳定性,我们得先给一个稳定性的定义 这个定义的逻辑本身是根据下游的task来定义上游够不够稳定,如果完全稳定的话下游的模型就不用retrain了。这里文章讲用zero one可能是因为讨论的是NLP的问题,假设是ctr的话这种zero one loss就不合理。 对于word embedding的算法,文中用了三种 Matrix Completion GloVE word2vec quantization用的是uniform quantization,原文在这里 https://arxiv.org/pdf/1909.01264.pdf ​ arxiv.org Embedding distance 的算法文中也用了几个来做比较

卫星影像识别技术在高德数据建设中的探索与实践

社会主义新天地 提交于 2020-03-23 15:56:33
3 月,跳不动了?>>> 导读 对于地图服务而言,地图数据的准确率和覆盖率是服务质量的关键因素,而地图数据的更新,依赖于多种信息源,如轨迹热力,实采图像,卫星影像等。近年来,由于遥感卫星数量的增多及高分辨率光谱相机的出现,以及卫星影像图自身覆盖广、视角好、信息丰富的特点,卫星影像作为地图数据更新的信息源起到了越来越重要的作用。 对于卫星影像的使用方式,高德经历了由前端用户展示,到人工数据作业参考,再到主动发现更新地图数据的进化过程,这同时也是我们不断挖掘影像数据价值的过程。本文会介绍高德视觉团队将卫星影像从被动参考升级为主动发现的过程中的探索和实践。 卫星影像关键元素 按照几何结构划分,影像元素可分为三大类:道路元素(road),地物元素(region),建筑物元素(building): 道路元素 :包含普通道路,精细道路(主/辅路/非机动车道,提前右转路),连接点(贯穿路、出入口、掉头口、路口等)。 地物元素 :包含建筑区域、拆迁区域、水域、农田、山区、林地、大棚等。 建筑物元素 :建筑物楼块。 卫星影像在数据更新上的优势 路网是地图数据的基础,所有的道路属性、动态事件、POI引导都需要基于准确的路网数据信息。而卫星影像由于具有上帝视角,对区域内路网的连接关系、复杂的路口关系、平立交关系的判断具有全局而丰富的信息支撑。同时,由于卫星影像覆盖广、成本低的特点

CVPR 2020 全部论文 分类汇总和打包下载

一世执手 提交于 2020-03-11 01:34:31
CVPR 2020 共收录 1470篇文章,根据当前的公布情况,人工智能学社整理了以下约100篇,分享给读者。 代码开源情况:详见每篇注释,当前共15篇开源。(持续更新中,可关注了解)。 关注我们,持续更新,捕捉最新 ~~ 算法主要领域:图像与视频处理,图像分类&检测&分割、视觉目标跟踪、视频内容分析、人体姿态估计、模型加速、网络架构搜索(NAS)、生成对抗(GAN)、光学字符识别(OCR)、人脸识别、三维重建等方向。 目录如下: 总目录 图像处理 Deep Image Harmonization via Domain Verification 论文: https://arxiv.org/abs/1911.13239 代码: https://github.com/bcmi/Image_Harmonization_Datasets Learning to Shade Hand-drawn Sketches 论文: https://arxiv.org/abs/2002.11812 Generalized ODIN: Detecting Out-of-distribution Image without Learning from Out-of-distribution Data 论文: https://arxiv.org/abs/2002.11297 Single Image

给 AI 讲故事,如何教它脑补画面?

微笑、不失礼 提交于 2020-01-07 15:45:26
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 简介: 视觉想象力是人与生俱来的, AI 能否拥有类似的能力呢?比如:给出一段故事情节,如何让机器展开它的想象力,“脑补”出画面呢?看看阿里AI Labs 感知实验室的同学们如何解决这个问题。 1. 背景 —— 视觉想象力(Visual Imagination) 1.1 什么是视觉想象力? 视觉想象力 是人脑拥有的一个重要功能,可以将一些抽象的概念具象化,进而凭借这些视觉想象进行思考。如图1最左列,当我们想到:A yellow bird with brown and white wings and a pointed bill时,脑海里可能已经想象出了一幅黄色鸟的画面。这就是视觉想象力。我们的目标就是让AI逐步具备这种能力。 图1:由第一行中的文本描述,AI“想象”出的画面 [1]。 1.2 AI拥有视觉想象力后的影响? AI如果具备视觉想象力后,将会更懂人的需求,并能够对一些传统行业产生颠覆性影响。下面举两个例子。 图2为一个在语义图像搜索领域中的案例。我们在google中搜索man holding fish and wearing hat on white boat,可能返回的结果质量为(a),引擎只是零星理解了我们的搜索意图。而当机器拥有一定视觉想象力后,它的搜索结果可能是(b)

基于深度学习的图像分割在高德的实践

蹲街弑〆低调 提交于 2019-12-16 11:32:41
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 一、前言 图像分割(Image Segmentation)是计算机视觉领域中的一项重要基础技术,是图像理解中的重要一环。图像分割是将数字图像细分为多个图像子区域的过程,通过简化或改变图像的表示形式,让图像能够更加容易被理解。更简单地说,图像分割就是为数字图像中的每一个像素附加标签,使得具有相同标签的像素具有某种共同的视觉特性。 图像分割技术自 60 年代数字图像处理诞生开始便有了研究,随着近年来深度学习研究的逐步深入,图像分割技术也随之有了巨大的发展。早期的图像分割算法不能很好地分割一些具有抽象语义的目标,比如文字、动物、行人、车辆。这是因为早期的图像分割算法基于简单的像素值或一些低层的特征,如边缘、纹理等,人工设计的一些描述很难准确描述这些语义,这一经典问题被称之为“语义鸿沟”。 得益于深度学习能够“自动学习特征”的这一特点,第三代图像分割很好地避免了人工设计特征带来的“语义鸿沟”,从最初只能基于像素值以及低层特征进行分割,到现在能够完成一些根据高层语义的分割需求。 (图像分割的发展历史) 高德地图拥有图像/视频大数据,在众多业务场景上都需要理解图像中的内容。例如,在数据的自动化生产中,通常需要寻找文字、路面、房屋、桥梁、指示牌、路面标线等目标。这些数据里有些是通过采集车辆或卫星拍摄

Public AI search engine capable extracting figures

我与影子孤独终老i 提交于 2019-11-30 07:37:04
In 2015, The Allen Institute for Artificial Intelligence — the research organization founded by late Microsoft cofounder Paul Allen — released Semantic Scholar, a public AI search engine capable extracting figures from over 173 million computer science and biomedicine journal papers. It received a warm reception, but researchers at the Institute wondered if its underlying algorithms might be adapted to solve other problems in the field of medical research. To this end, the Allen Institute this week launched Supp AI, a web portal that lets consumers of supplements like vitamins, minerals,

人工智能/数据科学比赛汇总 2019.9

家住魔仙堡 提交于 2019-11-29 08:03:24
内容来自 DataSciComp ,人工智能/数据科学比赛整理平台。 Github: iphysresearch/DataSciComp 本项目由 ApacheCN 强力支持。 微博 | 知乎 | CSDN | 简书 | OSChina | 博客园 全球数据智能大赛(2019)——“数字人体”赛场一:肺部CT多病种智能诊断 https://tianchi.aliyun.com/competition/entrance/231724/ 6月24 - 9月09, 2019 // Host by 天池 // Prize: $900,000 Note : 赛场一“数字人体”挑战赛以肺部CT多病种智能诊断为课题,开放高质量CT标注数据,要求选手提出并综合运用目标检测、深度学习等人工智能算法,识别肺结节、索条(条索状影)、动脉硬化或钙化、淋巴结钙化等多个病种,避免同一部位单病种的反复筛查,提高检测的速度和精度,辅助医生进行诊断。 Entry Deadline: Online Challenge: Build A Recommendation Engine (Powered by IBM Cloud) https://datahack.analyticsvidhya.com/contest/build-a-recommendation-engine-powered-by-ibm-cloud/