计算机视觉

【CV实践】图像检索从入门到进阶

痞子三分冷 提交于 2020-08-09 22:30:19
Datawhale分享 作者:阿水,Datawhale成员 简介: 阿水, Datawhale 成员,北京航空航天大学硕士, 多次获得国内外数据竞赛 TOP 名次 图像检索是计算机视觉中基础的应用,可分为文字搜图和以图搜图。借助于卷积神经网络CNN强大的建模能力,图像检索的精度越发提高。 本次分享,将会从基础分享图像检索的原理和流程,并具体讲解图像局部特征和全局特征的差异性,最后以图像检索比赛为案例,进行独家的分享。 注: 今晚7点 在阿里天池直播分享,录播上传后 原链接 可回看 https://tianchi.aliyun.com/course/live?spm=5176.12282027.0.0.8bc1379cPYBoA6&liveId=41152 如需直播PPT,后台回复关键词 阿水 获取 主题大纲 1. 图像检索入门 介绍图像检索的定义、图像检索的典型应用和流程 2. 图像检索特征 介绍图像全局特征和图像局部特征,进而图像检索过程 3. 图像检索案例 以图像检索的应用和竞赛为案例,讲解解决方案 图像检索入门 文字检索与内容检索 CB IR 应用场景 成熟的图像检索应用涉及到相关算法,也是一个工程问题 图像检索的本质是特征提取和相似度计算的过程 图像检索特征 即使相差万里的图像也有可能是相似的 如果图像相似,则图像特征也相似 局部特征与全局特征 简易代码示例 相似度计算

计算机视觉学习之路(目录)------你想要的都在这里了

久未见 提交于 2020-08-09 21:01:56
计算机视觉学习之路------你想要的都在这里了 (根据自己的学习进度后期不断更新哟!!!) 一、OpenCV+TensorFlow入门人工智能图像处理基础 1.anaconda一站式环境的搭建(anaconda、tensorflow、opencv) 2.两个问题解答、opencv、tensorflow、numpy、matplotlib的基本使用 3.图像处理之几何变换 二、OpenCV学习 三、TensorFlow学习 四、Numpy学习 五、matplotlib学习 持续更新中。。。。。。 来源: oschina 链接: https://my.oschina.net/u/4280438/blog/4439148

韦地科技携手珠海复旦创新研究院共建联合实验室

两盒软妹~` 提交于 2020-08-09 19:59:45
为充分发挥研究院与企业的资源优势,以市场需求驱动协同创新,2020年4月16日在创意谷21栋北区二楼大会议室举办了珠海复旦创新研究院与韦地科技有限公司共建联合实验室签约仪式。该实验室是研究院与韦地科技企业合作成立的第一家联合实验室,将在计算机视觉识别和自然语言处理技术、金融科技领域、物联网相关芯片与操作系统研发等应用方向联合研发,研发成果通过企业快速走向市场,加快科技成果转移转化。中共薛城区委薛城区人民政府尹作义等一行六人,韦地科技有限公司董事长孙伟等一行四人,珠海复旦创新研究院执行院长王俊宇及研究院相关负责人、韦地科技-珠海复旦创新研究院联合实验室主任汪卫出席了本次签约仪式。 尹作义对联合实验室的成立表示祝贺,并希望联合实验室能够充分利用研究院和韦地科技雄厚的技术优势、人才优势和市场优势,取得更多拥有知识产权和核心技术的新成果。同时,薛城区政府将给予全方位的支持,并祝愿联合实验室早出成果、多出成果、出好成果。 王俊宇院长向在座嘉宾介绍了研究院的发展情况和取得的成绩,并表示,韦地科技-珠海复旦创新研究院联合实验室是珠海复旦创新研究院与企业成立的第一个联合实验室,研究院将给予大力支持,携手韦地科技打造产学研合作典范。 孙伟董事长表示,韦地科技始终把科技创新作为企业发展的第一动力,拥有多项具有独立知识产权的创新成果,研究院又是一个培养人才、拥有核心研发技术的平台,希望通过强强联合

第六节、双目视觉之相机标定

孤街醉人 提交于 2020-08-09 15:43:09
去年三四月份实验室做了一个机器人与视觉识别系统的项目,主要就是利用双目摄像头进行物体空间坐标定位,然后利用机器人进行抓取物体。当时我才研一,还是个菜鸡,项目主要是几个学长负责做的,我也就是参与打打酱油,混混经验。现在过了一年多了,机器人一直在实验室放着,空着也是浪费,所以就想搞点事情。这里我们就先从利用双目摄像头进行空间定位说起,因此这是整个项目的核心部分。 双目视觉是建立在几何数学的基础上,数学推导是枯燥乏味的。因此这里不去过多的介绍数学原理,只是简要的叙述一下双目视觉的流程。 双目视觉主要包括相机标定、图片畸变矫正、摄像机校正、图片匹配、3D恢复五个部分。 下面我们从相机标定开始说起。相机 标定的目的有两个。 第一,要还原摄像头成像的物体在真实世界的位置就需要知道世界中的物体到计算机图像平面是如何变换的,相机标定的目的之一就是为了搞清楚这种变换关系,求解内外参数矩阵。 第二,摄像机的透视投影有个很大的问题——畸变。摄像头标定的另一个目的就是求解畸变系数,然后用于图像矫正。 一、三大坐标系 谈到相机标定,我们不得不说起摄相机坐标系、世界坐标系、图像坐标系。 上图是三个坐标的示意简图,通过它大家可以对三个坐标有一个直观的认识。 世界坐标系$(X_w,Y_w,Z_w)$: 目标物体位置的参考系。除了无穷远,世界坐标可以根据运算方便与否自由放置, 单位为长度单位如$mm$。

投稿数翻倍,接收率不到三成!史上最难的ECCV你中了吗?

谁说胖子不能爱 提交于 2020-08-09 13:41:45
点击 上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 整理:公众号@新智元 本文仅做学术分享,如有侵权,请联系删除。 ECCV 2020已于昨日开奖! 今年主办方共收到5025篇有效文章,数据为ECCV 2018的两倍还多,再创新高。最终有1361篇文章被接收发表,接收率27%,较上届稍有下降。 ECCV 2020论文接收情况已于昨日公布! 今年,由于疫情的影响,诸多会议转为线上。每两年举办一次的ECCV也不例外,ECCV将于2020年8月23日至28日在线上举行。 论文投稿「爆仓」,接收率为27% 近年来,计算机视觉大热,直接导致三大顶会:ICCV、CVPR、ECCV的论文接收暴涨,可以用「爆仓」来形容。今年主办方共收到 5025篇 有效文章, 数据为ECCV 2018的两倍还多 ,再创新高。最终有 1361篇 文章被接收发表,接收率仅27%,不到三成。 其中,oral的论文数为 104篇 ,占提交总量的 2% ;spotlight的数目为 161篇 ,占提交总量的 5% ;其余论文为poster。 回顾一下上两届的数据:ECCV 2016 有效投稿数为 1561 篇,录用论文 415 篇(占26.6%),其中 oral 论文 28 篇(占1.8%)。ECCV 2018有效投稿数共计 2439 篇,接收论文 776 篇(占31.8%),其中oral 论文 59 篇(占2

【深度学习】卷积神经网络

为君一笑 提交于 2020-08-09 12:37:35
本文为深度学习的学习总结,讲解卷积神经网络。欢迎交流 计算机视觉 如果我们想要输入的图片像素为 1000×1000×3,则此时神经网络特征维度为 3 百万, W [ 1 ] W^{[1]} W [ 1 ] 采用全连接时,维度更夸张。我们使用卷积运算来解决这个问题。 边缘检测 I 卷积运算是卷积神经网络最基本的组成部分。我们使用 边缘检测 作为入门样例。 为了让电脑搞清楚下面这张图片的内容,我们可能需要先检测图片中的垂直边缘,右上角的图为垂直 边缘检测器 的输出,右下角为水平边缘检测器的输出: 接下来我们讲解如何检测出这些边缘。下图中,左边为一个 6×6 的灰度图像,即 6×6×1 的矩阵,没有 RGB 三通道。我们可以构造图中中间的 3×3 矩阵,成为 过滤器 (或核), ∗ * ∗ 运算符为 卷积运算 。而矩阵运算的结果是一个 4×4 的矩阵,因为过滤器在图中左边的矩阵中有 4×4 个可能的位置,可将其看作 4×4 的图像: 我们计算右边矩阵中的第一个元素的值。将 3×3 的过滤器覆盖在输入图像的蓝色区域,并在每个元素上标记过滤器的值,将对应元素相乘后求和 1 × 3 + 0 × 0 + . . . + 2 × − 1 = − 5 1\times3+0\times0+...+2\times-1=-5 1 × 3 + 0 × 0 + . . . + 2 × − 1 = − 5

新基建下 AI 算力市场崛起,华为凭什么从中分一杯羹?

删除回忆录丶 提交于 2020-08-09 12:15:53
2020 年,成为真正意义上的新基建“元年”,各种利好政策密集落地,全国各地都开始重视起这个频频出现在国家政策文件上的新概念。近期,国家发改委近期多次强调加快 5G 网络、数据中心等新型基础设施建设,业内人士指出,新基建投资计划正加速推出,预计年内投资规模将达万亿元。 新基建暖风下, 算力市场“蛋糕”怎么分? 新基建中,人工智能的基础建设是最重要的部分之一,而人工智能的发展,离不开算力的支撑。我们都知道,随着 5G、物联网等新兴技术的发展,数据量将以更加难以计量的速度膨胀爆发,据 IDC 预测,2020 年全球数据总量将达到 44ZB,中国的数据总量超过8ZB,占全球数据总量的 18%,而到 2025 年,全球数据总量预计将达到180ZB。与此同时,模型计算也将变得更加复杂,对算力的需求节节拔升,挑战难度不断升级。 日前,国家发改委明确“新基建”的范围,其中包括信息基础设施、融合基础设施、创新基础设施等三个方面,以数据中心、智能计算中心为代表的算力基础设施,就包含在信息基础设施当中。 在这样的背景下,AI 算力将成为 AI 基础设施建设的重中之重,甚至成为整个新基建的核心支撑。顺应时代需求,各大算力供应商纷纷摩拳擦掌,意图瓜分算力市场这块巨大的“蛋糕”。 群狼环伺, 华为为何能杀出重围? 华为就是这对算力市场“虎视眈眈”的企业中的其中一个。在 AI 计算领域,华为是国内起步较早

字节跳动副总裁、AI Lab负责人马维英宣布离职,加入清华大学

喜你入骨 提交于 2020-08-09 10:43:00
科技公司 AI Lab 大潮正在褪去? 机器之心报道,参与:泽南、张倩。 据多方消息确认,字节跳动副总裁、人工智能实验室主任马维英已宣布即将离职。他将赴清华大学智能产业研究院任职,加入正在筹备该产业院的原百度总裁张亚勤团队。 对此,字节跳动方面回复机器之心说:「根据自己的兴趣,马维英选择到清华大学从事人才培养和科研相关工作,他同时还会继续担任字节跳动技术顾问。」 马维英曾在世界级会议和学报上发表过数百篇论文,拥有一百多项技术专利,2010 年被评选为 ACM 杰出会员(ACM Distinguished Member),2011 年入选 IEEE Fellow。 在 Guide2Research 发布的 2020 全球顶尖计算机科学家排名中,马维英位居中国大陆第二位,仅次于源码资本投资合伙人张宏江。 AI 工程化难题是一个讨论已久的问题,包括场景碎片化、应用成本高、稳定性差、可解释性差等。有人认为,这些原因加速了 AI 顶级研究者从业界到学界的回流。 被张一鸣「杀鸡用牛刀」触动,加盟字节跳动 马维英 1990 年毕业于台湾国立清华大学电气工程系,1994 年和 1997 年分别获美国加州大学圣芭芭拉分校(UCSB)电气和计算机工程系硕士和博士学位。攻读博士学位期间,马维英负责开发的互联网图像检索系统 Netra 被认为是最具代表性的图像检索系统之一。 博士毕业至今

计算机视觉热潮的“B面”:技术或遇瓶颈,落地生死局

爱⌒轻易说出口 提交于 2020-08-09 08:42:13
计算机视觉可谓是 AI 最火爆的技术领域,这个赛道上诞生了一批最炙手可热的明星独角兽,学研与创投风潮一浪盖过一浪.... 从事计算机视觉算法研发多年的 CV 领域创业者李寻欢见证了这个行业的起伏。 我 10 年开始找工作,但当时没什么工作可以找,国内大厂基本上不需要这个岗位,感觉跟我最相近的岗位是懂 PS 的美工。 很快,情况就发生了变化。 到了 2012 年左右,因为 GPU 加速的红利,计算机视觉突然就“尘土飞扬”了起来,后来不少 AI 公司都起来了。 旷视、依图等 CV 独角兽都是在那一年创立的。计算机视觉创业在 2015 年形成了一个小高峰,据前瞻产业研究院统计,大约有 40 家公司在这一年成立。 2016-2018 年,在由深度学习引发的第三次 AI 浪潮助推下,计算机视觉按下了“快进键”,尤其是在创投圈,大额融资频现,简直成了资本宠儿,吸金能力无敌,单 2018 年一年,该领域融资额高达 230 亿。与此同时,资本的涌入也令计算机视觉技术快速应用到各个行业,走到普罗大众身边。 2018 年是 AI 商业化落地的元年,处在焦点中的计算机视觉领域也迎来了落地的关键阶段,不过这个进程却进行的并不尽如人意,能真正实现盈利的公司寥寥无几。 很多从业者切身感受到,到了 2019 年,计算机视觉行业明显不如上一年热闹了。 前两年大家都在瞩目的 AI 独角兽

计算机视觉中的半监督学习

僤鯓⒐⒋嵵緔 提交于 2020-08-09 06:46:16
作者:Amit Chaudhary 编译:ronghuaiyang 原文链接: 计算机视觉中的半监督学习 ​ mp.weixin.qq.com 导读 图解半监督的各种方法的关键思想。 计算机视觉的半监督学习方法在过去几年得到了快速发展。目前最先进的方法是在结构和损失函数方面对之前的工作进行了简化,以及引入了通过混合不同方案的混合方法。 在这篇文章中,我会通过图解的方式解释最近的半监督学习方法的关键思想。 1、自训练 在该半监督公式中,对有标签数据进行训练,并对没有标签的数据进行伪标签预测。然后对模型同时进行 ground truth 标签和伪标签的训练。 a. 伪标签 Dong-Hyun Lee[1] 在 2013 年提出了一个非常简单有效的公式 —— 伪标签。 这个想法是在一批有标签和没有标签的图像上同时训练一个模型。在使用交叉熵损失的情况下,以普通的监督的方式对有标签图像进行训练。利用同一模型对一批没有标签的图像进行预测,并使用置信度最大的类作为伪标签。然后,通过比较模型预测和伪标签对没有标签的图像计算交叉熵损失。 总的 loss 是有标签和没有标签的 loss 的加权和。 为了确保模型已经从有标签的数据中学到了足够的知识,在最初的 100 个 epoch 中,αt 被设置为 0。然后逐渐增加到 600 个 epochs,然后保持不变。 b. Noisy Student Xie