计算机视觉

VGG、ResNet、GoogleNet网络理论

笑着哭i 提交于 2020-04-13 23:37:17
【今日推荐】:为什么一到面试就懵逼!>>> 本文作者:馬立 分享嘉宾:白浩杰 文章整理:马立辉 内容来源:百度云智学院 导读: 计算机视觉领域涉及许多不同任务,对于图像分类任务,人类一直在追求更高的分类精度,期间衍生了许多有代表性的经典网络结构,今天就来做个探讨。 本篇文章主要包含以下内容: 1.计算机视觉任务 2 图像分类应用案例 3.经典网络结构 1. 计算机视觉任务 计算机视觉通常涉及以下几个任务:图像分类、目标检测、语义分割/实例分割、场景文字识别、图像生成、人体关键点检测、视频分类、度量学习。相对而言,前四个任务已经有比较成熟的技术,工业应用比较广泛。 ① 图像分类 图像分类任务,需要根据在图像信息中所反映的不同特征,把不同类别的目标区分开来。例如,在给定的不同图片中,分类任务需要能够把图片主体识别出来,如给定下面两张图,经过图像分类程序的识别,能够识别出图1是猫,图2是狗。 图1 图2 ② 目标检测 目标检测任务不仅仅要识别图片主体,还要把主体所在的位置用最小包围矩形进行标记。如图3,图中的主体是一位小朋友和他手中拿的小锤子,通过目标检测,把主体所在的位置用最小包围矩形标记了出来。 图3 ③ 语义分割/实例分割 语义分割是指我们按照像素级别的精度,把图片的每一个像素属于哪一个类别标注出来。比如图4(c),黄色区域归于背景,蓝色归于瓶子。 实例分割相比语义分割更加复杂

7 Papers | 微软亚研麻将AI「Suphx」技术细节;港中文、商汤动作识别时序金字塔网络

て烟熏妆下的殇ゞ 提交于 2020-04-13 20:24:18
【今日推荐】:为什么一到面试就懵逼!>>> 本周的重要论文有微软麻将 AI 研究团队公布 Suphx 所有技术细节,以及港中文联合商汤科技推出的特征级通用时序金字塔网络。 目录: Background Matting: The World is Your Green Screen Suphx: Mastering Mahjong with Deep Reinforcement Learning A mountable toilet system for personalized health monitoring via the analysis of excreta Weakly-Supervised Reinforcement Learning for Controllable Behavior Evolving Normalization-Activation Layers Temporal Pyramid Network for Action Recognition Tracking Objects as Points ArXiv Weekly Radiostation:NLP、CV、ML更多精选论文(附音频) 论文 1:Background Matting: The World is Your Green Screen 作者:Soumyadip Sengupta

CVPR 提前看:视觉常识的最新研究进展

冷暖自知 提交于 2020-04-13 13:34:15
【今日推荐】:为什么一到面试就懵逼!>>> 2020 年 CVPR 将于 6 月 13 日至 19 日在西雅图举行。今年的 CVPR 有 6656 篇有效投稿,最终录用的文章为 1470 篇,接收率为 22%。作为计算机视觉三大顶会之一,CVPR 今年的论文方向依然为目标检测、目标跟踪、图像分割、人脸识别、姿态估计等等。CVPR 是老牌的视觉、图像和模式识别等研究方向的顶会,本篇提前看中,让我们在人工智能、深度学习热潮的冲击下,一起关注一下视觉常识的最新研究进展。 机器之心分析师网络,作者:仵冀颖,编辑:Joni Zhong。 具体的,我们关注下面四篇文章: 1、What it Thinks is Important is Important: Robustness Transfers through Input Gradients2、ClusterFit: Improving Generalization of Visual Representations3、Learning Representations by Predicting Bags of Visual Words4、AdderNet: Do We Really Need Multiplications in Deep Learning? 1、What it Thinks is Important is

图神经网络的新基准

独自空忆成欢 提交于 2020-04-13 11:11:33
【今日推荐】:为什么一到面试就懵逼!>>>       作者 | 李光明    编辑 | 贾 伟   编者注:本文解读论文与我们曾发文章 《 》所解读 论文,为同一篇,不同作者,不同视角。一同参考。   近些年,图神经网络(GNN)的关注度越 来越高,相关的算法也越来越多,应用领域越来越广,其面临的两大基础问题是:   1)构建GNN的第一原则和第一要素是什么?使用什么样的架构能够使得GNN在大数据集上同样拥有泛化能力和扩展性?   2)如何研究和量化不同 GNN 的影响?   基准框架(Benchmarking)是解决这些基础问题的强大工具。比如,著名的2012 ImageNet 竞赛提供了基准的图像数据集,引来各国参赛队伍争相产出最好的图像分类模型,直接促进了深度学习在计算机视觉领域的变革。   但设计成功的基准库面临着很多挑战:合适的数据集,鲁棒性的代码接口,以及公平的实验设置,并且要求结果可复现。现有的GNN模型常用的数据集(CORA和TU)都很小,导致大多数GNN模型产出几乎一样的结果,即使没有引入图结构的神经网络,有时都能表现地比GNN好。此外,实验参数的设置,包括超参,损失函数以及学习率的选择,都是构建基准库需要面临的挑战。      论文链接:   https://arxiv.org/pdf/2003.00982.pdf   开源链接:   https:/

三维重建(三)-------------------(三维重建资料收集)

谁说胖子不能爱 提交于 2020-04-12 18:59:07
Major学者的个人主页汇总: 1.陈宝权: http://web.siat.ac.cn/~baoquan/ 2.南亮亮: http://web.siat.ac.cn/~liangliang/ 3.mueller: http://people.ee.ethz.ch/~pascmu/publications.html 4.Yasutaka Furukawa: http://homes.cs.washington.edu/~furukawa/ 5.肖建雄: http://mit.edu/jxiao/ 6.Peter Wonka: http://peterwonka.net/ 7.Jerry Talton: http://www.jerrytalton.net/ 6.3d-coform:http://www.3d-coform.eu/ 7.吴常常:http://homes.cs.washington.edu/~ccwu/------------提供了SFM可执行文件或源代码 8.计算机视觉中的多视图几何作者Visual Geometry Group: http://www.robots.ox.ac.uk/~vgg/ 领域的综述文献 城市三维重建:A Survey of Urban Reconstruction.pdf 源代码 ImageJ: http://imagej.nih.gov

计算机视觉图像预处理中的 Zero-mean(零均值化) 和 Normalization(归一化)

狂风中的少年 提交于 2020-04-11 18:58:42
在训练神经网络前,往往要对原始图像数据进行预处理,中心化(Zero-centered及Mean-subtraction)和归一化(Normalization)。那么具体是什么意思呢? 1、零均值化/中心化 在训练神经网络前,预处理训练集数据,通常是先进行零均值化(zero-mean),即让所有训练图像中每个位置的像素均值为0,使得像素范围变成 [-128, 127],以0为中心。 零均值化:是指变量减去它的均值; 优点:在反向传播时加快网络中每层权重参数的收敛;还可以增加基向量的正交性。 2、归一化/标准化 不同的评价指标往往具有不同的量纲和量纲单位,这样无法对结果进行分析,难以对结果进行衡量,为了消除指标之间的量纲影响,需要对数据进行标准化处理,以使数据指标之间存在可比性。 归一化:是指变量减去它的均值,再除以标准差; 优点:归一化后加快了梯度下降求最优解的速度;并且有可能提高精度。 来源: oschina 链接: https://my.oschina.net/u/4260256/blog/3229516

计算机视觉图像预处理中的 Zero-mean(零均值化) 和 Normalization(归一化)

雨燕双飞 提交于 2020-04-11 18:54:19
在训练神经网络前,往往要对原始图像数据进行预处理,中心化(Zero-centered及Mean-subtraction)和归一化(Normalization)。那么具体是什么意思呢? 1、零均值化/中心化 在训练神经网络前,预处理训练集数据,通常是先进行零均值化(zero-mean),即让所有训练图像中每个位置的像素均值为0,使得像素范围变成 [-128, 127],以0为中心。 零均值化:是指变量减去它的均值; 优点:在反向传播时加快网络中每层权重参数的收敛;还可以增加基向量的正交性。 2、归一化/标准化 不同的评价指标往往具有不同的量纲和量纲单位,这样无法对结果进行分析,难以对结果进行衡量,为了消除指标之间的量纲影响,需要对数据进行标准化处理,以使数据指标之间存在可比性。 归一化:是指变量减去它的均值,再除以标准差; 优点:归一化后加快了梯度下降求最优解的速度;并且有可能提高精度。 来源: oschina 链接: https://my.oschina.net/u/4352371/blog/3229531

VGG、ResNet、GoogleNet网络理论

两盒软妹~` 提交于 2020-04-11 02:46:08
本文作者:馬立 分享嘉宾:白浩杰 文章整理:马立辉 内容来源:百度云智学院 导读: 计算机视觉领域涉及许多不同任务,对于图像分类任务,人类一直在追求更高的分类精度,期间衍生了许多有代表性的经典网络结构,今天就来做个探讨。 本篇文章主要包含以下内容: 1.计算机视觉任务 2 图像分类应用案例 3.经典网络结构 1. 计算机视觉任务 计算机视觉通常涉及以下几个任务:图像分类、目标检测、语义分割/实例分割、场景文字识别、图像生成、人体关键点检测、视频分类、度量学习。相对而言,前四个任务已经有比较成熟的技术,工业应用比较广泛。 ① 图像分类 图像分类任务,需要根据在图像信息中所反映的不同特征,把不同类别的目标区分开来。例如,在给定的不同图片中,分类任务需要能够把图片主体识别出来,如给定下面两张图,经过图像分类程序的识别,能够识别出图1是猫,图2是狗。 图1 图2 ② 目标检测 目标检测任务不仅仅要识别图片主体,还要把主体所在的位置用最小包围矩形进行标记。如图3,图中的主体是一位小朋友和他手中拿的小锤子,通过目标检测,把主体所在的位置用最小包围矩形标记了出来。 图3 ③ 语义分割/实例分割 语义分割是指我们按照像素级别的精度,把图片的每一个像素属于哪一个类别标注出来。比如图4(c),黄色区域归于背景,蓝色归于瓶子。 实例分割相比语义分割更加复杂,不仅要求把哪一个像素属于哪一个类别标注出来

【学习笔记】人工智能原理(MOOC北大 王文敏,教材是《人工智能一种现代的科学计算方法》)(学习中。。。)

一世执手 提交于 2020-04-10 18:02:22
MOOC大学上的课程,做个学习笔记,方便以后复习回顾 教材是 1 绪论 1.1 AI概述 人工智能研究如何用硬件和软件实现智能的理智的行为,即搜索、推理、规划与学习,并在此之上去实现感知、认知与智能行为 人工智能自1956年诞生,经历2次低潮后,计算能力的提升为其提供良好的平台,多媒体数据的爆发性增长为期提供充足原料,AI先后战胜了人类象棋、围棋以及德州扑克的顶级选手,图像的识别与分类能力已经超越人类,指纹语音与人脸识别正在改变人机交互手段,各种类型的机器人运行在工厂和现实生活之中,人工智能的学术研究越来越深入,人工智能的创业者越来越多,人工智能正在改变我们的生活,世界上主要发达国家都把人工智能当做重大发展战略,力争在新一轮国际竞争中争得主动权,中国国务院于2017年7月8日印发《新一代人工智能发展规划》明确提出了中国人工智能发展战略为三步走,2020年,人工智能的应用技术与世界先进水平同步,2025年人工智能基础理论取得重大突破,2030年发展为世界主要的人工智能创新中心。所以说现在是人工智能的最好时期,有人担心人工智能会造成大批人失业,有人认为人工智能是威胁,有人游说人工智能可能引发第三次世界大战,更有人惧怕人工智能会毁灭人类,所以又说这是人工智能最有争议的时期。 1956年的“Dartmouth Summer Research Project on Artificial

【学习笔记】人工智能原理(MOOC北大 王文敏,教材是《人工智能一种现代的科学计算方法》)(学习中。。。)

孤街浪徒 提交于 2020-04-10 16:30:17
MOOC大学上的课程,做个学习笔记,方便以后复习回顾 教材是 1 绪论 1.1 AI概述 人工智能研究如何用硬件和软件实现智能的理智的行为,即搜索、推理、规划与学习,并在此之上去实现感知、认知与智能行为 人工智能自1956年诞生,经历2次低潮后,计算能力的提升为其提供良好的平台,多媒体数据的爆发性增长为期提供充足原料,AI先后战胜了人类象棋、围棋以及德州扑克的顶级选手,图像的识别与分类能力已经超越人类,指纹语音与人脸识别正在改变人机交互手段,各种类型的机器人运行在工厂和现实生活之中,人工智能的学术研究越来越深入,人工智能的创业者越来越多,人工智能正在改变我们的生活,世界上主要发达国家都把人工智能当做重大发展战略,力争在新一轮国际竞争中争得主动权,中国国务院于2017年7月8日印发《新一代人工智能发展规划》明确提出了中国人工智能发展战略为三步走,2020年,人工智能的应用技术与世界先进水平同步,2025年人工智能基础理论取得重大突破,2030年发展为世界主要的人工智能创新中心。所以说现在是人工智能的最好时期,有人担心人工智能会造成大批人失业,有人认为人工智能是威胁,有人游说人工智能可能引发第三次世界大战,更有人惧怕人工智能会毁灭人类,所以又说这是人工智能最有争议的时期。 1956年的“Dartmouth Summer Research Project on Artificial