计算机视觉

VGG、ResNet、GoogleNet网络理论

主宰稳场 提交于 2020-04-08 03:07:06
本文作者:馬立 分享嘉宾:白浩杰 文章整理:马立辉 内容来源:百度云智学院 导读: 计算机视觉领域涉及许多不同任务,对于图像分类任务,人类一直在追求更高的分类精度,期间衍生了许多有代表性的经典网络结构,今天就来做个探讨。 本篇文章主要包含以下内容: 1.计算机视觉任务 2 图像分类应用案例 3.经典网络结构 1. 计算机视觉任务 计算机视觉通常涉及以下几个任务:图像分类、目标检测、语义分割/实例分割、场景文字识别、图像生成、人体关键点检测、视频分类、度量学习。相对而言,前四个任务已经有比较成熟的技术,工业应用比较广泛。 ① 图像分类 图像分类任务,需要根据在图像信息中所反映的不同特征,把不同类别的目标区分开来。例如,在给定的不同图片中,分类任务需要能够把图片主体识别出来,如给定下面两张图,经过图像分类程序的识别,能够识别出图1是猫,图2是狗。 图1 图2 ② 目标检测 目标检测任务不仅仅要识别图片主体,还要把主体所在的位置用最小包围矩形进行标记。如图3,图中的主体是一位小朋友和他手中拿的小锤子,通过目标检测,把主体所在的位置用最小包围矩形标记了出来。 图3 ③ 语义分割/实例分割 语义分割是指我们按照像素级别的精度,把图片的每一个像素属于哪一个类别标注出来。比如图4(c),黄色区域归于背景,蓝色归于瓶子。 实例分割相比语义分割更加复杂,不仅要求把哪一个像素属于哪一个类别标注出来

港中文李弘扬 :物体检测最新进展

▼魔方 西西 提交于 2020-04-08 02:05:57
本文作者:HelloDeveloper 嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。 人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。由中国科学院大学主办,中国科学院大学学生会承办,读芯术作为指定合作自媒体的“AI未来说·青年学术论坛”第三期“计算机视觉”专场已于2019年3月24日下午在中科院举行。港中文李弘扬博士为大家带来报告《物体检测最新进展》。 李弘扬,香港中文大学多媒体实验室(MMLab)博士生,微软亚洲研究院实习生。博士期间导师为王晓刚教授。主攻计算机视觉和深度学习方向,尤其对物体检测、人体姿态估计、CNN网络结构设计、少样本学习(few-shot learning)、胶囊网络(capsule networks)等热点问题做了一些初步探索。在机器学习和计算机视觉六大顶级会议和两大顶级期刊中,共发表文章9篇,其中一作6篇(包含1篇口头报告)。多次担任顶级会议审稿人、AI教育公司兼职顾问。 报告内容:物体检测(object detection)作为计算机视觉中最基础、最核心的任务,多年来备受学术界、工业界关注

业界首个视频识别与定位工具集PaddleVideo重磅更新 | 飞桨PaddlePaddle升级解读

和自甴很熟 提交于 2020-04-07 03:09:05
本文作者:杨蕊1002 导读:飞桨(PaddlePaddle)致力于让深度学习技术的创新与应用更简单。7月初,随着Paddle Fluid 1.5版本的发布,国内业界首个视频识别与定位工具集PaddleVideo也迎来了重磅更新。PaddleVideo在实际工业界可以形成很多具体应用,包括:视频精彩片段预测、关键镜头定位、视频剪辑等任务,例如定位NBA篮球赛视频中扣篮镜头,电视剧中的武打镜头等。如下图所示: 本文末尾,为广大算法和开发同学准备了PaddleVideo模型实战的应用案例,视频剪辑、素材拼接和标题生成工作完全是程序模型自动完成的,极大地减轻了人力剪辑的工作量,效果也还不错。不过,在看具体模型具体应用之前,让我们可以先来了解一下PaddleVideo。 1. PaddleVideo是什么? PaddleVideo是飞桨在计算机视觉领域为用户提供的模型库PaddleCV中的视频识别与定位部分的模型库。PaddleVideo的全部模型都是开源的,用户可以一键式快速配置模型完成训练和评测。 PaddleVideo目前视频分类和动作定位模型包括: 2. 重磅更新内容详解 本次重磅更新要点如下: 增加动作定位模型C-TCN,该模型是2018年ActivityNet夺冠方案。 增加已发布的模型骨干网络,Non-local模型增加ResNet101和l3d网络结构

中科院张士峰:基于深度学习的通用物体检测算法对比探索

蓝咒 提交于 2020-04-07 02:44:13
本文作者:HelloDeveloper 嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。 人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。由中国科学院大学主办,中国科学院大学学生会承办,读芯术作为指定合作自媒体的“AI未来说·青年学术论坛”第三期“计算机视觉”专场已于2019年3月24日下午在中科院举行。中科院张士峰博士为大家带来报告《基于深度学习的通用物体检测算法对比探索》。 张士峰,中科院自动化所2015级直博,导师李子青研究员,研究方向为基于深度学习的物体检测,主要包括通用物体检测、人脸检测、行人检测。目前已发表论文14篇,其中第一作者论文11篇,包括3篇CVPR、IJCV、ICCV、ECCV、IJCAI、AAAI等。在投论文7篇,在审专利4项,获CCF-CV学术新锐奖、百度奖学金、国家奖学金、唐立新奖学金、必和必拓奖学金、攀登一等奖学金、三好学生、国际人脸检测竞赛季军、最佳学生论文等荣誉。 报告内容:目前基于深度学习的通用物体检测算法大致可以分为两类:一步法检测器和二步法检测器。一步法检测器有较高的检测速度

唐宇迪-人工智能学习路线(下篇)

社会主义新天地 提交于 2020-04-06 15:02:42
唐宇迪:51CTO微职位讲师,计算机博士,人工智能专家 内容梗概: 介绍人工智能学习步骤和知识框架。人工智能的学习可以拆分为7步,此为4-7步:下篇。 第4步:深度学习 1)深度学习概述 终于说到深度学习了,都需要学什么呢? 深度学习可以说是当下最好用的算法了,各个领域都能吃得开。其实最核心的还是在计算机视觉和自然语言处理中,因为神经网络算法更适用于图像和文本数据。 主要需要掌握的就是算法和框架了,算法就是CNN,RNN这些经典网络模型,框架就是实战的工具了例如tenorflow,Pytorch等,后面还会详细说。 深度学习听起来比较高大上,是不是比机器学习难很多? 好像现在好多小伙伴一拿到任务,第一个想法都是直接用深度学习做。如果深度学习难度大,做起来麻烦,那还能有这么高的热度吗? 其实恰恰相反,我觉得深度学习真的比机器学习简单很多,在机器学习中需要我们对不同的数据选择不同的预处理方法和特征工程构建方法。 深度学习中的套路相对来说更固定一些,而且有这些开源框架和各大经典网络架构,我们通常需要做的就是套用就可以了。整体难度要比机器学习任务更容易一些(只是相对来说!)。 2)深度学习必备算法 深度学习都需要学哪些算法呢? 算法名称 内容概述 神经网络 神经网络是最基础的,相当于为后面网络的学习打下基础 卷积神经网络 这个大家听起来很熟悉吧,深度学习中的大哥大!计算机视觉的核心网络

港中文李弘扬 :物体检测最新进展

喜夏-厌秋 提交于 2020-04-06 12:14:57
本文作者:HelloDeveloper 嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。 人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。由中国科学院大学主办,中国科学院大学学生会承办,读芯术作为指定合作自媒体的“AI未来说·青年学术论坛”第三期“计算机视觉”专场已于2019年3月24日下午在中科院举行。港中文李弘扬博士为大家带来报告《物体检测最新进展》。 李弘扬,香港中文大学多媒体实验室(MMLab)博士生,微软亚洲研究院实习生。博士期间导师为王晓刚教授。主攻计算机视觉和深度学习方向,尤其对物体检测、人体姿态估计、CNN网络结构设计、少样本学习(few-shot learning)、胶囊网络(capsule networks)等热点问题做了一些初步探索。在机器学习和计算机视觉六大顶级会议和两大顶级期刊中,共发表文章9篇,其中一作6篇(包含1篇口头报告)。多次担任顶级会议审稿人、AI教育公司兼职顾问。 报告内容:物体检测(object detection)作为计算机视觉中最基础、最核心的任务,多年来备受学术界、工业界关注

【杂谈】大学期间杂七杂八的经历

二次信任 提交于 2020-04-06 00:48:09
疫情期间在家看论文写论文改论文,内心满满的是即将毕业的焦虑和对未来工作的排斥,这个时候总是容易胡思乱想,我记性向来不好,所以占坑想到啥写啥,也算是留个回忆。 我的语言表达能力很不好,可又总忍不住地想要去分享。公开私密转了好几圈,不过既然写了那就放出来吧。 最开始的絮絮叨叨 好的坏的,如果我依然没能够改变心态去迎接接下来的生活,大概是不会太快乐了。 人,生而孤独。尽管每隔一段时间,都好像会出现一些聊得来的朋友,一起嬉笑打闹地走过一年、两年、五年、十年或许更久,然后渐行渐远。不知道从什么时候开始不相信感同身受,不相信人与人之间是可以真正相互理解的! 经常听到的一句话是什么,一群人的狂欢是一个人的孤独,很文邹邹地一句话,显然这是我经常会碰到的窘境。 作为一个很被动社交甚至害怕社交的人,当初选择了计算机这个专业,是因为爸爸说,起码跟机器打交道会好一点。喜欢吗?谈不上多喜欢吧,但是也没有多不喜欢,那就接着走下去吧,然后一学就是7年。 我的大学兼职之旅 尽管大一刚进学校就已经想好了考研,大学几年仍是逼着自己上蹿下跳地参加了好多活动认识了好些人,大四毕业那年还向舍友要了他们故事的版权,准备把这些酸甜苦辣都写下来,书名摘要人物都想好了,就是迟迟没有下笔…… 细数大学前两年做过的杂七杂八的兼职:发传单、收银员、打印员、服务员、戴尔课戴表、会计班服旅游团建等等的活动代理、上门家教

计算机视觉标准数据集整理

十年热恋 提交于 2020-03-31 03:46:05
VOC2007 与 VOC2012 此数据集可以用于图像分类,目标检测,图像分割!!! 数据集下载镜像网站: http://pjreddie.com/projects/pascal-voc-dataset-mirror/ VOC2012: Train/Validation Data(1.9GB),Test Data(1.8GB),主页: http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2012/ VOC2007: Train/Validation Data(439MB),Test Data(431MB),主页: http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2007/ MNIST手写体数据集 (用作10类图像分类) 包含了60,000张28x28的二值(手写数字的)训练图像,10,000张28x28的二值(手写数字的)测试图像.用作分类任务,可以分成0-9这10个类别! 引用 :Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner. "Gradient-based learning applied to document recognition." Proceedings of the IEEE , 86(11):2278-2324,

赛迪数据丨2021年我国人工智能和智能制造市场规模将分别达到818.7亿元和2948.9亿元...

纵然是瞬间 提交于 2020-03-24 08:14:14
3 月,跳不动了?>>> 研 究 对 象 在人工智能领域,赛迪研究的产品包括计算机视觉、语音语义识别、自然语音处理、深度学习等软件产品,以及具备复杂环境感知的智能工业机器人、智能无人设备,服务机器人等硬件产品。智能制造领域的研究对象则主要是指智能制造系统集成市场。 赛迪顾问 整理了 《2019-2021年中国人工智能与智能制造市场预测与展望数据》 ,分别从三个方面对我国的人工智能和智能制造进行了预测。 赛迪预计,未来三年,中国人工智能市场将持续升温,市场规模将保持 30% 左右的增长速度。到2021年,人工智能市场规模将突破 800亿元 ,中国智能制造系统集成市场规模将达到 2948.9亿元 。以下是目录及详细内容: 2019-2021年 中国人工智能与智能制造市场预测与展望数据 1 人工智能 中国人工智能市场规模及增长预测 中国人工智能市场产品结构预测 中国人工智能市场行业结构预测 2 智能制造  中国智能制造系统集成市场规模及增长预测 中国智能制造系统集成细分市场结构预测 中国智能制造系统集成市场区域结构预测 人工智能 中国人工智能市场规模及增长预测 预计未来三年中国人工智能市场规模仍将保持 30%左右 的增长速度,到2021年,中国人工智能市场规模将达到 818.7亿元 。 中国人工智能市场产品结构预测 预计未来三年,人工智能市场中的智能硬件相比于软件仍将保持较高的占比。

32篇论文、7大事业群,这是腾讯在斯德哥尔摩的AI之夜

旧街凉风 提交于 2020-03-24 07:35:14
3 月,跳不动了?>>> 7 月,全球 AI 人才荟聚瑞典斯德哥尔摩,前来参加学界顶尖会议 ICML 和 IJCAI。在两个会议交接之际,腾讯在当地时间 14 日晚举办了 TAIC 大会,与三位特邀嘉宾、腾讯七大事业群代表探讨前沿 AI 研究与应用。 据机器之心了解,今年腾讯共有 17 篇论文被 ICML 2018 接收,15 篇论文被 IJCAI 2018 接收。本次活动设有三个特邀 keynote,以及五个分论坛,介绍了腾讯在人工智能领域的多元探索和全方位布局。 IJCAI 第 27 届回顾和工程化的标准建立 作为特邀嘉宾,香港科技大学主任教授,腾讯微信-港科大人工智能联合实验室主任杨强教授在开场演讲中表示,「中国队虽然没有进入足球世界杯,但我们进入了人工智能的世界杯,能有今天非常不易。」 1969 年,人们在华盛顿举办了第一届 IJCAI 大会,自那时起,中国学者的出席人数和论文提交量逐年递增。1995 年,参会的韩家炜、张钹等教授还在一起讨论该如发扬中国学界的声音,而中国科学院的教授更为了中国承办学术顶会四处奔走。快进到 2018,中国学者递交的 IJCAI 文章数目已经超过了美国同行,并在一些子方向的研究上开始领先。 杨强教授提到今年 IJCAI 将颁发首个以人工智能领域创始人之一马文·明斯基命名的 Marvin Minsky Award,获奖团队是 Demis