计算机视觉经典任务分类
一、经典任务 计算机视觉领域中和目标有关的经典任务有三种:分类、检测和分割。其中分类是为了告诉你「是什么」,后面两个任务的目标是为了告诉你「在哪里」,而分割任务将在像素级别上回答这个问题。 二、几种专业名词的含义 目标检测,搜索系统感兴趣的目标区域; 目标跟踪,捕获感兴趣区域的运动轨迹; 目标分类,将被跟踪目标分为人,汽车或其他移动物体; 目标行为识别,对跟踪目标进行行为识别。 立体视觉匹配,是一种从平面图像中恢复深度信息的技术。 光流,是指图像灰度模式的表面运动,是三维运动场在二维图像平面上的投影。 场景流,是空间中场景运动形成的三维运动场。两者在视频跟踪与监控,自主机器人导航,三维视频压缩与显示等领域有着广泛的应用。 三、KITTI数据集(非常重要) 对于KITTI数据集,该数据集用于评测立体图像(stereo),光流(optical flow),视觉测距(visual odometry),3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。 四、几种深度学习算法含义 FCNN:全卷积网络:并行,迭代 CNN:FCNN基础上加入空间结构参数共享 RNN:FCNN基础上加入时间结构参数共享 五、论文汇总总结 六、论文以及源码常用网站 CVPR2017 http://openaccess.thecvf.com