深度学习在计算机视觉领域(包括图像,视频,3-D点云,深度图)的应用一览
深度学习在计算机视觉领域(包括图像,视频,3-D点云,深度图)的应用一览 计算机视觉、以及深度学习在其中的应用闲扯 深度学习无疑是最近人工智能领域最有影响力的方法,在语音识别、计算机视觉、自然语言处理、游戏、机器人和自动驾驶等领域起了非常大的作用,有的可以说是所在领域最成功的一次突破。 计算机视觉从2012年ImageNet获得冠军的AlexNet起,深度学习已经产生了巨大的贡献,从最早的图像分类,到目标检测、识别、分割和跟踪等,都可以看到替代传统视觉方法和战胜以前浅层机器学习的杰出成果。特别是近几年来,我们看到深度学习在计算机视觉的另外两个传统的领域开始发力,一是底层的图像处理和计算摄影学,特别是逼真度极高的一些人脸合成和替换让人感到了深度学习的威力,有得甚至引起了社会道德范畴的反思;另一个是3-D重建,其中包括了2.5D的深度估计和运动估计等,这个本是传统计算机视觉的核心,也是大家觉得确定性(deterministic)计算和估计是必要存在的防守“领地”,现在也在接受深度学习的挑战。另外,在一些计算机视觉外围的领域,比如和图形学结合的图像合成技术,以及和自然语言处理合作的图像加注和问答,还有自动驾驶系统中的多传感器融合技术等,也看到了深度学习的“身影”。 Marr School的贡献就是给出了一个分层的世界描述框架:从首要简约图(primal sketch),到2.5 D