CV方向调研
CV方向调研 本文主要对CV方向深度学习相关的知识、资料进行介绍。DNN相关的模型在计算机视觉上有许多应用场景,大方向上大致分为2D和3D两类。 C V 技术总览 PS:列举的多为各个方向的state of the art。 C V 领域发展和应用 2D方向上,自从2012年提出的AlexNet获得了ImageNet 的冠军之后,性能惊人的用于图像分类的卷积神经网络模型不断涌现。以3*3卷积核为主的VGG、借鉴了NIN且在宽度上进行了增加的GoogleNet(Inception v1)、引入了残差块使得网络深度能够继续加深而不容易出问题的ResNet,都在分类问题上取得了不俗的成绩,并作为视觉中许多其他任务的网络模型的backbone。由于DNN模型消耗的计算资源过多,MobileNet、ShuffleNet等能够减少卷积计算量的网络被提出,虽各有特点,但核心操作在于将标准卷积用depthwise卷积(特殊的分组卷积)和1*1卷积代替。这些模型有望用于计算资源不多的嵌入式设备上。 MobileNet关键结构替换示意图 目标检测方面,模型主要分为two-stage和one-stage两大类。Two-stage首先给出proposal region,然后在给出的proposal region上进行定位和分类回归,而one-stage则是直接进行定位和分类回归任务。Two