作者:Tom Hardy
Date:2020-02-02
来源:超全的OCR数据集
1、SynthText in the Wild dataset
数据集下载链接:
http://www.robots.ox.ac.uk/~vgg/data/scenetext/
数据集介绍:一个综合生成的数据集,其中单词实例放置在自然场景图像中,同时考虑场景布局。数据集由大约80万个合成词实例的800万个图像组成。每个文本实例都使用其文本字符串、字级和字符级边界框进行注释。
2、Google FSNS
数据集下载链接:
http://rrc.cvc.uab.es/?ch=6&com=downloads
数据集介绍:Google FSNS数据集包含了100多万张从法国Google街景图片中截取的街道名称标志图片。每个图像包含同一街道名称标志的四个视图。路标上的文字最多可以跨越三行。每一个路标都有一个规范的抄本。
3、COCO-Text
数据集下载链接:
https://vision.cornell.edu/se3/coco-text-2/
数据集介绍:63686个图像,145859个文本实例,3个细粒度文本属性。
此数据集基于MSCOCO数据集。
主要内容:
来源:CSDN
作者:3D视觉工坊
链接:https://blog.csdn.net/Yong_Qi2015/article/details/104147441