超全的OCR数据集

拥有回忆 提交于 2020-02-02 23:57:15

作者:Tom Hardy
Date:2020-02-02
来源:超全的OCR数据集


1、SynthText in the Wild dataset

数据集下载链接:

http://www.robots.ox.ac.uk/~vgg/data/scenetext/


数据集介绍:一个综合生成的数据集,其中单词实例放置在自然场景图像中,同时考虑场景布局。数据集由大约80万个合成词实例的800万个图像组成。每个文本实例都使用其文本字符串、字级和字符级边界框进行注释。

2、Google FSNS

数据集下载链接:

http://rrc.cvc.uab.es/?ch=6&com=downloads


数据集介绍:Google FSNS数据集包含了100多万张从法国Google街景图片中截取的街道名称标志图片。每个图像包含同一街道名称标志的四个视图。路标上的文字最多可以跨越三行。每一个路标都有一个规范的抄本。

3、COCO-Text

数据集下载链接:

https://vision.cornell.edu/se3/coco-text-2/


数据集介绍:63686个图像,145859个文本实例,3个细粒度文本属性。

此数据集基于MSCOCO数据集。

主要内容:

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!