使用Google的Tesseract和OpenCV构建光学字符识别(OCR)系统
总览 光学字符识别(OCR)是计算机视觉领域中广泛使用的系统 了解如何为各种任务构建自己的OCR 我们将利用OpenCV库和Tesseract来构建OCR系统 介绍 你还记得考试期间我们必须填写正确答案的日子吗?或者你还记得在开始第一份工作之前进行的能力测验呢?我可以回忆起奥林匹克竞赛和多项选择测试,大学和组织会使用光学字符识别(OCR)系统对答卷进行大量评分。 老实说,OCR在广泛的行业和功能中都有应用,因此从扫描文档(包括银行对帐单,收据,手写文档,优惠券等)到阅读自动驾驶汽车的路牌,都在OCR的范畴内。 OCR系统在几十年前建造起来是非常昂贵和繁琐的,但随着计算机视觉和深度学习领域的进步意味着我们现在可以建立自己的OCR系统了! 但是,建立OCR系统并不是一件容易的事,对于初学者来说,面临着诸如图像中的字体不同,对比度差,图像中有多个对象等问题。 因此,在本文中,我们将探讨OCR任务的一些非常著名且有效的方法,以及如何自己实施。 如果你不熟悉目标检测和计算机视觉,建议你先阅读以下资源: 基本目标检测算法的介绍 https://www.analyticsvidhya.com/blog/2018/10/a-step-by-step-introduction-to-the-basic-object-detection-algorithms-part-1 计算机视觉课程 https: