ocr识别开源软件tesseract试用记录
针对公司系统现场查验场景中,需要用到拍照识别并查验证件信息的需求。对其中关键的ocr开源软件tesseract技术进行了简单试用记录。 1、新建一个winform测试项目,通过nuget搜索安装tesseract的sdk。 2、去github下载语言包: https://github.com/tesseract-ocr/tessdata ,分各种语言,下载英文(eng.traineddata)以及中文(chi_sim.traineddata)的,下载完成后放到测试项目的\debug\tessdata目录下,注意只能是tessdata目录,名字不能错。 3、代码如下: using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.IO; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Windows.Forms; using Tesseract; namespace TestOCR { public partial class Form1 : Form { public