基于python的OCR中文字符识别——基于windows平台
1.安装配套环境 (1)首先安装OCR字符识别库Tesseract 下载网址:https://digi.bib.uni-mannheim.de/tesseract/ 下载下图对应的版本 下载后双击进行安装,这里因为我们要识别中文字符,所以在安装界面中需要进行额外的语言勾选,展开Additional language data 然后点击next安装即可(注意:在选择安装路径的时候不要出现中文,并且要记住这个安装路径) 接下来配置环境变量.路径添加到环境变量中 分别对用户变量PATH和系统变量Path添加刚才的安装目录 D:\toolplace\OCR\Tesseract-OCR; 这里注意各个变量之间隔开用英文的分号。 环境变量修改好之后验证下是否安装成功。打开cmd命令行工具 敲入命令: Tesseract -v 安装python环境 pip install Pillow==5.2.0 pip install pytesseract==0.2.4 pathSaveShot = “” img = Image.open(pathSaveShot) text = pytesseract.image_to_string(img, lang='chi_sim') logging.info('[截取图片的识别结果:' + text + ']') 问题: 安装之后报错 pytesseract