ocr

Python - 开发截图识别OCR小工具

放肆的年华 提交于 2020-03-02 16:18:46
一、简介 你一定用过那种“OCR神器”,可以把图片中的文字提取出来,极大的提高工作效率。 今天,我们就来做一款实时截图识别的小工具。顾名思义,运行程序时,可以实时把你截出来的图片中的文字识别出来。 二、模块 import keyboard # 用于监控键盘按下,触发事件(pip install keyboard) import time from aip import AipOcr # 调用百度接口(pip install baidu-aip) from PIL import ImageGrab # 用于保存屏幕截图 三、获取百度应用接口 AI开放平台文档中心 https://ai.baidu.com/ai-doc 查看python语言的SDK文档 点击右上角(控制台),登录自己的百度账号,创建“文字识别”的应用 四、代码实现 #! /usr/bin/env python3 # -*- coding:utf-8 -*- # Author : MaYi # Blog : http://www.cnblogs.com/mayi0312/ # Date : 2020-03-02 # Name : test_ocr # Software : PyCharm # Note : 用Python开发截图识别OCR小工具 import keyboard # 用于监控键盘按下,触发事件(pip

阿里云OCR证件识别商业化发布,减少人工审核误差节省成本

不羁的心 提交于 2020-03-02 04:09:50
随着互联网的发展,利用现代信息技术开展高效快捷便民服务工作,已经势在必行。证件识别算法,极大地提高了办公效率,现已在互联网金融、银行保险、电信通讯运营商、智能交通、政府、航空、社保局等行业领域被广泛运用。 近日,阿里云宣布OCR证件识别商业化发布,通过机器人工智能的方式自动识别,减少人工审核的误差和节省人力成本。 OCR证件识别可谓是含着金汤匙出生,基于阿里云在国内领先的人工智能技术,通过对亿万级海量标注样本进行训练,不断提升识别精度的同时,识别效率也不断加速,同步检测达到1秒内即可返回结果。 据悉,阿里云OCR证件识对于身份证,营业执照识别等全新升级,新增文档图片识别、电商图片识别、视频文字识别、行业解决方案。典型应用场景包括证件信息的自动识别和提取,自然场景中的文字识别,文档或宣传,资料中的文字检测识别等。 作者: 云攻略小攻 原文链接 本文为云栖社区原创内容,未经允许不得转载。 来源: oschina 链接: https://my.oschina.net/u/3552485/blog/2208972

怎么把OCR文字识别软件识别结果的文档导出

青春壹個敷衍的年華 提交于 2020-03-01 19:44:06
使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,识别结果可以保存至一个文件、复制到剪贴板或通过电子邮件发送。可以执行下列操作:导出整个文档、仅导出所选页面、以FineReader 支持的图像文件格式将文档图像导出至图像文件等。 注意:谨慎选择相应的输出参数和输出模式。 文档导出模式: 应根据未来使用输出文档的方式来选择导出模式。 1、“精确副本” 生成格式与原始格式相同的文档。建议对布局复杂的文档使用该选项,如广告手册。但是,该选项会限制更改输出文档文本和格式的功能。 2、“可编辑的副本” 生成格式与原始格式稍有不同的文档,以这种模式生成的文档易于编辑。 3、“带格式文本” 保留字体、字体大小和段落,但不会保留页面上对象的确切间距或位置。将生成左对齐的文本,以从右至左语言编写的文本将会在右侧对齐。 注:在该模式下竖排文本将变为横排文本。 4、“纯文本” 该模式不保留文本格式。 如何导出文档: 1、单击主工具栏中的“导出”。 提示:若要导出特定页面而非整个文档,请选中页面,然后单击右键,并在快捷菜单上单击“导出页面”。 2、在“保存设置”下拉列表中选择所需的导出参数。 3、在“导出”对话框中,输入文件名称、文件导出的磁盘位置,并选择下列某一文件创建选项: •“为所有页面创建一个文件”:将文档的所有页面导出至一个文件。 •

C#使用Tesseract OCR 解析验证码

孤街醉人 提交于 2020-03-01 14:20:35
下面介绍一个开源的OCR引擎Tesseract2。值得庆幸的是虽然是开源的但是它的识别率较高,并不比其他引擎差劲。网上介绍Tessnet2也是当时时间排名第三的识别引擎,只是后来慢慢不维护了,目前是Google在维护,大家都知道Google 在搞电子图书馆,每天都有不同类目的书被扫描成电子版。所以有G老大维护,识别率差不到哪里去。呵呵。。别鄙视我。。。 Tessnet2 是用vc ++ 开发的,其中是生成Tessnet2.dll ,我们可以通过.net 来调用内部具体类库实现识别。 Tessnet2的使用: 1、点击 http://files.cnblogs.com/zhuxiangyu/tessnet2_32.rar 链接下载Tessnet2.dll , Tessnet2是支持多国语的。语言包下载链接: http://code.google.com/p/tesseract-ocr/downloads/list 2、将Tessnet2.dll 添加到vs 引用中,和添加.net程序集一样。 3、用Tessnet2进行识别 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 WebRequest request = WebRequest.Create( " http://sz.2zf.cn/js/code2.asp " ); WebResponse

【OCR技术系列之四】基于深度学习的文字识别(3755个汉字)

China☆狼群 提交于 2020-03-01 09:12:18
上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建。用深度学习做文字识别,用的网络当然是CNN,那具体使用哪个经典网络?VGG?RESNET?还是其他?我想了下,越深的网络训练得到的模型应该会更好,但是想到训练的难度以及以后线上部署时预测的速度,我觉得首先建立一个比较浅的网络(基于LeNet的改进)做基本的文字识别,然后再根据项目需求,再尝试其他的网络结构。这次任务所使用的深度学习框架是强大的Tensorflow。 网络搭建 第一步当然是搭建网络和计算图 其实文字识别就是一个多分类任务,比如这个3755文字识别就是3755个类别的分类任务。我们定义的网络非常简单,基本就是LeNet的改进版,值得注意的是我们加入了batch normalization。另外我们的损失函数选择sparse_softmax_cross_entropy_with_logits,优化器选择了Adam,学习率设为0.1 #network: conv2d->max_pool2d->conv2d->max_pool2d->conv2d->max_pool2d->conv2d->conv2d->max_pool2d->fully_connected->fully_connected def build

Extracting selected text by bounding box from an image

不羁岁月 提交于 2020-02-29 03:55:08
问题 I am trying to fetch selected text by bounding box on an Image. like if only on word is selected by bounding box and I want to fetch that text and convert it into the text file. Please see my code and give some review so I can implement that functionality. So far what I've done I've converted the PDF file to image with bounding box over the text. import numpy as np import csv import io from PIL import Image import pytesseract from wand.image import Image as wi from pytesseract import Output

Extracting text written in hindi from pdf in python [duplicate]

不羁岁月 提交于 2020-02-28 22:16:08
问题 This question already has answers here : Unable to copy exact hindi content from pdf (1 answer) Read PDF using itextsharp where PDF language is non-English (2 answers) Parsing a pdf(Devanagari script) using PDFminer gives incorrect output [duplicate] (1 answer) Closed 2 years ago . I want to extract text typed in hindi from a pdf document.I've attached the image of the sample page I am dealing with. I've tried using pdfminer to get text from it but the text is garbled (may be due to hindi

How to de-skew a text image also retrieve the new bounding box of that image?

微笑、不失礼 提交于 2020-02-28 09:30:26
问题 Here's a receipt image that I've got and I've plotted it using matplotlib and If you see the image the text in it is not straight. How can I de-skew and fix it? from skimage import io import cv2 # x1, y1, x2, y2, x3, y3, x4, y4 bbox_coords = [[20, 68], [336, 68], [336, 100], [20, 100]] image = io.imread('https://i.ibb.co/3WCsVBc/test.jpg') gray = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY) fig, ax = plt.subplots(figsize=(20, 20)) ax.imshow(gray, cmap='Greys_r') # for plotting bounding box

手机OCR证件识别

梦想的初衷 提交于 2020-02-27 08:00:55
互联网的高速发展,让保险业拓宽了渠道,呈现出新的服务模式,让互联网保险开始沸腾起来,再加上形势和政策等多重刺激下,互联网保险将成为互联网金融的下一个风口,似乎已经成了业内的共识。 而在信息高速发展的今天,精益求精不断改革升级创新是生存发展开拓市场不变的定律。互联网保险不同于传统保险,它必须由投保人自行填写各种身份信息,像姓名、户籍住址、身份证号码等等。而且如今移动互联网的飞速发展,手机投保也逐渐兴起,那么试想一下,如果在手机上填写诸多信息,是不是非常繁琐。 手机身份证OCR扫描识别支持多个平台(Windows/Linux/Android/IOS及嵌入式平台)。使用文通身份证OCR识别软件后,大大地节省了人工录入、存储的成本负担,并且在优化业务流程的同时,增强了用户体验。基于android平台的身份证OCR技术技术还可以部署在识别服务器上,可支持Linux 32/64位操作系统、Windows 32位/64位操作系统。用户可部署到自有服务器上,APP可直接调用基于android平台的身份证OCR技术服务识别身份证信息。 手机身份证OCR扫描识别支持身份证头像提取,通过该软件即可快速完成对身份证图像的识别,达到人证合一;另一方面,它能够将识别后所获取的图片信息以及文字信息,精确地传送到指定的业务系统进行保存与处理,对业务人员快速高效的办理相关业务有着积极的意义。

OCR+人工智能,未来更完美

断了今生、忘了曾经 提交于 2020-02-26 04:09:07
人工智能这个词可谓是耳熟能详,近几年人工智能热潮再度席卷而来。引起轰动的要数google的AlphaGo,相继打败了围棋界的韩国选手李世石以及世界冠军柯洁,见证了人工智能发展的里程碑式变革,人工智能再度引起了众人的注视。 人工智能当然不止会下棋这么简单,其实早在20年前智能家居的开发就有不少团队在进行,只不过切入点不对,所以一直没什么起色。资深的市场营销和战略咨询专家王煜全提出:人工智能时代语音交互是最重要的入口,现在大家以语音为切入点,使得人工智能开始步入正轨,亚马逊的智能音箱echo就是代表产品。自然语言互动会逐渐摆脱人对着屏幕互动的束缚,其最大的价值是回归人性,在未来会迁就人类,语音交互就是这样一个在各个场景中都可以嵌入的技术。 AI背后的内容和服务整合虽然很重要,但入口一定要有趣好玩儿,只有体验顺畅才会更占优势。比如:家庭、办公、随身、车载等,亚马逊的alexa、谷歌的assistant、苹果的Siri都具有各自的优势。目前,电子阅读器亚马逊的kindle一家独大,因为亚马逊有内容,在大数据的支持下亚马逊成功击败了索尼和松下等巨头。 目前我国的语音识别技术也已经从进场发展到远场,其中关键的两个技术:麦克风阵列技术和远场语音识别,但我国目前面临的问题是在深度学习和大数据方面仍然欠缺。但是,如果人工智能找准切入口就会迅速崛起,产品也必定琳琅满目。 如果要实现人工智能