jpg

java ocr tesseract, (支持tif,jpg,png,pdf等)

匿名 (未验证) 提交于 2019-12-02 21:45:52
之前在对tif做ocr的时候,在网上找了很多资源,最后选择了tesseract。 关于tesseract相信大多数人找到了资料无非两种,我来一一阐述一下用后的感受。 1.使用tess4j,在实测中发现这种封装后的效果极差,稍微复杂一点的文档识别出来的精度惨不忍睹。所以推荐以下一种方式。 2.安装tesseract原版客户端,使用java中的ProcessBuilder运行。 网上找出来的资源多是3个类,一个OCR,一个OCR2,一个ImageIOHelper,在使用中发现了实在实际上只OCR了tif中的第一个图片,如果tif有多张那么后面都被略过。 于是我把代码研究了后,发现在ImageIOHelper中的这一行代码出了问题 BufferedImage bi = reader.read(0); IIOImage image = new IIOImage(bi,null,reader.getImageMetadata(0)); tempFile = tempImageFile(imageFile); ios = ImageIO.createImageOutputStream(tempFile); writer.setOutput(ios); writer.write(streamMetadata, image, tiffWriteParam); BufferedImage bi

python将PNG格式的图片转化成为jpg

梦想的初衷 提交于 2019-12-02 19:50:26
python将PNG格式的图片转化成为jpg """ 先来说一下jpg图片和png图片的区别 jpg格式:是有损图片压缩类型,可用最少的磁盘空间得到较好的图像质量 png格式:不是压缩性,能保存透明等图 """ from PIL import Image import cv2 as cv import os def PNG_JPG(PngPath): img = cv.imread(PngPath, 0) w, h = img.shape[::-1] infile = PngPath outfile = os.path.splitext(infile)[0] + ".jpg" img = Image.open(infile) img = img.resize((int(w / 2), int(h / 2)), Image.ANTIALIAS) try: if len(img.split()) == 4: # prevent IOError: cannot write mode RGBA as BMP r, g, b, a = img.split() img = Image.merge("RGB", (r, g, b)) img.convert('RGB').save(outfile, quality=70) os.remove(PngPath) else: img.convert(

Python字符串学习笔记

这一生的挚爱 提交于 2019-12-02 18:47:55
# encode 编码 decode 解码 #编码 msg = '刘小明' result =msg.encode() print(result) #解码 print(result.decode()) startswith判断是否以xxx开头的,或者endswith判断是否以xxx结尾的应用: 文件上传 只能上传图片(jpg,png,bmp,gif) filename = '笔记.doc' result = filename.endswith('doc') print(result) s = 'hello' result = s.startswith('h') print(result) 来源: https://www.cnblogs.com/lxmalg/p/11758291.html

前端中常见路径./使用

蓝咒 提交于 2019-12-02 18:11:12
前端中常见路径./使用 1. 去~根目录: / index.html里面:src="/a.jpg" 就可以访问到JPG文件。 2.当前目录:./ (即和index.html同一级,即Two文件夹下) index.html里面:src="./a.jpg" 就可以访问到JPG文件(src="a.jpg"也可以 )。 3.去上一级目录:../ (即One文件夹下) 4.去上一级目录的上一级目录:../../(即E盘下) 5.使用几个../就等于返回几个上一级 原链接: https://www.cnblogs.com/XiaoYEBLog/p/11394486.html 1. 去~根目录: / index.html里面:src="/a.jpg" 就可以访问到JPG文件。 2.当前目录:./ (即和index.html同一级,即Two文件夹下) index.html里面:src="./a.jpg" 就可以访问到JPG文件(src="a.jpg"也可以 )。 3.去上一级目录:../ (即One文件夹下) 4.去上一级目录的上一级目录:../../(即E盘下) 5.使用几个../就等于返回几个上一级 原链接: https://www.cnblogs.com/XiaoYEBLog/p/11394486.html 来源: https://www.cnblogs.com/huanghuali/p

tensorflow 读图并显示

蓝咒 提交于 2019-12-02 12:19:02
#!/usr/bin/env python # @Time : 2019/10/26 11:59 # @File : f102601.py import pylab import tensorflow as tf import numpy as np import matplotlib.pyplot as plt image_raw_data_jpg= tf.io.gfile.GFile(r'C:\Users\Administrator\Desktop\test\cat\c1.jpg','rb').read() with tf.compat.v1.Session() as sess: #这种情况下不能用tensor.numpy() img= tf.image.decode_jpeg(image_raw_data_jpg,channels=3) #开重新保存的,说明下图片是网上下载的数据集,于是我猜测可能图片本身就是多通道的,但是由于收集图片的人使用 #编辑器的问题,导致图像不是真实的通道,试将decode_jpeg里的channel=1改为channel=3 # img= tf.image.convert_image_dtype(img_data_jpg,dtype=tf.uint8) plt.figure() #图像显示 # img = tf.image.decode_jpeg

Linux命令总结--打包解压命令

亡梦爱人 提交于 2019-12-01 23:28:07
Linux下的压缩和解压缩工具比较多,有时经常记不住,这里给大家汇总一下,方便大家查阅。 tar -c: 建立压缩档案 -x:解压 -t:查看内容 -r:向压缩归档文件末尾追加文件 -u:更新原压缩包中的文件 这五个是独立的命令,压缩解压都要用到其中一个,可以和别的命令连用但只能用其中一个。下面的参数是根据需要在压缩或解压档案时可选的。 -z:有gzip属性的 -j:有bz2属性的 -Z:有compress属性的 -v:显示所有过程 -O:将文件解开到标准输出 下面的参数-f是必须的 -f: 使用档案名字,切记,这个参数是最后一个参数,后面只能接档案名。 # tar -cf all.tar *.jpg 这条命令是将所有.jpg的文件打成一个名为all.tar的包。-c是表示产生新的包,-f指定包的文件名。 # tar -rf all.tar *.gif 这条命令是将所有.gif的文件增加到all.tar的包里面去。-r是表示增加文件的意思。 # tar -uf all.tar logo.gif 这条命令是更新原来tar包all.tar中logo.gif文件,-u是表示更新文件的意思。 # tar -tf all.tar 这条命令是列出all.tar包中所有文件,-t是列出文件的意思 # tar -xf all.tar 这条命令是解出all.tar包中所有文件,-t是解开的意思 压缩

小程序点击图片,png转jpg,再预览方法

好久不见. 提交于 2019-12-01 19:17:24
通过wx.previewImage预览图片时,会出现格式为png预览背景为黑色时,图片查看不清楚,能过下面的方法转化为白色底,方便查看 1、先用wx.getImageInfo 下载图片到本地,并且获取图片的信息;2、将图片画入canvas,并生成临时图片地址;3、将canvas生成的地址填写入imgList缓存起来;4、当所有图片都转化完成之后,调用wx.previewImage查看图片;5、每次转化完一片图片的时候,就重新绘制一下canvas; //通过canvas将图片转为jpg,使图片生成白色底便于查看预览 //list为原图片数组列表,index表示当前图片下标, //imgList表示已经通过canvas转化的图片列表 trasformImgType(list,index,imgList){ this.setData({ isSignCanvasShow:true }); index=index?index:0; const that=this; let img=list[index].fileUrl; img=img.replace(/http/,'https'); tip.loading('正在打开图片'); //获取图片信息, wx.getImageInfo({ src: img, success (res) { //画入canvas const context =

图片懒加载

▼魔方 西西 提交于 2019-12-01 16:59:05
一、什么是懒加载技术? 定义:这张图片很懒,喜欢临时抱佛脚,都到了出现在屏幕视线范围内了才加载。不过懒人有懒福,这样可以在那种有大量图片需要展示的网站上优化性能,减轻浏览器压力,毕竟你要浏览器一次加载一两百张图片也很累 二、为什要使用这个技术? 这样做能防止页面一次性向服务器发送大量请求,导致服务器响应慢,页面卡顿崩溃等。比如一个页面中有很多图片,如淘宝、京东首页等等,如果一上来就发送这么多请求,页面加载就会很漫长,如果js文件都放在了文档的底部,恰巧页面的头部又依赖这个js文件,那就不好办了。更为要命的是:一上来就发送百八十个请求,服务器可能就吃不消了(又不是只有一两个人在访问这个页面)。因此优点就很明显了:不仅可以减轻服务器的压力,而且可以让加载好的页面更快地呈现在用户面前(用户体验好)。 三、怎么实现? 原理: 先将img标签的src链接设为同一张图片(比如空白图片),先把图片地址存储在一个临时属性上,然后将真正的图片地址存储在data-src中,当用浏览器的onscroll事件监听到该图片元素进入可视窗口时,将自定义属性中的地址存储到src属性中,达到懒加载的效果。 判断条件 window.innerHeight 可以获取到这个窗口的高度(不包括工具栏和滚动条)。getBoundingClientRect()方法用来获取页面中某个元素的左、上、右、下分别相对浏览器视窗的位置

idea 新建项目 coding上新建项目 idea推送到coding

北城以北 提交于 2019-12-01 12:44:07
1. 注册coding a. 首先在(https://coding.net)上创建项目 ps:跳过注册 ![file](https://img2018.cnblogs.com/blog/1416679/201910/1416679-20191016164755170-1562737291.jpg) b. 创建项目 ![file](https://img2018.cnblogs.com/blog/1416679/201910/1416679-20191016164755725-1230299948.jpg) c. 创建项目成功 ![file](https://img2018.cnblogs.com/blog/1416679/201910/1416679-20191016164755951-937943309.jpg) 2. 创建项目 a. 创建本地项目 ![file](https://img2018.cnblogs.com/blog/1416679/201910/1416679-20191016164756210-716176616.jpg) b. 选择spring boot创建项目 ![file](https://img2018.cnblogs.com/blog/1416679/201910/1416679-20191016164756464-1497986780.jpg) c

idea 新建项目 coding上新建项目 idea推送到coding

妖精的绣舞 提交于 2019-12-01 12:39:52
1. 注册coding a. 首先在(https://coding.net)上创建项目 ps:跳过注册 ![file](https://img2018.cnblogs.com/blog/1416679/201910/1416679-20191016162338876-498624912.jpg) b. 创建项目 ![file](https://img2018.cnblogs.com/blog/1416679/201910/1416679-20191016162339221-917367858.jpg) c. 创建项目成功 ![file](https://img2018.cnblogs.com/blog/1416679/201910/1416679-20191016162339444-818380573.jpg) 2. 创建项目 a. 创建本地项目 ![file](https://img2018.cnblogs.com/blog/1416679/201910/1416679-20191016162339720-1436178221.jpg) b. 选择spring boot创建项目 ![file](https://img2018.cnblogs.com/blog/1416679/201910/1416679-20191016162339992-336673371.jpg) c