poi

poi提取docx中的文字和图片

霸气de小男生 提交于 2020-01-10 01:55:36
package com.fry.poiDemo.dao; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.PrintStream; import java.util.List; import org.apache.poi.xwpf.extractor.XWPFWordExtractor; import org.apache.poi.xwpf.usermodel.XWPFDocument; import org.apache.poi.xwpf.usermodel.XWPFPictureData; public class Word { // maven太好用了 // 读取srcFile源word文件docx文字 // 读取srcFile源word文件docx中的image图片并且存放在文件夹imageFile中 public String readDocxImage(String srcFile, String imageFile) { String path = srcFile; File file = new File(path); try { //

利用poi操作word文档

夙愿已清 提交于 2020-01-09 18:33:33
关键字:POI JAVA 批注 总页数 总字符数 一:认识POI Apache POI是一个开源的利用Java读写Excel、WORD等微软OLE2组件文档的项目。最新的3.5版本有很多改进,加入了对采用OOXML格式的Office 2007支持,如xlsx、docx、pptx文档。 POI主页:poi.apache.org/ 二:POI3.5相关下载 3.5Jar包下载地址 3.5源码下载地址 三:POI组成部分概览 以下是POI的几个重要组成部分,以及各组件的功能概述。 POIFS POIFS是该项目的最古老,最稳定的一部分。.这是格式化OLE 2复合文档为纯Java的接口。 它同时支持读写功能。所有的组件,最终都依赖于它的定义 HSSF 和 XSSF HSSF: MS-Excel 97-2003(.xls),基于BIFF8格式的JAVA接口。 XSSF:MS-Excel 2007+(.xlsx),基于OOXML格式的JAVA接口。 HWPF 和XWPF HWPF: MS-Word 97-2003(.doc),基于BIFF8格式的JAVA接口。只支持.doc文件简单的操作,读写能力有限。本API为POI项目早期开发,很不幸的 是主要负责HWPF模块开发的工程师-“Ryan Ackley”已经离开Apache组织,现在该模块没有人维护、更新、完善。 XWPF:MS-Word

JavaScript实现坐标转换

蓝咒 提交于 2020-01-09 16:41:03
/** * 经纬度转墨卡托 * @param poi 经纬度 * @returns {{}} * @private */ function _getMercator ( poi ) { //[114.32894, 30.585748] var mercator = { } ; var earthRad = 6378137.0 ; // console.log("mercator-poi",poi); mercator . x = poi . lng * Math . PI / 180 * earthRad ; var a = poi . lat * Math . PI / 180 ; mercator . y = earthRad / 2 * Math . log ( ( 1.0 + Math . sin ( a ) ) / ( 1.0 - Math . sin ( a ) ) ) ; // console.log("mercator",mercator); return mercator ; //[12727039.383734727, 3579066.6894065146] } /** * 墨卡托转经纬度 * @param poi 墨卡托 * @returns {{}} * @private */ function _getLngLat ( poi ) { var lnglat

使用POI读写word doc文件

拟墨画扇 提交于 2020-01-09 14:12:46
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> Apache poi的hwpf模块是专门用来对word doc文件进行读写操作的。在hwpf里面我们使用 HWPFDocument 来表示一个word doc文档。在HWPFDocument里面有这么几个概念: l Range :它表示一个范围,这个范围可以是整个文档,也可以是里面的某一小节(Section),也可以是某一个段落(Paragraph),还可以是拥有共同属性的一段文本(CharacterRun)。 l Section :word文档的一个小节,一个word文档可以由多个小节构成。 l Paragraph :word文档的一个段落,一个小节可以由多个段落构成。 l CharacterRun :具有相同属性的一段文本,一个段落可以由多个CharacterRun组成。 l Table :一个表格。 l TableRow :表格对应的行。 l TableCell :表格对应的单元格。 Section、Paragraph、CharacterRun和Table都继承自Range。 1 读word doc文件 在日常应用中,我们从word文件里面读取信息的情况非常少见,更多的还是把内容写入到word文件中。使用POI从word doc文件读取数据时主要有两种方式:通过 WordExtractor

java 在线给word 文件插入图片,并设置图片大小

自古美人都是妖i 提交于 2020-01-08 12:06:28
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 一、前言: 有时我们想在一篇word文档中的指定位置添加一张服务器上的图片,并且并且设置图片大小。这个对文档的操作一定是需要第三方api的。市面上对文档处理的插件有POI以及openoffice等等,学习成本很大,关键是通过这些插件对文档的操作功能也是十分有限。 所以我们今天就要介绍一个中间件技术——pageoffice,此中间件技术已经将 在web系统操作office文档的大部分功能整合完毕,大家只需要关注自己web系统的业务逻辑即可,学习成本低,且功能很丰富。下面我们来实战将pageoffice集成一下 二、核心代码 插入图片的代码 DataRegion dataRegion = worddoc.openDataRegion("PO_开头的书签名称"); dataRegion.setValue("[image]doc/1.jpg[/image]"); 插入图片并设置图片大小的代码 data1.setValue("[image width=500.2 height=200]doc/1.jpg[/image]"); 注意:500.2单位是磅 具体实现过程 1.官网 http://www.zhuozhengsoft.com/dowm/ 下载集成文件,引入jar包,配置web.xml 2.在父页面index.jsp

java poi ppt 接口的基本操作

烈酒焚心 提交于 2020-01-06 13:17:16
依赖 在 pom.xml中增加以下依赖 <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>4.1.1</version> </dependency> 注:很多博客,教我们用以下依赖,是没有XSSF相关内容的 <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>3.14</version> </dependency> version 版本 poi的版本可以在 https://mvnrepository.com/artifact/org.apache.poi/poi 进行查询。 找到想要依赖的版本 点击进入后,可以直接复制里面的依赖 初始化 import org.apache.poi.sl.usermodel.SlideShow; import org.apache.poi.sl.usermodel.SlideShowFactory; SlideShow slideShow = SlideShowFactory.create(new File("./res/1.pptx"));   如果文件不存在或文件正在使用,create 方法抛出

Springboot 之 使用POI读取解析Excel文件

浪子不回头ぞ 提交于 2020-01-06 03:36:42
1、引入依赖jar包。 在pom.xml中引入两个依赖的包即可: <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>RELEASE</version> </dependency> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>RELEASE</version> </dependency> 2、读取xxx .xlsx @GetMapping(value = "/impPriceRecord") public InvokeResult impPriceRecord() throws Exception { try { List<AmoycarClue> infos = new ArrayList<AmoycarClue>(); InputStream is = new FileInputStream("D:/xxx.xlsx"); XSSFWorkbook xssfWorkbook = new XSSFWorkbook(is); XSSFSheet xssfSheet = xssfWorkbook.getSheetAt(0);

Struts2 POI 导入导出Excel数据

青春壹個敷衍的年華 提交于 2020-01-03 03:38:17
页面端: <html>   <head>     <title>导入数据</title>   </head>   <body>     <h1>导入excel数据</h1>     <s:form action="import" method="post" enctype="multipart/form-data">     导入Excel文件:<s:file name="excelFile" /> <br />     <s:submit value="导入"></s:submit>     </s:form>   </body> </html> 配置struts.xml <action name="exportExcel" class="com.bestbpo.action.ExcelAction">   <result name="success" type="stream">     <param name="contentType">application/vnd.ms-excel</param>     <param name="contentDisposition">attachment;filename=${fileName}</param>     <param name="inputName">excelStream</param>     <param

poi excel

旧城冷巷雨未停 提交于 2020-01-02 16:29:08
使用apache的poi包可以对excel进行操作读取和写入。 因excel分为xls的2003版和xlsx的2007版,poi在创建workbook时使用不同的类创建,因此需要注意区分xls。 Workbook workbook = null; String fileExtension=FilenameUtils.getExtension(file.getOriginalFilename()); if(".xls".equals(fileExtension)){ workbook = new HSSFWorkbook(file.getInputStream()); //2003 xls }else{ workbook = new XSSFWorkbook(file.getInputStream()); //2007 xlsx } ※注意如果引入poi后找不到XSSFWorkbook,则可能没有引入poi-ooxml.jar Sheet sheetWorkInfo = workbook.getSheet([sheetname]); 以下为读取excel内容装入到list<bean>中的实例: /** * ExcelUtils 读取信息 * @author DennyZhao * */ public class ExcelUtils { /** * 获取workbook *

Apache POI 实现对 Excel 文件读写

痴心易碎 提交于 2020-01-02 05:13:44
1. Apache POI 简介 Apache POI是Apache软件基金会的开放源码函式库。 提供API给Java应用程序对Microsoft Office格式档案读和写的功能。 老外起名字总是很谦虚,POI为(Poor Obfuscation Implementation)的首字母缩写,意为“可怜的模糊实现”。 如果你查看过 Apache 开源库中的任意项目的源码,你会发现恰到好处的设计模式、高内聚低耦合的模块关系、 到位的接口抽象、优雅的实现方式,这样的一些特点。 o(︶︿︶)o 唉 需要多严谨的思维、多大的代码实现量,多少项目的设计积累,才能达到那样的高度? POI 中主要提供的读写 Microsoft Office 功能点如下: HSSF -- 提供读写Microsoft Excel格式档案的功能。 XSSF -- 提供读写Microsoft Excel OOXML格式档案的功能。 HWPF -- 提供读写Microsoft Word格式档案的功能。 HSLF -- 提供读写Microsoft PowerPoint格式档案的功能。 HDGF -- 提供读写Microsoft Visio格式档案的功能。 本文借一次使用POI 实现读写 Excel 的过程,记述其中具体POI运用的方式。 由搜索引擎点进来的同学,上面这一句话就是本文的主旨句。若能解决你问题,请往下细看。