poi

Apache Poi获取各类文档内容。

丶灬走出姿态 提交于 2019-12-24 16:42:04
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> poi版本3.9 操作之前获取文件输入流对象 FileInputStream fis; try { fis = new FileInputStream(file); } catch (FileNotFoundException fnfe) { return; } 1.获取word2003及以前版本内容。 WordExtractor wordExtractor = new WordExtractor(fis); String result = wordExtractor.getText(); 2.获取word2007内容。 XWPFWordExtractor xwpfWordExtractor = new XWPFWordExtractor(new XWPFDocument(fis)); String result = xwpfWordExtractor.getText(); 3.获取excel2003及以前版本内容。 POIFSFileSystem poifsFileSystem = new POIFSFileSystem(fis); StringBuffer sb = new StringBuffer(); HSSFWorkbook wb = new HSSFWorkbook(poifsFileSystem)

使用Python划分矩形网格爬取百度POI数据

…衆ロ難τιáo~ 提交于 2019-12-24 12:57:45
原文地址: http://www.mapboxx.cn/article/bmappoi/ 各大互联网地图厂商均提供了开放的POI数据,不过各个地图几乎都对一个城市能采集的POI数量有限制,高德地图是900条,百度更狠,才400条,这种很明显与实际的数量相差甚远,因此,可以采用将大范围划分为N多个小矩形范围,调用百度提供的矩形范围POI爬取接口,将各个小矩形爬取的POI汇总,即可得到大区域内的所有POI数据,理论上来说,只要矩形划分得足够小,就能爬到大区域内的所有POI数据,但是百度高德是否也对矩形范围内的数据有所限制也说不定。不过,从目前来看,使用划分矩形来爬到的POI数据量比在城市内搜索的方式得到的数据量多了很多很多,缺点是爬取的耗时比较久。因此最好就是在自己电脑上跑。前次爬深圳的所有住宅区大概用了半小时,总的大概3W条数据。 如果想查看高德地图POI数据爬取可以参考: 高德POI划分矩形范围爬取:http://www.mapboxx.cn/article/poi-pology/ 高德POI根据关键字爬取在线工具:http://www.mapboxx.cn/tool/poiview/ 百度地图根据矩形范围爬取的API地址在这: 其实很简单, 主要的参数是需要的POI类型、以及矩形范围坐标(也支持多边形范围),矩形的话只需要传入左下角和右上角坐标即可。因此我们的主要流程其实就是:

GrapeCity Documents for Excel 与 Apache POI 功能对比

丶灬走出姿态 提交于 2019-12-24 09:29:16
GrapeCity Documents for Excel 与 Apache POI 功能对比 GrapeCity Documents for Excel 是什么? GrapeCity Documents for Excel (简称为:GcExcel)是葡萄城推出的一款文档API组件,同时适用于 Java 和所有支持 .NET Standard 2.0 及以上标准的平台,以编码的方式,无需依赖任何 Microsoft Excel 组件,即可快速批量操作 Excel 文件,轻松满足您关于 Excel 电子表格的一切需求。 超快速、低占用率、更轻量,使用 GrapeCity Documents 可极大节省应用程序在生成、加载、编辑和保存大型文档时所占用的内存和时间,帮助企业以更高效的方式处理各种文档,实现更多定制化选项。 下载试用GrapeCity Documents for Excel (Java平台) 下载试用GrapeCity Documents for Excel (.NET平台) Apache POI是什么? Apache POI 是由Java编写的一款免费开源的跨平台Java API,主要用于实现对Microsoft Office文档进行读、写的功能。POI为“Poor Obfuscation Implementation”首字母的缩写,意为“简单的模糊实现”。

java poi读取excel文件

邮差的信 提交于 2019-12-23 13:28:06
近期项目需要用到数据导入,虽然之前用过,但是并不是很熟悉,而且使用的是jxl.jar读取的,可是jxl.jar貌似不能读取高版本的xlsx文件,所以这次采用了poi来读取,读取其实很简单,只要遵循其读取规则便可读取指定的excel文件,下面是其用到的jar包: poi-3.9-20121203.jar poi-ooxml-3.9-20121203.jar poi-ooxml-schemas-3.9-20121203.jar stax-api-1.0.1.jar xmlbeans-2.3.0.jar 上面几个jar包缺一不可,有时候会出现ClassNotFound之类的错误,是因为jar缺少或不兼容的原因,上面jar包已经过测试,可以使用。 读取excel文件代码如下: public class ExcelUtils { // 对外提供读取excel文件的接口 public static List<List<Object>> readExcel(File file) throws IOException { String fName = file.getName(); String extension = fName.lastIndexOf(".") == -1 ? "" : fName .substring(fName.lastIndexOf(".") + 1); if ("xls

第6章 视图和视图解析器

那年仲夏 提交于 2019-12-22 20:02:05
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> Spring MVC如何解析视图 视图和视图解析器 请求处理方法执行完成后,最终返回一个 ModelAndView 对象。对于那些返回 String , View 或 ModeMap 等类型的处理方法,Spring MVC也会在内部将它们装配成一个 ModelAndView 对象,它包含了逻辑名和模型对象的视图。 Spring MVC 借助视图解析器(ViewResolver)得到最终的视图对象(View),最终的视图可以是JSP,也可以是Excel、JFreeChart等各种表现形式的视图。 对于最终究竟采取何种视图对象对模型数据进行渲染,处理器并不关心,处理器工作重点聚焦在生产模型数据的工作上,从而实现MVC的充分解耦。 视图 其作用是渲染模型数据,将模型里的数据以某种形式呈现给客户。 为了实现视图模型和具体实现技术的解耦,Spring在 org.springframework.web.servlet 包中定义了一个高度抽象的 View 接口: 视图对象由视图解析器负责实例化。由于视图是无状态的。所以它们不会有 线程安全 的问题。 常用的视图实现类 视图解析器 SpringMVC为逻辑视图名的解析提供了不同的策略,可以在Spring WEB上下文中配置一种或多种解析策略,并指定他们之间的先后顺序

Delphi调用DLL出现错误:Invalid pointer operation

空扰寡人 提交于 2019-12-22 08:42:29
DLL中的函数返回string类型,在Delphi中动态调用时可以得到正确结果,在关闭程序是提示错误:Invalid pointer operation 在网上搜索了一圈,均指向内存泄露,以及下面的解决方法:   Windows中如果一个动态库导出函数以参数形式传递或者返回了一个长字符串或者 动态数组(无论是直接传递还是包含在一个对象中),那么动态库以及其调用程序都必须得引用ShareMem单元。同样,如果程序或者库通过New或者 GetMem申请了内存,并且该内存在另一个模块中通过Dispose或FreeMem释放,也得这么做。务必把ShareMem放在程序或者库所有引用 单元之首。   ShareMem是BORLANDMM.dll内存管理单元接口,它允许模块间共享动态申请内存。BORLANDMM.dll必须与使用了改单元的程序或者Dll一块儿部署。当程序或者动态库使用了ShareMem,其内存管理将会由BORLANDMM.dll接管。 注意:在dpr文件的uses语句的开头加上ShareMem,以及DLL中的uses语句开头加上ShareMem。 来源: https://www.cnblogs.com/fred-rk/archive/2012/12/16/2820836.html

scala读取excel的.xlsx文件

戏子无情 提交于 2019-12-22 01:54:42
Scala 读入xlsx文件 原理 : 主要是利用java的poi包 poi官网: 主页传送门 API传送门 准备依赖: <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version>4.1.1</version> </dependency> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>4.1.1</version> </dependency> 准备一个.xlsx文件,读取代码如下 public static void main(String[] args) throws IOException { XSSFWorkbook workbook = new XSSFWorkbook("src/main/resources/test.xlsx"); XSSFSheet sheetAt = workbook.getSheetAt(0); for (Row row : sheetAt) { if (row != null) { for (Cell cell : row) { if (cell != null) { System.out.print

Java之使用poi导出excel文件及文件格式设置为文本

霸气de小男生 提交于 2019-12-21 20:21:58
使用 SXSSFWorkbook 进行Excel导出下载 注意:该方法是将Excel中指定列的单元格格式设置为文本格式 1.excel模版导出工具类 package com.qzlink.util.excel; import com.jfinal.core.Controller; import com.jfinal.plugin.activerecord.Record; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream; import java.text.DecimalFormat; import java.text.SimpleDateFormat; import java.util.Collection; import java.util.Iterator; import java.util.LinkedList; import java.util.List; import javax.servlet.http.HttpServletResponse; import org.apache.poi.hssf.usermodel.HSSFDateUtil;

POI读取第三方下载的Word文档

丶灬走出姿态 提交于 2019-12-20 11:15:56
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 因为从第三方读取到的word可能是其他格式(例如:html)转成word的,此时去读取word可能会失败。这里以HTML为例 依赖 <!-- parse world --> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>4.0.1</version> </dependency> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-scratchpad</artifactId> <version>4.0.1</version> </dependency> <dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.10.3</version> </dependency> 代码片段 private String parseWord(String path) throws ParseWordException { // inspect if (isEmpty(path)) { throw new