[PDFBox]后台操作pdf的工具类
PDFBox是Apache下的一个操作pdf的类库。其也提供了一个命令行的工具,也提供了java调用的第三方类库。 下载地址: https://pdfbox.apache.org/ 下面的实验基于JDK8+pdfbox-2.0.13.jar+pdfbox-app-2.0.13.jar(命令行工具库) 1.命令行使用 https://pdfbox.apache.org/2.0/commandline.html 命令行工具可以提取pdf中的图片、文本,合并pdf与拆分pdf,pdf转换为图片等操作。 1.提取图片 java -jar pdfbox-app-2.0.13.jar ExtractImages ./1.pdf 会在同文件夹下提取出pdf中的图片。 2.提取文字 java -jar pdfbox-app-2.0.13.jar ExtractText ./1.pdf ./text.txt 当然还可以指定起始页号等参数。 3.pdf转换为图片 java -jar pdfbox-app-2.0.13.jar PDFToImage ./1.pdf 还有许多命令行操作可以参考官网的文档,对于参数都有详细的解释。 这种方式可以封装为工具类用Runtime多线程执行操作pdf。 2.Java中作为类库使用 https://www.cnblogs.com