docx

教你如何在工作中“偷懒”,python优雅的帮你解决

我的梦境 提交于 2020-04-15 16:00:08
【推荐阅读】微服务还能火多久?>>> 前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun 有些朋友在工作中会有这样的困惑:明明我从早忙到晚,为什么得到的评价还不高? 要知道,企业对一个员工的评价是出于“产出”而非“付出”。所以,如果把大量时间花在机械重复的工作上,不但工作效率不高,对个人发展来说也无甚帮助。 而这些工作,如果对于会点编程的人来说,往往通过几行代码就可以快速搞定了。 于是,我去了解了一下身边不同岗位(HR、产品、运营、市场、数据分析师等)每天需要面对的重复性劳动(肯定会有不全,欢迎补充~),总结了一些在工作中非常常见的例子,并且将源码整理好供参考。希望这些程序可以让你的工作更高效!(升职加薪了别忘了回来发红包哦~) 那么如何将这些统统实现呢? 我将这些分为以下几类,大家可以自行评估,各取所需: 系统录入自动化 由于你经常需要不断的将一些信息录入系统,每一次录入的过程中你可能需要不断的点击一些按钮,面对这种情况,完全可以写一个自动脚本,每次代替你来执行这些点击的行为。 这里写了一个自动登录邮箱的脚本,可以实现文本输入和网页点击: 同理可以写一个简单的游戏挂机脚本,游戏挂机脚本

性能优化教案

爷,独闯天下 提交于 2020-04-09 18:51:43
【摘要】 多维分析是针对一个事先准备好的数据立方体实施旋转、切片(切块)、钻取等交互操作的过程,经常也被直接称为 OLAP(On-line Analysis Processing)。OLAP 需要即时响应,对性能要求很高。这类运算形式虽然简单,但常常基于大数据量,因此计算量也不小,如果不设法优化,效率就可能很差。本文介绍了多维分析后台建设时几种经常被采用的性能优化手段。 来源: oschina 链接: https://my.oschina.net/u/4290180/blog/3226259

SPL 教案——游标

生来就可爱ヽ(ⅴ<●) 提交于 2020-04-09 18:51:25
简介: 数据量太大不方便处理,我们希望在处理大数据量的时候和小数据量的代码相同,但往往不能实现,而 SPL 中的游标的出现让这个愿望变成了可能。 来源: oschina 链接: https://my.oschina.net/u/4414278/blog/3226260

使用POI读写word docx文件

我是研究僧i 提交于 2020-04-07 08:02:04
POI在读写word docx文件时是通过xwpf模块来进行的,其核心是XWPFDocument。一个XWPFDocument代表一个docx文档,其可以用来读docx文档,也可以用来写docx文档。XWPFDocument中主要包含下面这几种对象: l XWPFParagraph:代表一个段落。 l XWPFRun:代表具有相同属性的一段文本。 l XWPFTable:代表一个表格。 l XWPFTableRow:表格的一行。 l XWPFTableCell:表格对应的一个单元格。 1 读docx文件 跟读doc文件一样,POI在读docx文件的时候也有两种方式,通过XWPFWordExtractor和通过XWPFDocument。在XWPFWordExtractor读取信息时其内部还是通过XWPFDocument来获取的。 1.1 通过XWPFWordExtractor读 在使用XWPFWordExtractor读取docx文档的内容时,我们只能获取到其文本,而不能获取到其文本对应的属性值。下面是一段使用XWPFWordExtractor来读取docx文档内容的示例代码: public class XwpfTest { /** * 通过XWPFWordExtractor访问XWPFDocument的内容 * @throws Exception */ @Test public

POI读写Word docx文件

不羁的心 提交于 2020-04-07 08:01:13
标签: poi word docx | 发表时间:2014-04-18 15:56 | 作者:234390216 分享到: 出处:http://www.iteye.com 使用 POI 读写 word docx 文件 目录 1 读docx文件 1.1 通过XWPFWordExtractor读 1.2 通过XWPFDocument读 2 写docx文件 2.1 直接通过XWPFDocument生成 2.2 以docx文件作为模板 POI在读写word docx文件时是通过xwpf模块来进行的,其核心是XWPFDocument。一个XWPFDocument代表一个docx文档,其可以用来读docx文档,也可以用来写docx文档。XWPFDocument中主要包含下面这几种对象: l XWPFParagraph:代表一个段落。 l XWPFRun:代表具有相同属性的一段文本。 l XWPFTable:代表一个表格。 l XWPFTableRow:表格的一行。 l XWPFTableCell:表格对应的一个单元格。 1 读docx文件 跟读doc文件一样,POI在读docx文件的时候也有两种方式,通过XWPFWordExtractor和通过XWPFDocument。在XWPFWordExtractor读取信息时其内部还是通过XWPFDocument来获取的。 1.1

在Apache的POI XWPFRun对象分隔文本行

扶醉桌前 提交于 2020-04-06 20:50:05
问 题 我是试图取代模板 DOCX 与Apache POI文件使用 XWPFDocument 类。我在doc和 JSON 文件标签读取替换数据。我的问题是一个文本行,似乎在 DOCX以某种方式分离当我改变其推广到邮政编码文件打开 document.xml 。例如 [MEMBER_CONTACT_INFO] 文本成为 [MEMBER_CONTACT_INFO 和] 分别。 POI 在自 DOCX 原来是这样以同样的方式读取此。这将在第2款 XWPFRun 对象这显示文本为 [MEMBER_CONTACT_INFO 和] 分开。 我的问题是,有没有办法迫使 POI 通过合并相关的运行或类似的东西,如Word运行?或者,我怎么能解决这个问题?我正在运行的匹配,而文本替换因为它被分成2个不同的运行对象我找不到我的标签。 最佳 解决方案 这浪费了那么多我的时间...一次 基本上,一个 XWPFParagraph 是由多个的 XWPFRun s和XWPFRun是具有固定的传染性文本同样的风格。 所以,当你尝试写一些像“[PLACEHOLDER_NAME]”在MS-Word中它会创建一个单一的XWPFRun。但是,如果你不小心添加了一些东西多了,然后你回去改“[PLACEHOLDER_NAME]”以别的东西它永远不会保证它仍将是一个 XWPFRun 它很可能,这将拆分到两分。据我所知,这是MS

java生成自定义证书图片3 - 将word转成pdf格式

二次信任 提交于 2020-03-28 00:39:12
将doc指定内容替换成自定义数据之后,需要将docx文件转成pdf文件,便于下一步转成图片,工具类如下: package com.x.certificate.doc; import java.io.File; import java.io.IOException; import org.artofsolving.jodconverter.OfficeDocumentConverter; import org.artofsolving.jodconverter.office.DefaultOfficeManagerConfiguration; import org.artofsolving.jodconverter.office.OfficeManager; /** * 用于docx文件的格式转换 * @author xuhaojin * @version [版本号, 2020年3月22日] */ public class DocxConverter { /** * 使用libreoffice服务,将docx格式文件转成pdf格式文件 * @param docxPath * @param pdfPath * @param libreOfficePath * @return * @throws IOException 参数 * File 返回类型 */ public static

markdown、word、pdf文件之间相互转换

女生的网名这么多〃 提交于 2020-03-26 10:17:37
3 月,跳不动了?>>> 现实需求 平常会用markdown去写一些文档,这可以说是程序员的 最爱,但是在实际工作过程中与产品、需求人员以及客户交流更多还是使用word以及pdf等官方文档,直至发现了 Pandoc,它可以将文档在 Markdown、LaTeX、reStructuredText、HTML、Word docx 等多种标记格式之间相互转换,并支持输出 PDF、EPUB、HTML 幻灯片等多种格式。该程序被称为格式转换界的 “瑞士军刀”。 功能介绍 Pandoc 的作者是 John MacFarlane,他是加州大学伯克利分校的哲学系教授。Pandoc 使用 Haskell 语言编写,被作者用来生成讲义、课件和网站等。该程序开源免费,目前以 GPL 协议托管在 Github 网站上。 安装Pandoc 可以直接访问pandoc的官网 https://www.pandoc.org/installing.html ,由于我本地使用的mac系统所以直接找到对应mac版本,然后执行 brew install pandoc brew install pandoc-citeproc 使用文档转换 打开终端直接执行如下命令,如将word转为markdown文档,其他例旧即可,这里注意pandoc不能转换doc格式的需要docx格式的 pandoc project.docx -o

昨晚我牺牲很大,用Python深夜帮行政小姐姐做了500多份武汉复工证明

孤街醉人 提交于 2020-03-23 08:27:59
时间:2020.3.22 22:08, 距离 “ 武汉发布 ”官方发布《湖北省内外人员返汉、省内人员离汉政策来了》 30分钟, 大晚上的,公司行政小姐姐骚扰我。。。 我能怎么? 实在不好拒绝。。。。。。 准备阶段 需要1张excel表格,记录了每个员工的必要信息, openpyxl模块可以读取excel 需要1个《复工证明_模板》.docx, 可以用python-docx来读写word 复工模板是一个模板,里边能动态替换的地方是:[TODO1][TODO2][TODO3] 复工模板word里边标题和公司落款可以自定义化,可自行DIY。 Python批处理脚本形式 import openpyxl from docx import Document from docx.shared import Pt from docx.oxml.ns import qn # 读取excel里边的内容 wb = openpyxl.load_workbook('员工名单信息.xlsx') table = wb.active rows = table.max_row cols = table.max_column for each_row in range(2, rows+1): value1 = table.cell(row=each_row, column=1).value value2 =

在服务器端生成 Word 2007 文档

柔情痞子 提交于 2020-03-22 08:49:20
直到现在,编写和部署服务器端的能够读取、修改和生成 Microsoft ® Office 应用程序所使用的文档的应用程序仍然是个挑战。Microsoft Word、Excel ® 和 PowerPoint ® 所用的较早的二进制格式是在 1997 年开始使用的,直到在 Office 2003 版中仍然将其作为默认文件格式。然而,这种二进制的文件格式已被证明因过于棘手而不便使用。大多数读写 Office 文档的生产应用程序都通过承载 Office 应用程序的对象模型来达到此目的。 使用应用程序(如 Word 或 Excel)的对象模型的应用程序和组件,在桌面机上的运行状况远远好于在服务器端环境中。任何曾花费时间编写额外的基础代码来让 Office 桌面应用程序在服务器上可靠运行的人都会告诉您,那绝对不是理想的解决方案。这是因为,Word 和 Excel 之类的 Office 桌面应用程序的设计初衷从来就不是使其在服务器上运行,每当遇到需要人工干预的频繁的对话时,就需要用一个自定义实用程序来终止并重新启动它们。 对于服务器端而言,无需采用承载 Office 应用程序的对象模型的方法即可读写 Office 文档的能力已变为极需要的趋势。Office 2000 和 Office 2003 都引入了一些模型化的功能,可使用 XML 来创建 Excel 工作簿和 Word 文档