XWPFDocument创建和读取Office Word文档基础篇(一)

注:有不正确的地方还望大神能够指出,抱拳了 老铁!

建议大家使用office word来创建文档。(wps和word结构有些不一样)

IBodyElement ——————-迭代器(段落和表格)

XWPFComment ——————-评论(个人理解应该是批注)

XWPFSDT

XWPFFooter ——————-页脚

XWPFFootnotes ——————-脚注

XWPFHeader ——————-页眉

XWPFHyperlink ——————-超链接

XWPFNumbering ——————-编号(我也不知是啥…)

XWPFParagraph ——————-段落

XWPFPictureData ——————-图片

XWPFStyles ——————-样式(设置多级标题的时候用)

XWPFTable ——————-表格

1、正文段落

一个文档包含多个段落,一个段落包含多个Runs,一个Runs包含多个Run,Run是文档的最小单元

获取所有段落:List

获取一个段落中的所有Runs:List

获取一个Runs中的一个Run:XWPFRun run = xwpfRuns.get(index);

XWPFRun–代表具有相同属性的一段文本

2、正文表格

一个文档包含多个表格,一个表格包含多行,一行包含多列(格),每一格的内容相当于一个完整的文档

获取所有表格:List

获取一个表格中的所有行:List

获取一行中的所有列:List

获取一格里的内容:List

之后和正文段落一样

个人理解:我不能确定表格所处的位置(第一个段落后面 ,还是第二个段落后面…)

3、页眉:

一个文档可以有多个页眉,页眉里面可以包含段落和表格

获取文档的页眉:List

获取页眉里的所有段落:List

获取页眉里的所有表格:List

之后就一样了

4、页脚:

页脚和页眉基本类似,可以获取表示页数的角标

言归正传——-干货:

1、通过XWPFDocument读:段落+表格

a、获取文档的所有段落

获取段落内容

b、获取文档中所有的表格

2、XWPFDocument生成word

直接new一个空的XWPFDocument,之后再往这个XWPFDocument里面填充内容,然后再把它写入到对应的输出流中。

新建一个文档

新建一个表格

段落内容替换

直接调用XWPFRun的setText()方法设置文本时,在底层会重新创建一个XWPFRun,把文本附加在当前文本后面,所以我们不能直接设值,需要先删除当前run,然后再自己手动插入一个新的run。

//抽取 word docx文件中的图片

多级标题结构

Original: https://www.cnblogs.com/unruly/p/7479518.html
Author: 福尔摩狼
Title: XWPFDocument创建和读取Office Word文档基础篇(一)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/579646/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球