• Java 读取Word标题(目录)


    概述

    Word中的标题可通过“样式”中的选项来快速设置(如图1),

    图1

    在添加目录时,可将“有效样式”设置为“目录级别”显示(如图2),一定程度上来说,标题大纲也可以作为目录来参考。

    图2

    本文,将通过后端Java程序代码介绍如何来获取Word中的标题内容。

    注:如果在Word中进行了如图2中的设置,此方法也可以作为获取目录的方法;若没有对应设置,则想要通过此方法来获取的目录内容可能不完整。

    本次测试的Word文档如下图所示,【标题样式】和【目录级别】经过相应设置,在获取标题大纲时等同于获取目录:

    图3

    代码测试环境

    • Word测试文档:.docx 2013版
    • 编译环境:IntelliJ IDEA 2018
    • Jdk版本:1.8.0
    • Word jar包:Free Spire.Doc for Java 3.9.0

     

    Java 程序代码

    import com.spire.doc.*;
    import com.spire.doc.documents.Paragraph;
    
    import java.io.BufferedWriter;
    import java.io.File;
    import java.io.FileWriter;
    import java.io.IOException;
    
    
    public class GetTitle {
        public static void main(String[] args)throws IOException {
            //加载Word测试文档
            Document doc = new Document();
            doc.loadFromFile("sample.docx");
    
            //保存标题内容到.txt文档
            File file = new File("GetTitle.txt");
            if (file.exists())
            {
                file.delete();
            }
            file.createNewFile();
            FileWriter fw = new FileWriter(file, true);
            BufferedWriter bw = new BufferedWriter(fw);
    
            //遍历section
            for (int i = 0; i < doc.getSections().getCount(); i++)
            {
                Section section = doc.getSections().get(i);
                //遍历Paragraph
                for (int j = 0; j < section.getParagraphs().getCount(); j++)
                {
                    Paragraph paragraph = section.getParagraphs().get(j);
    
                    //获取标题
                    if ( paragraph.getStyleName().matches("1"))//段落为“标题1”的内容
                    {
                        //获取段落标题内容
                        String text = paragraph.getText();
    
                        //写入文本到txt文档
                        bw.write("标题1: "+ text + "
    ");
                   }
                    //获取标题
                    if ( paragraph.getStyleName().matches("2"))//段落为“标题2”的内容
                    {
                        //获取段落标题内容
                        String text = paragraph.getText();
    
                        //写入文本到txt文档
                        bw.write("标题2: " + text + "
    ");
                    }
                    //获取标题
                    if ( paragraph.getStyleName().matches("3"))//段落为“标题3”的内容
                    {
                        //获取段落标题内容
                        String text = paragraph.getText();
    
                        //写入文本到txt文档
                        bw.write("标题3: " + text+"
    ");
                    }
                    //获取标题
                    if ( paragraph.getStyleName().matches("4"))//段落为“标题4”的内容
                    {
                        //获取段落标题内容
                        String text = paragraph.getText();
    
                        //写入文本到txt文档
                        bw.write("标题4: " + text+"
    ");
                    }
    
                    bw.write("
    ");
                }
    
            }
            bw.flush();
            bw.close();
            fw.close();
        }
    }

    标题(目录)获取结果:

    本文完。

    原创内容,如需转载,请注明出处!

  • 相关阅读:
    数据结构做题一些总结
    ExecuteNoQuery执行, 报错“go”附近有语法错误。
    EF总结
    哨兵模式
    Redis 发布订阅
    Redis 持久化
    Redis 事务 和乐观锁
    缓存穿透和雪崩
    Redis 基础知识
    Redis 三种特殊的数据类型
  • 原文地址:https://www.cnblogs.com/Yesi/p/14653661.html
Copyright © 2020-2023  润新知