• Java 将Word转为HTML的方法


    本文介绍如何在JAVA程序中将Word文档通过 Document.saveToFile() 方法转换为HTML文档。编辑代码前,参考如下环境配置,导入jar包。

    【程序环境】

    1. IntelliJ IDEA 2018( jdk 1.8.0)

    2. 测试文档:Word 2013(.docx)

    3. Jar包:Free Spire.Doc for Java 3.9.0

    导入jar的两种方法:

    方法1下载jar包到本地,解压,将本地lib文件夹下的Spire.Doc.jar导入Java程序,步骤如下:

     

     

    导入结果:

     

    方法2maven程序中需要配置pom.xml文件,指定maven仓库路径和spire.doc.free的依赖,配置内容如下:

    <repositories>
            <repository>
                <id>com.e-iceblue</id>
                <url>http://repo.e-iceblue.cn/repository/maven-public/</url>
            </repository>
        </repositories>
    
    <dependencies>
        <dependency>
            <groupId>e-iceblue</groupId>
            <artifactId>spire.doc.free</artifactId>
            <version>3.9.0</version>
        </dependency>
    </dependencies>

    【Java】

    import com.spire.doc.*;
    
    public class WordtoHtml {
        public static void main(String[] args) {
            Document  doc = new Document();
            doc.loadFromFile("test.docx");
            doc.saveToFile("wordtohtml.html",FileFormat.Html);
            doc.dispose();
        }
    }

    转换效果

    Word测试文档:

    转换后的HTML文件:

     

    注:代码中的文件路径为IDEA程序项目文件夹路径,如 F:IDEAProjectConversion_Doc est.docx ,文件路径可以另行自定义为其他路径。

    —End—

  • 相关阅读:
    关于React的脚手架
    yarn和npm
    谈谈NPM和Webpack的关系
    php开发环境和框架phalcon的搭建
    Centos6.5--svn搭建
    System.Diagnostics.Process.Start(ProcessStartInfo)
    PHP错误:call to undefined function imagecreatetruecolor
    PostgreSQL删除表中重复数据行
    URL存在http host头攻击漏洞-修复方案
    for循环的执行顺序
  • 原文地址:https://www.cnblogs.com/Yesi/p/15384554.html
Copyright © 2020-2023  润新知