• java读取pdf文档


    import java.io.*;
    import org.pdfbox.pdmodel.PDDocument;
    import org.pdfbox.pdfparser.PDFParser;
    import org.pdfbox.util.PDFTextStripper;


    public class PDFReader {
     
     public static String file_path = "F:/pdf/网易技术部的MySQL中文资料.pdf";
     // 获取PDF内纯文本信息
     public String GetTextFromPdf(String filename) throws Exception
     {
      FileInputStream instream = new FileInputStream(filename);    // 根据指定文件创建输入流
      PDFParser parser = new PDFParser( instream );                // 创建PDF解析器
      parser.parse();                                              // 执行PDF解析过程
      
      PDDocument pdfdocument = parser.getPDDocument();             // 获取解析器的PDF文档对象
      PDFTextStripper pdfstripper = new PDFTextStripper();         // 生成PDF文档内容剥离器
      String contenttxt = pdfstripper.getText(pdfdocument);        // 利用剥离器获取文档
      
      System.out.println("文件长度 : "+ contenttxt.length() +" ");
      return contenttxt;http://www.huiyi8.com/jiangbei/sheji/
      
     }
     
     public static void main(String args[])
     {奖杯设计图
      PDFReader pdfbox=new PDFReader();                        // 生成PDFBoxHello对象
      try{
                                                                // 获取文档纯文本内容
       String doctext = pdfbox.GetTextFromPdf(file_path);
       System.out.println("文件内容 : ");   
       System.out.println(doctext);
       System.out.println("文件结束 . ");   
      } catch(Exception e){
       e.printStackTrace();
      }
     }
    }

    1. [图片] pdf.png    

  • 相关阅读:
    【摄影】延时摄影
    【sas sql proc】统计
    【分析模板】excel or sas
    JavaScript的方法和技巧
    好书推荐
    七招制胜ASP.NET应用程序开发
    .Net中使用带返回值的存储过程(VB代码)
    ASP.NET 2.0构建动态导航的Web应用程序(TreeView和Menu )
    简单查询和联合查询两方面介绍SQL查询语句
    数字金额大小写转换之存储过程
  • 原文地址:https://www.cnblogs.com/xkzy/p/4015814.html
Copyright © 2020-2023  润新知