java pdf 转word

不念不忘少年蓝@ 2022-12-11 15:14 511阅读 0赞
  1. 使用java api 简单实现pdf文档转word文档功能。
  2. import org.apache.pdfbox.pdmodel.PDDocument;
  3. import org.apache.pdfbox.util.PDFTextStripper;
  4. import java.io.*;
  5. public class PdfToWord {
  6. public static void main(String[] args) {
  7. String pdfPath = "D:\\Tools\\Spring.pdf";
  8. try {
  9. PDDocument doc = PDDocument.load(new File(pdfPath));
  10. int pageNum = doc.getNumberOfPages();
  11. pdfPath = pdfPath.substring(0, pdfPath.lastIndexOf("."));
  12. String fileName = pdfPath+".doc";
  13. File file = new File(fileName);
  14. if(!file.exists()){
  15. file.createNewFile();
  16. }
  17. FileOutputStream fos = new FileOutputStream(file);
  18. Writer writer = new OutputStreamWriter(fos,"UTF-8");
  19. PDFTextStripper textStripper = new PDFTextStripper();
  20. textStripper.setSortByPosition(true);
  21. textStripper.setStartPage(1);
  22. textStripper.setEndPage(pageNum);
  23. textStripper.writeText(doc,writer);
  24. writer.close();
  25. doc.close();
  26. System.out.println("转换成功");
  27. } catch (IOException e) {
  28. e.printStackTrace();
  29. }
  30. }
  31. }

本文所用的jar包,pdfbox-1.8.2.jar,jdk 1.8 ,由于使用gradle构建 ,compile(“org.apache.pdfbox:pdfbox:1.8.2”),也可以自行下载jar包。

本来有个pdf文档90多页,但是有没有标签,阅读麻烦,作为一个程序员,果断使用程序实现,结果转换过来的文件没有格式,没有达到预期效果。

发表评论

表情:
评论列表 (有 0 条评论,511人围观)

还没有评论,来说两句吧...

相关阅读

    相关 Java 实现wordpdf

    word转pdf我在网上转了一天,始终找不到适合自己的!! 我擦!我太难了,写此博客分享给你们,也以免我忘记 我用的是jacob一个jar包就可以了 步骤: 1.

    相关 C# word pdf

    将Word转换为带目录书签的PDF,待转换Word中应该有目录或书签,可以用Word中的标题来自动生成目录 office.interop.word 转pdf pub

    相关 Word2007PDF

    机子里面预装的office2007一直在用,功能可能不如现在一些高大上的版本强。百度上搜word转pdf,首页第一项就是一个小网页应用——word转pdf,以前也都是这么操作的

    相关 word PDF

         网上有很多 word 转 PDF 的例子,有些是根据 调用安装的服务来实现的,但是如果要实现跨平台或者在没有安装服务的服务器上面转,就很少有例子了。