当前位置: 首页>>技术问答>>正文


如何将pdf文件转换为odt文件?

,

问题描述

我想将.pdf文件转换为.odt文件,以便我可以进一步将其转换为.doc文件。有没有可以做到这一点的软件/脚本。我试图复制.pdf文件的内容并将其粘贴到liberoffice writer中,不保留格式。

该文档是保密的,因此我不希望使用任何on-line服务进行转换。

任何帮助都非常感谢。

最佳解决方法

由于缺乏免费的PDF到ODT转换器,我感到很恼火。我甚至不需要任何复杂的东西。只是一个生成ODT文件的工具,然后我可以在LibreOffice中注释(例如填写表单)。

我知道如何手动执行此操作,将PDF文档转换为图形文件,然后将其导入LibreOffice,但这会非常繁琐。

所以,我终于写了一个快速的小shell脚本,自动完成所有必需的步骤。你可以在https://github.com/gutschke/pdf2odt找到它

它可以将任意数量的PDF和图像文件作为输入,并生成可在LibreOffice中打开和编辑的ODT文件。图像显示为页面背景,因此您可以自由地书写它们。每个图像都与其自己的页面样式相关联。记住这一点,插入分页符并根据需要调整页面样式。

我在Linux和Mac上测试了脚本。鉴于它只需要少量合理标准的工具,它应该是非常便携的。

次佳解决方法

您可以查看包含pdftotext的PDF Utilities(通过Synaptic的poppler-utils或apt-get):

Poppler is a PDF rendering library based on Xpdf PDF viewer.

This package contains command line utilities (based on Poppler) for getting information of PDF documents, convert them to other formats, or manipulate them:
* pdfdetach — lists or extracts embedded files (attachments)
* pdffonts — font analyzer
* pdfimages — image extractor
* pdfinfo — document information
* pdfseparate — page extraction tool
* pdftocairo — PDF to PNG/JPEG/PDF/PS/EPS/SVG converter using Cairo
* pdftohtml — PDF to HTML converter
* pdftoppm — PDF to PPM/PNG/JPEG image converter
* pdftops — PDF to PostScript (PS) converter
* pdftotext — text extraction
* pdfunite — document merging tool

当然,成功将取决于pdf文件的生成方式。如果你得到你想要的文本文件,你可以将其保存为.odt文件。

编辑:我忘了提供报价的来源。它来自Synaptic中针对PDF Utilities (based on Poppler).的描述选项卡

第三种解决方法

LibreOffice能够导入.pdf文件。只需在当前版本的LibreOffice中打开它即可获得最佳效果。但是,它会将文档作为图形打开,您只能将其转换为支持的图像格式之一,而不能将其转换为Writer文档。

当然,并非所有格式都被保留,但至少有一些格式。

第四种方法

如果安装了poppler-utils软件包,下面的Nautilus脚本(作为可执行文件放入〜/.gnome2 /nautilus-scripts文件夹)将有助于将PDF文件转换为HTML(选项”-i”也可以删除以包含图像),这可以然后使用LibreOffice Writer打开并保存为ODT,尽管格式转换的成功在很大程度上取决于PDF的创建方式。

http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym

第五种方法

试试Calibre。它转换为html,然后转换为其他格式。它在我不得不打印的大型(183页)文件上做得非常好。

在我的情况下,我将它转换为epub,但为了好玩只是将其转换为.docx,结果非常好。

参考资料

本文由Ubuntu问答整理, 博文地址: https://ubuntuqa.com/article/7130.html,未经允许,请勿转载。