当前位置: 首页>>技术教程>>正文


如何将.epub文件转换为纯文本?

,

问题描述

我可以在okular中查看一个epub文件,选择所有文本并将copy-paste插入文本编辑器。我想要一个命令行方法-有人知道这样的事情吗?

最佳答案

我不知道Caliber是否值得为您的工作安装,但是如果您有,可以使用功能强大的电子书转换器:

ebook-convert input.epub output.txt

输出格式从输出文件扩展名中扣除

我想可能会有一些XML工具/脚本(XSLT)可以转换文本中的epub,因为epub基本上是ZIP存档中的XHTML

次佳答案

另一种选择是Kevin Boone的epub2txt,可在Github上找到。

epub2html is a simple command-line utility for extracting text from EPUB documents and, optionally, re-flowing it to fit a text display of a particular number of columns. It is written entirely in ANSI-standard C.

用法示例:

epub2txt input.epub > output.txt

第三种答案

MuPDF可以从epub转换为htmltxt。要安装它:

sudo apt install mupdf mupdf-tools

要使用它:

mutool convert -o somefilename.txt somefilename.epub 

假定从-o选项输出txt

有关更多信息,请参见mutool convert documentation

参考资料

本文由Ubuntu问答整理, 博文地址: https://ubuntuqa.com/article/11688.html,未经允许,请勿转载。