问题描述
我可以在okular中查看一个epub文件,选择所有文本并将copy-paste插入文本编辑器。我想要一个命令行方法-有人知道这样的事情吗?
最佳答案
我不知道Caliber是否值得为您的工作安装,但是如果您有,可以使用功能强大的电子书转换器:
ebook-convert input.epub output.txt
输出格式从输出文件扩展名中扣除
我想可能会有一些XML工具/脚本(XSLT)可以转换文本中的epub,因为epub基本上是ZIP存档中的XHTML
次佳答案
另一种选择是Kevin Boone的epub2txt,可在Github上找到。
epub2html is a simple command-line utility for extracting text from EPUB documents and, optionally, re-flowing it to fit a text display of a particular number of columns. It is written entirely in ANSI-standard C.
用法示例:
epub2txt input.epub > output.txt
第三种答案
MuPDF可以从epub
转换为html
和txt
。要安装它:
sudo apt install mupdf mupdf-tools
要使用它:
mutool convert -o somefilename.txt somefilename.epub
假定从-o
选项输出txt
。
有关更多信息,请参见mutool convert
documentation。