问题描述
关于Ubuntu可用的最佳PDF查看器,有很多问题和答案,但是我想解析PDF文件并了解PDF的详细信息,例如给定PDF文件中可用的图像,字体和链接。
是否有可用的PDF元数据查看器/标签编辑器?
最佳思路
-
查看pdf元数据以获取名为Example.pdf的文件:
pdfinfo Example.pdf
-
使用nano编辑器在终端中编辑现有元数据:
pdftk Example.pdf dump_data output Metadata-output.txt nano Metadata-output.txt
-
更新元数据:
pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
Nano编辑器的键盘快捷键使用键盘组合Ctrl
+ O
,然后按Enter
将文件保存到当前位置。使用键盘组合Ctrl
+ X
退出nano。
次佳思路
CLI解决方案
另一个值得研究的实用程序是exiftool。 exiftool与pdfinfo相比的优势在于它支持更多的元数据类型(例如XMP标签)。
这是一个命令示例,它将打印所有可用的元信息(-a
),并按组(-G1
)进行排序:
exiftool -a -G1 "$File"
支持的PDF-related标签的概述:
您可以使用以下命令在Ubuntu上安装exiftool:
sudo apt-get install libimage-exiftool-perl
GUI解决方案
如果您正在寻找GUI PDF元数据查看器/编辑器,则可以尝试PDFMtEd。这是我为使用exiftool管理PDF元数据编写的一组图形实用程序: