问题描述
我可以用什么来查找重复的照片,包括已调整大小的照片?
最佳解决办法
digiKam
将所有照片添加到您的收藏中。在菜单中,选择“工具/查找重复项”。这将在整个集合中查找重复项。
findimagedupes
命令行工具。在命令行上传递要比较的所有图像。
Geeqie(原名GQview)
在菜单中,选择“文件/查找副本”。拖放图像文件执行重复窗口。您可以删除目录以递归方式添加其内容。对于图像的视觉比较,drop-down菜单上有特定的non-default选项。 “custom”相似度允许将配对限制为最高相似度,但必须在”Preferences”上设置为99.即使这样,它至少对于某些类型的图像(如line-art)也不能完美地工作。遗憾的是,它没有提供具有合理标准的自动选择机制,例如分辨率,日期等等,自动选择似乎只是随机选择第一个作为保留参考的图像。删除许多图像可能会非常慢,因为它会尝试在每次删除时更新结果计数。
所有这三个工具都找到了可视副本,而不仅仅是字节相同的文件。
次佳解决办法
FSlint
fslint
是一个图形程序,可以通过md5sum查找任何类型的重复文件。如果图像不相同,则不会将它们标记为重复。下图显示了我的下载目录中的一堆重复的pdf文件:
您可以更改高级搜索参数以按文件类型搜索,并仅限制自己使用图像。这是通过将“额外查找参数”更改为find
命令选项来完成的。例如,这里我只查找*.jpg
文件(在同一路径中,只查看我的”Downloads”文件夹:
fdupes
fdupes
是一种基于命令行的等效工具。两者都在回购中。
第三种解决办法
fdupes
您可以使用名为fdupes
的命令行工具查找重复文件(有关详细信息,请参阅man fdupes
)。我不知道有任何方法可以找到已调整大小的’duplicates’。执行此操作的程序将需要某种智能算法来分析图像内容,因为在调整图像大小时,其数据会发生变化,因此传统的重复查找方法将无法工作。
第四种办法
imgSeek
imgSeek可以找到重复的以及类似的图片(因此它应该能够找到具有不同文件名和元数据的已调整大小的照片和照片),甚至可以根据草图搜索照片。它有桌面和服务器版本。
不过,我实际上并没有尝试过。
第五种办法
dupeGuru Picture Edition非常棒,值得一试。
他们有一个Launchpad PPA,dupeguru
(新的all-in-one包)或dupeguru-pe
(旧图片版包)可以使用这些命令从它安装:
sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru