问题描述
标题说明了一切。如何检测媒体库中的重复项?
最佳解决方法
dupeGuru Music Edition就是你想要的。在首选项中将扫描类型设置为”Audio Contents”。请注意,该计划是公平的,所以请尽可能提供。
我建议您将它与MusicBrainz Picard结合使用,它可以自动标记您的音乐文件。
次佳解决方法
有一个插件是在不久前制作的。我最近用过它,但仍然有点不尽如人意。它有一个“PPA” – 但还没有构建的包,只是Bazaar分支。安装说明如下:
wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz
如果您对使用Bazaar的源代码感兴趣,请执行以下操作:
mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source
一旦安装完毕,重新启动Rhythmbox,你现在应该在插件列表中有一个Duplicates Finder。
激活后 – 还有其他配置选项可用。
启用插件后 – 当它找到重复项时 – 它会为您的库列表添加一个附加选项:
我发现的一些设置为”odd” – 我在一个有超过120,000首歌曲(超过1,000个重复)的媒体库和一个包含大约1,000首歌曲,可能有30个重复的 Library 中尝试过这个设置。在前者上花了很长时间,并在搜索期间多次撞击Rhythmbox。我最终自动“从库中删除”以避免重建列表。在较小的 Library ,一切都很好。
找到副本时 – 如果您选择了默认选项 – 歌曲的低质量版本将添加到列表中。因此,选择Duplicates列表和”Remove”(从磁盘删除或从库中删除)中的所有歌曲是安全的。
第三种解决方法
您可以使用fdupes:
$ fdupes -r ~/Music
它为您提供了所有重复文件的列表。
您可以轻松安装它
sudo apt-get install fdupes
第四种方法
当我有一堆重复的图像文件时,我遇到了类似的问题。就我而言,我只是在文件上使用了md5sum
并对结果进行了排序:
for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort
具有相同内容的文件生成相同的哈希,因此可以轻松找到重复项。我从那里手动删除了欺骗,虽然我可以扩展脚本以删除除第一次出现之外的所有内容,但我总是在ad-hoc脚本中做这个偏执。
请注意,这仅适用于具有相同内容的重复文件。