При работе с большими объемами медиафайлов и документов довольно часто на вашем компьютере накапливается несколько копий одного и того же файла. Неизбежно, что за этим следует загроможденное пространство для хранения, заполненное избыточными файлами, что вызывает периодические проверки на наличие повторяющихся файлов в вашей системе.
С этой целью вы найдете различные программы для выявления и удаления повторяющихся файлов. И fdupes - одна из таких программ для Linux. Итак, следите за тем, как мы обсуждаем fdupes, и проводим вас через шаги по поиску и удалению повторяющихся файлов в Linux.
Что такое fdupes?
Fdupes - это программа на основе интерфейса командной строки для поиска и удаления повторяющихся файлов в Linux. Он выпущен под лицензией MIT на GitHub.
В простейшей форме программа работает, запустив указанный каталог через md5sum сравнить MD5 подписи его файлов. Затем он выполняет их побайтовое сравнение, чтобы определить повторяющиеся файлы и убедиться, что дубликаты не пропущены.
Как только fdupes обнаруживает повторяющиеся файлы, он дает вам возможность либо удалить их, либо заменить жесткими ссылками (ссылками на исходные файлы). Таким образом, в зависимости от ваших требований вы можете продолжить операцию соответствующим образом.
Как установить fdupes в Linux?
Fdupes доступен в большинстве основных дистрибутивов Linux, таких как Ubuntu, Arch, Fedora и т. Д. В зависимости от дистрибутива, который вы используете на своем компьютере, выполните приведенные ниже команды.
В системах на основе Ubuntu или Debian:
sudo apt install fdupes
Чтобы установить fdupe в Fedora / CentOS и других дистрибутивах на основе RHEL:
sudo dnf установить fdupes
В Arch Linux и Manjaro:
sudo pacman -S fdupes
Как использовать fdupes?
После того, как вы установили программу на свой компьютер, выполните следующие действия, чтобы найти и удалить повторяющиеся файлы.
Поиск повторяющихся файлов с помощью fdupes
Во-первых, давайте начнем с поиска всех повторяющихся файлов в каталоге. Базовый синтаксис для этого:
fdupes путь / к / каталогу
Например, если вы хотите найти повторяющиеся файлы в Документы каталог, вы должны запустить:
fdupes ~ / Документы
Выход:
Если fdupes найдет повторяющиеся файлы в указанном каталоге, он вернет список всех избыточных файлов, сгруппированных по набору, и вы сможете затем при необходимости выполнить с ними дальнейшие операции.
Однако, если указанный вами каталог состоит из подкаталогов, указанная выше команда не будет идентифицировать дубликаты внутри них. В таких ситуациях вам нужно выполнить рекурсивный поиск, чтобы найти все повторяющиеся файлы, присутствующие в подкаталогах.
Чтобы выполнить рекурсивный поиск в fdupes, используйте -р флаг:
fdupes -r путь / к / каталогу
Например:
fdupes -r ~ / Документы
Выход:
Хотя две приведенные выше команды могут легко найти повторяющиеся файлы в указанном каталоге (и его подкаталогах), их вывод также включает в себя дубликаты файлов нулевой длины (или пустые).
Хотя эта функция может пригодиться, если у вас слишком много пустых файлов-дубликатов на вашей системе, это может ввести в заблуждение, когда вы хотите только найти непустые дубликаты в каталог.
К счастью, fdupes позволяет исключить файлы нулевой длины из результатов поиска с помощью -n вариант, который вы можете использовать в своих командах.
Примечание: Вы можете исключить непустые повторяющиеся файлы как при обычном, так и при рекурсивном поиске.
Чтобы искать только непустые повторяющиеся файлы на вашем компьютере:
fdupes -n ~ / Документы
Выход:
Если вы имеете дело с несколькими наборами повторяющихся файлов, целесообразно вывести результаты в текстовый файл для дальнейшего использования.
Для этого запустите:
fdupes путь / в / каталог> имя_файла.txt
...куда путь / к / каталогу - это каталог, в котором вы хотите выполнить поиск.
Для поиска дубликатов файлов в Документы каталог, а затем отправьте вывод в файл:
fdupes / главная / Документы> output.txt
И последнее, но не менее важное: если вы хотите увидеть сводку всей информации, относящейся к повторяющимся файлам в каталоге, вы можете использовать -м флаг в ваших командах:
fdupes -m путь / к / каталогу
Чтобы получить дублирующую информацию о файле для Документы каталог:
fdupes -m ~ / Документы
Выход:
В любое время во время использования fdupes, если вам нужна помощь с командой или функцией, используйте -час возможность получить справку из командной строки:
fdupes -h
Удаление повторяющихся файлов в Linux с помощью fdupes
После того, как вы определили повторяющиеся файлы в каталоге, вы можете приступить к удалению / удалению этих файлов из вашей системы, чтобы убрать беспорядок и освободить место для хранения.
Чтобы удалить повторяющийся файл, укажите -d флаг с командой и нажмите Входить:
fdupes -d путь / к / каталогу
Чтобы удалить повторяющиеся файлы в Загрузки папка:
fdupes -d ~ / Загрузки
Теперь Fdupes представит вам список всех повторяющихся файлов в этом каталоге и даст вам возможность сохранить те, которые вы хотите сохранить на своем компьютере.
Например, если вы хотите сохранить первый файл в наборе 1, вы должны ввести 1 после вывода fdupes найдите и нажмите Входить.
Более того, при необходимости вы также можете сохранить несколько экземпляров файлов в наборе возвращенных повторяющихся файлов. Для этого вам нужно ввести числа, соответствующие повторяющимся файлам, в список, разделенный запятыми, и нажать Входить.
Например, если вы хотите сохранить файлы 1, 3 и 5, вам необходимо ввести:
1,3,5
Если вы хотите сохранить первый экземпляр файла в каждом наборе повторяющихся файлов и хотите игнорировать приглашение, вы можете сделать это, включив -N переключатель, как показано в следующей команде:
fdupes -d -N путь / к / каталогу
Например:
fdupes -d -N ~ / Документы
Успешное удаление повторяющихся файлов в Linux
Организация файлов сама по себе утомительная задача. Добавьте к этому проблему, вызываемую дублированием файлов, и вы получите несколько часов времени и усилий, потраченных на организацию вашего беспорядочного хранилища.
Но благодаря таким утилитам, как fdupes, выявлять повторяющиеся файлы и удалять их намного проще и эффективнее. И приведенное выше руководство должно помочь вам с этими операциями на вашем компьютере с Linux.
Подобно дублированным файлам, дублированные слова и повторяющиеся строки в файле также могут вызывать разочарование и требовать удаления дополнительных инструментов. Если вы тоже сталкиваетесь с такими проблемами, вы можете использовать уникальный для удаления повторяющихся строк из текстового файла.
Если у вас есть текстовый файл с повторяющимся содержимым, который вы хотите удалить, пора узнать, как использовать команду uniq.
Читать далее
- Linux
- Управление файлами
- Команды Linux

Яш - штатный писатель в MUO по DIY, Linux, программированию и безопасности. Прежде чем найти свое увлечение писательством, он занимался разработкой для Интернета и iOS. Вы также можете найти его работы на TechPP, где он освещает другие темы. Помимо технологий, он любит говорить об астрономии, Формуле-1 и часах.
Подписывайтесь на нашу новостную рассылку
Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!
Нажмите здесь, чтобы подписаться