При работе с большими объемами медиафайлов и документов довольно часто на вашем компьютере накапливается несколько копий одного и того же файла. Неизбежно, что за этим следует загроможденное пространство для хранения, заполненное избыточными файлами, что вызывает периодические проверки на наличие повторяющихся файлов в вашей системе.

С этой целью вы найдете различные программы для выявления и удаления повторяющихся файлов. И fdupes - одна из таких программ для Linux. Итак, следите за тем, как мы обсуждаем fdupes, и проводим вас через шаги по поиску и удалению повторяющихся файлов в Linux.

Что такое fdupes?

Fdupes - это программа на основе интерфейса командной строки для поиска и удаления повторяющихся файлов в Linux. Он выпущен под лицензией MIT на GitHub.

В простейшей форме программа работает, запустив указанный каталог через md5sum сравнить MD5 подписи его файлов. Затем он выполняет их побайтовое сравнение, чтобы определить повторяющиеся файлы и убедиться, что дубликаты не пропущены.

instagram viewer

Как только fdupes обнаруживает повторяющиеся файлы, он дает вам возможность либо удалить их, либо заменить жесткими ссылками (ссылками на исходные файлы). Таким образом, в зависимости от ваших требований вы можете продолжить операцию соответствующим образом.

Как установить fdupes в Linux?

Fdupes доступен в большинстве основных дистрибутивов Linux, таких как Ubuntu, Arch, Fedora и т. Д. В зависимости от дистрибутива, который вы используете на своем компьютере, выполните приведенные ниже команды.

В системах на основе Ubuntu или Debian:

sudo apt install fdupes

Чтобы установить fdupe в Fedora / CentOS и других дистрибутивах на основе RHEL:

sudo dnf установить fdupes

В Arch Linux и Manjaro:

sudo pacman -S fdupes

Как использовать fdupes?

После того, как вы установили программу на свой компьютер, выполните следующие действия, чтобы найти и удалить повторяющиеся файлы.

Поиск повторяющихся файлов с помощью fdupes

Во-первых, давайте начнем с поиска всех повторяющихся файлов в каталоге. Базовый синтаксис для этого:

fdupes путь / к / каталогу

Например, если вы хотите найти повторяющиеся файлы в Документы каталог, вы должны запустить:

fdupes ~ / Документы

Выход:

Если fdupes найдет повторяющиеся файлы в указанном каталоге, он вернет список всех избыточных файлов, сгруппированных по набору, и вы сможете затем при необходимости выполнить с ними дальнейшие операции.

Однако, если указанный вами каталог состоит из подкаталогов, указанная выше команда не будет идентифицировать дубликаты внутри них. В таких ситуациях вам нужно выполнить рекурсивный поиск, чтобы найти все повторяющиеся файлы, присутствующие в подкаталогах.

Чтобы выполнить рекурсивный поиск в fdupes, используйте флаг:

fdupes -r путь / к / каталогу

Например:

fdupes -r ~ / Документы

Выход:

Хотя две приведенные выше команды могут легко найти повторяющиеся файлы в указанном каталоге (и его подкаталогах), их вывод также включает в себя дубликаты файлов нулевой длины (или пустые).

Хотя эта функция может пригодиться, если у вас слишком много пустых файлов-дубликатов на вашей системе, это может ввести в заблуждение, когда вы хотите только найти непустые дубликаты в каталог.

К счастью, fdupes позволяет исключить файлы нулевой длины из результатов поиска с помощью -n вариант, который вы можете использовать в своих командах.

Примечание: Вы можете исключить непустые повторяющиеся файлы как при обычном, так и при рекурсивном поиске.

Чтобы искать только непустые повторяющиеся файлы на вашем компьютере:

fdupes -n ~ / Документы

Выход:

Если вы имеете дело с несколькими наборами повторяющихся файлов, целесообразно вывести результаты в текстовый файл для дальнейшего использования.

Для этого запустите:

fdupes путь / в / каталог> имя_файла.txt

...куда путь / к / каталогу - это каталог, в котором вы хотите выполнить поиск.

Для поиска дубликатов файлов в Документы каталог, а затем отправьте вывод в файл:

fdupes / главная / Документы> output.txt

И последнее, но не менее важное: если вы хотите увидеть сводку всей информации, относящейся к повторяющимся файлам в каталоге, вы можете использоватьфлаг в ваших командах:

fdupes -m путь / к / каталогу

Чтобы получить дублирующую информацию о файле для Документы каталог:

fdupes -m ~ / Документы

Выход:

В любое время во время использования fdupes, если вам нужна помощь с командой или функцией, используйте -час возможность получить справку из командной строки:

fdupes -h

Удаление повторяющихся файлов в Linux с помощью fdupes

После того, как вы определили повторяющиеся файлы в каталоге, вы можете приступить к удалению / удалению этих файлов из вашей системы, чтобы убрать беспорядок и освободить место для хранения.

Чтобы удалить повторяющийся файл, укажите -d флаг с командой и нажмите Входить:

fdupes -d путь / к / каталогу

Чтобы удалить повторяющиеся файлы в Загрузки папка:

fdupes -d ~ / Загрузки

Теперь Fdupes представит вам список всех повторяющихся файлов в этом каталоге и даст вам возможность сохранить те, которые вы хотите сохранить на своем компьютере.

Например, если вы хотите сохранить первый файл в наборе 1, вы должны ввести 1 после вывода fdupes найдите и нажмите Входить.

Более того, при необходимости вы также можете сохранить несколько экземпляров файлов в наборе возвращенных повторяющихся файлов. Для этого вам нужно ввести числа, соответствующие повторяющимся файлам, в список, разделенный запятыми, и нажать Входить.

Например, если вы хотите сохранить файлы 1, 3 и 5, вам необходимо ввести:

1,3,5

Если вы хотите сохранить первый экземпляр файла в каждом наборе повторяющихся файлов и хотите игнорировать приглашение, вы можете сделать это, включив -N переключатель, как показано в следующей команде:

fdupes -d -N путь / к / каталогу

Например:

fdupes -d -N ~ / Документы

Успешное удаление повторяющихся файлов в Linux

Организация файлов сама по себе утомительная задача. Добавьте к этому проблему, вызываемую дублированием файлов, и вы получите несколько часов времени и усилий, потраченных на организацию вашего беспорядочного хранилища.

Но благодаря таким утилитам, как fdupes, выявлять повторяющиеся файлы и удалять их намного проще и эффективнее. И приведенное выше руководство должно помочь вам с этими операциями на вашем компьютере с Linux.

Подобно дублированным файлам, дублированные слова и повторяющиеся строки в файле также могут вызывать разочарование и требовать удаления дополнительных инструментов. Если вы тоже сталкиваетесь с такими проблемами, вы можете использовать уникальный для удаления повторяющихся строк из текстового файла.

ДелитьсяТвитнутьЭл. адрес
Как найти повторяющиеся данные в текстовом файле Linux с помощью uniq

Если у вас есть текстовый файл с повторяющимся содержимым, который вы хотите удалить, пора узнать, как использовать команду uniq.

Читать далее

Похожие темы
  • Linux
  • Управление файлами
  • Команды Linux
Об авторе
Яш Вате (Опубликовано 23 статей)

Яш - штатный писатель в MUO по DIY, Linux, программированию и безопасности. Прежде чем найти свое увлечение писательством, он занимался разработкой для Интернета и iOS. Вы также можете найти его работы на TechPP, где он освещает другие темы. Помимо технологий, он любит говорить об астрономии, Формуле-1 и часах.

Ещё от Yash Wate

Подписывайтесь на нашу новостную рассылку

Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!

Нажмите здесь, чтобы подписаться