В отличие от текстового файла, вы не можете редактировать PDF напрямую. Существует несколько способов создания файлов PDF с использованием текста. Но что, если вы хотите пойти другим путем и преобразовать PDF-файлы в текстовые файлы?
К счастью, Linux позволяет вам легко изменять эти файлы из терминала. В этой статье будет продемонстрировано, как преобразовать файл PDF в текстовый документ в Linux.
Преобразование PDF в текст из терминала
Poppler - это программная библиотека, используемая для визуализации и изменения файлов PDF. Он содержит утилиту, известную как pdftotext, что позволяет пользователям создавать текстовые файлы из PDF-файлов. С Poppler-utils не входит в стандартные пакеты Linux, вам придется установить его вручную с помощью диспетчера пакетов.
В Ubuntu и Debian:
sudo apt установить poppler-utils
Чтобы установить Poppler в Arch Linux:
sudo pacman -S poppler
Установка Poppler-utils package в CentOS, Fedora и других дистрибутивах на основе RHEL очень просто.
sudo dnf установить poppler-utils
sudo yum установить poppler-utils
Преобразование всего PDF в текст
Основной синтаксис команды pdftotext:
pdftotext [параметры] текстовый файл pdffile
...где pdffile абсолютный или относительный путь к файлу PDF, и текстовый файл это имя выходного файла.
Например, чтобы преобразовать lorem-ipsum.pdf в текстовый файл:
pdftotext lorem-ipsum.pdf text.txt
Если файл, который вы конвертируете, содержит водяные знаки или невыровненный текст, вы можете удалить их в выводе, используя -nodiag флаг.
pdftotext -nodiag lorem-ipsum.pdf random.text
Обрабатывать страницы в определенном диапазоне
Использовать -f а также -l отметьте, если вы хотите преобразовать страницы, попадающие в определенный диапазон. Например, чтобы преобразовать страницы с первой по пятую в lorem-ipsum.pdf печатать:
pdftotext -f 1 -l 5 lorem-ipsum.pdf output.txt
Чтобы преобразовать только первую страницу файла PDF:
pdftotext -f 1 -l 1 lorem-ipsum.pdf output.txt
Преобразование PDF-файлов, защищенных паролем, в текст
Pdftotext может даже конвертировать PDF-файлы, защищенные паролем, в текстовые файлы. В -upw а также -opw флаги, которые обозначают пользовательский пароль а также пароль владельца соответственно позаботьтесь о процессе аутентификации при преобразовании файлов PDF.
pdftotext -upw пароль lorem-ipsum.pdf output.txt
pdftotext -opw пароль lorem-ipsum.pdf output.txt
Обязательно замените пароль с паролем файла PDF.
Вы также можете комбинировать несколько флагов, чтобы получить желаемый результат. Например, чтобы преобразовать первую-третью страницы PDF-файла, защищенного паролем, в текст:
pdftotext -f 1 -l 3 -upw пароль lorem-ipsum.pdf output.txt
Связанный: Как конвертировать PDF-файл в изображения в Linux
Графическое преобразование PDF в текстовый файл
Если работа с командной строкой вам не по душе, вы можете конвертировать PDF-файлы в текстовые файлы с помощью графического программного обеспечения, такого как Caliber. Это приложение для управления электронными книгами, которое можно использовать для просмотра, организации и изменять файлы PDF в вашей системе.
Caliber доступен в официальных репозиториях дистрибутива Linux, и любой может загрузить его с помощью диспетчера пакетов.
Чтобы установить Caliber в Ubuntu и Debian:
sudo apt установить калибр
В Arch Linux:
sudo pacman -S калибр
В дистрибутивах на основе RHEL, таких как CentOS и Fedora, вы можете загрузить Caliber с помощью DNF или Yum.
sudo dnf установить калибр
sudo yum установить калибр
Как использовать Caliber для преобразования файлов PDF
После установки запустите Caliber в вашей системе, используя Меню приложений. Кроме того, вы можете запустить Caliber из терминала, набрав:
калибр
Чтобы сгенерировать текстовые файлы с помощью PDF с Caliber:
- Нажми на Добавить книги вариант из меню.
- Найдите и выберите PDF-файл, который вы хотите преобразовать.
- Выделите PDF-файл на центральной панели и выберите Конвертировать книги из меню.
- От Выходной формат раскрывающийся список, выберите текст.
- Наконец, нажмите на ОК продолжать.
Caliber начнет преобразование указанного PDF-файла в текстовый документ. Вы можете проверить статус процесса, нажав на Вакансии вариант, расположенный в правом нижнем углу окна.
Работа с PDF-файлами в Linux
Если вы хотите поделиться документом с кем-то, преобразование его в PDF перед отправкой - наиболее эффективный способ. Раньше пользователям приходилось устанавливать в своей системе специальную программу просмотра PDF-файлов для отображения PDF-файлов, но теперь почти каждый браузер поставляется со встроенной программой просмотра PDF-файлов.
Вы можете найти несколько приложений, которые позволяют пользователю легко просматривать и редактировать файлы PDF. Многие установки Linux поставляются с LibreOffice, пакетом офисного программного обеспечения, который можно использовать в качестве редактора PDF.
Вам нужно отредактировать PDF-файл в Linux? Эти редакторы PDF для Linux бесплатны для установки и просты в использовании.
Читать далее
- Linux
- PDF редактор
- Linux
Дипеш - младший редактор Linux в MUO. Он пишет информационный контент в Интернете более 3 лет. В свободное время он любит писать, слушать музыку и играть на гитаре.
Подписывайтесь на нашу новостную рассылку
Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!
Еще один шаг…!
Пожалуйста, подтвердите свой адрес электронной почты в электронном письме, которое мы вам только что отправили.