Аудиокниги набирают все большую популярность по сравнению с традиционными электронными книгами. Они более удобны тем, что их можно слушать в любое время и в любом месте.

Вы можете преобразовать электронную книгу PDF в аудиокнигу с помощью простого скрипта Python. Используя несколько простых библиотек, вы можете разработать проект, который будет считывать PDF-файл и сохранять аудиокнигу в виде нового файла.

Установка необходимых пакетов

Вам необходимо установить PyPDF3, pyttsx3, а также pdfсантехник пакеты для начала. Вы можете установить эти пакеты с помощью менеджера пакетов pip. Убедитесь, что вы уже установленный pip в вашей системе. Выполните следующую команду в командной строке, чтобы установить пакеты:

точка установить PyPDF3 pyttsx3 pdfplumber
  • Вы можете использовать PyPDF3 библиотека для чтения и редактирования файлов PDF в Python.
  • pyttsx3 библиотека обеспечивает преобразование текста в речь.
  • pdfсантехник — это библиотека, позволяющая извлекать текст и таблицы из PDF-файлов.

Код, используемый в этом проекте, доступен в

instagram viewer
Репозиторий GitHub и вы можете использовать его бесплатно по лицензии MIT.

Преобразование PDF в аудиокнигу с помощью Python

После того, как вы установили вышеуказанные пакеты, вы готовы импортировать их в свой файл Python:

импорт PyPDF3
импорт pyttsx3
импорт pdfсантехник

Вам необходимо указать имя и местоположение PDF-файла, который вы хотите преобразовать. Для простоты вы можете использовать любой образец PDF-файла. Скопируйте его в тот же каталог, что и ваш скрипт, и сохраните его имя в переменной; если это называется Лорем.pdf, Например:

файл = 'Лорем.pdf'

Затем создайте файловый объект для файла PDF и объект для чтения PDF:

книга = открыть (файл, 'рб')
pdfReader = PyPDF3.PdfFileReader (книга)

Позже вы просмотрите все страницы PDF-файла. Чтобы найти общее количество страниц, используйте количество страниц имущество:

страницы = pdfReader.numPages

Теперь вы готовы извлечь текст из файла PDF:

окончательный текст = ""

с pdfсантехник.открыть(файл) в качестве pdf:
для i в диапазоне (0, страниц):
страница = pdf.pages[i]
текст = страница.extract_text()
окончательный текст += текст

Используйте цикл for для перебора всех страниц и извлечения текста из PDF. Вы можете использовать пакет pdfplumber, чтобы открыть файл PDF и экстракт_текста способ получения текста со страницы.

С полным текстом, хранящимся в переменной, вы можете обрабатывать его дальше, в зависимости от ваших требований. Если вы хотите преобразовать текст в аудио и сохранить его в новый файл, используйте следующий код:

двигатель = pyttsx3.init()
engine.save_to_file(finalText, 'лорем.mp3')
двигатель.runAndWait()

Когда ты запустите этот код Python, он создаст файл аудиокниги в своем каталоге.

Если вы не хотите сохранять аудиокнигу и, например, хотите прочитать файл PDF, вы можете вместо этого использовать следующий код:

двигатель = pyttsx3.init()
двигатель.сказать(окончательный текст)
двигатель.runAndWait()

Когда вы запустите этот скрипт, он прочитает файл PDF.

Разработка проектов с использованием Python

Python известен своей универсальностью. Вы можете легко создавать проекты с практическими приложениями, используя Python.

Если вы хотите запачкать руки кодом Python, вы можете начать с разработки мини-проектов. Вот некоторые хорошие стартовые идеи: приложение-викторина, чат-бот, игра-змейка, программа для сокращения URL-адресов, веб-скребок или конвертер единиц измерения.