Аудиокниги набирают все большую популярность по сравнению с традиционными электронными книгами. Они более удобны тем, что их можно слушать в любое время и в любом месте.
Вы можете преобразовать электронную книгу PDF в аудиокнигу с помощью простого скрипта Python. Используя несколько простых библиотек, вы можете разработать проект, который будет считывать PDF-файл и сохранять аудиокнигу в виде нового файла.
Установка необходимых пакетов
Вам необходимо установить PyPDF3, pyttsx3, а также pdfсантехник пакеты для начала. Вы можете установить эти пакеты с помощью менеджера пакетов pip. Убедитесь, что вы уже установленный pip в вашей системе. Выполните следующую команду в командной строке, чтобы установить пакеты:
точка установить PyPDF3 pyttsx3 pdfplumber
- Вы можете использовать PyPDF3 библиотека для чтения и редактирования файлов PDF в Python.
- pyttsx3 библиотека обеспечивает преобразование текста в речь.
- pdfсантехник — это библиотека, позволяющая извлекать текст и таблицы из PDF-файлов.
Код, используемый в этом проекте, доступен в
Репозиторий GitHub и вы можете использовать его бесплатно по лицензии MIT.Преобразование PDF в аудиокнигу с помощью Python
После того, как вы установили вышеуказанные пакеты, вы готовы импортировать их в свой файл Python:
импорт PyPDF3
импорт pyttsx3
импорт pdfсантехник
Вам необходимо указать имя и местоположение PDF-файла, который вы хотите преобразовать. Для простоты вы можете использовать любой образец PDF-файла. Скопируйте его в тот же каталог, что и ваш скрипт, и сохраните его имя в переменной; если это называется Лорем.pdf, Например:
файл = 'Лорем.pdf'
Затем создайте файловый объект для файла PDF и объект для чтения PDF:
книга = открыть (файл, 'рб')
pdfReader = PyPDF3.PdfFileReader (книга)
Позже вы просмотрите все страницы PDF-файла. Чтобы найти общее количество страниц, используйте количество страниц имущество:
страницы = pdfReader.numPages
Теперь вы готовы извлечь текст из файла PDF:
окончательный текст = ""
с pdfсантехник.открыть(файл) в качестве pdf:
для i в диапазоне (0, страниц):
страница = pdf.pages[i]
текст = страница.extract_text()
окончательный текст += текст
Используйте цикл for для перебора всех страниц и извлечения текста из PDF. Вы можете использовать пакет pdfplumber, чтобы открыть файл PDF и экстракт_текста способ получения текста со страницы.
С полным текстом, хранящимся в переменной, вы можете обрабатывать его дальше, в зависимости от ваших требований. Если вы хотите преобразовать текст в аудио и сохранить его в новый файл, используйте следующий код:
двигатель = pyttsx3.init()
engine.save_to_file(finalText, 'лорем.mp3')
двигатель.runAndWait()
Когда ты запустите этот код Python, он создаст файл аудиокниги в своем каталоге.
Если вы не хотите сохранять аудиокнигу и, например, хотите прочитать файл PDF, вы можете вместо этого использовать следующий код:
двигатель = pyttsx3.init()
двигатель.сказать(окончательный текст)
двигатель.runAndWait()
Когда вы запустите этот скрипт, он прочитает файл PDF.
Разработка проектов с использованием Python
Python известен своей универсальностью. Вы можете легко создавать проекты с практическими приложениями, используя Python.
Если вы хотите запачкать руки кодом Python, вы можете начать с разработки мини-проектов. Вот некоторые хорошие стартовые идеи: приложение-викторина, чат-бот, игра-змейка, программа для сокращения URL-адресов, веб-скребок или конвертер единиц измерения.