Представьте себе раннее утро, когда вы потягиваете чашку горячего свежесваренного кофе, а ваш компьютер читает вам последние заголовки — и все это самостоятельно. Разве это не звучит потрясающе?

Что ж, с помощью Python вы можете создать свою собственную персонализированную программу чтения новостей, которая будет зачитывать для вас все главные заголовки вместе с выдержками из каждого заголовка. Да все верно. Используя правильные библиотеки, вы можете заставить Python выполнять все ваши утренние дела без необходимости самостоятельно читать каждое слово.

Вот как вы можете написать этот код и настроить его на своем любимом новостном веб-сайте.

Предварительные условия для запуска кода

Прежде чем вы прыгнете и начнете писать код, вам нужно выполнить несколько предварительных условий. Это некоторые очень основные требования, которые могут сделать использование Python проще и эффективнее.

  1. Питон: Установка последней версии Python будет хорошим решением. Вы можете установить любую Python IDE для достижения наилучших результатов.
  2. instagram viewer
  3. Новостной сайт/доступ в Интернет: Поскольку код Python считывает заголовки с вашего любимого веб-сайта, вам необходимо убедиться, что вы можете получить доступ к веб-сайту во время выполнения этого кода.

Весь код написан в Jupyter Notebook, популярном Python IDE для этого руководства. Кроме того, новостной веб-сайт India Today закодирован в образце кода.

Чтобы загрузить Jupyter Notebook, вы можете использовать его как часть пакета anaconda или загрузить отдельную версию в своей системе.

Скачать:Анаконда | Блокнот Юпитера

Без лишних слов, давайте углубимся в код.

Написание кода на Python

Для начала вам нужно импортировать несколько библиотек Python, каждая из которых предназначена для разных целей.

импортировать win32com.client как wincl
из urllib.request импортировать urlopen как ureq
из bs4 импортировать BeautifulSoup как суп
сп = винкл. Отправка("SAPI.spVoice")

Где:

  • win32com.client: Эта библиотека взаимодействует с устройствами Windows и без проблем запускает программы Python.
  • urllib.request: Эта библиотека обрабатывает значения URL из модуля запроса.
  • бс4: Библиотека BS4 содержит функцию Beautiful Soup, которая собирает данные с веб-сайтов с помощью Python.
  • сп = винкл. Отправка("SAPI.spVoice"): Активируйте голосовые команды в Windows.

Этот код будет работать только в Windows, так как вы будете вызывать библиотеку win32.com.client.

Далее вам необходимо определить URL-адрес (ссылку) веб-сайта в URL переменная, которая хранится в памяти Python.

URL = https://www.indiatoday.in/top-stories

Создайте новую переменную client для хранения команды открытия URL.

клиент = ureq (ссылка)
печать (клиент)

куда:

  • клиент: Новая переменная.
  • урек: Функция Python, импортированная из urllib.request, которая открывает сохраненный URL-адрес.

Поскольку вы открыли URL-адрес в памяти, пришло время проверить, разрешает ли рассматриваемый веб-сайт незащищенные соединения через Python. Вы можете распечатать переменную клиента и проверить вывод.

Есть две возможности с командой печати:

  • HTTPОшибка: Когда веб-сайт защищен, вы не можете очистить его содержимое с помощью Python.
  • Фрагмент кода: Если фрагмент кода возвращается после запуска веб-сайта, предположим, что вы можете легко получить заголовки.

После того, как вы определили URL-адрес новостного веб-сайта в команде URL, пришло время импортировать HTML-код в переменную.

page_html = клиент.читать()
печать (страница_html)

В качестве меры предосторожности вам необходимо распечатать HTML-код веб-сайта, импортированный в Python. Вы даже можете сопоставить этот код с кодом веб-сайта, доступным в Осмотреть вариант.

Перед преобразованием кода вам необходимо закрыть веб-сайт из памяти Python с помощью команды close.

клиент.закрыть()

Поскольку у вас есть код HTML, импортированный в переменную Python, вам необходимо преобразовать его в читаемый формат Python, чтобы применить найти а также найти все команды для поиска ключевых слов.

Вы можете передать следующую команду для преобразования HTML-кода:

page_soup = суп (page_html, "html.parser")

Где:

  • page_soup: Новая переменная.
  • суп: Псевдоним для Модуль «Красивый суп».
  • страница_html: Переменная, содержащая HTML-код с веб-сайта.
  • html_parser: Синтаксис по умолчанию для преобразования кода HTML.

Как только код готов к использованию, пришло время изучить HTML-код веб-сайта, чтобы начать поиск ключевых слов заголовка.

Для этого щелкните правой кнопкой мыши в любом месте веб-сайта и выберите «Проверить». Это откроет код HTML для рассматриваемого веб-сайта.

В окне кода веб-сайта прокручивайте до тех пор, пока не найдете теги-контейнеры, в которых хранятся заголовки.

Они содержатся в просмотр содержимого теги на веб-сайте India Today. Контейнеры каждого новостного веб-сайта различаются, но вы должны иметь возможность перемещаться по коду с относительной легкостью.

статьи = page_soup.find ("div", { "класс": "представление контента" })

Наконец, вам нужно захватить вложенные теги, которые содержат основные заголовки, которые Python будет читать вам.

статьи = статьи.findAll("div", {"класс": "категория-список"})

Контейнер view-content будет содержать несколько заголовков, внешнюю оболочку для ваших заголовков.

Чтобы захватить теги H2 и фрагменты, перечисленные с каждым заголовком, вам нужно запустить цикл.

я = 1
для x в статьях:
заголовок = х.найти("h2").текст
пункт = x.find("p").текст
печатать (я, название, "
", "
", пункт, "
", "
")
сп. Говори (название)
сп. Говори (пара)
я=я+1

Где:

  • я: Новая переменная-счетчик, которая будет автоматически увеличиваться.
  • заглавие: Новая переменная для сохранения заголовка (h2).
  • пункт: Новая переменная для хранения абзацев, связанных с каждым H2.
  • Распечатать: Название заголовка и абзаца будут напечатаны в интерфейсе Python.
  • сп. Говорите (название): Python будет считывать каждый сохраненный заголовок.
  • сп. Говорите (пара): Python будет читать каждый сохраненный фрагмент абзаца.
  • я = я+1: Эта команда автоматически увеличивает серийный номер, связанный с каждым заголовком, отображаемым в интерфейсе Python.

Использование модуля Beautiful Soup Python для чтения ваших ежедневных новостей

Каждый раз, когда вы запускаете код, перед чтением вслух загружаются свежие заголовки с новостного сайта. Python выполняет код каждый раз, когда вы запускаете набор кодов, тем самым информируя вас об изменениях на веб-сайте.

Более старые заголовки будут продолжать отображаться и считываться Python, пока вы не обновите и не запустите код повторно.

Использование Python для чтения ваших ежедневных заголовков — это просто

Python как язык с открытым исходным кодом предлагает ряд инструментов, таких как Beautiful Soup, Selenium и другие фреймворки, как для начинающих, так и для опытных пользователей.

Если вы хотите, чтобы ваши ежедневные новости доносились голосом, Python упрощает эту задачу. Изучение этого конкретного языка также может помочь вам стать лучшим программистом во всех областях.

10 полезных инструментов для Python-разработчиков

Если вам нужны инструменты Python для науки о данных, машинного обучения, веб-разработки или чего-то еще, этот список поможет вам.

Читать дальше

ДелитьсяТвитнутьЭл. адрес
Похожие темы
  • Программирование
  • питон
  • Новости
  • Компьютерные советы
  • Программирование
Об авторе
Гаурав Сиял (опубликовано 56 статей)

Гаурав Сиял имеет двухлетний опыт написания текстов для ряда компаний, занимающихся цифровым маркетингом, и документов по жизненному циклу программного обеспечения.

Другие работы Гаурава Сиала

Подписывайтесь на нашу новостную рассылку

Подпишитесь на нашу рассылку технических советов, обзоров, бесплатных электронных книг и эксклюзивных предложений!

Нажмите здесь, чтобы подписаться