Артикул в кнопке "Далее": 899988
Jupyter Notebook - инструмент номер один для специалистов по данным. Он предлагает интерактивный веб-интерфейс, который можно использовать для визуализации данных, простого анализа и совместной работы.
Визуализация данных позволяет вам находить контекст для ваших данных с помощью карт или графиков. Это руководство предлагает подробное руководство по взаимодействию с графиками в Jupyter Notebook.
Предпосылки
Тебе надо установить Jupyter на вашей машине. Если это не так, вы можете установить его, введя следующий код в командную строку:
$ pip установить jupyter
Вам также понадобится панды а также matplotlib библиотека:
$ pip install pandas
$ pip install matplotlib
После завершения установки запустите сервер Jupyter Notebook. Для этого введите в терминале команду ниже. Страница Jupyter, показывающая файлы в текущем каталоге, откроется в браузере вашего компьютера по умолчанию.
Блокнот $ jupyter
Примечание: Не закрывайте окно терминала, в котором вы запускаете эту команду. Ваш сервер остановится, если вы это сделаете.
Простой сюжет
На новой странице Jupyter запустите этот код:
импортировать matplotlib.pyplot как plt
х = [1,2,3,4,5,6,7,8]
y = [2,4,6,8,10,12,14,16]
plt.plot (x, y)
plt.show ()
Код предназначен для простого линейного графика. Первая строка импортирует пиплот графическая библиотека из matplotlib API. Третья и четвертая строки определяют оси x и y соответственно.
В участок() вызывается метод построения графика. В показывать() затем используется для отображения графика.
Предположим, вы хотите вместо этого нарисовать кривую. Процесс такой же. Просто измените значения список Python для оси ординат.
импортировать matplotlib.pyplot как plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.plot (x, y)
plt.show ()
Обратите внимание на кое-что важное: на обоих графиках нет явного определения масштаба. Шкала рассчитывается и применяется автоматически. Это одна из многих интересных функций, которые предлагает Juypter, которая может помочь вам сосредоточиться на своей работе (анализе данных), а не беспокоиться о коде.
Если вы также будете бдительны, вы можете заметить, что количество значений для осей x и y одинаково. Если один из них меньше другого, при запуске кода будет отмечена ошибка, и график не будет отображаться.
Доступные типы
В отличие от линейного графика и кривой выше, другие визуализации графиков (например, гистограмма, гистограмма и т. Д.) Должны быть явно определены для отображения.
Гистограмма
Чтобы отобразить гистограмму, вам нужно будет использовать бар() метод.
импортировать matplotlib.pyplot как plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.bar (x, y)
plt.show ()
Точечная диаграмма
Все, что вам нужно сделать, это использовать разброс () в предыдущем коде.
импортировать matplotlib.pyplot как plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.scatter (x, y)
plt.show ()
Круговая диаграмма
Круговая диаграмма немного отличается от остальных, представленных выше. Строка 4 представляет особый интерес, поэтому обратите внимание на ее особенности.
фиговый используется для установки соотношения сторон. Вы можете установить это как угодно (например, (9,5)), но официальные документы Pandas советуют использовать соотношение сторон 1.
импортировать matplotlib.pyplot как plt
х = [4,9,16,25,36]
fig = plt.figure (figsize = (9, 5)) # строка 4
plt.pie (x)
plt.show ()
Следует отметить некоторые параметры круговой диаграммы:
этикетки - Это можно использовать для обозначения каждого фрагмента круговой диаграммы.
цвета - Это можно использовать для придания заранее определенных цветов каждому из фрагментов. Вы можете указать цвета как в текстовой форме (например, «желтый»), так и в шестнадцатеричной форме (например, «# ebc713»).
См. Пример ниже:
импортировать matplotlib.pyplot как plt
х = [4,9,16,25,36]
fig = plt.figure (figsize = (5.5, 5.5))
plt.pie (x, labels = («Гуавас», «Ягоды», «Манго», «Яблоки», «Авокадо»),
colors = ("# a86544", "# eb5b13", "# ebc713", "# bdeb13", "# 8aeb13"))
plt.show ()
Есть и другие сюжеты вроде история, область а также kde что ты можешь узнать больше о документах Pandas.
Форматирование графика
На графиках выше нет таких аспектов, как ярлыки. Вот как это сделать.
Чтобы добавить заголовок, включите приведенный ниже код в свой блокнот Jupyter:
matplotlib.pyplot.title ("Название моего графика")
Оси x и y могут быть соответственно помечены, как показано ниже:
matplotlib.pyplot.xlabel ("моя метка оси x")
matplotlib.pyplot.ylabel ("моя метка оси Y")
Узнать больше
Вы можете запустить помощь() в записной книжке, чтобы получить интерактивную помощь по командам Jupyter. Чтобы получить больше информации о конкретном объекте, вы можете использовать помощь (объект).
Вы также сочтете хорошей практикой попробовать рисовать графики с использованием наборов данных из csvfiles. Изучение того, как визуализировать данные, является мощным инструментом для передачи и анализа полученных результатов, поэтому стоит потратить некоторое время на то, чтобы развить свои навыки.
Для расширенного анализа данных Python лучше, чем Excel. Вот как импортировать данные Excel в скрипт Python с помощью Pandas!
Читать далее
- Программирование
- Python
- Учебники по кодированию
- Анализ данных
Джером - штатный писатель в MakeUseOf. Он освещает статьи по программированию и Linux. Он также криптоэнтузиаст и всегда следит за криптоиндустрией.
Подписывайтесь на нашу новостную рассылку
Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!
Еще один шаг…!
Пожалуйста, подтвердите свой адрес электронной почты в электронном письме, которое мы вам только что отправили.