Pandas - это библиотека Python с открытым исходным кодом, которая в основном используется для обработки и анализа данных. Он построен на основе библиотеки NumPy и предоставляет высокопроизводительные, простые в использовании структуры данных и инструменты анализа данных для языка программирования Python.
В этой статье вы узнаете, как выполнить 6 основных операций с помощью Pandas.
Использование примеров Pandas
Вы можете запустить примеры из этой статьи, используя вычислительные записные книжки, такие как Блокнот Jupyter, Google Colab, так далее. Вы также можете запустить примеры, введя код непосредственно в интерпретатор Python в интерактивном режиме.
Если вы хотите взглянуть на полный исходный код, использованный в этой статье, вы можете получить доступ к файлу записной книжки Python из этого Репозиторий GitHub.
1. Как импортировать Pandas как pd и распечатать номер версии
Вам нужно использовать Импортировать ключевое слово для импорта любой библиотеки в Python. Панды обычно импортируются под
pd псевдоним. При таком подходе вы можете ссылаться на пакет Pandas как pd вместо того панды.импортировать панд как pd
печать (pd .__ version__)
Выход:
1.2.4
2. Как создать серию в пандах
Pandas Series - это одномерный массив, содержащий данные любого типа. Это как столбец в таблице. Вы можете создать серию, используя массивы numpy, функции numpy, списки, словари, скалярные значения и т. Д.
Значения серии помечаются своим порядковым номером. По умолчанию первое значение имеет индекс 0, второе значение имеет индекс 1 и так далее. Чтобы назвать свои собственные ярлыки, вам нужно использовать показатель аргумент.
Как создать пустую серию
s = pd. Серия (dtype = 'float64')
s
Выход:
Серия ([], dtype: float64)
В приведенном выше примере пустая серия с плавать тип данных создан.
Как создать серию с помощью массива NumPy
импортировать панд как pd
импортировать numpy как np
d = np.array ([1, 2, 3, 4, 5])
s = pd. Серия (d)
s
Выход:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Связанный: NumPy Operations для начинающих
Как создать серию с помощью списка
d = [1, 2, 3, 4, 5]
s = pd. Серия (d)
s
Выход:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Как создать серию с индексом
Чтобы создать серию с индексом, вам нужно использовать показатель аргумент. Количество индексов должно быть равно количеству элементов в серии.
d = [1, 2, 3, 4, 5]
s = pd. Series (d, index = ["один", "два", "три", "четыре", "пять"])
s
Выход:
один 1
два 2
три 3
четыре 4
пять 5
dtype: int64
Как создать серию с помощью словаря
Ключи словаря становятся метками серии.
d = {"один": 1,
«два»: 2,
«тройка»: 3,
«четверка»: 4,
«пять»: 5}
s = pd. Серия (d)
s
Выход:
один 1
два 2
три 3
четыре 4
пять 5
dtype: int64
Как создать серию с использованием скалярного значения
Если вы хотите создать серию с использованием скалярного значения, вы должны предоставить показатель аргумент.
s = pd. Series (1, index = ["a", "b", "c", "d"])
s
Выход:
а 1
б 1
c 1
d 1
dtype: int64
3. Как создать фрейм данных в Pandas
DataFrame - это двухмерная структура данных, в которой данные выровнены в виде строк и столбцов. DataFrame может быть создан с использованием словарей, списков, списка словарей, массивов numpy и т. Д. В реальном мире DataFrames создаются с использованием существующего хранилища, такого как файлы CSV, файлы Excel, базы данных SQL и т. Д.
Объект DataFrame поддерживает ряд атрибутов и методов. Если вы хотите узнать о них больше, вы можете ознакомиться с официальной документацией фреймворк pandas.
Как создать пустой фрейм данных
df = pd. DataFrame ()
печать (df)
Выход:
Пустой фрейм данных
Столбцы: []
Показатель: []
Как создать DataFrame с помощью списка
listObj = ["MUO", "технология", "упрощенный"]
df = pd. DataFrame (listObj)
печать (df)
Выход:
0
0 MUO
1 технология
2 упрощенных
Как создать DataFrame с помощью словаря ndarray / Lists
batmanData = {'Название фильма': ['Бэтмен: начало', 'Темный рыцарь', 'Темный рыцарь: восстание'],
"Год выпуска": [2005, 2008, 2012]}
df = pd. DataFrame (BatmanData)
печать (df)
Выход:
Название фильма Год выхода
0 Бэтмен: Начало 2005
1 Темный рыцарь 2008
2 Темный рыцарь: восстание 2012
Как создать DataFrame, используя список списков
data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (данные, столбцы = ['Имя', 'Номер рулона'])
печать (df)
Выход:
Название Рулон №
0 Алекс 601
1 Боб 602
2 Каталин 603
Как создать DataFrame, используя список словарей
data = [{'Name': 'Alex', 'Roll No.': 601},
{'Name': 'Bob', 'Roll No.': 602},
{'Name': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (данные)
печать (df)
Выход:
Название Рулон №
0 Алекс 601
1 Боб 602
2 Каталин 603
Связанный: Как преобразовать список в словарь в Python
Как создать DataFrame с помощью функции zip ()
Использовать zip () функция для объединения списков в Python.
Name = ['Алекс', 'Боб', 'Каталин']
RollNo = [601, 602, 603]
listOfTuples = list (zip (Имя, Номер рулона))
df = pd. DataFrame (listOfTuples, columns = ['Name', 'Roll No.'])
печать (df)
Выход:
Название Рулон №
0 Алекс 601
1 Боб 602
2 Каталин 603
4. Как читать данные CSV в Pandas
Файл «значений, разделенных запятыми» (CSV) - это текстовый файл с разделителями, в котором значения разделяются запятыми. Вы можете прочитать файл CSV, используя read_csv () метод в пандах. Если вы хотите распечатать весь DataFrame, используйте нанизывать() метод.
В этом и следующем примерах это CSV файл будет использоваться для выполнения операций.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печать (df.to_string ())
Выход:
5. Как анализировать фреймы данных с помощью методов head (), tail () и info ()
Как просматривать данные с помощью метода head ()
В голова() - один из лучших способов получить быстрый обзор DataFrame. Этот метод возвращает заголовок и указанное количество строк, начиная сверху.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печать (df.head (10))
Выход:
Если вы не укажете количество строк, будут возвращены первые 5 строк.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печать (df.head ())
Выход:
Как просматривать данные с помощью метода tail ()
В хвост() Метод возвращает заголовок и указанное количество строк, начиная снизу.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печать (df.tail (10))
Выход:
Если вы не укажете количество строк, будут возвращены последние 5 строк.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печать (df.tail ())
Выход:
Как получить информацию о данных
В Информация() методы возвращают краткую сводку DataFrame, включая dtype индекса и dtypes столбцов, ненулевые значения и использование памяти.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
печать (df.info ())
Выход:
6. Как читать данные JSON в Pandas
JSON (JаваSскрипт Object Notation) - это облегченный формат обмена данными. Вы можете прочитать файл JSON, используя read_json () метод в пандах. Если вы хотите распечатать весь DataFrame, используйте нанизывать() метод.
В приведенном ниже примере это Файл JSON используется для выполнения операций.
Связанный: Что такое JSON? Обзор неспециалиста
df = pd.read_json (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
печать (df.to_string ())
Выход:
Обновите свои знания Python с помощью встроенных функций и методов
Функции помогают сократить код и повысить его эффективность. Функции и методы вроде уменьшать(), расколоть(), перечислить (), eval (), круглый(), так далее. может сделать ваш код надежным и легким для понимания. Всегда полезно знать о встроенных функциях и методах, поскольку они могут значительно упростить ваши задачи программирования.
Стандартная библиотека Python содержит множество функций, которые помогут вам с задачами программирования. Узнайте о самом полезном и создайте более надежный код.
Читать далее
- Программирование
- Python
- Веб-разработка
- Программирование
- Анализ данных
Юврадж - студент бакалавриата по информатике в Университете Дели, Индия. Он увлечен веб-разработкой Full Stack. Когда он не пишет, он исследует глубину различных технологий.
Подписывайтесь на нашу новостную рассылку
Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!
Нажмите здесь, чтобы подписаться