Учебное пособие по Pandas: чтение CSV-файлов, фильтрация, группировка и сортировка данных в Python.
Автор: itversity
Загружено: 2026-01-07
Просмотров: 85
Изучите операции с Pandas DataFrame с нуля! В этом всеобъемлющем руководстве по Pandas мы рассмотрим чтение CSV-файлов, фильтрацию данных, использование агрегации group by и сортировку результатов с помощью самой популярной библиотеки Python для анализа данных.
Это практическое руководство охватывает основные методы обработки данных в Pandas, используя реальный набор данных о продажах автомобилей, содержащий 5000 записей. Мы будем работать непосредственно в блокнотах VS Code (блокноты Jupyter в VS Code) и изучим основные функции Pandas, которые должен знать каждый аналитик данных и инженер данных.
Для получения заметок и материалов по теме «Pandas vs Polars vs PySpark» подпишитесь на нашу рассылку. Вот ссылка на статью: https://itversity.substack.com/p/whic....
Также вы можете найти материалы по теме "Pandas vs Polars vs PySpark" на Medium: https://medium.com/itversity/which-py...
Что вы узнаете:
✅ Настройка ядра Jupyter Notebook и iPyKernel в VS Code
✅ Чтение CSV-файлов с помощью pandas.read_csv() с относительными путями
✅ Изучение структуры DataFrame с помощью .shape и .head()
✅ Фильтрация данных с помощью функции запроса Pandas с переменными
✅ Передача динамических значений в запрос с помощью синтаксиса @variable
✅ Использование агрегации group by для вычисления итогов и количества
✅ Понимание различий между индексами и столбцами в DataFrames Pandas
✅ Применение reset_index() для преобразования индекса в столбец
✅ Сортировка Сортировка DataFrame в порядке убывания с помощью sort_values()
✅ Эффективная работа с наборами данных, содержащими более 5000 записей
Основные функции Pandas, рассмотренные в работе:
pd.read_csv() - Чтение CSV-файлов
.query() - Фильтрация данных с использованием синтаксиса, похожего на SQL
.groupby() - Группировка и агрегирование данных
.agg() - Несколько функций агрегирования
.reset_index() - Преобразование индекса в столбец
.sort_values() - Сортировка данных DataFrame
.shape и .head() - Исследование DataFrame
💡 Пример из реальной жизни: Мы проанализируем данные о продажах автомобилей в 10 разных штатах, отфильтруем данные по конкретным штатам, таким как Флорида, рассчитаем общую выручку и количество продаж по штатам и определим, в каком штате самые высокие продажи.
Это часть нашей всеобъемлющей серии сравнений Pandas, Polar и PySpark. Идеально подходит для начинающих изучать анализ данных на Python или для профессионалов, переходящих между библиотеками обработки данных!
🔔 ПОДПИСЫВАЙТЕСЬ, чтобы получать больше уроков по Python, контента по инженерии данных и советов по ИИ!
Свяжитесь с нами:
Рассылка: https://itversity.substack.com
LinkedIn: / itversity
Facebook: / itversity
Twitter: / itversity
Instagram: / itversity
Присоединяйтесь к этому каналу, чтобы получить доступ к бонусам:
/ @itversity
#Pandas #Python #DataAnalysis #DataScience #VSCode
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: