Учебное пособие по Pandas: чтение CSV-файлов, фильтрация, группировка и сортировка данных в Python.

Автор: itversity

Загружено: 2026-01-07

Просмотров: 85

Описание:

Изучите операции с Pandas DataFrame с нуля! В этом всеобъемлющем руководстве по Pandas мы рассмотрим чтение CSV-файлов, фильтрацию данных, использование агрегации group by и сортировку результатов с помощью самой популярной библиотеки Python для анализа данных.

Это практическое руководство охватывает основные методы обработки данных в Pandas, используя реальный набор данных о продажах автомобилей, содержащий 5000 записей. Мы будем работать непосредственно в блокнотах VS Code (блокноты Jupyter в VS Code) и изучим основные функции Pandas, которые должен знать каждый аналитик данных и инженер данных.

Для получения заметок и материалов по теме «Pandas vs Polars vs PySpark» подпишитесь на нашу рассылку. Вот ссылка на статью: https://itversity.substack.com/p/whic....

Также вы можете найти материалы по теме "Pandas vs Polars vs PySpark" на Medium: https://medium.com/itversity/which-py...

Что вы узнаете:
✅ Настройка ядра Jupyter Notebook и iPyKernel в VS Code
✅ Чтение CSV-файлов с помощью pandas.read_csv() с относительными путями
✅ Изучение структуры DataFrame с помощью .shape и .head()
✅ Фильтрация данных с помощью функции запроса Pandas с переменными
✅ Передача динамических значений в запрос с помощью синтаксиса @variable
✅ Использование агрегации group by для вычисления итогов и количества
✅ Понимание различий между индексами и столбцами в DataFrames Pandas
✅ Применение reset_index() для преобразования индекса в столбец
✅ Сортировка Сортировка DataFrame в порядке убывания с помощью sort_values()
✅ Эффективная работа с наборами данных, содержащими более 5000 записей

Основные функции Pandas, рассмотренные в работе:
pd.read_csv() - Чтение CSV-файлов
.query() - Фильтрация данных с использованием синтаксиса, похожего на SQL
.groupby() - Группировка и агрегирование данных
.agg() - Несколько функций агрегирования
.reset_index() - Преобразование индекса в столбец
.sort_values() - Сортировка данных DataFrame
.shape и .head() - Исследование DataFrame

💡 Пример из реальной жизни: Мы проанализируем данные о продажах автомобилей в 10 разных штатах, отфильтруем данные по конкретным штатам, таким как Флорида, рассчитаем общую выручку и количество продаж по штатам и определим, в каком штате самые высокие продажи.

Это часть нашей всеобъемлющей серии сравнений Pandas, Polar и PySpark. Идеально подходит для начинающих изучать анализ данных на Python или для профессионалов, переходящих между библиотеками обработки данных!

🔔 ПОДПИСЫВАЙТЕСЬ, чтобы получать больше уроков по Python, контента по инженерии данных и советов по ИИ!

Свяжитесь с нами:
Рассылка: https://itversity.substack.com
LinkedIn:   / itversity
Facebook:   / itversity
Twitter:   / itversity
Instagram:   / itversity

Присоединяйтесь к этому каналу, чтобы получить доступ к бонусам:
   / @itversity

#Pandas #Python #DataAnalysis #DataScience #VSCode

Учебное пособие по Pandas: чтение CSV-файлов, фильтрация, группировка и сортировка данных в Python.

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Как бы я БЫСТРО выучил Python (если бы мог начать заново)

Как бы я БЫСТРО выучил Python (если бы мог начать заново)

Код работает в 100 раз медленнее из-за ложного разделения ресурсов.

Код работает в 100 раз медленнее из-за ложного разделения ресурсов.

Watch me Cleaning Data in minutes with Python

Watch me Cleaning Data in minutes with Python

Как быстро освоить Python для инженеров данных (пошаговое руководство 2026 года)

Как быстро освоить Python для инженеров данных (пошаговое руководство 2026 года)

Что делает программист весь день? Показываю

Что делает программист весь день? Показываю

MCP Tutorial: Claude Desktop + BigQuery Integration for AI Data Analytics

MCP Tutorial: Claude Desktop + BigQuery Integration for AI Data Analytics

Трекер привычек в гугл таблицах. Бесплатный шаблон

Трекер привычек в гугл таблицах. Бесплатный шаблон

Что Будет с Junior Разработчиками в Эпоху ИИ

Что Будет с Junior Разработчиками в Эпоху ИИ

Я попробовал Zorin OS, будучи пользователем Windows 11 (это оказалось не тем, чего я ожидал).

Я попробовал Zorin OS, будучи пользователем Windows 11 (это оказалось не тем, чего я ожидал).

Как подготовить данные для использования ИИ в Power BI!

Как подготовить данные для использования ИИ в Power BI!

Build AI-Powered Technical Presentations in Minutes | Live Demo: Pandas vs Polars vs PySpark

Build AI-Powered Technical Presentations in Minutes | Live Demo: Pandas vs Polars vs PySpark

Собираем «Бизнес-Мозг» с нуля: интерактивные приложения с NotebookLM и Gemini

Собираем «Бизнес-Мозг» с нуля: интерактивные приложения с NotebookLM и Gemini

18 крутых способов использовать ChatGPT, которые могут ЗАПРЕТИТЬ!

18 крутых способов использовать ChatGPT, которые могут ЗАПРЕТИТЬ!

Apache Spark был сложным, пока я не изучил эти 30 концепций!

Apache Spark был сложным, пока я не изучил эти 30 концепций!

Синьор 1С: 10 привычек, без которых ты не вырастешь

Синьор 1С: 10 привычек, без которых ты не вырастешь

Сортировка вставкой — Учебник по структурам данных и алгоритмам Python #16

Сортировка вставкой — Учебник по структурам данных и алгоритмам Python #16

NotebookLM внутри чата Gemini - идеальная связка?

NotebookLM внутри чата Gemini - идеальная связка?

Python Pandas Tutorial (Part 1): Getting Started with Data Analysis - Installation and Loading Data

Python Pandas Tutorial (Part 1): Getting Started with Data Analysis - Installation and Loading Data

Почему Трамп в последний момент отменил удар по Ирану

Почему Трамп в последний момент отменил удар по Ирану

Я случайно создал приложение на работе. Gemini Canvas + NotebookLM гайд.

Я случайно создал приложение на работе. Gemini Canvas + NotebookLM гайд.