Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Chloe Mawer, Jonathan Whitmore - Exploratory data analysis in python - PyCon 2017

Автор: PyCon 2017

Загружено: 2017-05-18

Просмотров: 22559

Описание:

"Speakers: Chloe Mawer, Jonathan Whitmore

With the recent advancements in machine learning algorithms and statistical techniques, and the increasing ease of implementing them in Python, it is tempting to ignore the power and necessity of exploratory data analysis (EDA), the crucial step before diving into machine learning or statistical modeling. Simply applying machine learning algorithms without a proper orientation of the dataset can lead to wasted time and spurious conclusions. EDA allows practitioners to gain intuition for the pattern of the data, identify anomalies, narrow down a set of alternative modeling approaches, devise strategies to handle missing data, and ensure correct interpretation of the results. Further, EDA can rapidly generate insights and answer many questions without requiring complex modeling.

Python is a fantastic language not only for machine learning, but also EDA. In this tutorial, we will walk through two hands-on examples of how to perform EDA using Python and discuss various EDA techniques for cross-section data, time-series data, and panel data. One example will demonstrate how to use EDA to answer questions, test business assumptions, and generate hypotheses for further analysis. The other example will focus on performing EDA to prepare for modeling. Between these two examples, we will cover:

Data profiling and quality assessment
Basic describing of the data
Visualizing the data including interactive visualizations
Identifying patterns in the data (including patterns of correlated missing data)
Dealing with many attributes (columns)
Dealing with large datasets using sampling techniques
Informing the engineering of features for future modeling
Identifying challenges of using the data (e.g. skewness, outliers)
Developing an intuition for interpreting the results of future modeling

The intended audience for this tutorial are aspiring and practicing data scientists and analysts, or anyone who wants to be able to get insights out of data. Students must have at least an intermediate-level knowledge of Python and some familiarity with analyzing data would be beneficial. Installation of Jupyter Notebook will be required (and potentially, we will also demonstrate analysis in JupyterLab, if its development in the next few months allows). Instructions will be sent on what packages to install beforehand.



Slides can be found at: https://speakerdeck.com/pycon2017 and https://github.com/PyCon/2017-slides"

Chloe Mawer, Jonathan Whitmore - Exploratory data analysis in python - PyCon 2017

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Christopher Fonnesbeck - Introduction to Statistical Modeling with Python - PyCon 2017

Christopher Fonnesbeck - Introduction to Statistical Modeling with Python - PyCon 2017

IPython and Jupyter in Depth: High productivity, interactive Python - PyCon 2017

IPython and Jupyter in Depth: High productivity, interactive Python - PyCon 2017

Jake VanderPlas - Exploratory Data Visualization with Vega, Vega-Lite, and Altair - PyCon 2018

Jake VanderPlas - Exploratory Data Visualization with Vega, Vega-Lite, and Altair - PyCon 2018

Torsten Scholak, Diego Maniloff   Intro to Bayesian Machine Learning with PyMC3 and Edward

Torsten Scholak, Diego Maniloff Intro to Bayesian Machine Learning with PyMC3 and Edward

Aileen Nielsen - Time Series Analysis - PyCon 2017

Aileen Nielsen - Time Series Analysis - PyCon 2017

Гренландия вместо Украины

Гренландия вместо Украины

🔥 DDR5 СВОИМИ РУКАМИ | Выживаем в кризис памяти 2026 года 💪| SODIMM - UDIMM без переходников

🔥 DDR5 СВОИМИ РУКАМИ | Выживаем в кризис памяти 2026 года 💪| SODIMM - UDIMM без переходников

Aaron Knight   Build a data pipeline with Luigi   PyCon 2017

Aaron Knight Build a data pipeline with Luigi PyCon 2017

Allen Downey - Bayesian statistics made simple - PyCon 2016

Allen Downey - Bayesian statistics made simple - PyCon 2016

Skipper Seabold - Introduction to Python for Data Science - PyCon 2018

Skipper Seabold - Introduction to Python for Data Science - PyCon 2018

Matthew Rocklin   Dask A Pythonic Distributed Data Science Framework   PyCon 2017

Matthew Rocklin Dask A Pythonic Distributed Data Science Framework PyCon 2017

Chalmer Lowe - bokeh: Data Visualization in Python - PyCon 2017

Chalmer Lowe - bokeh: Data Visualization in Python - PyCon 2017

Лижут ли Вас Собаки? ВОТ ЧТО ЭТО ЗНАЧИТ (вас шокирует)!

Лижут ли Вас Собаки? ВОТ ЧТО ЭТО ЗНАЧИТ (вас шокирует)!

Stephen Elston - Data Visualization and Exploration with Python

Stephen Elston - Data Visualization and Exploration with Python

JetKVM - девайс для удаленного управления вашими ПК

JetKVM - девайс для удаленного управления вашими ПК

Курс Python с Абсолютного нуля! [12 часов из 80] Python курс - качественный старт для начинающих!

Курс Python с Абсолютного нуля! [12 часов из 80] Python курс - качественный старт для начинающих!

5 операций, которые я, как врач, НИКОГДА бы не сделал! / Вы ПОЖАЛЕЕТЕ об ЭТИХ операциях!

5 операций, которые я, как врач, НИКОГДА бы не сделал! / Вы ПОЖАЛЕЕТЕ об ЭТИХ операциях!

Священная ВОЙНА редакторов кода - Vim против Emacs

Священная ВОЙНА редакторов кода - Vim против Emacs

Времени и пространства точно НЕ существует! Физики думают, что это особое состояние чего-то

Времени и пространства точно НЕ существует! Физики думают, что это особое состояние чего-то

ВСЕ, ЧТО ВЫ НЕ ЗНАЛИ ОБ АТОМЕ И ЯДЕРНОЙ ЭНЕРГИИ

ВСЕ, ЧТО ВЫ НЕ ЗНАЛИ ОБ АТОМЕ И ЯДЕРНОЙ ЭНЕРГИИ

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com