Как кодировать категориальные признаки с помощью scikit-learn?
Автор: Data School
Загружено: 2019-11-12
Просмотров: 142413
Чтобы включить категориальные признаки в модель машинного обучения, необходимо закодировать их численно, используя «фиктивное» или «прямое» кодирование. Но как это правильно сделать с помощью scikit-learn?
В этом видео вы узнаете, как использовать OneHotEncoder и ColumnTransformer для кодирования категориальных признаков и подготовки матрицы признаков за один шаг. Вы также узнаете, как включить этот шаг в конвейер, чтобы можно было одновременно выполнять перекрестную проверку модели и этапы предварительной обработки. Наконец, вы узнаете, почему следует использовать scikit-learn (а не pandas) для предварительной обработки набора данных.
ПРОГРАММА:
0:00 Введение
0:22 Зачем использовать конвейер?
2:30 Предварительный просмотр урока
3:35 Загрузка и подготовка набора данных
6:11 Перекрёстная проверка простой модели
10:00 Кодирование категориальных признаков с помощью OneHotEncoder
15:01 Выбор столбцов для предварительной обработки с помощью ColumnTransformer
19:00 Создание двухэтапного конвейера
19:54 Перекрёстная проверка конвейера
21:44 Прогнозирование на основе новых данных
23:43 Повторение урока
24:50 Почему стоит использовать scikit-learn (а не pandas) для предварительной обработки?
КОД ИЗ ЭТОГО ВИДЕО: https://github.com/justmarkham/scikit...
ХОТИТЕ ПРИСОЕДИНИТЬСЯ К МОЕЙ СЛЕДУЮЩЕЙ ВЕБ-ТРАНСЛЯЦИИ? Стать участником ($5 в месяц):
/ dataschool
=== СВЯЗАННЫЕ РЕСУРСЫ ===
Документация OneHotEncoder: https://scikit-learn.org/stable/modul...
Документация ColumnTransformer: https://scikit-learn.org/stable/modul...
Документация Pipeline: https://scikit-learn.org/stable/modul...
Моё видео о перекрёстной проверке: • Selecting the best model in scikit-learn u...
Моё видео о поиске по сетке: • How to find the best model parameters in s...
Мой блокнот для уроков по StandardScaler: https://nbviewer.jupyter.org/github/j...
=== ХОТИТЕ УЛУЧШИТЬСЯ В МАШИННОМ ОБУЧЕНИИ? ===
1) ПОСМОТРИТЕ мою серию видео по scikit-learn: • Machine learning in Python with scikit-learn
2) ПОДПИШИТЕСЬ, чтобы смотреть больше видео: https://www.youtube.com/dataschool?su...
3) ЗАПИШИТЕСЬ на мой курс по машинному обучению: https://www.dataschool.io/learn/
4) ДАВАЙТЕ ОБЩАТЬСЯ!
Рассылка: https://www.dataschool.io/subscribe/
Twitter: / justmarkham
Facebook: / datascienceschool
LinkedIn: / justmarkham
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: