Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Data Pipeline Hyperparameter Optimization - Alex Quemy

Автор: PyData

Загружено: 2019-03-05

Просмотров: 3191

Описание:

PyData Warsaw 2018

It is commonly accepted that about 80% of data scientists time is spent on preparing data, including setting up the proper data pipeline or ETL.
For a large part, the proper configuration of a given data pipeline is the result of the data scientist experience and Subject Matter Expert knowledge, plus a dose of arbitrary decisions. What if most of this work could be automated? Better, is it possible to find some universal pipeline configurations that can work well on a wide range of domains and thus transfer what has been learn on one dataset to another?
In this presentation, we show on a PoC that Sequential Model-Based Optimization techniques can be used to tune data pipeline hyperparameters in order to improve model accuracy. We discuss how to measure if optimal configurations are algorithm-specific or independent, shows that, in the specific case of NLP preprocessing operators, there might exist some kind of generally good configurations, independently of the algorithm or the data.
===
www.pydata.org

PyData is an educational program of NumFOCUS, a 501(c)3 non-profit organization in the United States. PyData provides a forum for the international community of users and developers of data analysis tools to share ideas and learn from each other. The global PyData network promotes discussion of best practices, new approaches, and emerging technologies for data management, processing, analytics, and visualization. PyData communities approach data science using many languages, including (but not limited to) Python, Julia, and R.

PyData conferences aim to be accessible and community-driven, with novice to advanced level presentations. PyData tutorials and talks bring attendees the latest project features along with cutting-edge use cases. 00:00 Welcome!
00:10 Help us add time stamps or captions to this video! See the description for details.

Want to help add timestamps to our YouTube videos to help with discoverability? Find out more here: https://github.com/numfocus/YouTubeVi...

Data Pipeline Hyperparameter Optimization - Alex Quemy

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Computer vision challenges in drug discovery - Maciej Hermanowicz

Computer vision challenges in drug discovery - Maciej Hermanowicz

Kubernetes — Простым Языком на Понятном Примере

Kubernetes — Простым Языком на Понятном Примере

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

What Ad is this - Adam Witkowski

What Ad is this - Adam Witkowski

Переговоры в Лондоне, Кадырова перенесли, Маска послали на Марс. Морозов, Мартынов, Филиппенко

Переговоры в Лондоне, Кадырова перенесли, Маска послали на Марс. Морозов, Мартынов, Филиппенко

Richard Liaw: A Guide to Modern Hyperparameters Turning Algorithms | PyData LA 2019

Richard Liaw: A Guide to Modern Hyperparameters Turning Algorithms | PyData LA 2019

4 часа Шопена для обучения, концентрации и релаксации

4 часа Шопена для обучения, концентрации и релаксации

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Теорема Байеса, геометрия изменения убеждений

Теорема Байеса, геометрия изменения убеждений

Keynote: Trust in the device dimensions of human-chatbot relations - Aleksandra Przegalińska

Keynote: Trust in the device dimensions of human-chatbot relations - Aleksandra Przegalińska

КАК УСТРОЕН TCP/IP?

КАК УСТРОЕН TCP/IP?

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

Dan Ryan: Efficient and Flexible Hyperparameter Optimization | PyData Miami 2019

Dan Ryan: Efficient and Flexible Hyperparameter Optimization | PyData Miami 2019

Экспресс-курс RAG для начинающих

Экспресс-курс RAG для начинающих

Maria Murashova: Integrating LLMs with Traditional Data Analysis | PyData Tel Aviv 2025

Maria Murashova: Integrating LLMs with Traditional Data Analysis | PyData Tel Aviv 2025

Лучший Гайд по Kafka для Начинающих За 1 Час

Лучший Гайд по Kafka для Начинающих За 1 Час

Прогнозирование временных рядов с помощью XGBoost — используйте Python и машинное обучение для пр...

Прогнозирование временных рядов с помощью XGBoost — используйте Python и машинное обучение для пр...

Каковы распространённые шаблоны проектирования конвейеров данных? Что такое DAG? | ETL, ELT и CDC...

Каковы распространённые шаблоны проектирования конвейеров данных? Что такое DAG? | ETL, ELT и CDC...

Как устроена База Данных? Кластеры, индексы, схемы, ограничения

Как устроена База Данных? Кластеры, индексы, схемы, ограничения

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]