PySpark Pipeline в помощь аналитикам данных для построения качественных ETL-процессов. Дмитрий Ч.
Автор: X5 Tech
Загружено: 17 июл. 2023 г.
Просмотров: 498 просмотров
Дмитрий Чернышев, старший менеджер по анализу больших данных X5 Tech, рассматривает метод написания кода на PySpark таким образом, чтобы он был более читаем, легко тестируем и поддерживаем. Слушатели узнают как решить проблему документирования кода и логики пайплайнов, а также как стандартизировать работу с аналитическими пайплайнами.
Другие выступления митапа - • X5 Data Science meetup #2
____
Подписывайтесь на Х5 Tech, чтобы знать больше о технологиях:
https://vk.com/x5tech
https://t.me/x5_tech
https://habr.com/ru/company/X5Tech/blog
#X5DataScienceMeetup #X5meetup #datascience

Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: