Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Apache Spark для Джуна | Что такое Spark и как он работает?

Data Engineer

DE

Дата инженер

Как стать дата инженером

Как войти в IT

Big data

Автор: Евгений Виндюков

Загружено: 9 дек. 2024 г.

Просмотров: 7 958 просмотров

Описание:

Запусти свой Spark: https://github.com/halltape/HalltapeS...
Roadmap для Data Engineer: https://github.com/halltape/HalltapeR...

Таймкоды:
00:00:00 Начало
00:00:59 Как работает Pandas
00:01:32 Принцип работы Spark
00:02:53 Операция shuffle
00:07:30 YARN Выделяем ресурсы
00:09:03 Установка Spark
00:10:30 Запуск Spark
00:12:10 Чтение данных
00:14:56 Работа со схемой данных
00:19:40 Группировка и агрегирование
00:24:09 Фильтрация данных
00:26:57 Spark UI
00:27:50 Сохранение данных на диск
00:40:38 Чтение данных
00:46:16 JOIN
00:49:55 Cache и Persist
00:55:10 Repartition vs Coalesce
01:01:30 Out of Memory
01:03:02 Заключение

Видео по Apache Spark я сделал для тех, кто уже знаком с Python и SQL. Здесь я не касаюсь темы Spark Memory Management, темы спилов данных и так далее, так как это более продвинутый уровень. Данное видео поможет с нуля разобраться в Spark, а также запустить его на своем локальном ПК в режиме библиотеки или режиме кластера через docker-compose. Я специально упростил некоторые схемки для простоты объяснения, чтобы джуны не чокнулись раньше времени...


Полезные ссылки:
Telegram канал: https://t.me/halltape_data
Twitch канал:   / halltape  
GitHub: https://github.com/halltape
Канал с подкастами:    / @beyond_the_code  

Apache Spark для Джуна | Что такое Spark и как он работает?

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Data Engineer | Кто это такие, как им стать и что нужно знать?

Data Engineer | Кто это такие, как им стать и что нужно знать?

Строим DWH | Стрим для Data Engineer

Строим DWH | Стрим для Data Engineer

Кто такие devOps, что такое Docker на самом деле, Kubernetes - это сложно

Кто такие devOps, что такое Docker на самом деле, Kubernetes - это сложно

Все JOIN в SQL Для Начинающих За 15 Минут

Все JOIN в SQL Для Начинающих За 15 Минут

Greenplum | Что это такое и как оно работает?

Greenplum | Что это такое и как оно работает?

КАК Построить Дешевый ДОМ Своими Руками | Весь путь от нуля до новоселья

КАК Построить Дешевый ДОМ Своими Руками | Весь путь от нуля до новоселья

Что такое REST API? HTTP, Клиент-Сервер, Проектирование, Разработка, Документация, Swagger и OpenApi

Что такое REST API? HTTP, Клиент-Сервер, Проектирование, Разработка, Документация, Swagger и OpenApi

Что такое Apache Spark

Что такое Apache Spark

Лучший Гайд по Kafka для Начинающих За 1 Час

Лучший Гайд по Kafka для Начинающих За 1 Час

Визуализация данных в Apache Superset | Обзор на BI-инструменты

Визуализация данных в Apache Superset | Обзор на BI-инструменты

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]