Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Data Lake в 2025 (modern data stack) | Iceberg, S3 Minio, Trino, Spark, PostgreSQL

Автор: Корсаков о Data

Загружено: 2025-10-02

Просмотров: 1773

Описание:

🚀 В этом видео ты увидишь, как построить настоящий Data Lake с нуля и разберёшься, зачем дата-инженеру Iceberg, Trino, MinIO, Spark и PostgreSQL!
Показываю всё на живом проекте: подключим аналитику, устроим хранение в S3, заведём метастор, научимся писать и читать данные через SQL и PySpark.

Ссылки:
Менторство/консультации по IT – https://korsak0v.notion.site/Data-Eng...
TG канал – https://t.me/DataLikeQWERTY
Instagram –   / i__korsakov  
Habr – https://habr.com/ru/users/k0rsakov/pu...
GitHub проекта – https://github.com/k0rsakov/pet_proje...
Инфраструктура для Data-Engineer Apache Iceberg – https://habr.com/ru/articles/850674/

🔻 Что тебя ждёт:

• Что такое Data Lake и зачем он нужен в 2025 (простыми словами, на пальцах!)
• Чем Data Lake отличается от классического DWH
• Какие задачи решает связка Trino + Iceberg + S3 + Spark + PostgreSQL
• Как выглядит инфраструктура современного дата-инженера (и как всё это быстро поднять у себя)
• Как Trino читает данные из разных источников
• Как создавать таблицы через SQL и видеть их в S3
• Как работает метастор на PostgreSQL и зачем он нужен
• Как наполнять Data Lake внешними данными через Apache Spark
• Практика: запросы, схемы, создание таблиц, чтение через Spark и Trino
• Советы и лайфхаки по работе с Data Lake

Таймкоды:
00:00 – Начало
00:23 – Что такое Data Lake
02:17 – Разбор инфраструктуры
04:51 – Настраиваем подключение к Data Lake
05:51 – Настраиваем подключение к OLTP
08:29 – Первая запись в Data Lake Iceberg через Trino
13:29 – Запись данных в Data Lake Iceberg Через Spark (PySpark)
16:43 – Чтение данных из Data Lake Iceberg через Trino
17:03 – Чтение данных из Data Lake Iceberg через Spark (PySpark)
17:22 – Итог

#DataLake #Trino #Iceberg #S3 #MinIO #Spark #PostgreSQL #DataEngineering #BigData #ETL #SQL

🔥 Не забудь поставить лайк, подписаться на канал и включить колокольчик, чтобы не пропустить новые видео!

Data Lake в 2025 (modern data stack) | Iceberg, S3 Minio, Trino, Spark, PostgreSQL

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

S3 хранилище — Лучший способ хранить файлы на бэкенде | Как работать с S3 через Python

S3 хранилище — Лучший способ хранить файлы на бэкенде | Как работать с S3 через Python

Рынок дата-инженеров и прогноз на 2026

Рынок дата-инженеров и прогноз на 2026

Как на самом деле работает Apache Iceberg / Владимир Озеров

Как на самом деле работает Apache Iceberg / Владимир Озеров

Удаляем свои фото, выходим из чатов, скрываем фамилию? Как избежать штрафов

Удаляем свои фото, выходим из чатов, скрываем фамилию? Как избежать штрафов

Зачем нужны даталейки (Data Lake)

Зачем нужны даталейки (Data Lake)

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Основы тестирования для дата-инженеров. Гайд от А до Я: PyTest, Airflow, ETL, Python, Coverage, SQL

Основы тестирования для дата-инженеров. Гайд от А до Я: PyTest, Airflow, ETL, Python, Coverage, SQL

Владимир Озеров — Как работает Apache Iceberg на примере Trino

Владимир Озеров — Как работает Apache Iceberg на примере Trino

Зачем Apache Iceberg, если уже есть много других форматов

Зачем Apache Iceberg, если уже есть много других форматов

Лучший пет-проект для дата-инженера (The best pet-project for a data-engineer)

Лучший пет-проект для дата-инженера (The best pet-project for a data-engineer)

ETL Лучшие Практики: Полное руководство для начинающих и не только (ETL Best Practices)

ETL Лучшие Практики: Полное руководство для начинающих и не только (ETL Best Practices)

Data lake и DWH: практический опыт | Вебинар Александра Волынского | karpov.courses

Data lake и DWH: практический опыт | Вебинар Александра Волынского | karpov.courses

Apache Iceberg: что это такое и почему все о нем говорят.

Apache Iceberg: что это такое и почему все о нем говорят.

ВВЕДЕНИЕ В PYSPARK И SPARKSQL / ОЛЕГ АГАПОВ

ВВЕДЕНИЕ В PYSPARK И SPARKSQL / ОЛЕГ АГАПОВ

GREENPLUM ЧТО ЗА ЗВЕРЬ И КАК ЕГО ПРИРУЧИТЬ / ДМИТРИЙ ПАВЛОВ

GREENPLUM ЧТО ЗА ЗВЕРЬ И КАК ЕГО ПРИРУЧИТЬ / ДМИТРИЙ ПАВЛОВ

DWH, Data Lake и Data Lakehouse: что это такое и в чем разница? // Курс «Data Engineer»

DWH, Data Lake и Data Lakehouse: что это такое и в чем разница? // Курс «Data Engineer»

Apache iceberg: tips and tricks

Apache iceberg: tips and tricks

Владимир Озеров — Быстрая обработка данных в Data Lake с помощью Trino

Владимир Озеров — Быстрая обработка данных в Data Lake с помощью Trino

В РОССИИ ЗАПРЕТЯТ НАЛИЧНЫЕ? Готовится замена наличных рублей на цифровые...

В РОССИИ ЗАПРЕТЯТ НАЛИЧНЫЕ? Готовится замена наличных рублей на цифровые...

Perplexity - 5 вариантов использования сервиса с нейросетевыми инструментами

Perplexity - 5 вариантов использования сервиса с нейросетевыми инструментами

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com