Databricks Certified Data Engineer Associate - ELT With Spark SQL and Python [E2][Español]
Автор: Daniel DataShow
Загружено: 2025-04-17
Просмотров: 714
Este es el segundo episodio titulado "ELT With Spark SQL and Python" - "Transforming Data with Apache Spark".
En este capítulo, exploramos diversas tareas de transformación de datos, como la consulta de archivos, la escritura en tablas con diversas estrategias y la realización de operaciones ETL avanzadas. Además, descubriremos el potencial de las funciones de orden superior y las funciones definidas por el usuario (UDF) en Spark SQL.
------------------------
El examen Databricks Certified Data Engineer Associate evalúa la capacidad para utilizar la plataforma Databricks Lakehouse en tareas introductorias de ingeniería de datos. Los temas principales que abarca el examen incluyen:
1. Plataforma Databricks Lakehouse (24%): Comprensión de los conceptos, arquitectura y beneficios de la plataforma para los equipos de datos.
2. ELT con Spark SQL y Python (29%): Uso de Apache Spark™ SQL y Python para realizar tareas de extracción, carga y transformación de datos en arquitecturas de múltiples etapas.
3. Procesamiento de Datos Incrementales (22%): Implementación de procesos de datos que manejan cargas tanto por lotes como incrementales.
4. Pipelines de Producción (16%): Despliegue de pipelines ETL básicos y consultas de Databricks SQL en entornos de producción, asegurando el mantenimiento de permisos de entidades.
5. Gobernanza de Datos (9%): Gestión de permisos y gobernanza dentro de la plataforma Databricks.
⸻
Sígueme en mis redes sociales:
Daniel Datashow
📺 TikTok: / danielportugalr
📺 Youtube: / @danielportugalr
💼 LinkedIn: / danielportugalr
💬 ¿Tienes dudas o quieres compartir tu arquitectura?
Únete a nuestra comunidad Data Wizard en Discord:
👉 / discord
📺 YouTube: / @datawizardclub
💼 LinkedIn: / data-wizard-club
📷 Instagram: / data.wizard.club
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: