Big Data & Pentaho Multi Clúster Hadoop (Demo) Ingeniería de Datos: AWS S3, Cloudera y Hortonworks
Автор: NextCollege
Загружено: 2023-07-23
Просмотров: 422
(𝐃𝐞𝐦𝐨 𝐑𝐞𝐚𝐥) 𝐁𝐢𝐠 𝐃𝐚𝐭𝐚 & 𝐏𝐞𝐧𝐭𝐚𝐡𝐨 𝐌𝐮𝐥𝐭𝐢 𝐂𝐥𝐮́𝐬𝐭𝐞𝐫 𝐇𝐚𝐝𝐨𝐨𝐩, aplicando 𝐈𝐧𝐠𝐞𝐧𝐢𝐞𝐫𝐢́𝐚 𝐝𝐞 𝐃𝐚𝐭𝐨𝐬 sobre el Datalake en 𝐀𝐖𝐒 (𝐒𝟑,) 𝐂𝐥𝐨𝐮𝐝𝐞𝐫𝐚 (HDFS) 𝐲 𝐇𝐨𝐫𝐭𝐨𝐧𝐰𝐨𝐫𝐤𝐬 (HDFS)
En esta sesión se muestra una demo real de ingeniería de datos utilizando u entorno híbrido Multi-Clúster on-premise y on-cloud, teniendo a Pentaho Data Integration como componente tecnológico para lograr la agnosticidad en nuestros desarrollos de proyectos Big Data, de la mano con el uso de patrones de diseño, para lo cual se muestra un conjunto de transformaciones y jobs en un Data Pipeline de ejemplo, el cual permite apreciar la flexibilidad y potencia entregada por 𝑷𝒆𝒏𝒕𝒂𝒉𝒐 𝑫𝒂𝒕𝒂 𝑰𝒏𝒕𝒆𝒈𝒓𝒂𝒕𝒊𝒐𝒏
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: