Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Manage AWS Glue Jobs with Step Functions

Автор: Knowledge Amplifier

Загружено: 2022-06-28

Просмотров: 17479

Описание:

In this video , the usage of AWS Step Functions to orchestrate multiple Glue ETL jobs is explained from scratch.

Prerequisite:
------------------------
AWS Glue Workflow in-depth intuition with Lab
   • AWS Glue Workflow in-depth intuition with Lab  
Build and automate Serverless DataLake using an AWS Glue , Lambda , Cloudwatch
   • Build and automate Serverless DataLake usi...  

Step 1:
--------
Create a crawler

Step 2:
--------
Start crawler and get crawler state in Step Function

Step 3:
--------
Inspect the Json of GetCrawler component to build the if-else condition

Step 4:
--------
Create a waiter block

Step 5:
--------
Add the Glue Run Job component (Below code)--
(Configure the block as synchronous component i.e. call the service, and have Step Functions wait for a job to complete)

import sys
from awsglue.transforms import *
from awsglue.utils import getResolvedOptions
from pyspark.context import SparkContext
from awsglue.context import GlueContext
from awsglue.job import Job

@params: [JOB_NAME]
args = getResolvedOptions(sys.argv, ['JOB_NAME'])

sc = SparkContext()
glueContext = GlueContext(sc)
spark = glueContext.spark_session
job = Job(glueContext)
job.init(args['JOB_NAME'], args)

datasource0 = glueContext.create_dynamic_frame.from_catalog(database = "{}", table_name = "{}", transformation_ctx = "datasource0")

datasink4 = glueContext.write_dynamic_frame.from_options(frame = datasource0, connection_type = "s3",
connection_options = {"path": "s3://{}/{}/"}, format = "parquet", transformation_ctx = "datasink4")
job.commit()

Reusable Step Function Json:
-------------------------------
{
"Comment": "A description of my state machine",
"StartAt": "StartCrawler",
"States": {
"StartCrawler": {
"Type": "Task",
"Parameters": {
"Name": "{Write the Crawler name here}"
},
"Resource": "arn:aws:states:::aws-sdk:glue:startCrawler",
"Next": "GetCrawler"
},
"GetCrawler": {
"Type": "Task",
"Parameters": {
"Name": "{Write the Crawler name here}"
},
"Resource": "arn:aws:states:::aws-sdk:glue:getCrawler",
"Next": "Choice"
},
"Choice": {
"Type": "Choice",
"Choices": [
{
"Variable": "$.Crawler.State",
"StringEquals": "RUNNING",
"Next": "Wait"
}
],
"Default": "Glue StartJobRun"
},
"Wait": {
"Type": "Wait",
"Seconds": 5,
"Next": "GetCrawler"
},
"Glue StartJobRun": {
"Type": "Task",
"Resource": "arn:aws:states:::glue:startJobRun.sync",
"Parameters": {
"JobName": "{Write the Job name here}"
},
"End": true
}
}
}

Learn AWS Step Fucniton from Scratch:
   • AWS Step Functions Simplified  

Check this playlist for more AWS Projects in Big Data domain:
   • Demystifying Data Engineering with Cloud C...  

🙏🙏🙏🙏🙏🙏🙏🙏
YOU JUST NEED TO DO
3 THINGS to support my channel
LIKE
SHARE
&
SUBSCRIBE
TO MY YOUTUBE CHANNEL

Manage AWS Glue Jobs with Step Functions

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

AWS Step Functions + Lambda Tutorial - Step by Step Guide in the Workflow Studio

AWS Step Functions + Lambda Tutorial - Step by Step Guide in the Workflow Studio

AWS Step Functions Crash Course | Step by Step Tutorial

AWS Step Functions Crash Course | Step by Step Tutorial

Build and automate Serverless DataLake using an AWS Glue , Lambda , Cloudwatch

Build and automate Serverless DataLake using an AWS Glue , Lambda , Cloudwatch

Учебное пособие по AWS Glue для начинающих | Узнайте всё о Glue за 30 минут | Каталог данных Glue...

Учебное пособие по AWS Glue для начинающих | Узнайте всё о Glue за 30 минут | Каталог данных Glue...

End-to-End ETL Pipeline in AWS: Redshift, PySpark, Glue, EMR, Hudi & Airflow #aws #awstutorial #etl

End-to-End ETL Pipeline in AWS: Redshift, PySpark, Glue, EMR, Hudi & Airflow #aws #awstutorial #etl

The Good Life Radio • 24/7 Live Radio | Best Relax House, Chillout, Study, Running, Gym, Happy Music

The Good Life Radio • 24/7 Live Radio | Best Relax House, Chillout, Study, Running, Gym, Happy Music

Создайте бессерверный рабочий процесс с помощью AWS Step Functions

Создайте бессерверный рабочий процесс с помощью AWS Step Functions

Kubernetes — Простым Языком на Понятном Примере

Kubernetes — Простым Языком на Понятном Примере

4 часа Шопена для обучения, концентрации и релаксации

4 часа Шопена для обучения, концентрации и релаксации

PySpark For AWS Glue Tutorial [FULL COURSE in 100min]

PySpark For AWS Glue Tutorial [FULL COURSE in 100min]

4 Hours Chopin for Studying, Concentration & Relaxation

4 Hours Chopin for Studying, Concentration & Relaxation

ETL | Инкрементная загрузка данных из Amazon S3 Bucket в Amazon Redshift с использованием AWS Glu...

ETL | Инкрементная загрузка данных из Amazon S3 Bucket в Amazon Redshift с использованием AWS Glu...

AWS re:Invent 2024 - Building advanced workflows with AWS Step Functions (API402)

AWS re:Invent 2024 - Building advanced workflows with AWS Step Functions (API402)

lofi hip hop radio 📚 beats to relax/study to

lofi hip hop radio 📚 beats to relax/study to

Организуйте работу с клеем с помощью пошаговых функций

Организуйте работу с клеем с помощью пошаговых функций

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

AWS Lambda | Function URL | Environment Vars | Lambda Layers - Step by Step Tutorial (Part -17)

AWS Lambda | Function URL | Environment Vars | Lambda Layers - Step by Step Tutorial (Part -17)

Preventing Duplicate Executions in Step Function

Preventing Duplicate Executions in Step Function

Музыка без отвлекающих факторов для гиперконцентрации | Таймер Помодоро 90/30

Музыка без отвлекающих факторов для гиперконцентрации | Таймер Помодоро 90/30

AWS Glue Tutorial for Beginners [FULL COURSE in 45 mins]

AWS Glue Tutorial for Beginners [FULL COURSE in 45 mins]

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]