Distributed and Stable LLM Training on a Large-Scale Cluster

Автор: C-DAC

Загружено: 2025-09-03

Просмотров: 257

Описание:

Third session from the webinar series jointly organized by ‪@NVIDIA‬ and ‪@CDACOfficial‬ Pune, focused on training large language models (LLMs) from scratch.
In this session, we explored parallelism techniques (data, tensor, and pipeline), how they work together for scaling large models, and the role of mixed-precision training in improving efficiency. The discussion highlighted best practices and demonstrated how frameworks like NeMo and Megatron-LM support reliable large-scale training.

For any queries, please contact: [email protected]

#NPSF #GPU #CDACPune #HPCAI #AI #PARAMSiddhiAI #LLM

Distributed and Stable LLM Training on a Large-Scale Cluster

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Large-Scale Data Curation for LLM Training

Large-Scale Data Curation for LLM Training

Deep Dive Series on Training LLMs from Scratch

Deep Dive Series on Training LLMs from Scratch

QLoRA—How to Fine-tune an LLM on a Single GPU (w/ Python Code)

QLoRA—How to Fine-tune an LLM on a Single GPU (w/ Python Code)

RAG простыми словами: как научить LLM работать с файлами

RAG простыми словами: как научить LLM работать с файлами

Tec-Verse 2025 Driving Progress Through Innovation - Ashoka Session

Tec-Verse 2025 Driving Progress Through Innovation - Ashoka Session

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

ЦБ разработал порядок «помощи» заблокированным по 161-ФЗ. Совместно с МВД…

ЦБ разработал порядок «помощи» заблокированным по 161-ФЗ. Совместно с МВД…

Итоги 2025 года в ожидании мира. СВО, переговоры и ошибки сторон // «Февраль 24/7»

Итоги 2025 года в ожидании мира. СВО, переговоры и ошибки сторон // «Февраль 24/7»

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Первый контакт УЖЕ произошел, но мы этого НЕ ЗАМЕТИЛИ! Михаил Никитин, Борис Штерн

Первый контакт УЖЕ произошел, но мы этого НЕ ЗАМЕТИЛИ! Михаил Никитин, Борис Штерн

AI, Machine Learning, Deep Learning and Generative AI Explained

AI, Machine Learning, Deep Learning and Generative AI Explained

Training LLMs at Scale - Deepak Narayanan | Stanford MLSys #83

Training LLMs at Scale - Deepak Narayanan | Stanford MLSys #83

Краткий обзор новой версии n8n 2.0 🚀

Краткий обзор новой версии n8n 2.0 🚀

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

ДРУГАЯ история. Что изображено на старых картинах 15 века.

ДРУГАЯ история. Что изображено на старых картинах 15 века.

Что именно делает NVLink для машинного обучения (включая рабочую станцию Exxact Workstation с д...

Что именно делает NVLink для машинного обучения (включая рабочую станцию Exxact Workstation с д...

НОВИКОВ: "Теперь официально, можете проверить". Что случилось с Зеленским, Ермак, Порошенко, суд

Заявление Тертеля: о Лукашенко и не только /Масштабные аресты по всей Беларуси: вскрыли сеть шпионов

Заявление Тертеля: о Лукашенко и не только /Масштабные аресты по всей Беларуси: вскрыли сеть шпионов

How LLMs use multiple GPUs

How LLMs use multiple GPUs

Fast Fine Tuning with Unsloth

Fast Fine Tuning with Unsloth