Lecture 87: Low Latency Communication Kernels with NVSHMEM

Автор: GPU MODE

Загружено: 2025-12-07

Просмотров: 554

Описание:

Speaker: Prajwal Singhania

High-performance inference at scale is increasingly bottlenecked by communication, especially in decode-heavy LLM workloads where tensor parallelism dominates.

In this talk, we will introduce NVRAR - an NVSHMEM-based all-reduce tailored for inter-node settings.

Lecture 87: Low Latency Communication Kernels with NVSHMEM

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Getting Started with CuTe DSL

Getting Started with CuTe DSL

How FlashAttention 4 Works

How FlashAttention 4 Works

Helion: A high-level DSL for ML kernels

Helion: A high-level DSL for ML kernels

Mirage (MPK): Compiling LLMs into Mega Kernels

Mirage (MPK): Compiling LLMs into Mega Kernels

ESP32: распознавание речи нейросетью (TensorFlow Lite)

ESP32: распознавание речи нейросетью (TensorFlow Lite)

Lecture 80: How FlashAttention 4 Works

Lecture 80: How FlashAttention 4 Works

The Thinking Game | Full documentary | Tribeca Film Festival official selection

The Thinking Game | Full documentary | Tribeca Film Festival official selection

Крах Jaguar: Как “повестка” в рекламе добила легенду британского автопрома

Крах Jaguar: Как “повестка” в рекламе добила легенду британского автопрома

БЕЛЫЕ СПИСКИ: какой VPN-протокол справится? Сравниваю все

БЕЛЫЕ СПИСКИ: какой VPN-протокол справится? Сравниваю все

Лазер и Фрезер 2 в 1 - Идеальный ЧПУ по цене телефона!

Лазер и Фрезер 2 в 1 - Идеальный ЧПУ по цене телефона!

Почему спагетти-код лучше чистой архитектуры

Почему спагетти-код лучше чистой архитектуры

Building the PERFECT Linux PC with Linus Torvalds

Building the PERFECT Linux PC with Linus Torvalds

i think this is what AI should look like

i think this is what AI should look like

Обзор Neuralink, осень 2025 г.

Обзор Neuralink, осень 2025 г.

OpenAI тонет. Google рвёт индустрию. ИИ улетает в космос / Итоги ноября в AI

OpenAI тонет. Google рвёт индустрию. ИИ улетает в космос / Итоги ноября в AI

🧑‍💻 Собеседования и найм: алгоритмы, высокие нагрузки, использование LLM, IDE, стресс и лайвкодинг

🧑‍💻 Собеседования и найм: алгоритмы, высокие нагрузки, использование LLM, IDE, стресс и лайвкодинг

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Lecture 85: Factorio Learning Environment

Lecture 85: Factorio Learning Environment

Не создавайте агентов, а развивайте навыки – Барри Чжан и Махеш Мураг, Anthropic

Не создавайте агентов, а развивайте навыки – Барри Чжан и Махеш Мураг, Anthropic

Lecture 86: Getting Started with CuTe DSL

Lecture 86: Getting Started with CuTe DSL