Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Вычисления на GPU 02 | Архитектура GPU, модель массового параллелизма | CS Space

Автор: Николай Полярный

Загружено: 2026-01-01

Просмотров: 1693

Описание:

Практические задания (задания можно выполнять на любом из трех API - CUDA, OpenCL или Vulkan) - https://github.com/GPGPUCourse/
Плейлист лекций -    • Вычисления на GPU 12 | Как работает Nanite...  

00:00 План лекции
02:26 Сравнение GPU и CPU
07:10 Как уместить много ядер в GPU, warp, 32 лилипута
08:20 Streaming Multiprocessor (SM)
09:37 У потоков warp единый Instruction Pointer
13:33 Проблема Code Divergence
16:42 CPU: Hyper Threading и SMT
18:55 GPU: SM клоун жонглирует warp-ами с лилипутами, скрывает Latency
26:05 Метрика Occupancy, Registers Pressure/Spilling
33:47 Количество warp-ов - на этапе компиляции, прекомпиляция шейдеров
36:02 Отбраковка чипов и сегментация рынка
37:40 GPU память: Coalesced Memory Access pattern
50:12 SIMT vs SIMD
51:53 Архитектура ЭВМ: CPU-RAM-PCIE-VRAM-GPU
55:26 Local/Shared Memory (L1 cache)
56:32 Итоги архитектуры GPU
58:34 Threadripper 7980X как пример проблемы масштабируемости
1:01:34 Вычисления массового параллелизма: WorkRange/Grid, WorkItem/Block, WorkGroup/Thread
1:06:53 Local Memory Barrier, Registers Shuffle, dFdx, dFdy
1:09:58 2D WorkRange/Grid
1:11:40 Профилирование и оптимизация, compute bound, memory bound, NVIDIA Nsight
1:20:00 CPU код на OpenMP
1:24:50 GPU код кернелов на OpenCL, CUDA, Vulkan (GLSL)
1:32:57 Сложение матриц, Coalesced Memory Access
1:36:26 Вопрос: нужно ли дожидаться завершения работы кернела чтобы получить результаты
1:37:07 Вопрос: что если рабочая задача сильно больше чем число потоков
1:38:23 Вопрос: параллельный запуск кернелов на одной видеокарте

Темы лекции:
Архитектура GPU (на контрасте с CPU)
Модель массового параллелизма
code divergence, coalesced memory access
latency hiding, occupancy, registers pressure/spilling
Speed of Light (SoL) анализ, профилировщики
Синтаксис кернелов на OpenCL, CUDA, Vulkan

Слайды - https://storage.yandexcloud.net/csspa...
Лектор - Полярный Николай Вадимович
Telegram канал - https://t.me/UnicornGlade

По вопросам сотрудничества/консультирования/проектной разработки/помощи с оптимизацией вашего кода/разработки алгоритмов (GPU, GPGPU, Computer Vision, Machine Learning) - polarhare@gmail.com и TG@PolarNick239

Изначально лекция была записана и выложена на канале CS Space -    • Лекция 2 | Архитектура GPU, модель массово...  

Вычисления на GPU 02 | Архитектура GPU, модель массового параллелизма | CS Space

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Вычисления на GPU 03 | Локальная память, суммирование массива | CS Space

Вычисления на GPU 03 | Локальная память, суммирование массива | CS Space

Вычисления на GPU 01 | Архитектура CPU, история GPU и GPGPU, введение в OpenCL API | CS Space

Вычисления на GPU 01 | Архитектура CPU, история GPU и GPGPU, введение в OpenCL API | CS Space

Вычисления на GPU 04 | Транспонирование и умножение матриц | CS Space

Вычисления на GPU 04 | Транспонирование и умножение матриц | CS Space

Debian: САМЫЙ СТАБИЛЬНЫЙ Linux и ТЁМНАЯ История Создателя

Debian: САМЫЙ СТАБИЛЬНЫЙ Linux и ТЁМНАЯ История Создателя

«Вкатился» в продуктовый machine learning в 2026. Путь ML-разработчика: интро.

«Вкатился» в продуктовый machine learning в 2026. Путь ML-разработчика: интро.

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Как работает и какие отличия квантовых компьютеров.

Как работает и какие отличия квантовых компьютеров.

Кадыров не переживет смерти Адама | Срочный Разбор

Кадыров не переживет смерти Адама | Срочный Разбор

Самая опасная база данных прямо сейчас

Самая опасная база данных прямо сейчас

КАТАСТРОФА С БЮДЖЕТОМ/ РЕЗКИЙ РОСТ ЦЕН/ БИЗНЕС В ПАНИКЕ/ ИСТЕРИКА ДЕРИПАСКИ. Милов об экономике

КАТАСТРОФА С БЮДЖЕТОМ/ РЕЗКИЙ РОСТ ЦЕН/ БИЗНЕС В ПАНИКЕ/ ИСТЕРИКА ДЕРИПАСКИ. Милов об экономике

RUST: Язык Программирования, Который ЗАМЕНИТ C и C++?

RUST: Язык Программирования, Который ЗАМЕНИТ C и C++?

Вычисления на GPU 10 | Signed Distance Functions | CS Space

Вычисления на GPU 10 | Signed Distance Functions | CS Space

Вся память интернета: петабайты ОЗУ в БОЛЬШОМ обзоре дата-центра

Вся память интернета: петабайты ОЗУ в БОЛЬШОМ обзоре дата-центра

Скажи НЕТ нагреву | Андервольтинг CPU и GPU

Скажи НЕТ нагреву | Андервольтинг CPU и GPU

Вычисления на GPU 11 | Software rasterization, алгоритм Брезенхэма, cudaraster, Larrabee | CS Space

Вычисления на GPU 11 | Software rasterization, алгоритм Брезенхэма, cudaraster, Larrabee | CS Space

Вычисления на GPU 09 | Real-time построение BVH для Ray Tracing | CS Space

Вычисления на GPU 09 | Real-time построение BVH для Ray Tracing | CS Space

Open Source: ВЕЛИЧАЙШАЯ ЛОЖЬ интернета

Open Source: ВЕЛИЧАЙШАЯ ЛОЖЬ интернета

Видеокарта с WB за 21000 рублей померла за 1.5 месяца!

Видеокарта с WB за 21000 рублей померла за 1.5 месяца!

Neovim 0.12: новый менеджер плагинов и минимальный IDE-конфиг

Neovim 0.12: новый менеджер плагинов и минимальный IDE-конфиг

Занятие 1: вводное | Собираем пазл компьютерным зрением | Практический мини-курс для олимпиадников

Занятие 1: вводное | Собираем пазл компьютерным зрением | Практический мини-курс для олимпиадников

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com