HPSC 2025 - Lecture 36 - CUDA codes for optimised matrix multiplication
Автор: Gaurav Bhutani
Загружено: 2025-05-06
Просмотров: 337
Matrix multiplication using CUDA C with profiling in CUDA and Python (Jupyter notebook). Use of device properties to choose the optimum block size, CUDA API for maximising occupancy, ptxas-options. Use of shared GPU memory using tiling algorithm in matrix multiplication. Use of Cupy.
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: