ML Performance Reading Group Session 2: Flash Attention
Автор: EleutherAI
Загружено: 2024-12-14
Просмотров: 1043
ML Performance Reading Group Session 2 recording, in which we covered the original Flash Attention paper (https://arxiv.org/pdf/2205.14135), as well an example Triton kernel implementation of it.
Presenters: Ben Schneider, Daniel Vega-Myhre
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: