Нужно ли нам внимание? — Линейные рекуррентные нейронные сети и модели пространства состояний (SS...
Автор: Sasha Rush
Загружено: 2023-07-05
Просмотров: 33792
(Более поздняя версия для Mamba: • Do we need Attention? A Mamba Primer )
Доклад для MLSys, посвящённый обзору современных методов, использующих линейные рекуррентные нейронные сети (RNN) и модели пространства состояний для замены внимания в моделях типа «трансформер».
Слайды: https://github.com/srush/do-we-need-a...
Этот доклад предшествовал работе над Mamba, но охватывает основные предварительные вопросы. Версия для Mamba появится скоро.
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: