SparseD: Разреженное внимание к моделям диффузного языка

Автор: AIDAS Lab

Загружено: 2025-12-08

Просмотров: 51

Описание:

Модели диффузионного языка демонстрируют высокую производительность, но их вывод всё ещё медленный из-за дорогостоящего двунаправленного внимания. Чтобы лучше понять это узкое место, анализируются несколько ключевых характеристик внимания в моделях DLM.
Во-первых, паттерны внимания сильно привязаны к голове, что делает фиксированные разреженные паттерны неэффективными. Во-вторых, паттерны внимания остаются очень схожими на всех этапах диффузии, что позволяет эффективно повторно использовать паттерны. В-третьих, ранние этапы диффузии критически важны для качества генерации, поэтому разреженное внимание нельзя применять слишком рано.

Основываясь на этих наблюдениях, представлен SparseD — метод разреженного внимания, специализированный для моделей DLM. SparseD использует изолированный выбор, повторное использование разреженных паттернов и полное внимание на ранних этапах для сокращения задержки без потери точности, достигая ускорения до 1,50 раз при генерации длинного контекста.

Доклад: SparseD: Разреженное внимание для моделей диффузионного языка (Ван и др., arXiv 2025)
Докладчик: Джинхёк Ким

SparseD: Разреженное внимание к моделям диффузного языка

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Mastering Diffusion Week 12: Invited Talk – Foundations of Diffusion Language Models (Subham Sahoo)

Mastering Diffusion Week 12: Invited Talk – Foundations of Diffusion Language Models (Subham Sahoo)

Diffusion Language Models: The Next Big Shift in GenAI

Diffusion Language Models: The Next Big Shift in GenAI

Flow-Matching vs Diffusion Models explained side by side

Flow-Matching vs Diffusion Models explained side by side

Text diffusion: A new paradigm for LLMs

Text diffusion: A new paradigm for LLMs

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

A Window Into LLMs | Sparse Autoencoders Explained

A Window Into LLMs | Sparse Autoencoders Explained

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Акунин ошарашил прогнозом! Финал войны уже решён — Кремль скрывает правду

Акунин ошарашил прогнозом! Финал войны уже решён — Кремль скрывает правду

Удаляем свои фото, выходим из чатов, скрываем фамилию? Как избежать штрафов

Удаляем свои фото, выходим из чатов, скрываем фамилию? Как избежать штрафов

«Сыграй На Пианино — Я Женюсь!» — Смеялся Миллиардер… Пока Еврейка Не Показала Свой Дар

«Сыграй На Пианино — Я Женюсь!» — Смеялся Миллиардер… Пока Еврейка Не Показала Свой Дар

Persona Vectors: Monitoring and Controlling Character Traits in Language Models

Persona Vectors: Monitoring and Controlling Character Traits in Language Models

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Цены рухнули на 30%: риэлторы бегут с рынка, новостройки пустуют

Цены рухнули на 30%: риэлторы бегут с рынка, новостройки пустуют

MoBE: Смесь экспертов по базисам для сжатия линейных моделей на основе MoE.

MoBE: Смесь экспертов по базисам для сжатия линейных моделей на основе MoE.

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Ночные пробуждения в 3–4 часа: как найти причину и вернуть глубокий сон.

Ночные пробуждения в 3–4 часа: как найти причину и вернуть глубокий сон.

SCHOOLBOY VS ДЕВОН ЛАРРАТТ АРМРЕСТЛИНГ 2025

SCHOOLBOY VS ДЕВОН ЛАРРАТТ АРМРЕСТЛИНГ 2025

I Visualised Attention in Transformers

I Visualised Attention in Transformers

⚡️ Операция ФСБ в Киеве || Военные силы РФ в столице

⚡️ Операция ФСБ в Киеве || Военные силы РФ в столице

Почему Азовское море — самое опасное в мире

Почему Азовское море — самое опасное в мире