DEER - Geração com Difusão, Verificação com Modelos Autorregressivos
Автор: IA Papers
Загружено: 2025-12-18
Просмотров: 10
Título: Draft with Diffusion, Verify with Autoregressive Models
Resumo: Este documento sintetiza os principais conceitos do framework DEER (Draft with Diffusion, Verify with Autoregressive Models), uma nova abordagem para acelerar a inferência de Grandes Modelos de Linguagem (LLMs). O DEER aborda a latência inerente à decodificação autorregressiva (AR), um gargalo crítico de eficiência em sistemas de IA. Diferentemente dos métodos existentes de decodificação especulativa que utilizam modelos AR auxiliares (drafters), o DEER emprega um LLM de difusão em espaço discreto (dLLM) para gerar rascunhos de texto.
A principal inovação do DEER é a superação do "acúmulo de incerteza passo a passo", um problema fundamental em drafters AR onde erros iniciais se propagam e degradam a qualidade de sequências longas. Ao gerar blocos inteiros de tokens em uma única etapa paralela, o DEER elimina essa dependência sequencial. Para viabilizar isso, o framework introduz um pipeline de alinhamento em dois estágios (Diffusion-to-AR) que adapta dLLMs pré-treinados para gerar continuações de texto condicionadas a um prefixo, alinhando seu comportamento ao do modelo AR alvo.
Link do Paper: https://huggingface.co/papers/2512.15176
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: