Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion | Boyuan Chen

Автор: Valence Labs

Загружено: 2024-08-01

Просмотров: 2138

Описание:

Portal is the home of the AI for drug discovery community. Join for more details on this talk and to connect with the speakers: https://portal.valencelabs.com/logg

This paper presents Diffusion Forcing, a new training paradigm where a diffusion model is trained to denoise a set of tokens with independent per-token noise levels. We apply Diffusion Forcing to sequence generative modeling by training a causal next-token prediction model to generate one or several future tokens without fully diffusing past ones. Our approach is shown to combine the strengths of next-token prediction models, such as variable-length generation, with the strengths of full-sequence diffusion models, such as the ability to guide sampling to desirable trajectories. Our method offers a range of additional capabilities, such as (1) rolling-out sequences of continuous tokens, such as video, with lengths past the training horizon, where baselines diverge and (2) new sampling and guiding schemes that uniquely profit from Diffusion Forcing's variable-horizon and causal architecture, and which lead to marked performance gains in decision-making and planning tasks. In addition to its empirical success, our method is proven to optimize a variational lower bound on the likelihoods of all subsequences of tokens drawn from the true joint distribution. Project website: https://boyuan.space/diffusion-forcing

Paper link: https://arxiv.org/abs/2407.01392

Speakers: Boyuan Chen

Twitter Hannes:   / hannesstaerk  
Twitter Dominique:   / dom_beaini  

~

Chapters
00:00 - Intro + Background
25:30 - Diffusion Forcing
42:30 - DF with Causal Uncertainty
55:42 - Q+A

Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion | Boyuan Chen

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

G-Retriever: Retrieval-Augmented Generation for Textual Graph Understanding | Xiaoxin He

G-Retriever: Retrieval-Augmented Generation for Textual Graph Understanding | Xiaoxin He

A Unified Lottery Ticket Hypothesis for Graph Neural Networks | Tianlong Chen

A Unified Lottery Ticket Hypothesis for Graph Neural Networks | Tianlong Chen

[V-JEPA] Beyond Pixels: V-JEPA 2 and the Shift to Action-Conditioned Video Prediction.

[V-JEPA] Beyond Pixels: V-JEPA 2 and the Shift to Action-Conditioned Video Prediction.

Official Talk Video of Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion

Official Talk Video of Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion

Модели диффузии с нуля | Объяснение генеративных моделей на основе оценок | Математическое объясн...

Модели диффузии с нуля | Объяснение генеративных моделей на основе оценок | Математическое объясн...

Почему RAG терпит неудачу — как CLaRa устраняет свой главный недостаток

Почему RAG терпит неудачу — как CLaRa устраняет свой главный недостаток

Я в опасности

Я в опасности

Цепи Маркова — математика предсказаний [Veritasium]

Цепи Маркова — математика предсказаний [Veritasium]

Как обучить нейросеть, на которой работает Sora. Практический гайд по Diffusion Transformer

Как обучить нейросеть, на которой работает Sora. Практический гайд по Diffusion Transformer

Flow Matching | Explanation + PyTorch Implementation

Flow Matching | Explanation + PyTorch Implementation

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

What is the right

What is the right "token" for next-token visual prediction?

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Важные открытия XXI века: почему рак победил и что не так с клонированием? Что скрывают нобелевки?

Важные открытия XXI века: почему рак победил и что не так с клонированием? Что скрывают нобелевки?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

О выразительной силе языков программирования Шрирама Кришнамурти [PWLConf 2019]

О выразительной силе языков программирования Шрирама Кришнамурти [PWLConf 2019]

Scalable Diffusion Models with Transformers | DiT Explanation and Implementation

Scalable Diffusion Models with Transformers | DiT Explanation and Implementation

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

ИНТЕРНЕТ 2026: Смерть VPN, Белые списки и режим Интранета. Системный анализ конца сети

ИНТЕРНЕТ 2026: Смерть VPN, Белые списки и режим Интранета. Системный анализ конца сети

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com