Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Liming Wang, Can Diffusion Model Disentangle? A Theoretical Perspective

Автор: MIT Embodied Intelligence

Загружено: 2025-03-19

Просмотров: 400

Описание:

Title: Can Diffusion Model Disentangle? A Theoretical Perspective

Abstract:
This talk presents a novel theoretical framework for understanding how diffusion models can learn disentangled representations. Within this framework, we establish identifiability conditions for general disentangled latent variable models, analyze training dynamics, and derive sample complexity bounds for disentangled latent subspace models. To validate our theory, we conduct disentanglement experiments across diverse tasks and modalities, including subspace recovery in latent subspace Gaussian mixture models, image colorization, image denoising, and voice conversion for speech classification. Additionally, our experiments show that training strategies inspired by our theory, such as style guidance regularization, consistently enhance disentanglement performance.

Biography:
Liming Wang is a postdoctoral associate in the Spoken Language Systems Group at the MIT Computer Science and Artificial Intelligence Laboratory (CSAIL). His research interests broadly encompass the practical and theoretical aspects of self-supervised speech processing and multimodal learning, with the goal of improving accessibility and inclusivity of speech and language technology.

Liming Wang, Can Diffusion Model Disentangle? A Theoretical Perspective

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Diffusion Models (DDPM & DDIM) - Easily explained!

Diffusion Models (DDPM & DDIM) - Easily explained!

Akarsh Kumar - Automating the Search for Artificial Life with Foundation Models

Akarsh Kumar - Automating the Search for Artificial Life with Foundation Models

Как создать свой звук в FALCON 2026. Стрим в Bitwig Studio 6.6 @TuriaArt 01.12.2025

Как создать свой звук в FALCON 2026. Стрим в Bitwig Studio 6.6 @TuriaArt 01.12.2025

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Simple explanation of disentanglement ft. cute doggos & state-of-the-art work

Simple explanation of disentanglement ft. cute doggos & state-of-the-art work

Miika Aittala: Elucidating the Design Space of Diffusion-Based Generative Models

Miika Aittala: Elucidating the Design Space of Diffusion-Based Generative Models

MIT 6.S184: Flow Matching and Diffusion Models - Lecture 01 - Generative AI with SDEs

MIT 6.S184: Flow Matching and Diffusion Models - Lecture 01 - Generative AI with SDEs

Теорема Байеса, геометрия изменения убеждений

Теорема Байеса, геометрия изменения убеждений

How I Understand Flow Matching

How I Understand Flow Matching

EI Seminar - Jason Ma - Recent Progress on Foundation Model Supervision for Robot Learning

EI Seminar - Jason Ma - Recent Progress on Foundation Model Supervision for Robot Learning

Почему простые числа образуют эти спирали? | Теорема Дирихле и пи-аппроксимации

Почему простые числа образуют эти спирали? | Теорема Дирихле и пи-аппроксимации

EI Seminar - Danny Driess  - Have Large Models Changed Robotics?

EI Seminar - Danny Driess - Have Large Models Changed Robotics?

Сопоставление потоков для генеративного моделирования (с пояснениями в статье)

Сопоставление потоков для генеративного моделирования (с пояснениями в статье)

Визуализация скрытого пространства: PCA, t-SNE, UMAP | Глубокое обучение с анимацией

Визуализация скрытого пространства: PCA, t-SNE, UMAP | Глубокое обучение с анимацией

Felix Yanwei Wang - Inference-Time Policy Customization Through Interactive Task Specification

Felix Yanwei Wang - Inference-Time Policy Customization Through Interactive Task Specification

Yann LeCun - Self-Supervised Learning: The Dark Matter of Intelligence (FAIR Blog Post Explained)

Yann LeCun - Self-Supervised Learning: The Dark Matter of Intelligence (FAIR Blog Post Explained)

2025 MIT Integration Bee - Finals

2025 MIT Integration Bee - Finals

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

EI Seminar - Tim Dettmers - The Promises and Pitfalls of Open-source Agent Systems

EI Seminar - Tim Dettmers - The Promises and Pitfalls of Open-source Agent Systems

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]