Принципы моделей диффузии — запуск нового курса
Автор: Vizuara
Загружено: 2025-11-11
Просмотров: 5373
Два года назад мы внезапно обнаружили, что качество изображений, создаваемых с помощью ИИ, резко возросло. Мы смогли получать практически реалистичные изображения, созданные с помощью инструментов ИИ, за очень короткое время.
Все мы принимаем это как должное, но мало кто из нас действительно понимает, как стало возможным такое внезапное улучшение качества изображений.
Я помню, что первым инструментом, который я начал использовать для создания изображений, был Midjourney, и он создавал прекрасные изображения. Именно тогда я по-настоящему осознал мощь и возможности генеративного ИИ.
Однако был ещё один инструмент, который набирал популярность. Он назывался Stable Diffusion. Это был ведущий продукт Stability AI. Преимуществом Stable Diffusion было то, что он имел открытый исходный код, что делало высококачественную генерацию текста в изображения доступной каждому, что привело к буму в искусстве ИИ.
Используя эти инструменты, я всегда задавался вопросом, откуда взялось слово «Diffusion» в названии «Stable Diffusion»?
Я узнал о диффузии только на уроках физики, где мне рассказывали, что частицы диффундируют при наличии градиента концентрации. Это никак не было связано с методами ИИ.
Когда я начал изучать происхождение слов «диффузия» и «стабильная диффузия», я наткнулся на прекрасную исследовательскую арку. Оказалось, что мой опыт работы с Midjourney был настолько впечатляющим благодаря 10 годам целенаправленных исследований, где каждая работа основывалась на предыдущей.
Я также увидел, что в этой области математика, физика и ИИ прекрасно пересекаются, и диффузия в смысле «физики», которую я изучал в колледже, фактически является той же техникой, которая используется для создания изображений. Это действительно привлекло мое внимание, и мне захотелось полностью понять основы моделей диффузии с нуля.
Первое, что привлекло мое внимание, – это богатое пересечение различных областей. Второе – это применение моделей диффузии.
Существует множество приложений моделей диффузии: от создания изображений и синтеза белковых структур до моделей диффузии в видео, политик робототехники и моделей диффузии для создания музыки и речи. Диффузионные модели больших языков также становятся серьёзной альтернативой авторегрессионным программам LLM (большинству современных LLM), которые генерируют токены один за другим. Эти модели работают очень быстро, например, программы Mercury LLM.
Я очень рад начать новый цикл лекций под названием «Принципы диффузионных моделей». Главная цель этого цикла — с нуля разобраться в фундаментальных концепциях диффузионных моделей, уделяя при этом равное внимание практическому применению.
Все лекции будут бесплатно размещены на YouTube.
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: