Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Why decentralized, open-source training will win — Justus Mattern, Prime Intellect

Автор: DEMi network

Загружено: 2025-09-11

Просмотров: 487

Описание:

Prime Intellect created the first reasoning model, INTELLECT 2, with decentralized RL training run using idle GPUs contributed by their community. 75% of training compute was inference time.

They’re building more conviction on open-source, decentralized RL as a path to AGI:

1. With RL, LLMs iteratively generates its own training data. Since inference is parallelizable; each GPU can host a model replica and sample independently.
2. The bottleneck in RL is the availability of RL environments — reward functions and tool access during inference rollouts. Specialized environments are necessary to train models for tasks such as writing fast CUDA kernels, analyzing scientific datasets, or searching the web. PI launched an open-source RL environment development, Environments Hub, to address this.

In his talk at DEMi 3 Summit, Justus Mattern, Research Engineer at PrimeIntellect, shows how they're scaling RL to open AGI.

If you’re excited to help shape the future of a sovereign open-source AI ecosystem, contribute to the Environments Hub or join PI’s research team!

Why decentralized, open-source training will win — Justus Mattern, Prime Intellect

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Почему гуманоидные роботы ДОЛЖНЫ быть открытыми. Объясняют два ведущих руководителя в области роб...

Почему гуманоидные роботы ДОЛЖНЫ быть открытыми. Объясняют два ведущих руководителя в области роб...

A chip 10,000x more energy efficient than GPU -- Trevor McCourt, Extropic

A chip 10,000x more energy efficient than GPU -- Trevor McCourt, Extropic

Conversation with Elon Musk | World Economic Forum Annual Meeting 2026

Conversation with Elon Musk | World Economic Forum Annual Meeting 2026

Как и зачем охлаждают атомы — Семихатов, Вишнякова

Как и зачем охлаждают атомы — Семихатов, Вишнякова

What is an RL environment? w/ Nous Research's Roger Jin

What is an RL environment? w/ Nous Research's Roger Jin

Однополярный мир уходит с приходом Трампа | Почему так получается (English subtitles)

Однополярный мир уходит с приходом Трампа | Почему так получается (English subtitles)

it only took 2 characters

it only took 2 characters

Where Crypto Meets AI with Chris Dixon & David George

Where Crypto Meets AI with Chris Dixon & David George

Moving beyond transformers to scale in-context learning — Jacob Buckman, Manifest AI

Moving beyond transformers to scale in-context learning — Jacob Buckman, Manifest AI

Будущее Без РАБОТЫ и ДЕНЕГ | Либерманы

Будущее Без РАБОТЫ и ДЕНЕГ | Либерманы

Планируйте, определяйте спецификации и внедряйте с помощью Spec Kit.

Планируйте, определяйте спецификации и внедряйте с помощью Spec Kit.

Доработайте свою степень магистра права за 13 минут. Вот как

Доработайте свою степень магистра права за 13 минут. Вот как

12-факторные агенты: модели надежных приложений LLM — Декс Хорти, HumanLayer

12-факторные агенты: модели надежных приложений LLM — Декс Хорти, HumanLayer

МОРОЗОВ:

МОРОЗОВ: "Появился шанс на перелом". На что пойдет Кремль, снова ОРЕШНИК, что творит Трамп, Кадыров

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Роман Ямпольский: развитие ИИ, риски сверх интеллекта, контроль технологий и др.

Роман Ямпольский: развитие ИИ, риски сверх интеллекта, контроль технологий и др.

Большинство разработчиков не понимают, как работают контекстные окна.

Большинство разработчиков не понимают, как работают контекстные окна.

Экспресс-курс RAG для начинающих

Экспресс-курс RAG для начинающих

Training LLM to play chess using Deepseek GRPO reinforcement learning

Training LLM to play chess using Deepseek GRPO reinforcement learning

Ускоренный курс LangChain для начинающих | Учебное пособие по LangChain

Ускоренный курс LangChain для начинающих | Учебное пособие по LangChain

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com