Olmo 3: Определение пути развития модели для развития ИИ с открытым исходным кодом

Автор: AI Papers Podcast Daily

Загружено: 2025-11-20

Просмотров: 123

Описание:

Институт искусственного интеллекта Аллена (AI2) выпустил *Olmo 3* — семейство современных полностью открытых языковых моделей, доступных с 7 и 32 миллиардами параметров, включая модель *Olmo 3-Think 32B**, признанную лучшей полностью открытой моделью мышления в своем классе. Главной целью этого релиза является прозрачность и расширение возможностей, достигаемые путем предоставления общего доступа ко всему **потоку модели* — полному жизненному циклу разработки, охватывающему весь код, инфраструктуру обучения, контрольные точки и базовые данные. Эта полная открытость позволяет осуществлять индивидуальную разработку, исследования и вмешательство на любом этапе процесса, выходя за рамки типичных открытых версий, которые предоставляют только окончательные веса моделей. Семейство Olmo 3 включает четыре основных пути: Olmo 3-Base (базовая модель), Olmo 3-Think (для сложных рассуждений), Olmo 3-Instruct (для чата и использования инструментов) и Olmo 3-RL Zero (для экспериментов с обучением с подкреплением). Кроме того, модели интегрируются с *OlmoTrace* — функцией, которая позволяет пользователям отслеживать результаты работы модели и этапы рассуждений вплоть до конкретных данных обучения, предоставляя ценную информацию о поведении модели и решая такие проблемы, как галлюцинации. Делая все компоненты, включая новые наборы данных, такие как Dolma 3 (для предварительного обучения) и Dolci (для постобучения), полностью общедоступными по разрешительным лицензиям, AI2 стремится развивать ИИ в научных целях, снижая стоимость и барьеры для входа исследовательского сообщества.

https://allenai.org/blog/olmo3
https://huggingface.co/collections/al...
• Olmo 3 | A family of leading fully open LM...

Olmo 3: Определение пути развития модели для развития ИИ с открытым исходным кодом

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Olmo 3 | Семейство ведущих полностью открытых LM-моделей и полный поток моделей

Olmo 3 | Семейство ведущих полностью открытых LM-моделей и полный поток моделей

Reinforcement Learning, RLHF, & DPO Explained

Reinforcement Learning, RLHF, & DPO Explained

Современные подсказки для агентов ИИ

Современные подсказки для агентов ИИ

Покойся с миром, Deepseek. У нас есть новая модель ИИ №1 с открытым исходным кодом.

Покойся с миром, Deepseek. У нас есть новая модель ИИ №1 с открытым исходным кодом.

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Создание Olmo 3: полностью открытая модель большого языка

Создание Olmo 3: полностью открытая модель большого языка

QWEN-3: EASIEST WAY TO FINE-TUNE WITH REASONING 🙌

QWEN-3: EASIEST WAY TO FINE-TUNE WITH REASONING 🙌

Тренды в ИИ 2026. К чему готовиться каждому.

Тренды в ИИ 2026. К чему готовиться каждому.

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Может ли у ИИ появиться сознание? — Семихатов, Анохин

Может ли у ИИ появиться сознание? — Семихатов, Анохин

Как подходить к постобучению в приложениях искусственного интеллекта

Как подходить к постобучению в приложениях искусственного интеллекта

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Уоррен Баффетт: если бы мне было 50–60 лет, я бы сделал именно это в 2026 году

Уоррен Баффетт: если бы мне было 50–60 лет, я бы сделал именно это в 2026 году

Обучение с подкреплением для агентов — Уилл Браун, исследователь машинного обучения в Morgan Stanley

Обучение с подкреплением для агентов — Уилл Браун, исследователь машинного обучения в Morgan Stanley

Sakana.ai: Extending the Context of Pretrained LLMs by Dropping Their Positional Embeddings

Sakana.ai: Extending the Context of Pretrained LLMs by Dropping Their Positional Embeddings

Битва OpenAI и Google, письмо против Маска, зачем “отравляют” ИИ

Битва OpenAI и Google, письмо против Маска, зачем “отравляют” ИИ

Introduction to LLM Post Training by Maxime Labonne, PhD

Introduction to LLM Post Training by Maxime Labonne, PhD

Falcon-H1-Tiny: A series of extremely small, yet powerful LMs redefining capabilities at small scale

Falcon-H1-Tiny: A series of extremely small, yet powerful LMs redefining capabilities at small scale

Diffusion Language Models: The Next Big Shift in GenAI

Diffusion Language Models: The Next Big Shift in GenAI