Непрерывное системное обучение с подсказками для агентов кода – Апарна Дхинакаран, Ариз

Автор: AI Engineer

Загружено: 2025-12-23

Просмотров: 2

Описание:

Ваш программист пишет код, но не так, как ваша команда. RL (обучение с подкреплением) улучшило базовые модели, но оно непрозрачно и сложно масштабируется в масштабах предприятий. Большинство агентов по-прежнему полагаются на ненадежные, отредактированные вручную системные подсказки или руководства по стилю (например, agent.md) — что если бы ваш агент учился на ваших отзывах и обновлял их автоматически? В этом докладе я покажу цикл обучения на основе системных подсказок — методы RL, применяемые к подсказкам, а не к весам модели, — который постоянно настраивает agents.md, так что агент учится на ваших запросах на слияние, отзывах и оценках. Вы уйдете с конкретным рецептом для захвата сигналов во время выполнения и автоматической настройки системных подсказок — применимым к любому типу агентов, которые вы создаете.

Докладчики:
Апарна Дхинакаран | Соучредитель и директор по продуктам, Arize
https://x.com/aparnadhinak
/ aparnadhinakaran

Непрерывное системное обучение с подсказками для агентов кода – Апарна Дхинакаран, Ариз

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Проактивные агенты – Кэт Коревец, Google Labs

Проактивные агенты – Кэт Коревец, Google Labs

Трудные уроки создания эффективных программ для ИИ-агентов – Ник Паш, Клайн

Трудные уроки создания эффективных программ для ИИ-агентов – Ник Паш, Клайн

Состояние качества кода в сфере ИИ: шумиха против реальности — Итамар Фридман, Qodo

Состояние качества кода в сфере ИИ: шумиха против реальности — Итамар Фридман, Qodo

Строительство в эпоху Близнецов – Кэт Кампф и Аммаар Реши, Google DeepMind

Строительство в эпоху Близнецов – Кэт Кампф и Аммаар Реши, Google DeepMind

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Как Cursor переворачивает разработку и может погубить Github

Как Cursor переворачивает разработку и может погубить Github

Новое обновление Gemini + NotebookLM — это просто БЕЗУМИЕ!

Новое обновление Gemini + NotebookLM — это просто БЕЗУМИЕ!

Модель мира кода: построение моделей мира для вычислений – Джейкоб Кан, FAIR Meta

Модель мира кода: построение моделей мира для вычислений – Джейкоб Кан, FAIR Meta

Чему мы научились, внедряя ИИ в инженерном отделе Bloomberg — Лэй Чжан, Bloomberg

Чему мы научились, внедряя ИИ в инженерном отделе Bloomberg — Лэй Чжан, Bloomberg

Что есть для защиты сосудов от старения, атеросклероза и давления. Три простых продукта

Что есть для защиты сосудов от старения, атеросклероза и давления. Три простых продукта

Оценка навыков программирования: от фрагментов кода до кодовых баз – Наман Джайн, Cursor

Оценка навыков программирования: от фрагментов кода до кодовых баз – Наман Джайн, Cursor

Почему Азовское море — самое опасное в мире

Почему Азовское море — самое опасное в мире

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

Можно ли доказать окупаемость инвестиций в ИИ в разработке программного обеспечения? (Исследовани...

Можно ли доказать окупаемость инвестиций в ИИ в разработке программного обеспечения? (Исследовани...

От Arc до Dia: уроки, извлеченные из создания браузеров с искусственным интеллектом – Самир Моди,...

От Arc до Dia: уроки, извлеченные из создания браузеров с искусственным интеллектом – Самир Моди,...

Google Just Killed All Competitors + Disney Gave Mickey Mouse to AI (10 Updates)

Google Just Killed All Competitors + Disney Gave Mickey Mouse to AI (10 Updates)

Конференция NeurIPS 2025 в Сан-Диего: объяснение иллюзии мышления.

Конференция NeurIPS 2025 в Сан-Диего: объяснение иллюзии мышления.

В этом строе всё звучит вкусно и тяжело [гайд на Drop D]

В этом строе всё звучит вкусно и тяжело [гайд на Drop D]

Генерация ядра ИИ: что работает, что нет, что дальше – Натали Серрино, Gimlet Labs

Генерация ядра ИИ: что работает, что нет, что дальше – Натали Серрино, Gimlet Labs

Платить инженерам как продавцам – Арман Хезархани, Tenex

Платить инженерам как продавцам – Арман Хезархани, Tenex