Непрерывное системное обучение с подсказками для агентов кода – Апарна Дхинакаран, Ариз
Автор: AI Engineer
Загружено: 2025-12-23
Просмотров: 2
Ваш программист пишет код, но не так, как ваша команда. RL (обучение с подкреплением) улучшило базовые модели, но оно непрозрачно и сложно масштабируется в масштабах предприятий. Большинство агентов по-прежнему полагаются на ненадежные, отредактированные вручную системные подсказки или руководства по стилю (например, agent.md) — что если бы ваш агент учился на ваших отзывах и обновлял их автоматически? В этом докладе я покажу цикл обучения на основе системных подсказок — методы RL, применяемые к подсказкам, а не к весам модели, — который постоянно настраивает agents.md, так что агент учится на ваших запросах на слияние, отзывах и оценках. Вы уйдете с конкретным рецептом для захвата сигналов во время выполнения и автоматической настройки системных подсказок — применимым к любому типу агентов, которые вы создаете.
Докладчики:
Апарна Дхинакаран | Соучредитель и директор по продуктам, Arize
https://x.com/aparnadhinak
/ aparnadhinakaran
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: