Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

COMPUTER RL: Scaling End-to-End Online Reinforcement Learning for Computer Usage Agents

Автор: Aleksandr Kovyazin

Загружено: 2025-08-22

Просмотров: 16

Описание:

COMPUTER RL: Масштабирование сквозного онлайн-обучения с подкреплением для агентов, использующих компьютер

В этой статье представлена COMPUTER RL, платформа для автономных агентов, работающих на компьютере, которые взаимодействуют с ним посредством API-вызовов и GUI-взаимодействий. Платформа решает проблему несоответствия между ориентированной на человека средой рабочего стола и машинными агентами. Разработана распределенная инфраструктура RL для поддержки масштабируемого и надежного обучения с использованием тысяч параллельных виртуальных сред рабочего стола. Авторы предлагают Entropulse, стратегию обучения, которая чередует обучение с подкреплением и контролируемую точную настройку, чтобы смягчить коллапс энтропии. Эксперименты на эталонном тесте OSWorld показывают, что COMPUTER RL достигает самой современной точности, используя модели, такие как GLM-4-9B-0414 и Qwen2.5-14B. Система достигает значительного прироста производительности по сравнению с существующими методами. Работа вносит вклад в новую парадигму взаимодействия API-GUI и масштабируемую инфраструктуру RL. Оценка на OSWorld показывает существенные улучшения в задачах использования компьютера.
#ОбучениеСПодкреплением #КомпьютерныеАгенты #Автоматизация #ИИ #АвтоматизацияРабочегоСтола #МасштабируемыйRL #Entropulse

документ - http://arxiv.org/abs/2508.14040v1
подписаться - https://t.me/arxivpaperu
отправить донаты:
USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7
BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr
ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7
SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e
создано с помощью NotebookLM

COMPUTER RL: Scaling End-to-End Online Reinforcement Learning for Computer Usage Agents

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

array(0) { }

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]