Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Challenges in Reward Design for Reinforcement Learning-based Traffic Signal Control

Автор: Eclipse Foundation

Загружено: 2023-05-29

Просмотров: 1499

Описание:

Deep Reinforcement Learning (DRL) is a promising data-driven approach for traffic signal control, especially because DRL can learn to adapt to varying traffic demands. For that, DRL agents maximize a scalar reward by interacting with an environment. However, one needs to formulate a suitable reward, aligning agent behavior and user objectives, which is an open research problem. We investigate this problem in the context of traffic signal control with the objective of minimizing CO2 emissions at intersections. Because CO2 emissions can be affected by multiple factors outside the agent’s control, it is unclear if an emission-based metric works well as a reward, or if a proxy reward is needed. To obtain a suitable reward, we evaluate various rewards and combinations of rewards. For each reward, we train a Deep Q-Network (DQN) on homogeneous and heterogeneous traffic scenarios. We use the SUMO (Simulation of Urban MObility) simulator and its default emission model to monitor the agent’s performance on the specified rewards and CO2 emission. Our experiments show that a CO2 emission-based reward is inefficient for training a DQN, the agent’s performance is sensitive to variations in the parameters of combined rewards, and some reward formulations do not work equally well in different scenarios. Based on these results, we identify desirable reward properties that have implications to reward design for reinforcement learning-based traffic signal control.

--

Title: Challenges in Reward Design for Reinforcement Learning-based Traffic Signal Control: An Investigation using a CO2 Emission Objective

Presenters: Christian Medeiros Adriano and Max Schumacher

Authors: Max Schumacher, Christian Medeiros Adriano and Holger Giese

Challenges in Reward Design for Reinforcement Learning-based Traffic Signal Control

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Sensor-based Flow Optimization on connected real-world intersections via a SUMO Feature Gap Analysis

Sensor-based Flow Optimization on connected real-world intersections via a SUMO Feature Gap Analysis

Как работают сигналы дорожного движения?

Как работают сигналы дорожного движения?

Обучение с подкреплением с нуля

Обучение с подкреплением с нуля

Tutorial – SUMO User Conference 2023

Tutorial – SUMO User Conference 2023

ESP32: распознавание речи нейросетью (TensorFlow Lite)

ESP32: распознавание речи нейросетью (TensorFlow Lite)

Reinforcement Learning

Reinforcement Learning

Overcoming the Practical Challenges when using Reinforcement Learning

Overcoming the Practical Challenges when using Reinforcement Learning

Reinforcement Learning 101

Reinforcement Learning 101

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Reinforcement Learning Series: Overview of Methods

Reinforcement Learning Series: Overview of Methods

Зачем добавлять этот диод параллельно обмотке реле? Вот для чего он нужен!

Зачем добавлять этот диод параллельно обмотке реле? Вот для чего он нужен!

99% работы в области машиностроения сводится к 5 идеям.

99% работы в области машиностроения сводится к 5 идеям.

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Deep reinforcement learning - Traffic Light Control System

Deep reinforcement learning - Traffic Light Control System

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

Reinforcement Learning based Traffic Signal Control Validated in Real-Time Real World Traffic

Reinforcement Learning based Traffic Signal Control Validated in Real-Time Real World Traffic

Deep Reinforcement Learning Tutorial for Python in 20 Minutes

Deep Reinforcement Learning Tutorial for Python in 20 Minutes

Can AI Fix Traffic?

Can AI Fix Traffic?

Reinforcement Learning Crash Course

Reinforcement Learning Crash Course

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]