Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Multi-Agent Reinforcement Learning Chapter 6: Value Iteration for Zero-Sum Games

Автор: Jason Eckstein

Загружено: 2025-12-23

Просмотров: 116

Описание:

Live recording of online meeting reviewing material from "Multi-Agent Reinforcement Learning: Foundations and Modern Approaches" by Stefano V. Albrecht, Filippos Christianos, Lukas Schäfer. In this meeting we introduce the first algorithm to find equilibrium solutions in stochastic games. Value iteration uses dynamic programming to iteratively compute an exact solution to stochastic games which have a known equilibrium solution. For zero-sum games, we can use a linear program to solve for a minimax solution in each game state. The algorithm also uses a Bellman style update to compute game reward values for the joint-actions in each state. The combination of the state value function and the game rewards converge to their true values resulting in a solvable non-repeated normal form game for each state.

A simple two-player soccer game is introduced to study minimax algorithms. We first introduce the environment and observe its behavior with random policies. Then value iteration is used to find the unique minimax solution for every state and these policies are used against each other. Finally, we study the performance on the minimax algorithm against a random policy.

I'm using the following repository to store notes and interactive tools for multi-agent reinforcement learning: https://github.com/jekyllstein/MARL_c...

My previous material on reinforcement learning contains complete notes on the Sutton and Barto RL book: https://jekyllstein.github.io/Reinfor...

The textbook website contains materials provided by the authors including a pdf of the text, slides, and a github repository with code.

MARL textbook website: https://www.marl-book.com/
MARL kickoff slides: https://docs.google.com/presentation/...

This online meeting is hosted through https://www.meetup.com/boulderdatasci... and https://www.meetup.com/silicon-valley...

For background material covering traditional reinforcement learning see the following playlist:    • Reinforcement Learning Tutorial Meetings  

Previous meetings have covered the textbook "Reinforcement Learning: An Introduction" by Richard S. Sutton and Andrew G. Barto and the following links relate to that material and my notes/code based on it.

Sutton and Barto Textbook: http://incompleteideas.net/book/the-b...
HTML Notes: https://jekyllstein.github.io/Reinfor...
GitHub Repository: https://github.com/jekyllstein/Reinfo...

Notes and interactive tools seen in those video use the Julia Language (https://julialang.org/) and the package Pluto.jl (https://plutojl.org/).

#reinforcementlearning #education #multiplayergames

Multi-Agent Reinforcement Learning Chapter 6: Value Iteration for Zero-Sum Games

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Как происходит модернизация остаточных соединений [mHC]

Как происходит модернизация остаточных соединений [mHC]

Multi-Agent Reinforcement Learning Chapter 6: Joint-Action Learning with Game Theory

Multi-Agent Reinforcement Learning Chapter 6: Joint-Action Learning with Game Theory

ИИ-роботы и Технологии Будущего на Выставке в США 2026

ИИ-роботы и Технологии Будущего на Выставке в США 2026

Conversation with Elon Musk | World Economic Forum Annual Meeting 2026

Conversation with Elon Musk | World Economic Forum Annual Meeting 2026

Claude за 20 минут: Полный курс для новичков

Claude за 20 минут: Полный курс для новичков

Reinforcement Learning Tutorial Meetings

Reinforcement Learning Tutorial Meetings

Sutton and Barto Reinforcement Learning Chapter 4: Dynamic Programming, Value Iteration and Examples

Sutton and Barto Reinforcement Learning Chapter 4: Dynamic Programming, Value Iteration and Examples

Conversation with Alex Karp, CEO and Co-Founder, Palantir Technologies | WEF Annual Meeting 2026

Conversation with Alex Karp, CEO and Co-Founder, Palantir Technologies | WEF Annual Meeting 2026

Multi-Agent  Learning Kickoff Meeting

Multi-Agent Learning Kickoff Meeting

$1 vs $1,000,000,000 Футуристических Технологий!

$1 vs $1,000,000,000 Футуристических Технологий!

ChatGPT заберет долю, ИИ не крадёт работу, ИИ в тюрьмах

ChatGPT заберет долю, ИИ не крадёт работу, ИИ в тюрьмах

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Визуализация гравитации

Визуализация гравитации

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

Орешник это модернизированный Рубеж? И как украинцы узнали об ударе 9 января заранее?

Орешник это модернизированный Рубеж? И как украинцы узнали об ударе 9 января заранее?

ЛЕКЦИЯ ПРО НАДЁЖНЫЕ ШИФРЫ НА КОНФЕРЕНЦИИ БАЗОВЫХ ШКОЛ РАН В ТРОИЦКЕ

ЛЕКЦИЯ ПРО НАДЁЖНЫЕ ШИФРЫ НА КОНФЕРЕНЦИИ БАЗОВЫХ ШКОЛ РАН В ТРОИЦКЕ

Миллей в Давосе: «Запад умирает от социализма!»

Миллей в Давосе: «Запад умирает от социализма!»

Multi-Agent Reinforcement Learning Chapter 5: Reinforcement Learning in Games

Multi-Agent Reinforcement Learning Chapter 5: Reinforcement Learning in Games

Multi-Agent Reinforcement Learning Chapter 4: Nash Equilibrium and Welfare/Fairness Criteria

Multi-Agent Reinforcement Learning Chapter 4: Nash Equilibrium and Welfare/Fairness Criteria

Solving a Rubik's Cube with Reinforcement Learning Part 1

Solving a Rubik's Cube with Reinforcement Learning Part 1

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com