Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Лучшая стратегия «Угадай, кто?» (и как я её доказал)

Автор: Dr Mihai Nica

Загружено: 2025-11-21

Просмотров: 108164

Описание:

История о том, как я доказал оптимальную стратегию «Угадай, кто?» в своей работе 2016 года и чем она отличается от чистого бинарного поиска.

*Ссылки*
https://marimo.app/l/noa32s
Приложение, в котором можно сыграть в «Угадай, кто?» против лучшей стратегии, как на видео.
В раскрывающемся списке графиков также отображается график лучшей ставки и вероятности лучшего выигрыша из миниатюры!

Моя статья на arXiv https://arxiv.org/abs/1509.03327

Видео Марка Робера от 2015 года    • BEST Guess Who Strategy- 96% WIN record us...  

Короткие видео Марка Робера от 2024 года    • How to ALWAYS WIN "Guess Who"  

Видео LearnYouSomeMath по этой теме (там также есть ссылка на мою статью!)    • S1 E6 - Dominating Mark Rober in Guess Who!  

*Обновления*
Скотт Лоу спросил в комментарии, могу ли я рассчитать, насколько оптимальная стратегия лучше чистого бинарного поиска, что я и сделал! Вот результаты (см. также комментарии для дальнейшего обсуждения):

Вот таблица вероятности победы игрока P1 в матче P1 против P2, когда стартовый игрок выбирается случайным образом путём подбрасывания монеты из стартового пула из 31 персонажа. (см. также полное объяснение ниже):

| P2=Binary | P2=BinaryPlus | P2=Optimal
----------------------------------------------------------------------------------
P1=Binary | 50,00% | 39,07% | 28,15%
P1=BinaryPlus | 60,93% | 50,00% | 44,17%
P1=Optimal | 71,85% | 55,83% | 50,00%

Пояснение: Вероятность выигрыша для любых двух заданных стратегий легко рассчитать, двигаясь в обратном порядке, поскольку общее число оставшихся игроков уменьшается как минимум на одного с каждым ходом (т.е. «используйте динамическое программирование»). См. Алгоритм 1 в статье. Я применил его к предложенным вами матчапам, но оказалось, что чистый двоичный поиск действительно ужасен, когда проигрывает, поскольку его шансы на победу, как правило, равны 0%. Поэтому я также добавил стратегию «BinaryPlus», которая представляет собой двоичный поиск, если у противника не осталось 2 игрока и он выиграет на следующем ходу. В этом случае BinaryPlus делает случайное предположение. (Как тот, кто угадал 9 в видео).

Вы также можете увидеть разбивку по тому, чей это начальный ход, где действительно видно, что преимущество возникает, когда вы ходите вторым. По сути, стратегия «Оптимал» работает лучше, когда проигрывает, и именно в этом её преимущество.

+----------------+------------------------+--------------+-------------+------------------+
| Стратегия P1 | Стратегия P2 | P1 1-й % | P1 2-й % | P1 Coin % |
+----------------+------------------------+--------------+-------------+------------------+
| Бинарный | Бинарный | 96,88% | 3,12% | 50,00% |
| Бинарный | BinaryPlus | 75,03% | 3,12% | 39,07% |
| Бинарный | Оптимальный | 53,17% | 3,12% | 28,15% |
| BinaryPlus | Бинарный | 96,88% | 24,97% | 60,93% |
| BinaryPlus | BinaryPlus | 75,03% | 24,97% | 50,00% |
| BinaryPlus | Оптимальный | 63,37% | 24,97% | 44,17% |
| Оптимальный | Бинарный | 96,88% | 46,83% | 71,85% |
| Оптимальный | BinaryPlus | 75,03% | 36,63% | 55,83% |
| Оптимальный | Оптимальный | 66,29% | 33,71% | 50,00% |
+---------------------+-------------------+--------------+--------------+---------------+

Я всё это запустил в этом colab-файле https://colab.research.google.com/dri... .

Лучшая стратегия «Угадай, кто?» (и как я её доказал)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

This graph will change how you see the world

This graph will change how you see the world

How to lie using visual proofs

How to lie using visual proofs

How does DeepSeek learn? GRPO explained with Triangle Creatures

How does DeepSeek learn? GRPO explained with Triangle Creatures

The fastest sorting algorithm

The fastest sorting algorithm

The fewest items of clothes to never repeat an outfit.

The fewest items of clothes to never repeat an outfit.

How Schrödinger Derived It

How Schrödinger Derived It

The Strange Math That Predicts (Almost) Anything

The Strange Math That Predicts (Almost) Anything

Гипотеза Римана, объяснение

Гипотеза Римана, объяснение

Простая проблема, в которой математики ошиблись

Простая проблема, в которой математики ошиблись

Mystery of the Quintic

Mystery of the Quintic

The Birthday Problem & Other Paradoxes: A Step-by-Step Guide #SoME4

The Birthday Problem & Other Paradoxes: A Step-by-Step Guide #SoME4

Пишем физический движок с нуля!

Пишем физический движок с нуля!

How many holes does this mug have?

How many holes does this mug have?

The Invention That Saved Science

The Invention That Saved Science

The Problem With IQ Tests

The Problem With IQ Tests

Emergent Complexity

Emergent Complexity

A tale of two problem solvers | Average cube shadow area

A tale of two problem solvers | Average cube shadow area

The 15-Year-Old Who Discovered the Law of Primes

The 15-Year-Old Who Discovered the Law of Primes

"A Random Variable is NOT Random and NOT a Variable"

The Simple Math Problem Nobody Could Solve

The Simple Math Problem Nobody Could Solve

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]