Новый покерный бот Pluribus побил HLHE 6-max

Пару лет назад мир онлайн-покера был обеспокоен появлением бота Libratus, который смог обыграть лучших хедз-ап игроков и выйти в профит почти на $2,000,000. Теперь же появился повод для гораздо большего беспокойства: ученые из университета Карнеги-Меллона создали нового монстра, который побил 6-max.

Новый искусственный интеллект получил имя «Pluribus», и его испытывали также против сильнейших игроков в мире, но только уже за 6-max столом. Оппонентами бота выступили 15 профессионалов NLH, и ни один из них не смог сыграть в плюс.

15 игроков, согласившихся на игру против бота, являются профессиональными игроками в турнирах и за кэш-столами. На счету каждого из них более $1,000,000 призовых, а у некоторых эта сумма выше $10,000,000. В тесте участвовал и «LLinusLLove», который сегодня является одним из сильнейших игроков в NLH 6-max.

Игроки, выступившие против Pluribus:

  • Линус «LLinusLLove» Лелигер;
  • Крис Фергюсон;
  • Грег Мерсон;
  • Даррен Элиас;
  • Джейсон Лес;
  • Донг Ким;
  • Ник Петранжело;
  • Шон Руане;
  • Джейк Туле;
  • Майкл Гаглиано;
  • Сэт Дэйвис;
  • Тревор Севедж;
  • Джимми Чау;
  • Энтони Грэг;
  • Дэниел МакОлей.

Pluribus против профессионалов

Тесты покерного бота проходили в двух форматах. В первом варианте пять игроков выступали против одного бота, а во втором играли против пяти ИИ. В первых тестах Pluribus показал средний винрейт 5 BB/100 рук. Игроки по другую сторону экрана теряли около 2,3 BB/100 раздач.

Результаты каждого игрока были разными: от –0,5 до -4 BB, но суть остается одна – никто не смог выйти в плюс. Полностью отыграв по первому варианту игры 10,000 раздач, профессионалы ушли в минус на $500,000.

Как машина расправлялась с лучшими игроками, можно посмотреть на видео:

Второй вариант тоже не принес успеха покер-про. Уже на дистанции в 5,000 рук игроки вышли в минус. Pluribus не увидел серьезного оппонента в лице Криса Фергюсона, за плечами которого шесть браслетов WSOP, и Даррена Элиаса, который является рекордсменом по победам на WPT.

Покерный бот за $150

Создатели нового бота взяли за основу принцип Lidratus – когда ИИ обучает сам себя. В программу загружаются базовые данные, и бот, играя с самим собой, самостоятельно обучается и находит оптимальные стратегии. В Pluribus встроили систему, которую математики называют «минимизацией сожалений». Говоря более понятным языком, это процесс при котором ИИ вычисляет разницу между принятым ей решением и оптимальной стратегией и пытается уменьшить это значение. Внедрение такой системы позволило значительно сократить нагрузку на компьютер.

Чтобы создать бота, способного зарабатывать шестизначные суммы в день, потребовалось всего $150 на аренду вычислительного облака. Что касается техники, то Pluribus можно запустить на 28-ядерном процессоре, имея 512 ГБ оперативной памяти. Для запуска такого бота на домашнем современном ПК потребуется лишь небольшая модификация.

При такой мощности бот все равно работает быстрее профессионалов. Во время тестов он показал среднее время принятия решения в 20 секунд. Самое долгое время, которое потребовалось Pluribus – 33 секунды.

Опасное будущее

Пока разработчики не собираются разглашать код Pluribus. Если новый бот попадет в нехорошие руки – он станет большой опасностью для онлайн-покера в целом. Цель создания бездушной машины, которая бьет 6-max, а вместе с тем и лучших игроков планеты – глубокое изучение покера насколько это возможно, и понимание тех принципов игры, которые еще не открыли для себя даже лучшие профи.

Но Pluribus может служить и во благо человечеству. Если произвести правильные настройки, он может быть использован для предотвращение мошеннических действий, например вычисляя себе подобных.

Поделитесь вашим мнением