Libratus на службе армии США

В 2017 году покерный бот Libratus обыграл четырех лучших в мире игроков по безлимитному холдему, на что у него ушло 20 дней. Военные США заинтересовались ботом. По опубликованным данным Wired (американский ежемесячник), тот же прототип, который использован для Либратус, теперь служит в оборонном подразделении армии Соединенных Штатов.

Libratus Creator заступил на военную службу

Вариант, что армия США хочет победить другие государства в безлимитный холдем, маловероятен. Как неоднократно утверждалось создателями искусственного интеллекта, в нем может быть задействовано немало приложений, которые помогут определить наилучшую стратегию в военных задачах.

Libratus появился на свет благодаря усилиям команды ученых университета Carnegie Mellon, под руководством Туомаса Сандхольма и Ноама Брауна. После того, как бота испытали на живых покеристах, Туомас основал стартап-проект Strategy Robot. Это был тот же ИИ, только адаптированный под военные задачи. Одной из них была симуляция в военных шутерах.

Американский журнал опубликовал информацию о том, что Strategy Robot и Пентагон заключили контракт сроком на два года, сумма которого составила $10 млн. Официальных комментариев от оборонного и армейского отделения не последовало, но Туомас в интервью отметил, что программа может быть использована в военных целях, так как имеет возможность тестировать определенное количество стратегий.

Libratus – чемпион NLH

В покерный бот разработчики загрузили лишь основные аспекты техасского холдема – последовательность ходов и комбинации. На основе этих данных Libratus стал самообучаться в игре сам с собой. После того, как программа провела несколько триллионов раздач, бот понял свои ошибки и стал действовать так, чтобы выиграть раздачу. Создатели уверяли, что в базу программы никогда не вносилась статистика живой игры – Libratus проводил обучение исходя из собственного опыта.

Когда бот стал готов играть на более высоком уровне, были приглашены четверо профессиональных игроков по безлимитному холдему: Донг Ким, Джимми Чу, Джейсон Лес и Даниэль Маколи. Ежедневно по 12 часов на протяжении 20 дней покеристы проводили игровые сессии с машиной. Уже с первых дней Libratus стал преобладать, но через несколько дней стал проигрывать человеку. Это было временно – искусственный интеллект стал понимать, что такое блеф, когда игроки идут на обман в раздаче, а самое главное – стал сам его применять. По утверждению игроков, которые проводили тесты, было ощущение как будто они играют с профи, который досконально знает все стратегии и не боится их применять.

За 20 дней компьютер отыграл 120,000 рук и вышел в профит практически в $2 млн. Тестирование проводили в казино, но игра осуществлялась на виртуальные фишки. В качестве утешительного приза игроки разделили $200,000, полученных от спонсоров.