Программное обеспечение теперь может победить любого игрока в покер

08.09.2021

Поклонники покера размышляли о лучших стратегиях с момента изобретения карточной игры. Теперь появляется идеальный экспонент, который знает все оптимальные варианты игры и поэтому всегда выигрывает в долгосрочной перспективе - по крайней мере, так утверждают его создатели.

Непревзойденный плеер - это программа, созданная учеными-компьютерщиками из Университета Альберты в Эдмонтоне, Канада. Они говорят, что разработали идеальную стратегию для определенного вида игры. Эта работа может найти применение в реальных ситуациях, когда люди пытаются добиться желаемых результатов, включая аукционы и повышенную безопасность авиаперелетов.

Покер - популярный полигон для исследований искусственного интеллекта, потому что, в отличие от таких игр, как шахматы или шашки, у каждого игрока есть карты, которые другие игроки не видят. «Вся интересная часть игры проистекает из того факта, что у вас нет точной информации», - говорит Майкл Боулинг, член команды, которая разработала новое программное обеспечение.

Реклама

Вот уже несколько лет программы для игры в покер, в том числе и другие программы, созданные Боулингом, могут выдержать конкуренцию с лучшими игроками-людьми, но ни одна программа не была достаточно мощной, чтобы проанализировать все возможные сценарии и выбрать абсолютно лучшую игру из них. каждый случай.

Тонкое усиление

До сих пор говорят Боулинг и его коллеги. Они взяли свою предыдущую лучшую программу под названием Polaris и немного изменили способ обучения на собственном опыте. В новой версии более охотно идут игры, которые в прошлом не удались, но которые все еще могут работать, если они станут частью более крупной и сложной стратегии. Они также доработали его, оптимизировав использование дискового пространства и памяти.

Вместе эти изменения сделали новую программу Cepheus примерно в тысячу раз быстрее, дав команде Боулинга достаточно сил, чтобы вычислить идеальную стратегию для каждой возможной ситуации в варианте покера для двух игроков, известном как Heads Up Limit Hold 'Em. Они показали, что никакая альтернатива не может быть лучше, чем игра, которую можно потратить на всю жизнь.

Стратегия боулинга не демистифицирует покер таким образом, чтобы убить интерес людей к игре. Во-первых, алгоритмы состоят из 12 терабайт данных, поэтому игрок-человек не мог бы их изучить за выходные (или всю жизнь). Однако игроки могут тренироваться против компьютера или спрашивать его о конкретных сценариях; действительно, у команды Боулинга есть общедоступный веб-сайт, на котором каждый может это сделать.

Более того, в большинстве игр в покер участвует более двух игроков, и зачастую лимиты ставок отсутствуют. По словам Боулинга, это затрудняет анализ игр. Также большинство игроков мало что выиграет от использования идеальной стратегии Cepheus. «Немногие игроки в полной мере используют многие уже существующие сайты по обучению покеру», - говорит Фил Лаак, профессиональный игрок.

Безопасность полетов

Методы боулинга должны оказаться полезными в реальных ситуациях, когда стороны имеют неполную информацию. Милинд Тамбэ из Университета Южной Калифорнии в Лос-Анджелесе разработал программное обеспечение, которое назначает маршалов авиации на полеты способом, который террористы не могут предсказать, при этом обеспечивая максимальную защиту полетов, которые считаются наиболее уязвимыми. Программа делает несколько упрощающих предположений, поэтому подход Боулинга может помочь в построении более реалистичного подхода, говорит Тамбе.

Точно так же телекоммуникационным компаниям, участвующим в торгах на новые доступные радиочастоты, нужна стратегия, позволяющая получить достаточную полосу пропускания с наименьшими затратами. «Никто не знает рационального способа проведения торгов на типичном аукционе спектра», - говорит Туомас Сандхольм из Университета Карнеги-Меллона в Питтсбурге, штат Пенсильвания.

Опять же, программное обеспечение может дать ответ. «Если вы занимаетесь сферой высоких ставок, такой как кибербезопасность или аукционы, где на кону стоят миллиарды, было бы действительно приятно знать, что вы играете оптимально, а не просто делаете действительно достойную работу», - говорит Сандхольм.

В статью внесены изменения от12 января 2015 г.

Когда эта статья была впервые опубликована, мы неправильно приписали Филу Лааку комментарий, который на самом деле был сделан Майклом Боулингом. Теперь это исправлено.

Еще новости