Научится ли искусственный интеллект блефовать в покере?

Искусственный интеллект или ИИ (искусственный интеллект) — это машина, демонстрирующая признаки разумного поведения, и область, которая занимается их разработкой и исследованиями в этой области. Может ли покер преобладать в покере?

Может ли искусственный интеллект преобладать в покере?

Bluffování v pokeru

Искусственный интеллект или ИИ (искусственный интеллект) — это машина, демонстрирующая признаки разумного поведения и область, которая занимается их разработкой и исследованиями в этой области. Исследования в области искусственного интеллекта в основном сосредоточены на мышлении, планировании, обучении, общении, восприятии, знании и движении. В будущем исследователи также хотят сосредоточиться на социальном интеллекте, творчестве и общем интеллекте, которые объединят все вышеперечисленное.

ИИ и игры

Какое отношение имеет ИИ к покеру и играм в целом? Помимо различных тестов, игры — отличный способ сравнить способности ИИ с человеческими. Если ИИ не может победить своих противников-людей в игре, ученые могут определить, что необходимо доработать и улучшить, на основе анализа игры. Согласно исследованию Техасского университета в Остине, во время игры в определенные компьютерные игры игроки больше не могут определить, является ли их противник человеком или искусственным интеллектом. В настоящее время ИИ доминирует над людьми в так называемых играх с полной информацией (таких как шахматы, шашки или го!). В этих играх каждый игрок имеет ту же игровую информацию, что и другие игроки. Игра не влияет на риск или психику игрока. Поэтому ИИ использует детерминированный алгоритм. Примером может служить суперкомпьютер IBM Deep Blue, который стал первым компьютером, победившим бывшего чемпиона по шахматам и одного из лучших игроков в истории Гарри Каспарова в 1997 году.

umělá inteligence v pokeru

ИИ против покера

Однако использовать искусственный интеллект в покере сложнее, чем в этих играх. Покер определяется не только качеством игровых комбинаций, но прежде всего стратегией и тактикой. В покере вы можете выбрать один из нескольких вариантов за несколько шагов, и одни и те же ходы никогда не гарантируют одинаковый результат. Покер — это игра с неполной информацией. Игрок не знает, какие карты есть у других игроков или какие карты взяты из колоды. Таким образом, игроки могут влиять на результат, обманывая других игроков, так называемый блеф. Невербальное общение, эмоции и другие внешние проявления игроков играют роль. Эти проявления имеют решающее значение в игре, но программное обеспечение не может их воспринимать, поэтому разработка покерных программ затруднена. Программа должна работать только с несовершенными знаниями, так как она не знает ценности карт оппонентов. Он играет с большим количеством игроков, у каждого из которых своя тактика, поэтому он должен постоянно оценивать возможные риски. ИИ также должен учитывать блеф, поэтому он работает только с недостоверной информацией.

Научный коллектив Университета Альберты давно работает над этим вопросом. Их большим успехом пользуется программа Cepheus, играющая в покерную версию Техасского холдема с лимитом Heads Up. Это более простой вариант популярного безлимитного техасского холдема, в игре есть ограниченные ставки и играют только двое игроков. Согласно статье, опубликованной в Science в этом году. Цефей «слабо решил» этот вариант игры. Хотя он не является теоретически непобедимым, его стратегия почти идеальна. Это значит, что он не проиграет, даже если будет играть против гипотетического игрока, который не допускал ошибок в течение 70 лет. Cepheus работает по принципу, согласно которому его алгоритм проверяет различные стратегии и записывает информацию о том, какие из них не сработали. По мнению экспертов в области искусственного интеллекта, можно создать и использовать стратегию, которая приносит пользу в долгосрочной перспективе.

Roboti v pokeru

Команда исследователей из Университета Карнеги-Меллона во главе с профессором Туомасом Сандхольмом создала программу Claudico AI, которая играет в разновидность покера безлимитного техасского холдема. Клаудико поистине революционер в искусственном интеллекте. Вместо программирования «идеальной» стратегии на компьютере ученые создали алгоритмы, в которых программа создает свою собственную стратегию из всей доступной информации и возможностей, чтобы максимально приблизиться к равновесию Нэша. Это ситуация, когда никто из игроков не может улучшить свое положение, в одностороннем порядке изменив собственную стратегию. Итак, Клаудико блефует как люди, но его алгоритмы сами создают стратегию того, как и когда блефовать. Даже сами создатели не знают его конкретных реакций. ИИ использует блеф не на психологическом уровне, а как проявление выбранной стратегии.

Это был такой сложный проект, который Claudico запускает на суперкомпьютере Blacklight с 16 терабайтами оперативной памяти. Стратегия, созданная Клаудико во время игры, занимала 2 ТБ данных. Он должен предвидеть различные события и возможные реакции своих противников. Поэтому ИИ должен уметь принимать решения, даже если он не имеет в своем распоряжении всех ситуаций, но все же выбирать наилучшую стратегию и решать, какую комбинацию играть.

Клаудико принял участие в турнире Brains Vs. в апреле этого года. Искусственный интеллект, который проходил в Rivers Casino с некоторыми из лучших игроков в этом варианте, возглавлял Дуг Полк (в настоящее время один из лучших игроков в кэш-игре). Решение было принято после 14 дней и 80 000 раздач. Клаудико еще не хватило для команды профессионалов. Они получили в общей сложности 732 713 долларов. Однако эти 4 игрока выиграли только 1% от общего количества банков, что, по мнению создателей Клаудика, не является чистой победой. Сандхольм заявил после турнира, что ИИ победит лучших игроков в покер в мире самое позднее через пять лет.

Цель разработки таких программ, как Claudico, заключается не только в создании идеальной стратегии игры в покер. Основываясь на том же принципе, команда создает ИИ, которые могут работать с неполной информацией, что может иметь значительное влияние в будущем, например, в области кибербезопасности, медицины или онлайн-транзакций.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *