Штучний інтелект виграв партію в покер у професіоналів, блефуючи краще людей

Грати на рівні середньостатистичної людини ШІ зміг вже через 7 годин навчання, на рівні професіонала - через 20

автор Sofiya Kovalchuk 12 Лип, 2019

Штучний інтелект, розроблений фахівцями з лабораторії Facebook по дослідженню ШІ і приватного університету Карнегі-Меллона (Carnegie Mellon University), зміг обіграти деяких провідних світових гравців у покер в серії ігор в безлімітний техаський холдем на шість чоловік.

За 12 днів і 10 000 роздач система ШІ під назвою Pluribus зіткнулася з 12 професіоналами в двох різних сценаріях. В одному програма грала разом з п’ятьма людьми, в іншому — п’ять версій Pluribus грали з однією людиною (комп’ютерні програми не могли взаємодіяти один з одним в цьому сценарії).

В результаті Pluribus вигравав в середньому по 5 доларів за роздачу, а погодинні виграші становили близько тисячі доларів. Про це повідомляє портал The Verge.

«Грати проти Pluribus’а практично неможливо. Його складно переграти при будь-якому розкладі карт». – Кріс Фергюсон (Chris Ferguson), шестиразовий чемпіон WSOP (найпрестижніша серія турнірів в світі).

У грі в техаський холдем один на один ШІ зміг перемогти людини ще в 2015 році. Однак при збільшенні загального числа гравців за столом до шести програма починала губитися. Щоб розв’язати дану проблему, Ноам Браун (Noam Brown) з лабораторії Facebook і Туомас Сандхольм (Tuomas Sandholm) з CMU застосували дві техніки.

Перша — змусити кілька версій Pluribus грати між собою, навчаючись методом проб і помилок. Друга — запрограмувати ШІ так, щоб він вирішував, що робити на поточному ходу, виходячи з припущень всього на два-три ходи вперед (на відміну від, наприклад, шахів, де стратегія будується на десятки ходів вперед).

Можна зробити висновок, що Pluribus жертвує довгостроковою стратегією заради короткострокової вигоди, але в покері виявляється, що короткострокова різкість — це і є шлях до перемоги.

AI Poker WSOP