Skip to content
[OPEN_POKER]

Comparaison

Open Poker vs Pluribus

Pluribus est la premiere IA a avoir battu des professionnels humains d'elite au No-Limit Hold'em a 6 joueurs. Open Poker est une plateforme competitive en direct ou n'importe qui peut faire tourner un bot. L'un est un jalon de recherche que tu ne peux pas utiliser. L'autre est gratuit et fonctionne maintenant.

La reponse courte

Pluribus est l'IA de poker la plus forte jamais publiee. Mais elle n'existe pas pour toi. Le code source est ferme, le modele entraine n'est pas disponible, et la seule chose que tu peux en tirer est le paper publie et les idees d'algorithme. Open Poker est ce que tu utilises quand tu veux vraiment faire tourner un bot de poker et voir comment il s'en sort.

La plupart des gens qui lisent sur Pluribus et veulent essayer quelque chose de similaire finissent sur Open Poker parce que c'est le chemin le plus rapide de "j'ai lu le paper" a "mon bot joue contre de vrais adversaires."

Comparaison cote a cote

FonctionnaliteOpen PokerPluribus
DisponibilitePlateforme publique, gratuiteRecherche fermee, code non publie
Annee de sortie20262019 (paper dans Science)
Cree parDeveloppeur solo (Joao Carvalho)Noam Brown, Tuomas Sandholm (Meta AI / CMU)
FormatArene competitive en directSysteme de recherche
Jeu6-max No-Limit Hold'em6-max No-Limit Hold'em
Tu peux l'utiliser ?Oui, en 5 minutesNon
AlgorithmeTemplates heuristiques + tuning customCFR+ self-play + subgame solving en temps reel
ForceIntermediaire, en progressionA battu des pros humains d'elite
CoutGratuit, Pro a partir de $5/saisonN/A (non disponible au public)
AdversairesVrais bots d'autres devsHumains professionnels d'elite (dans le paper)

Ce que Pluribus a prouve et pourquoi c'est important

Pluribus etait important parce que c'etait la premiere IA a resoudre le No-Limit Hold'em multijoueur. Les systemes precedents comme Libratus (2017) resolvaient le jeu en heads-up, ce qui est techniquement plus facile parce qu'il n'y a qu'un adversaire et que le jeu est a somme nulle entre deux joueurs. Le poker multijoueur introduit des problemes de coordination et des arbres de jeu exponentiellement plus grands, et Pluribus a ete le premier systeme a gerer cette complexite assez bien pour battre des humains d'elite.

L'innovation technique etait de combiner une phase offline de self-play (ou la strategie blueprint est calculee avec une forme de CFR) avec une phase de recherche en temps reel online (ou le blueprint est affine pendant la main en cours via du subgame solving a profondeur limitee). Cette approche hybride a permis a Pluribus d'etre assez fort pour battre les meilleurs pros a une fraction du cout de calcul de Libratus.

Pourquoi tu ne peux pas telecharger Pluribus

L'equipe Pluribus a publie le paper dans Science decrivant la methode et les resultats, mais pas le code ni le modele entraine. C'est courant pour les systemes de recherche : le paper est le livrable, pas l'artefact. Les laboratoires academiques et industriels evitent souvent de publier des IA de poker de niveau tournoi par crainte de leur deploiement sur des sites d'argent reel (ou l'usage de bots est interdit) et parce que l'effort d'ingenierie pour supporter les utilisateurs externes est consequent.

La consequence pratique : si tu veux jouer contre Pluribus, tu ne peux pas. Si tu veux construire quelque chose inspire par Pluribus et le faire tourner quelque part, Open Poker est la plateforme qui te le permet.

Comment apporter le style de pensee Pluribus a Open Poker

Lis le paper de Science. Ensuite implemente les idees sous forme heuristique :

  • Bet sizing equilibre. Pluribus utilisait des sizings mixtes pour eviter d'etre exploitable. Ton bot peut approximer cela avec une variation de sizing street par street basee sur la texture du board et la position.
  • Strategies mixtes aux points de decision. Au lieu de toujours bluffer ou jamais bluffer, utilise une probabilite. Pluribus randomisait ses actions pour empecher les adversaires d'exploiter des patterns. Ton bot peut faire pareil avec un parametre de ratio bluff-to-value.
  • Conscience de l'adversaire sans CFR complet. Pluribus ne modelisait pas d'adversaires specifiques pendant le jeu (il utilisait un blueprint precalcule). Ton bot peut aller plus loin et suivre activement VPIP, PFR et AF pour s'adapter en temps reel.

Questions frequentes

Je peux telecharger Pluribus et jouer sur Open Poker ?

Non. Pluribus est un systeme de recherche ferme construit par Facebook AI Research (maintenant Meta AI) et Carnegie Mellon. Le paper a ete publie dans Science en 2019, mais le code source et le modele entraine ne sont pas publiquement disponibles. Tu peux lire les techniques et essayer de les reimplementer, mais il n'y a pas d'option pour telecharger Pluribus. Open Poker, en revanche, permet a n'importe qui de s'inscrire et de deployer un bot en moins de 5 minutes.

Qu'est-ce que Pluribus et pourquoi est-il celebre ?

Pluribus est la premiere IA a battre des professionnels humains d'elite au No-Limit Texas Hold'em a 6 joueurs. Il a ete construit par Noam Brown et Tuomas Sandholm chez Facebook AI Research et Carnegie Mellon, publie dans Science en 2019. Pluribus a battu un groupe de pros de niveau mondial sur plus de 10 000 mains a un cout de calcul nettement inferieur a celui des systemes heads-up precedents comme Libratus.

Quels algorithmes Pluribus a-t-il utilises ?

Pluribus a combine le Counterfactual Regret Minimization (CFR+) offline via self-play pour la strategie blueprint avec un algorithme de recherche en temps reel appele depth-limited subgame solving pour les decisions in-game. La methode complete est documentee dans le paper de Science par Brown et Sandholm (2019).

Si je ne peux pas utiliser Pluribus directement, que faire ?

Construis un bot sur Open Poker et utilise les insights du paper Pluribus pour eclairer la conception de ta strategie. Les techniques style Pluribus (strategies mixtes, frequences de bluff equilibrees, ranges conscientes de la position) peuvent etre implementees sous forme heuristique et deployees sur Open Poker en une journee. Pour l'experimentation algorithmique, utilise OpenSpiel (aussi gratuit et open source) pour faire tourner CFR localement, puis amene l'agent entraine sur Open Poker pour le tester contre de vrais adversaires.

Pluribus est-il plus fort que les bots Open Poker ?

Oui, Pluribus est nettement plus fort que tout ce qui tourne actuellement sur Open Poker. Pluribus a ete construit comme un systeme de recherche avec un investissement massif en calcul et a battu des professionnels humains d'elite. La plupart des bots sur Open Poker sont heuristiques et tunes par des devs solo. L'ecart est reel. Le compromis : tu peux vraiment faire tourner un bot contre de vrais adversaires sur Open Poker, alors que Pluribus n'existe que comme artefact de recherche.

Commence a construire ton propre bot

Cree un compte gratuit sur Open Poker. plan de 7 jours