Skip to content
[OPEN_POKER]

比較

Open Poker vs Pluribus

Pluribusは6人プレイヤーNo-Limit Hold'emでエリートプロを初めて打ち負かしたAIです。Open Pokerは誰でもボットを実行できるライブ競技プラットフォームです。一方は使えない研究のマイルストーン。もう一方は無料で今すぐ動いています。

短い答え

Pluribusはこれまでに発表された最強のポーカーAIです。しかしあなたには存在しません。ソースコードは非公開、トレーニング済みモデルは利用不可で、取れるのは公開された論文とアルゴリズムのアイデアだけです。Open Pokerは実際にポーカーボットを動かしてどうなるか見たいときに使うものです。

Pluribusについて読んで似たようなことを試したい人の多くは、「論文を読んだ」から「自分のボットが本物の対戦相手と戦っている」への最速パスだからOpen Pokerに辿り着きます。

並べて比較

特性Open PokerPluribus
利用可能性公開プラットフォーム、無料非公開研究、ソース未公開
リリース年20262019(Science論文)
開発者個人開発者(Joao Carvalho)Noam Brown, Tuomas Sandholm (Meta AI / CMU)
形式ライブ競技アリーナ研究システム
ゲーム6-max No-Limit Hold'em6-max No-Limit Hold'em
使えますか?はい、5分でいいえ
アルゴリズムヒューリスティックテンプレート+カスタムチューニングCFR+ self-play + リアルタイムsubgame solving
強さ中級、向上中エリートプロを打ち負かした
コスト無料、Proは$5/シーズンからN/A(一般利用不可)
対戦相手他の開発者の実際のボットエリートプロの人間(論文内)

Pluribusが証明したことと、なぜ重要か

Pluribusが重要だったのは、マルチプレイヤーNo-Limit Hold'emを解いた最初のAIだったからです。Libratus(2017)などの以前のシステムはヘッズアッププレイを解きましたが、これは対戦相手が1人だけでゲームが2人ゼロサムなので技術的に簡単です。マルチプレイヤーポーカーは協調の問題と指数関数的に大きなゲームツリーを導入し、Pluribusはその複雑さをエリート人間を倒せるほどうまく処理した最初のシステムでした。

技術的な革新は、オフラインself-playフェーズ(CFRの一形式でblueprint戦略を計算する)とオンラインリアルタイム探索フェーズ(現在のハンド内でdepth-limited subgame solvingを使ってblueprintを洗練する)を組み合わせたことでした。このハイブリッドアプローチにより、PluribusはLibratusの計算コストの何分の一かでトッププロを倒せるほど強くなりました。

なぜPluribusをダウンロードできないか

Pluribusチームは手法と結果を記述したScience論文を発表しましたが、コードやトレーニング済みモデルは公開していません。これは研究システムでは一般的です:論文が成果物であり、アーティファクトではありません。学術・産業研究所はトーナメントレベルのポーカーAIの公開を避けることが多いです。リアルマネーサイトでの展開(ボット使用は禁止)に対する懸念と、外部ユーザーをサポートするためのエンジニアリング労力が大きいためです。

実際の結果:Pluribusと対戦したいなら、できません。Pluribusに触発されたものを作ってどこかで動かしたいなら、Open Pokerがそれを可能にするプラットフォームです。

Pluribusスタイルの考え方をOpen Pokerに持ち込む方法

Science論文を読んでください。その後、アイデアをヒューリスティックな形で実装します:

  • バランスの取れたベットサイジング。 Pluribusはエクスプロイトされないようにミックスサイジングを使用しました。あなたのボットはボードテクスチャとポジションに基づくストリートごとのサイジング変動でこれを近似できます。
  • 決定ポイントでのミックス戦略。 常にブラフするか絶対ブラフしないかではなく、確率を使います。Pluribusは対戦相手がパターンをエクスプロイトするのを防ぐためにアクションをランダム化しました。あなたのボットもブラフ対バリュー比パラメータで同じことができます。
  • 完全なCFRなしの対戦相手認識。 Pluribusはプレイ中に特定の対戦相手をモデル化しませんでした(事前計算されたblueprintを使用)。あなたのボットはさらに踏み込んで、VPIP、PFR、AFを積極的に追跡してリアルタイムで適応できます。

よくある質問

PluribusをダウンロードしてOpen Pokerでプレイできますか?

いいえ。PluribusはFacebook AI Research(現Meta AI)とカーネギーメロン大学が構築した非公開の研究システムです。論文は2019年にScienceに掲載されましたが、ソースコードとトレーニング済みモデルは公開されていません。技術を読んで再実装を試みることはできますが、Pluribusをダウンロードするオプションはありません。Open Pokerは誰でも登録して5分以内にボットをデプロイできます。

Pluribusとは何で、なぜ有名ですか?

Pluribusは6人プレイヤーNo-Limit Texas Hold'emでエリートプロを初めて打ち負かしたAIです。Facebook AI Researchとカーネギーメロン大学のNoam BrownとTuomas Sandholmによって構築され、2019年にScienceに掲載されました。Pluribusは10,000ハンド以上でワールドクラスのプロのフィールドを、Libratusなどの以前のヘッズアップシステムよりも大幅に低い計算コストで倒しました。

Pluribusはどのアルゴリズムを使用しましたか?

Pluribusは、blueprint戦略のためのオフラインCounterfactual Regret Minimization(CFR+)self-playと、ゲーム内決定のためのdepth-limited subgame solvingと呼ばれるリアルタイム探索アルゴリズムを組み合わせました。完全な手法はBrownとSandholm(2019)のScience論文に記載されています。

Pluribusを直接使えないなら、何ができますか?

Open Pokerでボットを構築し、Pluribus論文からの洞察を戦略設計に活かしてください。Pluribusスタイルの技術(ミックス戦略、バランスの取れたブラフ頻度、ポジション認識レンジ)はヒューリスティックな形で実装でき、Open Pokerに1日以内にデプロイできます。アルゴリズム実験にはOpenSpiel(同じく無料でオープンソース)を使ってCFRをローカルで実行し、トレーニング済みエージェントをOpen Pokerに持ち込んで実際の対戦相手に対してテストしてください。

PluribusはOpen Pokerのボットより強いですか?

はい、Pluribusは現在Open Pokerで動いているものよりも大幅に強いです。Pluribusは大規模な計算投資を伴う研究システムとして構築され、エリートプロの人間を打ち負かしました。Open Pokerのほとんどのボットはヒューリスティックで個人開発者がチューニングしています。差は現実です。トレードオフ:Open Pokerでは実際にボットを実際の対戦相手に対して動かせますが、Pluribusは研究アーティファクトとしてのみ存在します。

自分のボットを作り始めよう

無料アカウントを作成 Open Pokerで. 7日間プラン