GTOとエクスプロイトについて(所感)
ところで、界隈で「FUCK GTO」が話題になりましたね。
「GTOなんかより、やっぱりエクスプロイトが大事だよ!Fuck!」って内容だったと記憶してますが、まさしくその通りだと思います。
こんなブログの割にあんまりGTOに詳しくはないんですが、せっかくなので、GTO戦略について思うところを書いてみます。
●はじめに
まず、ポーカープレイヤーとして目指すべきは、「利益の最大化」に尽きます。
そのためにやるべきは、GTO戦略の模倣ではなくて、相手に応じたエクスプロイト戦略の選択です。
ただ、ポーカーにおける問題は、エクスプロイトするための最初の基準がイマイチ解らないことです。
じゃんけんのGTOは分かりやすいですね。
「「グー」「チョキ」「パー」を33%ずつ同じ頻度で出す」ことが「GTO(搾取不可能な戦略)」です。
そして、特定の相手と何度かじゃんけんを繰り返しているうちに、「相手が「チョキ」を多用する」リークを発見すれば、こちらは「グー」の比率をGTOの33%から上昇させることで、エクスプロイトした(相手のリークを搾取する)戦略を採ることができます。
ところで、ポーカーのGTOは難しいです。
どのアクションをどんな頻度で採れば、じゃんけんでいうところの「「グー」「チョキ」「パー」を33%ずつ同じ頻度で出す」GTO戦略になるのでしょう?
●シチュエーション例
例えば、私たちBTNがオープンし、BBの相手がコールした2betpotを想定します。
そして、私たちは、BBのこれまでのプレイングから、「BBの相手がルース・パッシブである」ことを知っているとします。
さて、フロップのボードが[AcAh5d]のとき、BTNのCB戦略は、どんなアクションを採ればいいのでしょう?
「うーんGTOはわかんないけど、とりあえずCBを打とう!相手にそうそう「A」はないだろ!
それにパッシブだし、CBを打ってもあんまりレイズされなさそうだ。
普通のオリジナルのCB率は60%位って聞いたから、80%位のハンドでCBを打てばいいかな?
でもペアボードだし、CB額はpot30%で安くしとこう!
よーし、80%のハンドで、pot30%のCBを打とう!」
という安直にエクスプロイト戦略を立ててみました。
じゃ、実際にGTOを回してみましょう!
BTNvsBB(Loose)2betpotのハンドレンジを想定し、[AcAh5d]と設定します。
(BBの「ルースパッシブ」の特徴のうち、「ルース」のみハンドレンジの広さによって設定し、「パッシブ」なアグレッションはまだ考慮していません。)
このとき、BTNのCB戦略は以下のようになりました。
BTNアクション内訳(100%potBet,66%,33%,Check)=(0.0%,0.1%,99.9%,0.0%)
なんと、BTNvsBB(Loose)2betpotの[AcAh5d]ボードにおいて、GTOが示すBTNのCB戦略は、99.9%の頻度で33%potBetアクションです。
ルース・パッシブなBBに対し、さっきはBTNから80%位でCBするつもりでしたが、どうやら適正なCB比率には足りなかったようです。
さらにこの結果に加えて、「BBがパッシブである」という情報を基に、GTOによる簡易的なエクスプロイトを分析してみます。
「Node Lock」でCBに対するBB側のRaise頻度を減らした(GTOが推奨する頻度の30%程度のRaise率)場合について、BTNのGTO戦略を調べます。
BTNアクション内訳(100%potBet,66%Bet,33%Bet,Check)=(0.0%,12.2%,87.8%,0.0%)
元々のルースなハンドレンジに加え、「BBがパッシブである」ことにアジャストしたBTNのGTO戦略は、100%頻度の33%potBetからさらに攻撃的になり、12.2%の66%potBetアクションが加わりました。
また、驚くべきことに、この状況下におけるBTNのアクションで、Checkを採るハンドはありません(頻度0.0%)。
●結論
以上の結果をまとめると、BTNvsBB(Loose)の2betpotの[AcAh5d]ボードにおいて、BTNはGTO戦略として、100%の頻度で33%potのCBを打ちます。
この結果から、BTNはさらに「BBがどれほどパッシブか?」を考慮し、33%potBetの代わりに66%potBetなど、より高額なBetを組み入れていくことで、利益を最大化するエクスプロイトを試みます。
(この状況下で、BTNがCheckを採る選択肢はありません。)
このように、GTOは、時として私たちの感覚を上回るアクションを推奨します。
しかし、違和感のあるこの結果こそが、じゃんけんでいうところの「「グー」「チョキ」「パー」を33%ずつ同じ頻度で出す」GTO戦略であり、エクスプロイトするための基準にもなります。
つまり、「GTO戦略を知ることは、相手をエクスプロイトする基準を知ること」とも言えます。
そして同時に、ポーカープレイヤーである以上、相手にエクスプロイトしたいのは私たちだけではありません。
私たち自身も、相手のプレイヤーからエクスプロイトされる対象であることも承知していなければなりません。
先の言葉を言い換えれば、「GTO戦略を知らないことは、相手からエクスプロイトされ得る余地を残していること」とも言えます。
誰しも、「グー」「チョキ」「パー」を33%ずつ出せないのがポーカーです。
以上が、エクスプロイトに関して、GTO戦略を知ることの効果だと考えます。
●最後に
なんかポーカーにおけるGTOのイメージは、ロジック界のラスボスみたいな感じですが、その性質としては、ゴールというよりもスタートに近いものだと考えています。
特定の場面に応じて、エクスプロイトする基準となる「最適均衡」を知らなければ、「エクスプロイトしてやった!」はただの自己満足に終始してしまいます。
その基準を教えてくれるのがGTOです。
とはいえ、優れた観察眼を持っていたりエクスプロイトがやたら上手かったり、もちろんGTOなしに強くなる人はたくさんいることも同意します。
よっぽどのレートにならなければ、勝つためにGTOが必須科目というわけでもないと思います。
(特にライブポーカーなんかでは、ハンド以外にもプレイヤーの雰囲気・仕草・ティルト状態といった、エクスプロイトするための多くの分析材料が揃ってます。
GTOという言葉がこれだけ広まったのは、きっとネットポーカーの普及につれて対戦相手が見えなくなったことで、より「万人に対する標準的な戦略」が注目された結果なのだと勝手に想像しています。)
さらに言えば、GTO戦略の結果を模倣するよりも、「GTOが示すレンジvsレンジの考え方」や「GTOから乖離した相手をいかにエクスプロイトするか」を知ることの方が、ポーカープレイヤーとしてきっと大事な項目です。
そもそも、GTO戦略の真似だけやってても、あんまり面白くないです。
「守破離」の精神に似通ってますが、GTO戦略で示された解から、根拠を持って戦略を「動かせる」ことが、GTOを学ぶ最終目標だと思います。