ポーカーGTO戦略のまとめ

GTO+でポーカー戦略を考えるブログ。Twitter:@NENDERS_Poker

住居とblogのお引越し

4月1日から東京に転勤になったので、引越しの作業中です。

 

東京ならライブポーカーができるスポットがたくさんあるなあ、楽しみです。

トランプを触りに、東京近辺のアミューズ巡りでもしようかなと思います。

 

 

ついでの報告ですが、はてなブログからNoteに移動することにしました。

note.mu

「同じ分析をするにしても、もしNoteのサポートで報酬が貰える(可能性がある)なら、それに越したことない」という、とても現金な理由です。

Noteの「サポート」って嬉しいですね、文章がお金になるのは素直に感動しました。

なので、今後、ポーカー関連の分析はNoteで続けていこうと思います。

 

マニアックな分析が続くとは思いますが、今後ともよろしくお願いします。

③BBvsBTN(3betpot)のボードファクターによる回帰分析について(実践編)

BBvsBTN(3betpot)におけるCBについて、GTO(Check/Bet(25%pot)/Bet(36%)/Bet(50%)/Bet(70%)/Bet(100%))による最適戦略をボードファクター別に回帰分析をしました。

 

結論として、それぞれのボードファクターが与えるGTO戦略への影響は、こんな図(前記事再掲)で表されることがわかりました。

f:id:NENDERS:20190209155056p:plain

とはいえ、あんまり数値だけ見てもよくわかりません。

具体的なボードを取り出し、このそれぞれの係数が意味することを考察していきます。

●BBvsBTN(3betpot)[7d6s2s]

1.試算値

・Preflop(100bb持ち)

BTN:2.5bb open

SB:Fold

BB:3bet 7.75bb

BTN Call 7.75bb

f:id:NENDERS:20190215202445p:plain

あなたはBBからvsBTNで3bet、BTNがコールしてフロップになります。

[7d6s2s]のフロップが開いたとき、あなたのアクションは?

 

上記の回帰分析をもとに、GTOによる平均CB額を試算してみます。

①初期値

1.スート

 ⇒ツースート…BBの平均CBサイズは40.1からスタート

 

②修正値(定数)

2.ペアボード(ダミー変数:1 or 0)

3.ストレートコンボ(ダミー変数:1 or 0)

⇒どちらも該当なし

 

③修正値(可変)

4.ボードのハイカード(変数:2~14):ボードのハイカード×▲0.80%

⇒ハイカード「7」…7×▲0.80%=▲5.6%

5.ボードのSUM値(変数:6~42):ボードのSUM値×+0.19%

⇒ボードのSUM値15×0.19%=+2.8%

 

①+②+③

=40.1%+▲5.6%+2.8%=37.3%

 よって、①~③のフィルターを通したこのボードの平均CB試算額は、37.3%となりました。

 

試算の結果出てきたこの数値は、果たして妥当でしょうか?

早速、今回扱ったものと同じボードにおけるGTO戦略を検証してみます。

2.GTO

f:id:NENDERS:20190215202445p:plain

f:id:NENDERS:20190215205936p:plain

f:id:NENDERS:20190215210006p:plain


BBはBet(25%pot)からBet(100%)まで複雑怪奇な混合戦略を採っています。

このGTO戦略によるCB額の平均値を計算すると、33.3%になりました。

f:id:NENDERS:20190215212331p:plain

3.検証

結果として、

・回帰分析による試算は37.3%

・最適GTO戦略によるAVERAGE_BETは33.3%

となりました。

平均CB額は4.0%ほど乖離しましたが、試算値は概ねGTO戦略の傾向を捉えているといえそうです。

 

4.疑似GTO戦略としての試算値

ところで、[7d6s2s]において、回帰分析の試算値として得られた37.3%を、そのままBBのAll Hand CB戦略に当てはめてみると、BBのEVはどうなるでしょう?

 

つまり、シチュエーションでいうとこんな具合です。

・Preflop(100bb持ち)

BTN:2.5bb open

SB:Fold

BB:3bet 7.75bb

BTN Call 7.75bb

 

Flop:ボード[7d6s2s]

f:id:NENDERS:20190215213345p:plain

BB:All Hand CB 37.3%pot

 

BBのアクションを37.3%potBetの一択にした図がこちら。

f:id:NENDERS:20190215213227p:plain

f:id:NENDERS:20190215213741p:plain

BBがこの戦略によってBBが得られるEVは、8.45です。

実は、先のボードにおいて、BBの最適GTO戦略によるEVは、8.56でした(上図)。

 

この2つの戦略によるBBのEV乖離は、▲0.11bbです

つまり、16.0bbのpotに対して▲0.68%の損に留まっており、ALL37.3%potBet戦略は、十分GTO戦略の代替として活用できる水準といえます。

 

この結果をみると、面白そうな仮説が立てられます。

 

試算表「①初期値」⇒「②修正値(固定)」⇒「③修正値(可変)」によって、フロップボードごとの平均CB額「X%pot」を算出すれば、BBは「ALL X%pot CB」戦略によって、各ボードの疑似GTO戦略を採り得るのではないか?

ですが、結論から言えば、おそらくこれを今後証明することはありません。

 

1つに、1,000ボードそれぞれ固有の平均CB額を算出するのは簡単ですが、これらをそれぞれボードごとに設定してGTOを回すのは、途方もない作業だからです。

回帰分析による平均CB額は信憑性がありますが、この値を使ったGTO戦略となると、もう一度各ボードにおけるEV乖離値の検証が必要になります。

 

また、もう1つに、疑似戦略としての精度はそこそこ高そうですが、計算式がちょっとややこしいため、実践で使いにくいからです。

いざボードが開いてから「レインボーかつペアボード、ハイカードがいくつでSUM値がいくつだから~」とやっていると、いかんせん時間が足りません。

(将来、ボードを打ち込めば、最適GTO戦略による平均CB額を試算するアプリくらいなら作れるかもしれません。)

 

なので、回帰分析による試算値を使った「疑似GTO戦略」は、体系化の1つとしてはかなり再現性が高いように思えますが、このブログでの検証は一旦ここまでとします。

今後は、もう少し簡略化して実践向きな「疑似GTO戦略」の策定に入ります。

②BBvsBTN(3betpot)のボードファクターによる回帰分析について(結果)

最近はブログよりnoteにアップするのがアツそうですね。

今度試してみようと思います。

GTOを追って

前回は、ボードのスートに絞ってBBの「平均EQ」および「平均EV」について分析しました。

hmpokergto.hateblo.jp

結論として、BBは「①レインボー」のボードが最も望ましいことがわかりました。

 

しかし、ボードにはもっとたくさんのファクターがあります。

これらを準備すれば、スート以外のそれぞれのボードファクターについても、BBのGTO戦略に与える影響がわかるかもしれません。

 

今回のテーマは、「GTOはボードの何を見て、CB戦略を決めているのか?」です。

 

●ボードファクターの作成

まずは、1,000あるボードについて、それぞれボードの要素を示したファクターを設定します。

具体的には、以下のとおり定めました。

 

1.スート(ダミー変数:1 or 0)

 (1) レインボー

 (2) ツースート

 (3) モノトーン

2.ペアボード(ダミー変数:1 or 0)

※フロップでペアボードの場合に「1」

3.ストレートコンボ(ダミー変数:1 or 0)

※フロップでストレートが作れるコンボが存在する場合に「1」

4.ボードのハイカード(変数:2~14)

5.ボードのSUM値(変数:6~42

 

以上5つの要素をもとに、「GTOの平均CBサイズ(AVERAGE_BET)」について重回帰分析します。

f:id:NENDERS:20190208210345p:plain

上図のように、関数を組んでボードファクターを説明変数に変換した後、「AVERAGE_BET(対pot比)」に対して回帰分析しています。

 

その結果、以下の表が出てきました。

f:id:NENDERS:20190209150954p:plain

1,000のボードは、全て①レインボー②ツースート③モノトーンのどれかに分類されることを踏まえ、イメージが簡単なように、「Constant is Zero」で回帰分析をしています。

 

各説明変数が有意水準であることを確認のうえ、この表をもうちょっと見やすくすると、こんな図になります。

f:id:NENDERS:20190209155056p:plain

●分析結果(CBサイズ早見表)

上図における「CBサイズ(%)/1単位」は、各ボードファクターの変数1単位の変化が与えるCBサイズ(対pot比)への影響を回帰分析で計算したものです。

 

この結果から、BBvsBTN(3betpot)において、BBの最適CBサイズは、以下の「①初期値」⇒「②修正値(固定)」⇒「③修正値(可変)」のプロセスで導出できることがわかります。

 

①初期値

1.スート

 (1) レインボー…BBの平均CBサイズは47.2%(pot)

 (2) ツースート…BBの平均CBサイズは40.1

 (3) モノトーン…BBの平均CBサイズは22.6

 

②修正値(定数)

2.ペアボード(ダミー変数:1 or 0)

 ボードがペアボードの場合、「初期値」から▲5.52%

 

3.ストレートコンボ(ダミー変数:1 or 0)

 ボードにストレートを作るコンボがある場合、「初期値」から▲13.5%

※フロップにおいて、ペアボードとストレートコンボ有りが重複するボードはありません。

 

③修正値(可変)

4.ボードのハイカード(変数:2~14)

 ボードのハイカード×▲0.80%

 (Aハイボードであれば、14×▲0.80%=▲11.2%

 

5.ボードのSUM値(変数:6~42

 ボードのSUM値×+0.19%

 ([AdKdAh]のAAKボードであれば、SUM値41×0.19%=7.79%

 

 

ボードファクターの影響がもたらすGTO戦略への影響は、こんな結果になりました。

私たちBBは、3betpotのボードを見たときに、「①初期値」⇒「②修正値(固定)」⇒「③修正値(可変)」のフィルターを通せば、GTOの平均CBサイズを概算することができます。

 

とはいえ、まだ数値だけを見ても、イメージが湧きにくいかもしれません。

次回は、ボードの具体例と、導出された結果の考察をしたいと思います。

①BBvsBTN(3betpot)のボードファクターによる回帰分析について

Q.あなたはBBで、vsBTNの3betpotを開きました。

これからフロップが開くところですが、もしボードのスートテクスチャを

①レインボー

②ツースート

③モノトーン

の3択から1つ選べるなら、どれにしますか?

 

今回は、そんなお話です。

---

ちょっと前からBBvsBTN(3betpot)の分析をしています。

 シチュエーションは過去記事のとおりです。

hmpokergto.hateblo.jp

ちなみに、当ブログにおける3betpot分析の進捗は、段階分けするとこんな感じです。

 

1.GTO戦略による理論値の導出(←今ココ!)

2.疑似GTO戦略の模索(←でもホントはココが一番楽しい)

3.理論値と疑似GTO戦略によるEVとの検証

4.疑似GTO戦略の策定

 

面白さ的には「2.疑似GTO戦略の模索」に移りたいところですが、今回は「1.GTO戦略による理論値の導出」について、もう少し細かく分析をしてみようと思います。

●ボードのスートファクター別分析

GTO戦略による理論値の導出そのものについては、前回の記事で既に終わっています。

その際に、BBのCBサイズはCheck/Bet(25%pot)/Bet(36%)/Bet(50%)/Bet(70%)/Bet(100%)と決めていました。

 

GTOは、ランダムな1,000のボードに対し、この6つのアクションを混合して搾取不可能なCB戦略を導出しています。

では、GTOはボードの何を見て、CB戦略を決めているのでしょう?

 

この疑問に対する1つの答えが、冒頭の問いにあります。

早速、答え合わせしましょう。

 

下図は、1,000ボードを①レインボー②ツースート③モノトーンに分類したものです。

それぞれのテクスチャについて、BB(3bet)の「平均EQ」と「平均EV」を計算しました。

f:id:NENDERS:20190208212420p:plain

どうやら、それぞれのテクスチャ間には、有意なEQ・EV差があることが見受けられます。

平均EQ」および「平均EV」から判断すれば、BBvsBTN(3betpot)において、BBが最も望ましいテクスチャは「①レインボー」です!

正解の方はおめでとうございます。

僕は勝手に「②ツースート」くらいがフラドロもあってCB打ちやすいから良いなと思ってました。

 

ところで、なぜフロップは「①レインボー」がBBにとって一番望ましいのでしょう?

この答えは、3betpotにおけるBBおよびBTNのハンドレンジの特徴にあります。

 

●BBvsBTN(3betpot)におけるダイナミックボード

前回の再掲になりますが、下図がBBvsBTN(3betpot)のハンドレンジになります。

①BB(3bet)                ②BTN(Call_3bet)

f:id:NENDERS:20190131225228p:plainf:id:NENDERS:20190131225347p:plain

もちろん、①BB(3bet)vs②BTN(Call_3bet)において、①BB(3bet)には[AA],[KK],[AK]といったプレミアハンドを持っており、レンジvsレンジの総体エクイティでは、①BB(3bet)が優位に立っています。

ですが、こうしたハイポケットは、フラッシュやストレートが見込まれるダイナミックなボードにおいて、十分にエクイティを発揮できません。

 

また、①BB(3bet)のハンドレンジには、ブラフレンジとして多くの[AXs]が含まれており、フラッシュの可能性があるボードは、オリジナルのBB側にも望ましいように思えます。 

しかし、①BB(3bet)と②BTN(Call_3bet)を図で見比べると、ハンドレンジに占めるスートハンド(ハンドレンジの青い部分)の割合は、一目で②BTN(Call_3bet)が多いことがわかります。

(ちなみに、青の濃淡は見えにくいですが、Snowieの設定どおり、②BTN(Call_3bet)における[AXs]の数十パーセントをブラフ4betに回しています。)

 

この結果として、フロップのボードテクスチャをみると、BBのエクイティは、「①レインボー>②ツースート>③モノトーンの順に並んでいることがわかります。

 

GTOを追って(次回)

スートについては、BBが好ましいパターンがわかりました。

ですが、フロップのボードには、スートの他にも「ペアボード」「ローボード」「ボードのハイカード」「ストレートコンボがあるボード」…など、さまざまなファクターがあります。

 

こうしたボードファクターは、GTO戦略へのどういった影響をもたらすのか? 

GTOは計算結果を出力するだけなので、GTO戦略の背景は、私たちが考えなくてはなりません。

 

次回、各ボードファクターを説明変数として重回帰分析を行い、「GTOはボードの何を見て、CB戦略を決めているのか?」を検証します。

BBvsBTN(3betpot)におけるCB戦略について(理論値)

24時過ぎに投稿するよりは19時頃の方が目に留まりやすいかなと思い、前回、予約投稿機能と予約投稿ツイート機能を使ったところ、なんかツイートが変な感じになってしまったようです。

 

でも、これがあれば複数回分の記事を書き溜めて自動でポンポン放出できて良いですね。

 

記事を書き始めるとつい自分で盛り上がって突っ走ってしまう結果、1記事が長すぎる気もするので、意識して小分け投稿勢にシフトしたいもんです。

●BBvsBTN(3betpot)におけるベンチマーク・「理論値」の導出

まず前提として、GTO戦略は、複数のBetおよびアクションをかなり複雑に混合しており、実践でそうそう真似できるものではありません。

 

例として、下図は前回のシチュエーション(BBvsBTN(3betpot))での[Kd8d4h]におけるBBのCB戦略(GTO(Check/Bet(25%pot)/Bet(36%)/Bet(50%)/Bet(70%)/Bet(100%)))です。

 

ハンドごとの色分けを見ると、それぞれのハンドについて、BBのアクション比率がかなり細かく設定されていることがわかります。

f:id:NENDERS:20190204213016p:plain

f:id:NENDERS:20190204213027p:plain

しかし、GTOの最適アクション比率は混合されすぎているため、これを実戦で真似しようとするのは、かなり骨が折れそうです。

むしろ、アクションごとの最適頻度を気にしなければ、どのアクションをしてもGTO的に正解になるんじゃないかとすら思えます。

 

そこで、こうした混合戦略について、実践で活用できるよう簡単な「疑似GTO戦略」を体系化することがひとまずの目的です。

 

そのために、前回のシチュエーションをもとに、BBのCB戦略の理論値を考察します。

(ここでいう「理論値」とは、BBが複数のBetサイズを混合したGTOに基づき、特定のストリートで最適にアクションを採った場合に得られるEVとします。

EVは、以降のストリートでプレイヤーが最適にアクションした場合の期待値です。)

 

そして、理論値として計算されたEVと「疑似GTO戦略」によるEVの差が小さければ、「疑似GTO戦略」を最適GTO戦略の代替として活用することができそうです。

 

 ●CB戦略による理論値の導出

ということで、1000フロップにおける理論値を導出します。

ちなみに、ポジションの優位性云々は置いといて、OOPの分析はIPより簡単です。 

 

というのも、先般のBTNvsBB(2bet pot)と異なり、OOPの分析の特徴として、主に以下のことがあります。

・IPと異なり、Check or Betによってストリートの分岐が変わらない

(IPの分析では、自分のCheckによってターンに進むが、Betによって相手の「Fold or Call or Raise」アクションに進む。)

OOPの分析では、「CheckBet 0%pot」とみなし、HeroによるCBの平均Betサイズを比較的簡単に計算することができる。

 

・相手のdonk Betを考慮せずにすむ

⇒BBは、「Preflop3bet→FlopCB戦略」の一連の流れを確実に実行できる。

 

そんなOOP分析について、今回のBBvsBTN(3betpot)における理論値が以下の図になります。

f:id:NENDERS:20190204222821p:plain

通番が1~29しか映っていませんが、こんな調子で下には1000番まであります。

GTO+の良いところは、最近のアップデートでフロップボードのハイカード順にソートを並び替えてくれるところです。

 

ここでのGTO戦略は、前掲のとおり、GTO(Check/Bet(25%pot)/Bet(36%)/Bet(50%)/Bet(70%)/Bet(100%)の6種類のアクションを選択肢とし、これによって得られるEV値を今後の分析における「理論値」とします。

(本当は、Betサイズを1%区切りで200種類くらいのアクションをGTOに入れれば、より精緻な「理論値」が導出されますが、あまりに時間がかかるので省略します。)

 

ボードごとのEQ(エクイティ)は、GTOの結果云々に関わらず、ハンドレンジvsハンドレンジによって導出されるので、どんなCB戦略を採ろうと一定です。

私たちが追い求めるべき数値は、CB戦略の変化によってもたらされる赤枠内「EV」にあります。

 

では、1~1000番におけるEV値およびBetサイズの平均理論値は、どんな値でしょう?

1~1000番のボードについて、平均値を導出しました。

f:id:NENDERS:20190204225133p:plain

この図から、1,000ボードの16.00bbのpotに対し、BBが最適CB戦略を採った場合の平均理論値は、9.09bbとなりました。

また、BBの平均Betサイズは、右のAVERAGE_BETのとおり、33.18%potでした。

 

16.00bbのpotに対して9.09bbというと、BBは適切にCBを打てば、フロップ時点で平均56.8%のpotがEVとして見込めることになります。

 

この「56.8%」というのも、なんだか多いような少ないような数値ですね。

ですが、とりあえず3bet側はちゃんとした戦略でCBを打っていれば、potの55%を超えるEVを得られることがわかりました。

 

言い換えると、BBがプリフロ→フロップにかけて適切なハンドレンジおよびCB戦略を備えていれば、3betpotを開くたび、BBは平均1.25bb程度の利益(9.09bb-7.75bb:「flopのEV」-「Preflopの3bet額」)を獲得できるともいえそうです。

(3betによる相手のFoldやvs4bet等の展開を加味しない単純計算です。)

 

以上、今後の分析でベンチマークとして用いる理論値を計算できました。

次回は参考として、この理論値をボードのファクターごとに分析してみます。

BBvsBTN(3betpot)におけるCB戦略について(導入)

ポーカー界隈で著名なLillian氏の動画は、既に視聴済みですか?

www.youtube.com

当ブログの分析のスタートは、この動画にあります。

加えて、当時GTO+という廉価版Pioが出回ったことも、分析を始める一助となりました。

 

当時、それまではGTOという言葉もイマイチ苦手でしたが、この動画の「EV_Lossを基に、簡略化した疑似GTO戦略で実用化する」という考えに感銘を受けました。

 

そして、今では実際のハンドヒストリーから抽出⇒レンジ設定⇒解析の一連作業について、自動化する方までいらっしゃいます。

 

いやあすごいなあ。

このビックウェーブに乗って、GTO+からPioに乗り換えようか考えているところです。

 

---

さて、2月になったので新しいことを始めましょう。

 

前回までは、BTNvsBB(2bet pot)のCB戦略を解析してきました。

これまではIPであるBTN側の分析でしたが、今回からは、コメントでリクエストがあったBBvsBTN(3bet pot)におけるOOPのBB側を分析してみます。

 

目標としては、集合分析を経てGTO戦略の体系化を図り、実戦で簡単に使える「お手軽GTO」を策定することです。

それから、「モノトーン」や「ペアボード」といった、ボード毎のファクターがCB戦略にもたらす影響についても、研究できたら楽しそうですね。 

 

今回の分析において、設定した前提条件は、以下のとおりです。

●シチュエーション

・Preflop(100bb持ち)

BTN:2.5bb open

SB:Fold

BB:3bet 7.75bb

BTN Call 7.75bb

 

・Flop(16bb pot)

BB:GTO(Check/Bet(25%pot)/Bet(36%)/Bet(50%)/Bet(70%)/Bet(100%))

※BBは、GTOによって計算された上記6種のアクションの混合戦略を採る。

 

●ハンドレンジ

ハンドレンジの設定には、Poker SnowieのPreflop Advisorを参考にしています。

・BB(3Bet vsBTN 

f:id:NENDERS:20190131225228p:plain

3betを打つBBのハンドレンジには、[AA],[KK]といったプレミアハンドに加えて、[AKo],[AQo]など強いAハイ、また全ての[AXs]が含まれています。

 

そのほか、[KQo],[QJo]のコネクタと、10%程度のウェイト(10回に1回程度の頻度)ではありますが、[98s]~[54s]といったスーコネが含まれています。

 

これに対して、3betにCallするBTNのハンドレンジは以下のとおりです。

・BTN(Call 3bet vsBB)

f:id:NENDERS:20190131225347p:plain

BTNは、[KK](15%),[QQ](100%)といった強いハンドから、[64s],[53s],[22]といった弱いハンドまで、かなり広いレンジで3betに対してCallしていることがわかります。

ポケットペアの全部とスートワンギャッパーまでは、基本3betに対してCallできます。

 

なお、BBの3betに対する4betのハンドレンジは、[AA],[KK](85%)のプレミアに加え、(色の濃淡は見えにくいですが)[A8s]~[A2s]の20%程度を採用しています。

 

●フロップボード

フロップボードの組み合わせとして、GTO+におけるrandom flopsの最大値である1000フロップを用意しました(当社比2.5倍)。

2bet potに比べてハンドレンジが狭い影響か、想定より解析時間は短く済みました。

f:id:NENDERS:20190131233405p:plain

●BBのGTO戦略におけるアクション内訳

シチュエーションのとおりですが、BBvsBTN(3bet)において、potは16bbと設定。

 

GTOでBBが採り得るアクションは、Checkを含めた以下の6種類です。

BB:GTO(Check/Bet(25%pot)/Bet(36%)/Bet(50%)/Bet(70%)/Bet(100%))

 

f:id:NENDERS:20190131234348p:plain

f:id:NENDERS:20190131233956p:plain

※パーセンテージの内訳は、[9c4c5d]におけるBBの最適CB戦略分布。

 

この6種類のアクションを選択肢として、GTOはボードごとにBBのCB戦略を解析します。

まずは、GTO戦略の体系化に向けて、EV_Lossの基準となる「最適EV」を求めます。

---

長くなってしまいましたが、前提条件は以上のとおりです。

次回からは、BBvsBTN(3betpot)の集合分析に入ります。