検索

目指せグランドマスター~AIを利用した鶴流高速学習法①/2~

更新日:5月10日



こんばんは鶴です。


ブリッジのサイトなのに3連続バックギャモンですいません。次からちゃんとブリッジの記事書く。。。と思うから許してね。


突然ですが、バックギャモンの強さって何でしょう?

前の記事にも書いたようにバックギャモンには将棋や囲碁と異なり、さいころの出目という明確な運要素が存在します。したがって、試合の勝ち負けでだけで決めてしまうと不正確さが残ってしまいます。もちろん、長期的には運の要素は収束していきますが、いずれにせよ数値で表すのは難しいです。困ってしまいました。


しかし、バックギャモンにはもう一つの性質があります。それはAIが全知全能、ほとんど神に匹敵する強さを持っているということです。将棋や囲碁は人類をとうに超越していますが、それでも日々進化を続けています。裏を返せばまだ神の領域には至っていないということです。しかしバックギャモンではAIを利用すれば、自分の差した手が最善かどうかはもちろん、最善手と比べて勝率を何パーセント損したかもはっきり調べることができます。厳密にはバックギャモンAIにもまだ改善点はあるでしょうが、改善したところでもう強さは大きくは変わらないでしょう。


この性質を利用し、どれだけAIに近いうち回しをできたかという指標「PR」が存在します。

PRは「自分のエラーの合計値」/「選択肢が存在する判断の数」*500であらわされます。


「自分のエラー」とはなにかというと、たとえば最善手を指せば確実に1点とれる局面で、悪手を指してしまったばっかりに期待値0.9点にしてしまった場合、エラーは0.1点になります。試合中何百回と選択は来るので、合計値はこれを全て足し合わせます。ちなみにギャモナーたちは1000倍して0.1点のエラーは100点と表現することが多いです。


「判断の数」はムーブとキューブの判断数の合計で、ムーブは基本的にさいころを振った数ですが、何をやっても変わらない場合や、強制手の場合は数に入りません。キューブはさいころを振る前に、ダブルを打つか、打たないかの判断の数ですが、明らかな場合(200点以上ノーダブル)や意味のないキューブは判断に入りません。


厳密な定義は一度おいておいて、ざっくり500ムーブごとに何ポイント分期待値を損失しているかがPRです。このPRが小さいほど、コンピューターに近い動きができたという意味になり、強さを測る指標になります。

もちろん、機械にどれだけ近いか、ということだけが指標になるわけではありません。対戦相手は人間なので、相手のミスを誘うのが実践的にはいいこともあります。


PRを基にしたざっくりとした強さは大体以下の通りです。

PR30ぐらい・・・ルール覚えて初めてやった人

PR20以下・・・初級者

PR15以下・・・中級車

PR10以下・・・上級者

PR6以下・・・マスター

PR4以下・・・グランドマスター(現在68人)

PR3以下・・・世界トップ10

PR2.13・・・現在の世界1位 望月さん


ちなみに今の世界トップ3は全員日本人です。日本はプレイヤーの平均レベルが高いバックギャモンの超強国なのでした。


バックギャモンプレイヤーの中で超強豪と呼ばれるのはこの中でPR4以下の人、つまりグランドマスターです。現在は世界に68人いますが、認定を受けていないだけで実力的にグラマス級の人はもっといることでしょう。


2.強くなる戦略(PR6まで)


さて、ぼくはバックギャモンを始めて、ルールも大してわからずに代官山のカフェミケランジェロに乗り込みます。とっても親切に教えてもらいましたし、みんな気さくでいい人でした。


当時の僕が知っていた戦い方、というか直観で思ったのは、相手の駒はヒットしたほうがいい。自分の駒はヒットされない方がいい。ぐらいでした。練習しているうちにとある人がわざと自分の駒をバラバラにしてきました。当時の僕は「接待プレイ?」とか思いつつどんどんヒットしていきます。勘のいいひとならもうわかるでしょう。そう、バックゲームです。


バックギャモンの5戦術の中で最も難易度が高く、最もらしさがあるバックゲームの罠に見事にはまった鶴はきれいな逆転負けをしてしまいます。


「こんな戦い方があるのか。バックギャモンって奥が深い!もっと学んで強くなろう!!」・・・とはなりませんでした。


意図的なバックゲームが期待値最善でないことは始めて1日目の僕にでもわかります。つまり「僕のことを初心者だと思ってなめたプレイをしたことを必ず後悔させてやる」と思ったのでした。


そう、鶴はひねくれているのです。


ひとまずバックギャモンブックとインターネットバックギャモンクラブの動画を見て、何となくの戦術を学びます。この後バックギャモン王位戦というイベントがあり、それにもお邪魔させていただきました。とても楽しかったですし、みんなが真剣にボードゲームをやっているのを見て、すごいなあと思いました。

今はないですが、Backgammon Aceというアプリでも多少練習しましたし、PRも近似的に求められました。初めて数日、学習時間10時間ほどで僕のPRは10は切る程度になります。


初心者におすすめの動画です。(シリーズものの1個目です)

https://www.youtube.com/watch?v=9r7UTLLMC_c&t=99s


10を切るまではバックギャモンブックを読むことと基本的な動画を見ることがおすすめですし、数学、特に幾何が得意だったらわりと簡単にいけます。


このころはほかのこともいろいろと忙しく、ごくたまにアプリで遊ぶ程度でバックギャモンはあまりやりませんでしたが、そんなことをしているうちに、「オンラインバックギャモン王位戦」まで1か月に迫っていました。コロナでオンラインになってしまった王位戦ですが、参加する以上トレーニングするしかありません。僕は中級レベルででようとおもっており、そこにはPR6ぐらいの人までいるという前情報をつかみます。ここから1か月でPR10から6に改善する目標がたちます。


単純計算で1週間で1ずつ改善していかなければいけません。さすがにこれは適当にやっても無理です。とりあえず作戦を立ててみます。


〇PR6は基本的なことができれば到達できるレベルらしいので、頻出系を多くこなす。できるだけすぐ復習できた方がいい。

〇中級戦に出る人はどう考えても僕より経験値が圧倒的に多いので、不慣れな局面、つまり経験の差が出そうな場面は意図的にカットする

〇エラーが大きくなりがちなキューブ判断はできるだけたくさんのサンプルを記憶する


とまあ拙いながらも当時の僕はそんなことを考えていました。さて、こういうことに最適なのはXG2 (eXtreme Gammon 2)と呼ばれるソフトです。お値段は10000円はしないぐらいの有料ソフトですが、使いやすく、AIとの対戦およびその解析ができます。

https://www.extremegammon.com/default.aspx



僕は訓練にXG2と対局を繰り返すことを基本戦術としました。これには当然メリットとデメリットがあります。

〇XGの棋譜は美しく、必ず正しい手を指してくるので相手の指し手が非常に参考になる

〇XGは世界最強なので、今後誰と対局してもひるむことがなくなる

〇いつでも練習できるしどれだけ検討してもいい

〇キューブを打つタイミングの感覚が付きやすい

〇人間に指摘されるのがあまり好きでない僕もXGの言うことは素直に受け入れられる。


×変な手は絶対指さないので、似た局面が多くなる

×エラーの理由は説明してくれない

×XGからキューブのうち遅れが絶対ないので、キューブはかなりテイクが正解


欠点はいくつかありますが、珍しい局面にする気はあまりないうえPR6ぐらいなら最初の問題はあまり関係ありません。

エラーを説明してくれないことに関してはtwitterやdiscordの質問版、中高大の後輩いずみーぬくんとの練習で解決、キューブに関しては専用の本を買って練習しました。


1日1回5ポイントマッチをXGと練習してそのエラーを片っ端から記憶、整理していきます。

このころが一番成長を実感できて楽しい時期です。


ここでのポイントは『エラーを見て、正解と見比べて何が違うのかという理由を出す』だけでは足りないということです。それはただ仮説を出したにすぎません。仮説は検証する必要があります。理由がわかったら類似系でその仮説が成り立っているか、違う仮説にした場合しっかり成り立たないかを検討することで初めて仮説は実証されます。


バックギャモンは微妙なポジションの違いで最善手が変わる非常に厄介な性質を持っているので、『ざっくりこういうときはこっちのほうがいいのか』ぐらいだと不正確な可能性がかなり高いです。これに気が付いた時にはトレーニングを開始しして2週間以上たっていました。だいぶ効率のロスです。


そんな感じで50試合以上1か月で練習して、本番に挑みました。合計練習時間は50時間ぐらいはあったと思います。


XGとの対戦では平均PRは5点台に入っていましたが、実践は6点台で、目標は達成できませんでしたが、まあまあなところです。理由はシンプルで、人間とやると避けようとしても珍しい局面にどうしてもなりやすくなってしまうからです。


予選をいい感じで通過しましたが、準決勝で負けてしまいます。この時の敗因は僕にとっては盲点でした。


・・・持ち時間です。XGとやるとき大量に思考をしていた僕は持ち時間のことは一切考えてなかったのでした。実践想定がなかったのです。


そう、鶴はつめが甘いのです。


PR6を目指す場合はXGと大量に練習するのがおすすめ。苦手分野は本を読んだ方がいい。



2.強くなる戦略(PR4まで)


このころから僕はこんなことを思います。

『最短かつ最小の努力でグラマス級のPRが出せるようになりたい』


そう、鶴は怠惰なのです。


バックギャモンの練習を始めて1か月で10が6になるならあと2週間で4になるんじゃね?と甘く考えた僕はうかつにもそんなことを考えたのでした。というわけで、XGとの練習を繰り返します。

大会が終わってモチベーションは落ちていたのでゆるゆると数か月かけてXGの癖?的なものは大体理解して、200戦ほど戦った後、XG対戦での50試合平均PRは4を切れるようになります。ゆうてバックギャモンも大したことないなと思っていた鶴ですが、この後足元をすくわれることになります・・・


(後半へ続く)




閲覧数:603回0件のコメント

最新記事

すべて表示