【逆転オセロニア】オセロニア学会(ORS2025)というものに参加してみた

遡ること1ヶ月ほど前、8月16日～17日に開催されたオセロニア学会(Othellonia Research Symposium 2025)というものに講演者として参加させて頂きました！

この学会は、かのディートリヒ研究所で知られるgeonさん(@geon16400684)が発起人のイベントで、オセロニアに関する様々な研究成果等を発表するオンライン形式のシンポジウムという、非常に斬新で画期的なイベントです。

オセロニアンでオンラインの学会や研究会を開催したら楽しそうだよねー

構築論, 定石, ダメージ計算, 新駒提案...

なんでも好きなことをプレゼン発表して意見交換する場があれば（妄想）#オセロニア
— geon (@geon16400684) June 18, 2025

このポストに対して多くの反響・賛同の声があったようで、その後geonさんの迅速な企画力によって現実のオンラインイベントとして具現化したのでした。

予想以上に反応をいただいたので、もう少しだけ妄想を膨らませます🤤

架空のオセロニア研究会参加登録フォームを作ってみました（は？）↓↓https://t.co/i0ZJiAGuL1

ご興味あれば是非この茶番にお付き合い下さい(回答が多ければ、存在しない研究会のタイムテーブル作ってみます笑)#オセロニア https://t.co/qC40oR04lI pic.twitter.com/7uXsqBiBBv
— geon (@geon16400684) June 19, 2025

そして、私は光栄にもgeonさんよりお声がけいただき、「初手の神ブラは何故成功しないのか？（オセロニアと認知バイアス）」と題して発表させて頂きました。

発表の内容としては、以前、本ブログ上でも取り上げたことのある「なぜか初手の神ブラガチャの成功率が低い気がする」問題に加えて、「対戦で自分がS駒を引く確率が不当に低いと感じる」問題について、実戦において蓄積されたデータを基に考察し、認知バイアスという心理的な側面も絡めて説明を試みた、というものでした。

othellonia-ron.hatenablog.com

当日の発表内容

ここからは、当日の発表スライドをダイジェスト形式で掻い摘んで紹介したいと思います。

正直に白状すると、実はこの発表資料は発表の当日にほぼ1日で作成したものであり、クオリティに関しては公開するのが恥ずかしいものであることをご了承頂きたいと思います(もちろん、頭の中でなんとなくのストーリー案は組んでいましたが、実作業としてスライド化する時間がなかなか取れず…)。

それでは本題の発表内容に移ります。

序論

まずは問題提起。皆さんもこんな経験ありませんか。

なんで自分ばっかりこんな運悪いんだ、これは「確率操作」だ！と。そして憤り、気付けばこんな顔をしてスマホを握っている。

でもそれって、本当に偏っているのでしょうか？というのが本発表の問題提起。

試合における相手とのS駒差

そこで、まずは試合における相手とのS駒差について検証してみました。ある1ヶ月間のグローリーモードにおいて、自分と相手がS駒を使うことができた数を実戦の中でカウントし、集計した結果の報告です。

ここで「S駒を使うことができた」というのは、盤面に出すことができた回数を指し、例えばターン数スキルを終盤に引いてしまった場合など「手駒に引けたけど出せなかった」場合はカウントしていません。これは、相手の手駒を知ることができないためです。自分も相手も手駒に引けただけ(出せなかった)の回数をカウントしないことで、前提条件を揃えてフェアな比較になるようにしています。

また、ニヌルタや嫁アイリアなど、オーラとして仕事をするS駒の場合は、手駒で発動するオーラの効果が見えた時点で「S駒を使うことができた」としてカウントしています。

全213戦の結果を集計すると、自分はS駒を299回、相手はS駒を273回使うことができました。

しかし、ここで1つ注意すべき点があります。私は213戦すべてをS駒リーダーのデッキで戦いましたが、相手が使用するデッキの中には神殴りデッキやラウナス混合デッキなど、A駒リーダーのデッキがそれなりに混ざっていました。

S駒リーダーの場合は試合開始時点でS駒を確実に1つ手駒に引けており、サブS駒を1つ引ければS2となるのに対し、Aリーダーの場合は1つ目を引いてきてようやくスタート時点の相手のS駒数に並び、そこからさらにもう一つ引けないとS2にはなりません。つまりS引きを考える際、リーダーのレアリティによる不公平さが存在しているということになります。

そこで今度は、相手のデッキがA駒リーダーだった場合の試合を除外して再集計してみると、なんと自分も相手もS駒使用回数は224回となり、お互いに1回も差がないという結果になりました！

試合の中では、「なんで相手ばっかりS駒を引けるんだ…」「あんまりだよ、けいじぇいさん…」という思いを抱きながらプレイしていましたので、この結果には正直なところ驚きを隠せませんでした。

では、なぜプレイ中に受けた印象と実測データにこのような乖離が生じたのか、というと、そこには「認知バイアス」の関与が示唆されます。

認知バイアスとは、人間の考え方や判断が、無意識のうちに偏ってしまう心理的なクセや傾向のこと(ChatGPTより)です。誤解を恐れずにもっと噛み砕いて簡単に言うと、「思い込み」や「偏見」などに似たニュアンスだと捉えることもできると思います。

認知バイアスというのは日常生活の様々なところにも見られ、ありがちな失敗や悲劇をまとめた有名な「マーフィーの法則」の中にも、認知バイアスが関連する事例がいくつか含まれています。

例えると、「テーブルから落下するトーストはよりによってバターを塗った面を下にして落下する」「洗車をした直後に限って雨が降る」などといったものがそれにあたります。

実際にはこれら事象の因果には科学的根拠はないものの※1、たまたま悪い結果に終わった時の印象が強く残っているために、同じシナリオに陥ったときに「どうして毎回毎回こうなるんだ」という思いとともにその印象が補強されていき、その人の中で悪い「法則」として確立されていくというプロセスが存在するのだと考えられます。

※1 トーストの事例では、テーブルの高さが結果に関係しているとする研究結果も一応あるにはある

それでは、オセロニアにおける「マーフィーの法則」的な事象はあるか？というと、個人的には「初手の神ブランジェッタのゾノバ召喚位置は失敗しがち」というものが当てはまります。

初手にゾノバ召喚を理想の位置に決められると、相手からすぐに消されないだけでなく、すぐにコンボができてアドを稼ぐことができます。

しかし失敗すると、相手は何も進行を工夫することなくゾノバを即消しできるので、ルインスキルを2ターン入れることができないだけでなく、コンボも使うことができなくなります。

ゾノバ召喚が成功するか失敗するかは、特にオーダーCを達成したいツクヨミデッキにとっては天と地、雲泥の差となる一方で、先行の場合は約67%、後攻の場合は50%という高い確率で即座にコンボを使える場所にゾノバが出るので、大きいリスクがありつつも実行する価値がある「神ブラガチャ」として知られています(？)

そこで、初手に神ブランジェッタを引けた場合のゾノバ召喚位置を集計してみた、という試みを「実際に測ってみた(その2)」として報告させて頂きました。

先行の初手神ブランジェッタの成功率

まず先行の場合、全93回の試行回数のうち、普通の進行で消されにくい位置に召喚された回数は54回であり、確率にして58.1%で当たりを引くことができました。これは理論値(66.7%)よりも若干低い成功確率でした。

では、この確率が誤差の範囲と言えそうかどうかを見ていきます。

今回の神ブラガチャの確率変数は二項分布に従うとしてモデル化することができ、このとき期待値は62回、分散は20.666…と算出できます。

そして、標準偏差は分散の平方根をとって約4.55と計算できます。

正規分布に近似した際のばらつきの範囲は、1σ(全体の約68%がこの範囲に入る)を仮定すると、成功回数は57.45回～66.55回の範囲に収まることになりますので、今回の54回という成功回数は少しだけ低いということができそうです。

2σ(約95%が入る)の範囲を取ると52.9回～71.1回となり、その中には収まることから、54回というのは誤差の範囲と言うことができるかなと思います。また、試行回数nが93回と少ないことにも注意しなければなりません。

後攻の初手神ブランジェッタの成功率

続いて、後攻の場合の結果です。

後攻では、全90回の試行回数を通じて、成功35回に失敗55回という結果を得ることができました。これは、成功確率の理論値50%に比べると、いくぶん失敗側に偏っている印象を受けます。

先行の場合と同様に、二項分布に従う事象として標準偏差を計算すると約4.74となり、1σで40.26回～49.74回の範囲、2σで35.52回～54.48回の範囲を取ると考えられます。

したがって、90回の試行回数のうち、成功回数がたった35回というのは、2σの95%信頼区間からも外れており、期待値からかなり外れた少ない値だったと評価することができます。

S駒差の場合とは異なり、初手のゾノバ召喚場所のデータは割とプレイ中の実感と近しい印象がありました。

ただし、試行回数が90回と少ない中でのデータであり、n数をさらに増やしていくことで統計的に収束していく可能性もあることから、「後攻の神ブラガチャは理論値よりも成功しにくい！」「確率◯作だ！」と結論付けるには尚早だと思われます。

よって、信頼性がより高い検証となるよう、今後も継続してデータを蓄積していこうかなと思っております。

最後に、発表の主旨となるメッセージとして、以下のようなスライドを示させて頂きました。

S駒を引ける・引けない、手駒の引きの良し悪し、召喚の位置など、試合中のランダム事象の結果というのは、試合に熱中すればするほどネガティブな印象が強烈に残りやすく、それが積み重なると感情的に荒れていきやすいのかなと思います。

そこで、多少面倒であっても「本当に相手よりもS駒を引けていない？」「ひょっとして認知バイアスが影響してはいないだろうか？」などという仮説に基づいて、自分の中で統計データを蓄積していき、そのデータの前提を揃えたりノイズを除去したりする(例：先ほどのA駒リーダーの試合の除去など)ことで結果を正しく解釈するというプロセスを踏むことで、一時的な感情に流されることなく試合に向き合うことができるようになるというライフハックです。

この、「仮説の立案」→「精度の良い測定」→「データの解釈」（→「次のアクションの決定」）という一連のプロセスは、オセロニアに限らず、様々な取り組みに対して普遍的に応用できる考え方なので、慣れて習慣化しておくことをオススメします。