サッカーの勝敗予測モデルをベイズモデル化する

  • このエントリーをはてなブックマークに追加

以前、サッカーの試合の勝敗をポアソン回帰を使って予測を行いました。
今回は上記モデルをベイズモデル化し、今後の発展的分析につなげていきたいと思います。

 

ベイズ統計と頻度統計の違い

厳密ではありませんが、おおざっぱに言うと下記です。
データの捉え方と母数の捉え方が違います。
 

頻度統計の考え方

・唯一無二のパラメータが決まっている(パラメータ=固定)
・得られたデータはサンプリングの結果たまたま得られたものとして扱う(データ=確率変数)
・得られたデータよって唯一無二のパラメータを推定する

 

ベイズ統計の考え方

・得られたデータを変更のしようがない唯一のものと考える (データ=固定)
・パラメータが確率的に変動するものとする(パラメータ=確率変数)
・得られたデータと事前分布によってパラメータを分布として推定する

 

分析内容

データ

プレミアリーグ2013-2014シーズンの全試合、2014-2015シーズンの1-19節
 

モデル

今回用いたJAGSコードは下記の通りです。

前回の記事同様、baselineと攻撃力・守備力・ホーム効果によってポアソン分布のパラメータであるラムダを推測するモデルです。
各パラメータの事前分布に関して、平均0の正規分布を仮定しています。

結果

結果は下記の通りです。いずれもRhat < 1.1となっているので収束していると判断することができます。  

攻撃力

attack

守備力

defense

その他のパラメータ

other

 
各チームの攻撃力・守備力をキャタピラプロットしてみると下記のようになっています。
一般化線形モデルで予測したものとほぼ同等の値となっています。
大きく違うのは、パラメータを唯一の値ではなく、分布として推定している点です。
下図の細線は2.5%-97.5%区間、太線は25%-75%区間、点は中央値です。
 

攻撃力

attack2

守備力

defense2

 
今回は事前分布の平均を0と仮定しています。
が、今回得られた値を事前分布に組み込むことで、
チームごとの各能力の推移を時系列でプロットできそうですね。
今後もベイズ統計の思想を使いながら、分析を掘り下げていきたいと思います。

  • このエントリーをはてなブックマークに追加