【千葉ロッテ荻野で学ぶ】二項分布で打率から安打数を予測できるか試してみた

2022年11月5日

当ページのリンクには広告やプロモーションが含まれています。

世の中は二項分布で溢れている

二項分布は成功か失敗か2通りの結果しかない場合に、成功回数が従う確率分布を求めることができます。

二項分布の公式の意味とExcelでグラフを描く2通りの方法を実演

 

成功か失敗かにしか適用できないので適用範囲が狭いように思えますが、表か裏かでもいいですし、遅れるか遅れないかでもいいですし、買うか買わないかでもいいわけです。

一人ひとりの消費者の買うか買わないかを複数の消費者について集めると、全体で何個売れるかの確率分布になりますが、消費者の数が多くなるにつれて正規分布に近づいていきます。

要するに、世の中で起きていることは要素分解していくと二項分布に従っている現象が多いと言えます。

 

打率も要素分解すれば二項分布になるはず

プロ野球の世界で重要な指標である打率も、1打席ごとにヒットを打つか打たないかに要素分解すれば二項分布を使えます。

例えば打率2割5分の打者なら、1試合で4打席回ってきたとしたら、その日は1本だけヒットを打って家に帰る確率が一番高いはずです。

勿論、毎日1本であるはずもなく、絶好調で4本打つ日もあるかもしれませんが、その確率は極めて低いはずです。

 

千葉ロッテ荻野の2021年打撃成績で検証する

試合別の打数と安打数を整理する

そこで、千葉ロッテマリーンズの不動のトップバッター荻野の2021年シーズン143試合分の毎日の安打数を調べ、最終打率である.296をpとする二項分布に従っているかを調べてみました。

 荻野の全打席の成績は、下記のサイトを参照させていただきました。

荻野貴司全打席成績|データで楽しむプロ野球

 

このデータを元に試合別に何打数何安打だったかを調べると、下記のようになりました。

 

試合によって5打席だったり4打席だったりしますので、確率は各打数ごとに計算しています。

2打数しか回ってこなかった試合は4試合しかありませんでしたので無視し、3~5打数の場合についてグラフにすると次のようになりました。

 

二項分布に従う場合の安打数を打数別に求める

一方、荻野の年間通算打率は.296でした。

二項分布を使うと、3~5打数の場合の安打数はどういう確率分布になるのでしょうか?

二項分布の公式によると、n回試行でk回成功する確率は、

でした。

従って、3打数の場合はn=3とすれば安打数の確率分布が計算できます。

Excelで計算すると次のようになります。

 

グラフにするとこうなります。

 

安打数の理論値と実績値を比較する

先ほど描いた実績グラフと比べてどうでしょうか?

大体同じ分布になっていますね。

同様に4打数、5打数の場合についても計算して、実績とどれくらい違うかを比較してみると、次のようになります。

 

3打数、4打数の場合は傾向は同じですので、サンプル数が増えればもっと近づいていくと思います。

 

5打数では理論値と実績値の乖離が大きいわけ

しかし、5打数の場合は傾向が異なっています。

二項分布では5打数1安打になる確率が一番高いのに対し、実績では5打数2安打が一番多くなっています。

5打数2安打ということは打率にすると4割ですので、普段よりかなり打っていることになります。

これは実際あり得ることで、5打数回ってくるということは相手ピッチャーの調子が悪くて、荻野だけでなく他のバッターも打ちまくったからこそ、5打席も回ってきたのでしょう。

実際、5打数回ってきた試合に限った打率を計算すると.319になっています。

しかも、中にはワンサイドゲームになってしまったために、相手チームが早い回から敗戦処理のピッチャーを出してきた試合もあったでしょう。

そういう試合ではマルチヒットの固め打ちが出易くなります。

 

つまり、確率pが一定でないということです。

二項分布は確率pが一定との仮定の下に成り立つ確率分布なので、この場合は成り立たないと言えます。

 

打数別に分けずに比較すると理論値と実績値は一致する

しかし、これで二項分布は使えないと諦めるのは早計です。

打数ごとに分けると、5打席の場合は特殊なために二項分布が当てはまりませんでしたが、分けなければ影響は薄まります。

実際、世の中の事象は確率pが一定でないことの方が圧倒的に多いですが、それがランダムに起こるなら確率変動と見なせます。

そこで、打数ごとに分けずに1試合当たりの安打数だけで見てみましょう。

 

年間の荻野の打数を合計すると570になります。

これを143試合で割ると、1試合当たりの打数はになります。

打数4、打率.296の場合の二項分布は先ほど求めてありますので、実績と比較すると次のようになります。

 

グラフに描くとこうなります。

 

ほぼ一致していますね。

サンプル数を多くすれば、更に近づくでしょう。

今度、「幕張の安打製造機」福浦和也の生涯打率で検証してみようと思います。

 

【Udemyの関連講座】

Excel(エクセル)による確率分布基礎講座【確率思考を身につけよう】

統計学の確率分布という優れた道具を理解し、実際にエクセルを使って確率分布を実践することで、確率的に考える思考プロセス(確率思考)を身につけましょう!