【多項分布の使い方】サイクルヒットを打つ確率が高い選手の特徴を検証する
サイクルヒットを打つ選手の特徴を確率論で検証したい
1試合で1人の打者が単打、二塁打、三塁打、本塁打のすべてを打つことをサイクルヒットと言いますが、過去73年間で延べ76人が達成しています。
過去20年間で見ても21人達成しているので、平均年間1人ずつくらいが達成していることになります。
今年はDeNAの牧とヤクルトの塩見が達成しました。
牧は今季.314で打率3位、塩見は.278で13位でした。
牧はともかく、塩見の打率はそれほど高くありません。
サイクルヒットを打つバッターにはどんな特徴があるのでしょうか?
それを明らかにするために確率論を使って検証してみます。
多項分布でサイクルヒットを定式化する
バッターの結果には大きく分けて単打、二塁打、三塁打、本塁打、凡打の5通りあります。
サイクルヒットを打つ確率とは、凡打を除く4通りの安打を最低1回ずつ打つ確率のことです。
これは多項分布で定式化できます。
多項分布の式は下記の通りでした。
状態1、2、…、k をとる確率が p1 、p2 、…、pk のとき ( p1+p2+…+pk=1 ) 、N 回の試行で各状態を ni回 ( n1+n2+…+nk=N ) とる確率は次式で表されます。
N!/n1! … nk! (p1n1 … pk nk)
ベルヌーイ分布/二項分布/カテゴリ分布/多項分布の関係をまとめてみた。
サイクルヒットの確率を求めたい時は、次のように考えます。
単打、二塁打、三塁打、本塁打、凡打を打つ確率がp1 、p2 、p3 、p4、p5 の時、5打数で単打を1 回、二塁打を1回、三塁打を1 回、本塁打を1回、凡打を1回打つ確率は次式で表されます。
5!/1!1!1!1!1! (p11p21p31p41 p51)
但し、上では5打数4安打と仮定しています。
実際は4打数や6打数のこともありますが、過去の記録を見ると、ほとんどは4打数か5打数で達成しています。
従って、4打数4安打、5打数4安打、5打数5安打(4通り)の確率を足してサイクルヒットの確率とします。
牧と塩見がサイクルヒットを打つ確率
n塁打の比率を計算する
それでは、この式を使って今年の牧と塩見がサイクルヒットを打つ確率を計算してみましょう。
今年のセ・リーグの打率ランキングは次の通りです。
(2021年度セ・リーグ打撃個人成績|データで楽しむプロ野球 より抜粋)
まず、安打数に占める単打、二塁打、三塁打、本塁打の比率を下記のように計算します。
打率を考慮する
しかし単打、二塁打、三塁打、本塁打を打つ確率をp1 、p2 、p3 、p4とすると、上で計算した比率はpiにはなりません。
上で計算した確率は安打全体に占める各塁打の比率なので、安打が出る確率、つまり打率を掛けないといけません。(打率と比率の同時確率)
また凡打になる確率をp5とすると、p5=(1-打率)になります。
以上に注意してp1 ~p5を計算すると、次のようになります。
多項分布に当てはめサイクルヒットを打つ確率を計算する
これを多項分布の式に代入します。
4打席の場合は単打、二塁打、三塁打、本塁打が1回ずつ起きるので、
4!/1!1!1!1!1! (p11p21p31p41)
で計算できます。
5打席の場合は少し複雑で、
(単打、二塁打、三塁打、本塁打、凡打)=(1、1、1、1、1)
(単打、二塁打、三塁打、本塁打、凡打)=(2、1、1、1、0)
(単打、二塁打、三塁打、本塁打、凡打)=(1、2、1、1、0)
(単打、二塁打、三塁打、本塁打、凡打)=(1、1、2、1、0)
(単打、二塁打、三塁打、本塁打、凡打)=(1、1、1、2、0)
の場合に分かれますので、それらの確率の和になります。
従って、
5!/1!1!1!1!1! (p11p21p31p41p51) + 5!/2!1!1!1! (p12p21p31p41p50) + 5!/1!2!1!1! (p11p22p31p41p50) + 5!/1!1!2!1! (p11p21p32p41p50) + 5!/1!1!1!2! (p11p21p31p42p50)
で計算できます。
最後の列に1打席でサイクルヒットの出る確率に打数を掛けて、年間何本のサイクルヒットを打てるかを示す期待値を計算しました。
この値を見ると、サイクルヒットを達成した牧が0.23本で1位、塩見が僅差の0.22本で2位になっているのが分かります。
阪神近本が0.15本、巨人松原が0.13本と続きますが、やはり牧と塩見の2人が抜けていて、この2人がサイクルヒットを打つべくして打ったと言えます。
過去7年間ではソフトバンク柳田が最高確率
次に、過去7年間でサイクルヒットを達成した10人について、同じように分析してみましょう。
(サイクル安打達成者一覧|日本野球機構 より抜粋)
先ほどと同じように計算すると、次のようになりました。
こう見ると、必ずしも確率の高い選手がサイクルヒットを達成しているとも言えないことが分かります。
特に2016年の中日大島は年間期待値が0.06本なので、17年に1度の奇跡が起こるくらいの確率です。
入団時から毎年コンスタントに3割前後の打率を叩き出している大島であれば、17年間この年の調子を維持するのは可能かもしれませんが、かなり稀な出来事だったと言えます。
それに対して2018年のソフトバンク柳田の期待値は、大島の10倍もあります。
1年半に1度起こってもいいくらいの確率です。
このくらい高い確率であればもっとサイクルヒットを打っても良さそうなものですが、2018年は特別に高い確率だったようです。
しかし、他の年も低いとはいえ、今年の牧や塩見くらいの確率はありますので、あと何回かは達成するでしょう。
ミスターサイクルヒットは横浜ローズ
更に記録を遡ると凄い人がいました。
横浜のローズです。
タフィー・ローズではなく、ロバート・ローズです。
なんと、95年、97年、99年と2年おきに3回も達成しています。
6年間の年間期待値の平均は0.31で、3年に1度起こるくらいの確率です。
実際は2年に1度起こっていますが、決してまぐれではなかったことが分かります。
柳田と比較して凄いのは、年によるばらつきが小さいことです。
6年間の年間期待値の標準誤差(標準偏差÷平均)を計算してみると27%です。
対して柳田の場合は70%です。
柳田も年間期待値の平均は0.29でローズの0.31と遜色ありませんが、好不調の波が少ない方がサイクルヒットを達成する確率は上がるのでしょう。
イチローがサイクルヒットを打つ確率は高くない
サイクルヒットというと、三塁打を打つのが一番難しい印象があります。
その点、足の速い選手は有利です。
並みの選手なら二塁打のところを三塁打にできる確率が高まるからです。
それならば、打率が高くて足の速いイチローはサイクルヒットの申し子のようにも思えます。
しかし、意外なことに一度も達成していません。
そこで全盛期の1994年から2010年までの記録でサイクルヒットを打つ確率を計算してみました。
1994年から2000年までは日本のプロ野球、2001年以降はメジャーリーグでの記録です。
こう見ると、日本の7年間は年間期待値の平均が0.20と悪くありません。
今年の牧や塩見と比較しても遜色ない確率です。
確率的には1回くらいは達成しても良かったはずですが、運がなかったのでしょう。
一方、メジャーに行ってからの年間期待値の平均は0.12と低くなっています。
これは三塁打は多いものの、本塁打が少なくなったことが効いています。
サイクルヒットは打率、足、運、そして長打力も必要なことが分かります。