多項分布の計算式と使い方を具体例を使ってわかりやすく解説します。
多項分布が使える具体例
ある工場では、毎日時間指定で部品の納入があります。
これまでの実績によると、サプライヤーA社は±30分以内に到着する確率が50%、30分以上前に到着する確率が30%、30分以上遅れて到着する確率が20%です。
明日からの3日間で、±30分以内の到着が2日以上、30分以上の遅れが1日以内になる確率は何%でしょうか?
多項分布とは?
上の例で、ただ単に30分以上の遅れになるのが1日以内になる確率を求めるのであれば、二項分布の問題になります。
30分以上遅れる確率が20%なので、3日のうち1日だけ遅れる確率は、
3C1×0.21×(1-0.2)(3-1) = 38.4%
1日も遅れない確率は、
3C0×0.20×(1-0.2)(3-0) = 51.2%
となり、合計89.6%です。
ここでは、±30分以内に到着するのと、30分以上前に到着するのを区別していません。
ところが今回の問題では、これを区別する必要があります。
つまり、起こる事象が3つあるのです。
起こる事象が二つの場合は二項分布、三つ以上の場合は多項分布を使います。
多項分布の計算式
多項分布の式は次の通りです。
状態1、2、…、k をとる確率が p1 、p2 、…、pk のとき ( p1+p2+…+pk=1 ) 、N 回の試行で各状態を ni回 ( n1+n2+…+nk=N ) とる確率は次式で表されます。
N!/n1! … nk! (p1n1 … pknk)
多項分布の具体例をExcelで計算する
今回の例に当てはめてみましょう。
状態は3つあり、それぞれの確率pは次のように表されます。
状態1:±30分以内に着く、p1=0.5
状態2:30分以上前に着く、p2=0.3
状態3:30分以上遅れて着く、p3=0.2
また、今後3日間で取り得る状態は、次のように10パターンあります。
パターン1の確率を計算してみましょう。
N!/n1! n2! n3! (p1n1 p2n1 p3n3)
= 3!/1!1!1! (0.510.310.21)
= 0.18
残りのパターンについても同様に計算すると、次のようになります。
これらのうちで、±30分以内の到着が2日以上、30分以上の遅れが1日以内になるパターンは次の3つです。
これらの確率を足すと50%になります。
多項分布は二項分布の拡張
2つに1つの状態しか取らないような試行についての確率分布が二項分布でした。
多項分布はそれを3以上の状態にまで拡張したものです。
二項分布では成功/失敗の状態しか取れませんが、多項分布では多数の状態を取れるため、応用範囲は広くなります。
ただし、すべての状態の取る確率を足すと1になる必要があります。
この他に有名な離散確率分布としてベルヌーイ分布やカテゴリ分布もあります。
これら4つはまとめて勉強すると理解し易くなります。
ベルヌーイ分布/二項分布/カテゴリ分布/多項分布の関係をまとめてみた。
このように多項分布は二項分布の発展形になっていて離散確率分布の親玉みたいな存在なので、いろいろな場面で応用できます。
例えば、ある人材派遣会社から毎日作業員を手配しているが、手配できる人数に限りがあり、毎日必要人数を手配できていないとします。
この場合、過去データから30人手配できる確率20%、31人手配できる確率15%、、、のように確率分布が分かります。
そうすると、今後1週間(7回の試行)に30人以上確保できる確率は何%とか、90%以上の確率で確保できる人数は何人といったことを確率的に予想することができるようになります。
多項分布を使って人手を確保できる確率を計算する方法をExcelで実演