【具体例でわかりやすく!】多項分布は何に使えるの?|納品遅延確率の予測を実演

2021年7月29日

ある工場では、毎日時間指定で部品の納入があります。

これまでの実績によると、サプライヤーA社は±30分以内に到着する確率が50%、30分以上前に到着する確率が30%、30分以上遅れて到着する確率が20%です。

明日からの3日間で、±30分以内の到着が2日以上、30分以上の遅れが1日以内になる確率は何%でしょうか?

 

多項分布とは

上の例で、ただ単に30分以上の遅れになるのが1日以内になる確率を求めるのであれば、二項分布の問題になります。

30分以上遅れる確率が20%なので、3日のうち1日だけ遅れる確率は、

3C1×0.21×(1-0.2)(3-1) = 38.4%

1日も遅れない確率は、

3C0×0.20×(1-0.2)(3-0) = 51.2%

となり、合計89.6%です。

 

ここでは、±30分以内に到着するのと、30分以上前に到着するのを区別していません

ところが今回の問題では、これを区別する必要があります。

つまり、起こる事象が3あるのです。

起こる事象が二つの場合は二項分布、三つ以上の場合は多項分布を使います。

 

多項分布の式は次の通りです。

状態1、2、…、k をとる確率が p1 、p2 、…、pk のとき ( p1+p2+…+pk=1 ) 、n 回のうち ni 回 ( n1+n2+…+nk=n ) とる確率は次式で表されます。

n!/n1! … nk! (p1n1 … pknk)

 

エクセルで計算

今回の例に当てはめてみましょう。

状態は3つあり、それぞれの確率pは次のように表されます。

 

状態1:±30分以内に着く、p1=0.5

状態2:30分以上前に着く、p2=0.3

状態3:30分以上遅れて着く、p3=0.2

 

また、今後3日間で取り得る状態は、次のように10パターンあります。

 

パターン1の確率を計算してみましょう。

n!/n1! n2! n3! (p1n1 p2n1 p3n3)

= 3!/1!1!1! (0.510.310.21)

= 0.18

 

残りのパターンについても同様に計算すると、次のようになります。

 

これらのうちで、±30分以内の到着が2日以上、30分以上の遅れが1日以内になるパターンは次の3つです。

 

これらの確率を足すと50%になります。

 

まとめ

2つに1つの状態しか取らないような試行についての確率分布が二項分布でした。

多項分布はそれを3以上の状態にまで拡張したものです。

 

二項分布では成功/失敗の状態しか取れませんが、多項分布では多数の状態を取れるため、応用範囲は広くなります。

ただし、すべての状態の取る確率を足すと1になる必要があります。

 

例えば、ある人材派遣会社から毎日作業員を手配しているが、手配できる人数に限りがあり、毎日必要人数を手配できていないとします。

この場合、過去データから30人手配できる確率20%、31人手配できる確率15%、、、のように確率分布が分かります。

そうすると、今後1週間(7回の試行)に30人以上確保できる確率は何%とか、90%以上の確率で確保できる人数は何人といったことを確率的に予想することができるようになります。

>> 多項分布の応用例【バイト確保人数の確率を求める】