【具体例でわかりやすく解説!】超幾何分布は何に使えるの?|船便遅延確率の求め方を実演

2021年7月26日

カンボジアの卸売会社Aは日本から商品を輸入していますが、過去50回の輸入で18回、入荷が遅延しました。

今後10回の輸入で入荷遅延が3回以内になる確率は何%でしょうか?

 

超幾何分布とは

超幾何分布はN個の中に目的の物がM個含まれる時、N個の中からx個抜き出して目的の物がx個含まれる確率の分布です。

例えば、ジョーカーのない52枚のトランプがある時、10枚引いてキングが少なくとも1枚含まれる確率を求める場合などに使えます。

 

確率f(x)は次式で計算できます。

f(x) = M C x N-M C n-x / N C n

N:総数

M:目的の物の個数

n:取り出す個数

x: n個の中に含まれる目的の物の個数

 

トランプの例では次のようになります。

N=52

M=4

n=10

f(x)= 4 C x 48 C 10-x / 52 C 10

 

エクセルで計算すると次のようになります。

 

グラフにすると、このようになります。

従って、10枚の中にキングが少なくとも1枚ある確率は、

0.413445+0.424047=0.8375

となり、約84%になります。

 

適用する

冒頭の例に適用すると次のようになります。

 

グラフにすると次のようになります。

 

従って、10回の輸入のうち遅延が3回以内になる確率は、0~3回遅延する確率を足して、約48%になります。

 

過去のデータでは50回中18回ですので、遅延する平均確率は36%です。

調べたいケースは10回のうち3回以内の遅延ですので、確率は0~30%です。

だいぶ低い確率のように思えますが、こうなる確率は50%近くもあるのです。

 

エクセル関数で求める

超幾何分布はエクセル関数でも計算できます。

= HYPGEOM.DIST(x,n,M,N,FALSE)

FALSETRUEに変えると、累積確率を計算できます。

 

これを使って冒頭の例を計算すると次のようになります。

 

二項分布も一緒に学習すると理解が深まります。