【エクセルで実演!】二項分布のグラフの描き方を具体例でわかりやすく解説

2021年8月4日

コインを10回投げて、表は何回出るでしょうか?

5回出る確率が一番高そうですが、4回かもしれませんし、3回しか出ないかもしれません。

この時、表が0回、1回、2回、、、10回出る確率をまとめた確率分布のことを、二項分布と言います。

理論的には、こんなグラフになります。

 

なぜこのようなグラフになるのかと、グラフの作り方について解説していきます。

 

二項分布の式の意味

成功する確率をpとします。

すると失敗する確率は1-pですね。

 

10回試行して、1回だけ成功する確率を求めてみましょう。

それはこのように考えます。

10回試行して1回だけ成功する組み合わせの数はいくつでしょうか?

1回目だけ成功、2回目だけ成功、、、、10回目だけ成功の10パターンですね。

 

一方、1回だけ成功するということは、残りの9回は失敗するということです。

その確率は、

p1×(1-p)9

となります。

 

そして、この確率になるケースが10パターンありますので、10パターン全部併せた確率は、

10×p1×(1-p)9

になります。

 

同様に、10回試行して、2回だけ成功する確率を求めてみましょう。

10回試行して2回だけ成功する組み合わせの数はいくつでしょうか?

これは手計算では大変ですので、組み合わせの数を求める公式を使いましょう。

>> 【順列と組み合わせを学びなおす!】具体例を使ってわかりやすく解説します。

 

n個からk個を選ぶ組み合わせの数を求める公式は

nCkn! / (n-k)!k!

でした。

 

従って10回試行して2回だけ成功する組み合わせの数は、n=10、k=2として

10C2=10! / (10-2)!2!=45通り

で求められます。

 

一方、2回だけ成功するということは、残りの8回は失敗ですので、その確率は

p2×(1-p)8

になります。

 

そして、この確率になるケースが45パターンありますので、45パターン全部併せた確率は、

45×p2×(1-p)8

になります。

 

以下、同様に3回成功する確率、、、、10回成功する確率も求められます。

これを一般化すると、k回成功する確率は

10Ck×pk×(1-p)(10-k)

となります。

 

これは10回試行の場合ですので、n回試行でk回成功する確率は、

nCk×pk×(1-p)(n-k)

となり、これが二項分布の確率分布になります。

 

二項分布のグラフの描き方

それでは、冒頭のグラフをエクセルで作ってみましょう。

いかさまコインでなければ表が出る確率は0.5ですので、p=0.5です。

また10回試行ですのでnは10です。

従ってk回表が出る確率分布は

10Ck×0.5k×(1-0.5)(10-k)

で表せます。

 

これをエクセルで計算すると次のようになります。

 

この赤で囲んだ確率の数値をグラフにすると、冒頭のグラフになります。

 

なお、エクセルにはこの確率分布を一度に求める関数が用意されています。

BINOM.DIST関数で、次式のように使います。

=BINOM.DIST(成功数,試行回数,成功確率,関数形式)

 

下図のように入力すると、途中の計算をすることなく、一度に同じ確率が計算されます。

 

まとめ

成功か失敗か?

表か裏か?

など、2つに1つの結果しかない試行をn回行って、k回成功、または表になる確率分布を二項分布と言います。

 

1回の試行で成功する確率をpとすると、k回成功、または表になる確率は、pk×(1-p)(n-k)にn個の中からk個を選ぶ組み合わせの数nCkを掛けた数になります。

nCk×pk×(1-p)(n-k)

 

また、二項分布には興味深い性質があります。

それは平均がnp分散がnp(1-p)になることです。

 

冒頭の例で確認してみましょう。

10回の試行で、表の出る確率が0.5ですから、n=10、p=0.5です。

従って平均:np=5分散:np(1-p)=2.5です。

標準偏差は分散の平方根ですので、標準偏差は1.6です。

平均±標準偏差には全体のデータの約68%が含まれるのでしたね。

>> 【標準偏差の気持ち】標準正規分布表の使い方をわかりやすい言葉で徹底解説

 

グラフで確かめると、確かにそうなっていることが分かります。