二項分布の公式の意味とExcelでグラフを描く2通りの方法を実演
コインを10回投げて、表は何回出るでしょうか?
5回出る確率が一番高そうですが、4回かもしれませんし、3回しか出ないかもしれません。
この時、表が0回、1回、2回、、、10回出る確率をまとめた確率分布のことを、二項分布と言います。
理論的には、こんなグラフになります。
なぜこのようなグラフになるのかと、グラフの作り方について解説していきます。
二項分布の公式は各パターン組み合わせの数に確率を掛けた総和
成功する確率をpとします。
すると失敗する確率は1-pですね。
10回試行して、1回だけ成功する確率を求めてみましょう。
それはこのように考えます。
10回試行して1回だけ成功する組み合わせの数はいくつでしょうか?
1回目だけ成功、2回目だけ成功、、、、10回目だけ成功の10パターンですね。
一方、1回だけ成功するということは、残りの9回は失敗するということです。
その確率は、
p1×(1-p)9
となります。
そして、この確率になるケースが10パターンありますので、10パターン全部併せた確率は、
10×p1×(1-p)9
になります。
同様に、10回試行して、2回だけ成功する確率を求めてみましょう。
10回試行して2回だけ成功する組み合わせの数はいくつでしょうか?
これは手計算では大変ですので、組み合わせの数を求める公式を使いましょう。
「順列」と「組み合わせ」の具体例と計算方法をわかりやすく解説
n個からk個を選ぶ組み合わせの数を求める公式は
nCk=n! / (n-k)!k!
でした。
従って10回試行して2回だけ成功する組み合わせの数は、n=10、k=2として
10C2=10! / (10-2)!2!=45通り
で求められます。
一方、2回だけ成功するということは、残りの8回は失敗ですので、その確率は
p2×(1-p)8
になります。
そして、この確率になるケースが45パターンありますので、45パターン全部併せた確率は、
45×p2×(1-p)8
になります。
以下、同様に3回成功する確率、、、、10回成功する確率も求められます。
これを一般化すると、k回成功する確率は
10Ck×pk×(1-p)(10-k)
となります。
これは10回試行の場合ですので、n回試行でk回成功する確率は、
nCk×pk×(1-p)(n-k)
となり、これが二項分布の確率分布になります。
二項分布グラフの2通りの描き方
二項分布の公式から計算する方法
それでは、冒頭のグラフをエクセルで作ってみましょう。
いかさまコインでなければ表が出る確率は0.5ですので、p=0.5です。
また10回試行ですのでnは10です。
従ってk回表が出る確率分布は
10Ck×0.5k×(1-0.5)(10-k)
で表せます。
これをエクセルで計算すると次のようになります。

この赤で囲んだ確率の数値をグラフにすると、冒頭のグラフになります。
Excel関数を利用する方法
なお、エクセルにはこの確率分布を一度に求める関数が用意されています。
BINOM.DIST関数で、次式のように使います。
=BINOM.DIST(成功数,試行回数,成功確率,関数形式)
下図のように入力すると、途中の計算をすることなく、一度に同じ確率が計算されます。

おまけ:二項分布の平均と分散
二項分布には興味深い性質があります。
それは平均がnp、分散がnp(1-p)という簡単な式で表されることです。
冒頭の例で確認してみましょう。
10回の試行で、表の出る確率が0.5ですから、n=10、p=0.5です。
従って平均:np=5、分散:np(1-p)=2.5です。
標準偏差は分散の平方根ですので、標準偏差は1.6です。
平均±標準偏差には全体のデータの約68%が含まれるのでしたね。
【標準偏差を使えば確率が分かる】標準正規分布表の使い方をわかりやすく解説
グラフで確かめると、確かにそうなっていることが分かります。
二項分布の使い方については、下記の記事で具体例で解説しています。
【千葉ロッテ荻野で学ぶ】二項分布で打率から安打数を予測できるか試してみた