【指数分布の応用】確率1%の賭けを100回繰り返して勝つ確率は?
コインを2回投げて表が出る確率は?
1回投げて表が出る確率は1/2ですね。
だからと言って、2回投げれば必ず表が出るとも限りません。
難しいですね。
当選確率1,000万分の1の宝くじを1,000万枚買った人が当選する確率は?
宝くじは還元率の悪い賭けなので、このような買い方をして必ず当選するとしても元は取れません。
でもどれくらい当選する確率があるのか知りたいですね。
年間365回起こる事故が1日目に起こる確率は?
事故は均等に起こるわけではなく、1日に3度起こる日もあれば、一度も起こらない日もあります。
ですので、最初の日には無事故かもしれません。
起きる確率は何%か?
これも難しいですね。
実はこれらの確率はすべて63%になります。
不思議ですね。
これは指数分布を使えば導けます。
まずは指数分布の復習から入りましょう。
指数分布を使ってロングテール商品の欠品による機会損失を推定する
指数分布の確率密度を求める公式
1日にλ回起こる事象が1日目で最初に起こる確率、2日目で最初に起こる確率、、、をまとめたものが指数分布です。
サイクルの単位は日でも週でも年でも時間でも回数でも構いません。
つまり、1回当たりにλ度起こる事象が1回目で最初に起こる確率、2回目で最初に起こる確率、、、も同じく指数分布に従います。
そしてx回目に最初に起こる確率は
f(x) = λe–λx
x:サイクル数
λ:サイクル内で事象が起こる平均回数
で計算できます。
これが指数分布の確率密度を求める公式になります。
指数分布の累積分布を求める公式
次にx回目までに起こる確率はどうやって求めればよいでしょうか?
1回目で最初に起こる確率+2回目で最初に起こる確率+、、、+x回目で最初に起こる確率
で求められますね。
これは先程の指数分布の確率密度の累積和、つまり積分です。
従って、次のように計算できます。
これが指数分布の累積分布を求める公式です。
コインを2回投げて表が出る確率
これを使って、2回コインを投げた時に最低1度は表が出る確率を求めてみましょう。
イカサマコインでなければ表が出る確率は2回に1回ですので、1回投げれば0.5回表が出るはずです。
つまり、この場合λ=0.5です。
これを指数分布の累積分布を求める公式に当てはめると、
F(x) = 1 – e–λx
= 1 – e-0.5x
になります。
2回目までに表が出る確率を求めたいので、xに2を代入して
F(2) = 1 – e-0.5×2
= 0.632121
になります。
つまり、コインを2回投げて表が出る確率は63%です。
当選確率1,000万分の1の宝くじを1,000万枚買った人が当選する確率
この場合、宝くじを1回買って当たる確率は1,000万分の1なので、λ=1/10,000,000です。
これを1,000万回買って最低1回は当たる確率なので、x=10,000,000です。
公式に当てはめると、
F(10,000,000) = 1 – e-(1/10,000,000)×10,000,000
= 0.632121
となります。
これも63%になりましたね。
年間365回起こる事故が1日目に起こる確率
1年で365回なのでλ=365、1日は1/365年なのでx=1/365になります。
公式に当てはめると、
F(1/365) = 1 – e-365×(1/365)
= 0.632121
です。
これも63%になりました。
これは別の考え方もできます。
1年で365回起こるということは、1日に1回起こることと同じです。
従って、単位を日に変えるとλ=1、x=1と考えることができます。
公式に当てはめると、
F(1) = 1 – e-1×1
= 0.632121
となり、同じく63%になります。
確率の逆数回試すといつも63%
このように計算してみると、あることに気づきますね。
いずれも計算式が1 – e-1になっていることです。
なぜ皆この式になるのでしょうか?
λは1サイクル内に起こる平均回数です。
この平均回数は1より小さければ、起こる確率と考えることができます。
コイン投げでは、1回のうち表が出る平均回数は0.5回なので、確率と同じですね。
宝くじも同じことです。
λは当選する確率のことです。
3つ目の例では1年に365回なのでλ=365は確率とは言えませんが、考え方は同じなので広義の意味で確率と考えましょう。
次にxを見てみます。
コイン投げの例では2回投げるのでx=2です。
これは表が出る確率0.5の逆数です。
宝くじの例でも1,000万回買うのでx=10,000,000ですが、これも当選する確率の逆数です。
最後の例でもx=1/365、これはλ=365の逆数です。
つまり、すべて次の計算をしていることになります。
すべてλx=1となるために、1 – e-1を計算していることになるのです。
「下手な鉄砲も数打ちゃ当たる」とは、確率が低いことでも何度も繰り返せばまぐれで当たることもあるということですね。
この諺は「まぐれ」というところがポイントです。
確率1%なら100回やれば1度は当たるだろうと思ってしまいますが、そうなる確率は63%、つまり3回に1回は失敗するのです。