指数分布を使ってロングテール商品の欠品による機会損失を推定する
指数分布を使える具体例
ネット通販会社Aではニッチなマニア向け商品をあえて品揃えする、ロングテール戦略に会社の方針を切り替えました。
ところが、週に1冊しか売れないだろうと思っていた本Bが早速欠品しました。
急いで仕入れ先に発注しましたが、納品は1週間後です。
この間に、注文が来て売り逃す確率は何%でしょうか?
指数分布とは?
世の中にはいろいろな時間のサイクルがあります。
1日というサイクル、1週間というサイクル、10日間というサイクルと言った具合です。
このサイクル期間内で一定回数起こる事象があった時、それが最初に起こるまでのサイクル数の確率分布を指数分布と言います。
簡単に言えば、事象が起こる間隔の確率分布です。
ポアソン分布は事象が起こる回数の確率分布なので、表裏の関係にあります。
指数分布の確率密度関数
冒頭の例では、本Bは1週間のサイクルで平均1回しか売れません。
この本が1サイクル目(1週間内)で最初に売れる確率、2サイクル目で最初に売れる確率、、、をまとめた分布が指数分布になります。
そして下記の式で表されます。
f(x) = λe–λx
x:サイクル数
λ:サイクル内で事象が起こる平均回数
確率密度関数をグラフにする
先の例では1サイクルは1週間で、この期間内に平均1回売れるのでλは1です。
また1日は1/7サイクル(x=0.14)、2日は2/7サイクル(x=0.29)、、、ですので、エクセルで計算すると次のようになります。
そしてグラフにすると次のようになります。
あれっ、何か変ですね。
1週間に1冊しか売れないのなら、もっと後の日の方が良く売れそうな気がしませんか?
でも次に売れるのが3日目ということは、1日目と2日目は売れないという条件が付くため、確率は小さくなってしまうのです。
そのため、後に行くほど確率は小さくなります。
指数分布の累積分布関数
さて、この指数分布の式では縦軸が確率密度で、このままでは使い物になりません。
確率は確率密度の積分(面積)になりますので、例えば3日から4日の間に売れる確率は下図の赤で示した部分の面積になります。
このように指数分布の式を積分すれば確率が分かりますので、積分しておきましょう。
これが指数分布の累積分布関数です。
この式を使えば、1週間以内に売れる確率が分かります。
λ=1、x=1(1週間は1サイクルのため)を代入して計算すると、63%になります。
つまり、納品が1週間後だと、売り逃す確率が63%あることが分かります。
累積分布関数をグラフにする
これは、次のようにしてエクセルで計算した後、グラフにすることでも分かります。
このようにグラフにすると、納品を3日後に早めてもらえば売り逃しの確率が35%にまで減少することも分かります。
指数分布の使い方については、こちらでも解説しています。
【指数分布の使い方】大谷翔平のホームラン間隔が指数分布に従うか計算してみた