消費の合計である需要は正規分布になることを中心極限定理で説明する方法
安全在庫理論では、需要(売上)が正規分布に従うと仮定しています。
平均付近の日数が一番多く、離れるに従って少なくなっていく分布です。
でも、
「いつもこんなきれいな正規分布になる訳がない、そんなの机上の空論だ!」
と思いませんか?
確かに、業種や会社や商品によってモノの売れ方は違います。
しかし、どんな商品でも買ってくれる人がそれなりにいれば、必ず正規分布になると統計学で証明されているのです。
証明自体は難解で読む気にもなりませんが、定理だけ知っていれば実務上は十分です。
その名は、中心極限定理です。
以下、具体例を挙げながら解説していきます。
需要は沢山の消費の合計
ひとつの例として、小売業の顧客に配送するケースを考えます。
物流センターに納品された商品は、小売業の社内物流によって各店舗に配送され、消費者によって購買されます。
この時、すべての店舗の商圏を併せた消費者の数をm人とします。
それぞれの消費者は、ある日に商品Aを買わないかもしれないし、1個買うかもしれないし、2個買うかもしれないし、、、いろんな可能性があります。
しかも予測できません。
つまり、消費者が毎日商品Aを購入する数は、サイコロを振って出た目の数のようなものです。
すると、毎日m人の消費者のサイコロの目を合計した数xiが、毎日の需要(売上)になります。
更に、これらの店舗が東京23区全体をカバーしているとすると、1,000万人の中からm人のサンプルを抽出して、毎日の23区全体の需要を推定していると考えることができます。
中心極限定理の二大重要性質
サイコロ遊びで理解する中心極限定理
少し難しくなってきたので、サイコロ遊びをしてみましょう。
1から6まで目のあるサイコロを振った時に、出る目の平均は何になるでしょうか?
これを実験するのに、2個のサイコロを何回も振ってその平均を記録すると、次のようなグラフになります。
同じように3個、5個、100個のサイコロで実験した場合のグラフは次のようになります。
段々と正規分布に近いづいて、幅も狭まっていくのが分かりますね。
幅が狭まるというのは、それだけ精度が高くなるということです。
サイコロの目の平均は3.5になるのですが、サイコロを多く使って実験するほど、3.5から離れた値になる確率が低くなります。
尚、試行回数を増やせば二項分布は正規分布に近づいていくことは、数学的に簡単に証明できます。
詳細はこちらをどうぞ。
【二項分布が正規分布で近似できるのはなぜ?】簡単な証明方法と応用事例
つまりなるべく多くのサイコロを使って実験する方が、いいわけです。
これは言い換えると、母集団の平均(サイコロの目の平均値)を推定するためには、なるべく多くのサンプルで実験した方が良いということです。
①ばらつきはサンプルサイズの平方根に反比例する
ここまでは感覚でも何となく分かることですが、統計学では更に凄いことが分かっています。
サンプルの大きさが大きくなるほど、その平方根に反比例してばらつきが小さくなるのです。
ばらつきは標準偏差で表せるのでしたね。
標準偏差がばらつきを表すのに丁度いい理由をわかりやすく解説します。
5個のサイコロで実験した場合と、100個のサイコロで実験した場合のグラフを重ねると、次のようになります。
このように、100個のサイコロで実験した場合の標準偏差(σ)は、5個の場合と比較して√(5/100)倍、約五分の一になるのです。
これは分散の加法性で説明することができます。
【分散の加法性とは?】足し算だけでなく平均値にも応用する方法を解説
②どんな分布でもサンプルの合計は正規分布になる
そして中心極限定理では更に凄いことを言っています。
先ほど、サンプルの大きさが大きくなるほど、平均値の分布は正規分布に近づき、標準偏差も小さくなると言いました。
平均値データ数を掛けたのが合計ですので、合計も正規分布に近づきます。
この時、元のデータの分布は正規分布でなくてもOKです。
それどころか、どんな分布でもOKなのです。
サイコロの例で言うと、元のデータとは一つひとつのサイコロの出た目です。
これはばらばらですね。
100個のサイコロを振って、その平均を取れば3.5に近い値になるかもしれませんが、100個のサイコロの目はばらばらです。
あえて言うなら、1から6までの目が同じくらいの割合で出るでしょう。
少なくとも正規分布ではありません。
このように、元のデータ(母集団のデータ)がどんな分布でも、サンプルを採ってきてその平均(または合計)を計算すれば、その分布は正規分布になるところがミソです。
中心極限定理から消費の合計である需要は正規分布になる
ここで再び、先ほどの買い物の話しに戻ってみましょう。
サイコロの話しと同じだと思いませんか?
サイコロの話しではサンプルの平均から、母集団の平均を推定していました。
買い物の話しではサンプルの合計(m人の消費者による1日の購入数)から、母集団(23区の消費者による1日の購入数)の合計を推定しています。
でも、平均は合計をデータ数で割っただけなので、基本的には同じです。
だから、一人ひとりの消費者が1回に購入する数自体は、別に正規分布になっていないくても全く問題ないのです。
なぜなら、m人の合計が分かればいいからです。
- 消費の合計が需要
- 個々の分布がでたらめでも、その合計は正規分布になる
- 従って、消費がどんな分布であっても、その合計である需要は正規分布になる
この3段論法により、需要は正規分布に従うのです。
まとめ
分散の加法性から、
- 母集団からm個のサンプルを採った平均値は正規分布に従う
- その正規分布の標準偏差はmの平方根に反比例する
そして中心極限定理から、
- a)は母集団がいかなる分布でも成り立つ
が言えます。
一文で言うと、
母集団がいかなる分布であっても、標本の大きさnが十分に大きければ、標本平均の確率分布は平均値μ、分散σ2/n(標準偏差σ/√n)の正規分布で近似される。
需要が正規分布になる理由
- 1日の需要は、大勢の消費者による購入数の合計である
- 中心極限定理により、各消費者の購入数が正規分布に従わなくても、1日単位の合計(1日の需要)は正規分布になる
以上が、需要が必ず正規分布に従う理由です。
もしこれで納得してくれないおじさんがいたら、こちらの方法も試してみて下さい。
もう少し簡単な説得方法です。
モンテカルロ法で需要が正規分布になることを示すやり方をExcelで実演
但し、これはmが十分に大きい場合に限ります。
どれくらい大きくないといけないかは、各消費者の購入確率によって変わってきます。
間欠需要を正規分布になるようにして在庫理論を使えるようにするための工夫
また、正規分布の標準偏差がmの2乗に反比例することが、物流拠点集約で在庫が削減されることの理論的根拠にもなっています。
物流拠点集約で安全在庫はどれくらい減るのか?は一概には言えない理由