【安全在庫】そもそも需要は正規分布に従うのか?

2021年6月12日

安全在庫理論では、需要(売上)が正規分布に従うと仮定しています。

平均付近の日数が一番多く、離れるに従って少なくなっていく分布です。

でも、

いつもこんなきれいな正規分布になる訳がない、そんなの机上の空論だ!

と思いませんか?

 

確かに、業種や会社や商品によってモノの売れ方は違います。

しかし、どんな商品でも買ってくれる人がそれなりにいれば、必ず正規分布になると統計学で証明されているのです。

証明自体は難解で読む気にもなりませんが、定理だけ知っていれば実務上は十分です。

その名は、中心極限定理です。

以下、具体例を挙げながら解説していきます。

 

1日の需要は多くの消費者による購入数の合計

ひとつの例として、小売業の顧客に配送するケースを考えます。

物流センターに納品された商品は、小売業の社内物流によって各店舗に配送され、消費者によって購買されます。

 

この時、すべての店舗の商圏を併せた消費者の数をm人とします。

それぞれの消費者は、ある日に商品Aを買わないかもしれないし、1個買うかもしれないし、2個買うかもしれないし、、、いろんな可能性があります。

しかも予測できません。

つまり、消費者が毎日商品Aを購入する数は、サイコロを振って出た目の数のようなものです。

 

すると、毎日m人の消費者のサイコロの目を合計した数xiが、毎日の需要(売上)になります。

更に、これらの店舗が東京23区全体をカバーしているとすると、1,000万人の中からm人のサンプルを抽出して、毎日の23区全体の需要を推定していると考えることができます。

 

サイコロで分かる中心極限定理

少し難しくなってきたので、サイコロ遊びをしてみましょう。

1から6まで目のあるサイコロを振った時に、出る目の平均は何になるでしょうか?

 

これを実験するのに、2個のサイコロを何回も振ってその平均を記録すると、次のようなグラフになります。

 

同じように3個、5個、100個のサイコロで実験した場合のグラフは次のようになります。

 

段々と正規分布に近いづいて、幅も狭まっていくのが分かりますね。

幅が狭まるというのは、それだけ精度が高くなるということです。

サイコロの目の平均は3.5になるのですが、サイコロを多く使って実験するほど、3.5から離れた値になる確率が低くなります。

 

つまりなるべく多くのサイコロを使って実験する方が、いいわけです。

これは言い換えると、母集団の平均(サイコロの目の平均値)を推定するためには、なるべく多くのサンプルで実験した方が良いということです。

 

ここまでは感覚でも何となく分かることですが、統計学では更に凄いことが分かっています。

サンプルの大きさが大きくなるほど、その平方根の2乗に反比例してばらつきが小さくなるのです。

ばらつきは標準偏差で表せるのでしたね。

【参考】

標準偏差のばらつきとは

 

5個のサイコロで実験した場合と、100個のサイコロで実験した場合のグラフを重ねると、次のようになります。

 

このように、100個のサイコロで実験した場合の標準偏差(σ)は、5個の場合と比較して√(5/100)倍、約五分の一になるのです。

これがあの中心極限定理です。

 

中心極限定理では更に凄いことを言っています。

先ほど、サンプルの大きさが大きくなるほど、平均値の分布は正規分布に近づき、標準偏差も小さくなると言いました。

この時、元のデータの分布は正規分布でなくてもOKです。

それどころか、どんな分布でもOKなのです。

 

サイコロの例で言うと、元のデータとは一つひとつのサイコロの出た目です。

これはばらばらですね。

100個のサイコロを振って、その平均を取れば3.5に近い値になるかもしれませんが、100個のサイコロの目はばらばらです。

あえて言うなら、1から6までの目が同じくらいの割合で出るでしょう。

少なくとも正規分布ではありません。

 

このように、元のデータ(母集団のデータ)がどんな分布でも、サンプルを採ってきてその平均値を計算すれば、その分布は正規分布になるところがミソです。

 

消費者とサイコロは同じ

ここで再び、先ほどの買い物の話しに戻ってみましょう。

 

サイコロの話しと同じだと思いませんか?

サイコロの話しではサンプルの平均から、母集団の平均を推定していました。

買い物の話しではサンプルの合計(m人の消費者による1日の購入数)から、母集団(23区の消費者による1日の購入数)の合計を推定しています。

でも、平均は合計をデータ数で割っただけなので、基本的には同じです。

 

だから、一人ひとりの消費者が1回に購入する数自体は、別に正規分布になっていないくても全く問題ないのです。

なぜなら、m人の合計が分かればいいからです。

そして、それはmが十分に大きければ中心極限定理から正規分布に従うのです。

 

まとめ

中心極限定理とは?

  1. 母集団からm個のサンプルを採った平均値は正規分布に従う
  2. その正規分布の標準偏差はmの2乗に反比例する
  3. a)は母集団がいかなる分布でも成り立つ

一文で言うと、

母集団がいかなる分布であっても、標本の大きさnが十分に大きければ、標本平均の確率分布は平均値μ、分散σ2/n(標準偏差σ/√n)の正規分布で近似される。

 

需要が正規分布になる理由

  1. 1日の需要は、大勢の消費者による購入数の合計である
  2. 中心極限定理により、各消費者の購入数が正規分布に従わなくても、1日単位の合計(1日の需要)は正規分布になる

以上が、需要が必ず正規分布に従う理由です。

 

但し、これはmが十分に大きい場合に限ります。

どれくらい大きくないといけないかは、各消費者の購入確率によって変わってきます。

【参考】

間欠需要の在庫管理

 

また、正規分布の標準偏差がmの2乗に反比例することが、物流拠点集約で在庫が削減されることの理論的根拠にもなっています。

【参考】

拠点集約で在庫削減できるのか?|統計で解くとこうなります。