【需要を表すグラフはなぜ正規分布になるの?】ヒストグラムを理解しよう

2023年10月17日

物流ではヒストグラムを多く使います。

安全在庫の勉強をする時に必ず出てくるこのグラフもヒストグラムを近似したものですが、多くの人がここで躓きます

良くある疑問が「横軸と縦軸は何を表しているのか?」です。

「横軸は出荷数で、縦軸は出現日数です」

と聞くとふーんと頷くのですが、暫くすると

「でも山のてっぺんの箇所は、出荷数が○○だった日数でしょう?そんなに同じ出荷数だった日が多いのかなあ」

という疑問が沸いてくるのです。

確かにその通りで、一日何十万個も売れている大きな会社であれば、同じ出荷数になる日なんて1年にあってもせいぜい1日くらいでしょう。

ならば、このグラフは何なのか?

これについて解説していきます。

 

◆仕事や勉強の息抜きに。。。

散布図では正規分布にならない

まず次のデータを見て下さい。

 

772、1,061、1,000、900、1,387、1,247、1,022、1,055、1,584、1,218、1,391、1,040、1,174、952、1,064、1,083、922、1,317、1,245、848、774、998、734、1,215、998、936、976、1,014、796、788

 

これはある商品についての30日分の出荷データです。

これを先ほどのグラフにするとどうなるでしょうか?

このようなグラフになってしまいます。

出荷データの中には同じ数字が一つもありませんので、出現日数は0か1になります。

また横軸は0から2,000ですが、この間には無数の数字がありますね。

例えば、8.2973645とか923.865789なども含まれることを思えば、納得すると思います。

それに対して、出荷データは高々30個しかありませんね。

ですから、出現回数でいうと0がほとんどで、1はほんの少しです。

ですから上のようなグラフになるのです。

安全在庫理論で出てくるグラフとは程遠いですね。

 

ヒストグラムで近似すると正規分布になる

実は安全在庫理論で出てくるグラフはヒストグラムを近似したものです。

ヒストグラムとは度数分布表とも呼ばれ、自分でデータ区間を設定して、その中にデータが入る回数をグラフにしたものです。

先ほどのデータを使って説明します。

 

772、1,061、1,000、900、1,387、1,247、1,022、1,055、1,584、1,218、1,391、1,040、1,174、952、1,064、1,083、922、1,317、1,245、848、774、998、734、1,215、998、936、976、1,014、796、788

 

最小値は734、最大値は1,584ですので、30個のデータはすべてこの範囲に入っています。

ここですべてのデータが入るように、

 

0-400

400-800

800-1,200

1,200-1,600

1,600-2,000

 

の5つのデータ区間を設定してみます。

そしてその中に入るデータの数を調べると下表のようになります。

出現日数をすべて足し合わせると、データ数の30と一致しますね。

 

そしてこれをグラフにするとこうなります。

これをヒストグラム(度数分布表)と呼びます。

横軸は5つのデータ区間に区切られています。

 

次にこのデータ区間を1つの数字で代表させます。

各データ区間の一番大きい数字で代表させて出現日数をプロットします。

そしてプロットした点を滑らかな線で結びます。

すると次のようなグラフになります。

これが安全在庫理論で出てくるグラフになります。

ヒストグラムを作る方法はこちら⇩

Excelでヒストグラムを描く二通りの方法。正規分布の近似曲線も併せて表示!

 

まとめ

安全在庫理論で出てくるグラフを連続グラフ、ヒストグラムのように横軸や縦軸が飛び飛びの値しか取らないグラフを離散グラフと言います。

在庫の数量は整数の値しか取らない離散値ですので、そのままでは安全在庫理論で出てくるような連続グラフにはなりません。

実は、その間に離散グラフであるヒストグラムがあったのです。

そして、それを連続になるように近似したものが安全在庫理論で出てくるグラフだったのです。