【標準偏差を使えば確率が分かる】標準正規分布表の使い方をわかりやすく解説
標準偏差を使えば確率が分かる
前回の記事
標準偏差がばらつきを表す理由をわかりやすい言葉で徹底解説します。
で、なぜ標準偏差でデータのばらつきを表すことができるのかを解説しました。
標準偏差は単にばらつきを定量化するだけでなく、物流の世界でいろいろな応用が利きます。
それを紹介する前に、標準偏差が持つとても重要な性質について今回は解説します。
標準偏差を使えば確率が分かるのです。
そのツールである標準正規分布表の使い方を解説します。
これさえ理解すれば、いろいろな場面で標準偏差を使いたくなるでしょう。
正規分布は確率分布の一種
標準偏差の性質を語る時に正規分布は欠かせませんので、まずは正規分布から説明しますね。
このようなグラフを見たことはないでしょうか?
これが正に正規分布を表すグラフです。
横軸はデータと書いてありますが、これは場面によって異なります。
例えばある小学校のクラスで行った算数のテストの点数の分布を想定してみましょう。
平均点付近を取る生徒が一番多いことは容易に想像できます。
上のグラフで言うと、グラフの山のてっぺんから垂直に線を降ろして横軸と交わる点が平均点になります。
つまり、この場合の横軸は点数です。
そして平均点付近を取る生徒が多いことは、山の高い位置ほど縦軸の確率密度が高いことで表されます。
世の中にはこのような分布になる現象が非常に多いことが知られています。
成人男性や女性の身長や体重の分布なども、平均値を中心とする釣鐘状の分布になることが想像できると思います。
確率分布を積分すれば確率が分かる
このように正規分布は確率分布の一つです。
そしてすべての確率分布は、横軸とグラフで囲まれた部分の面積が常に1になるように書かれています。
すべてのデータの確率を足し合わせたら100%になるということです。
例えば、成人男性の体重の分布も釣鐘状の正規分布になりますが、すべての人の確率を足し合わせると100%になります。
更に便利なのは、グラフを縦に区切ると、区切ったデータ区間に対応する確率が分かることです。
例えば、成人男性のうち66kgから72kgまでの体重の人が全体の何%いるかを知りたいとしましょう。
そのような時は、下に示す部分の面積を調べれば分かります。
でもこの部分の面積を求めるには、積分計算が必要になりそうで難しそうですね。
安心して下さい。
表から簡単に求められる方法がありますので、後ほど説明します。
標準偏差を使えば積分しなくても確率が分かる
さて、この正規分布と標準偏差との間には超重要な関係があります。
まず標準偏差の略称であるσ(シグマ)という記号を覚えて下さい。
式の中でわざわざ標準偏差と書くのは面倒なため、至る所でこの記号を使います。
また平均はμ(ミュー)という記号で表します。
σとかμが出てくると、途端に理系っぽくなり難しそうに見えますが、単なる略称ですので恐れないで下さい。
さて、正規分布と標準偏差との超重要な関係は次の図に凝縮されています。
これはどういうことかと言うと、
(平均-標準偏差)から(平均+標準偏差)の間のデータになる確率は68%
(平均-2×標準偏差)から(平均+2×標準偏差)の間のデータになる確率は95%
(平均-3×標準偏差)から(平均+3×標準偏差)の間のデータになる確率は99.7%
になるということです。
更に上の図では標準偏差の1~3倍までしか書いていませんが、1.1倍とか2.37倍などの小数倍率についても何%の確率になるということが決まっています。
図を見て分かりますように、標準偏差が大きければ横に広がったグラフになります。
そして、小さければ縦にすぼまったグラフになります。
しかし先の確率は、正規分布であればいつも同じになります。
これは言い方を変えれば、(データ-平均)の間に標準偏差が何個入っているかで、そのデータになる確率が分かるということです。
難しい積分は不要なのです。
例を挙げましょう。
成人男性の体重の分布が正規分布に従い、平均が66kgで標準偏差が8kgだとします。
すると、体重66kg±8kgの人の割合は全体の68%になります。
また正規分布は左右対称ですので、体重66kgから74kgの人は全体の34%になります。
同じように、体重66kgから82kgの人は47.5%となります。
(μ+2σ=82、μ±2σには95%が含まれるので、その半分であるμ~μ+2σには47.5%)
更に体重74kgから82kgの人は13.5%ということも分かります。
(μ~μ+σには34%、μ~μ+2σには47.5%が含まれるので、その差を取ってσ~2σには13.5%)
このようにすれば、いかなるデータ(体重)区間であってもその確率が分かるのです。
標準正規分布表の使い方
では標準偏差の小数倍の確率はどのように調べればよいのでしょうか?
それが調べられるのが標準正規分布表です。
この表は知りたいデータと平均の差が標準偏差の何倍かを指定すれば、平均からデータの間になる確率が分かるようになっています。
例えば、先ほどの例で体重が66kgから76kgの間に入る人の確率を求めたいとします。
標準偏差が8kgで、76kgは平均66kgから10kg離れていますから、1.25σ(標準偏差の1.25倍)離れています。
従って、標準正規分布表で1.25を検索します。
この表は、縦軸に小数点第一位までを、横軸に小数点第二位を参照するようになっています。
1.25を検索すると0.3944になります。
これは、66kg~66kg+1.25σの間にいる人の割合が39.44%ということです。
つまり66kgから76kgの間に入る人の割合は39.44%ということになるわけです。
まとめ
このように平均と標準偏差を求めれば、あるデータと平均の差が標準偏差の何個分かが分かります。
それさえ分かれば、標準正規分布表で検索することによって、あるデータと平均の間に全体の何%のデータが入るかを知ることができます。
積分する必要はありません。
平均でない2つのデータ間に入る確率を知りたい時には、まずデータAと平均の間に入る確率を先の方法で求めます。
次に同じようにデータBと平均の間に入る確率を求めます。
そして、その差をとれば、データAとデータBの間に入る確率を求めることができます。
つまり、標準偏差は単にばらつきを定量化するだけではなく、これを使っていかなるデータの取る確率をも求めることができるのです。
そしてこの性質を使うことによって、ある許容欠品率のもとでの安全在庫を求めることができます。