【分散の加法性とは?】足し算だけでなく平均値にも応用する方法を解説
分散の加法性は足し算だけでなく平均値にも応用できる
分散の加法性の適用例としては、製造業における品質管理が有名です。
例えば、筒のような形をした部品を作る場合、指示通りの長さピッタリに作ることはほぼ不可能です。
必ず誤差が出ます。
そして誤差は分散で表されます。
部品Aが平均10mm/分散1mm2、部品Bが平均300mm/分散4mm2で作れたとすると、それらをつなぎ合わせたら平均310mm/分散5mm2になるはず、というのが基本的な考え方です。
部品Aの標準偏差が1mm、部品Bのそれが2mmだからといって、つなぎ合わせた部品の標準偏差は3mmにはなりません。
それより少し小さい√5mmになるのです。
この場合は、2つの観測値の合計の分散を求めています。
その他に、2つの観測値の平均の分散を求めたい場合もあります。
どのように適用するのでしょうか?
単純平均に分散の加法性を応用する
3年B組で国語と数学のテストをしました。
点数の分布は次の通りでした。
国語:平均=70、分散=400(標準偏差=20)
数学:平均=60、分散=225(標準偏差=15)
この時、国語と数学の合計点の分布は次のように計算できます。
平均=70+60=130
分散=400+225=625
分散の加法性がそのまま使えるので簡単です。
では、国語と数学の平均点の分布は、どのように計算したらよいのでしょうか?
これをするには、分散の加法性の詳細バージョンを知っている必要があります。
簡易バージョンは次式で表されます。
観測値 X1 と X2があり、Y = X1 + X2の時、分散V(Y)は
V(Y) = V(X1) + V(X2)
これに対し、詳細バージョンは次式になります。
観測値 X1 と X2があり、Y = a1X1 +a2X2の時、分散V(Y)は
V(Y) = a12V(X1) + a22V(X2)
この詳細バージョンを適用すると、国語と数学の平均点の分布は次のように計算できます。
国語の点数 = X1
数学の点数 = X2
国語と数学の平均点 = (X1+X2)/2 = (1/2)X1 + (1/2)X2 = (1/2) (70+60) = 65
国語と数学の平均点の分散 = (1/2)2V(X1) + (1/2)2V(X2) = (1/4)( V(X1) + V(X2)) = (1/4) (400+225) = 156
平均点の分散は、それぞれの分散よりも小さくなります。
加重平均に分散の加法性を応用する
続いて別の例を考えてみましょう。
3年A組と3年B組の数学の点数の分布は次の通りでした。
3年A組:平均=70、分散=400(標準偏差=20)
3年B組:平均=60、分散=225(標準偏差=15)
この時、2つのクラスを併せた数学の平均点の分布はどうなるでしょうか?
この場合、両クラスの人数を考慮する必要があります。
もしA組の人数がB組よりも多ければ、平均点は65よりも70に近い点数になるはずだからです。
仮に3年A組は40人、3年B組は60人とした時の平均点の分布は、次のように計算できます。
3年A組の点数 = X1
3年B組の点数 = X2
両クラスの平均点 = (40X1+60X2)/(40+60) = 6,400/100 = 64
両クラスの平均点の分散 = (40/100)2V(X1) + (60/100)2V(X2) = (4/25)V(X1) + (6/25)V(X2) = 64+54 = 118
人数の多い3組の方に引っ張られて、単純平均の分散よりも小さくなりましたね。
物流への応用方法
合計値の分散
分散の加法性が適用される最も有名な例は、安全在庫の式ではないでしょうか。
安全在庫=√(N+M)*標準偏差*安全係数
N:リードタイム(日)
M:発注間隔(日)
適正在庫を維持するための発注数の決め方をわかりやすく【定期発注方式の場合】
この式の中にある標準偏差は一日当たりの需要予測誤差のことです。
リードタイムや発注間隔が長くなれば、それだけ長い期間の需要を予測しないといけないので、予測誤差も大きくなります。
どのくらい大きくなるかを計算するのに、分散の加法性を使います。
一日当たりの需要予測の分散を日数分だけ足し合わせるのです。
一日当たりの需要予測の標準偏差をσとすると、分散はσ2になります。
ですので、もしN+Mが7日だとすると、7日間の需要予測の分散は7 σ2になります。
従って、7日間の需要予測の標準偏差は√7σになります。
これがN+Mにルートが付く理由です。
これは一日分の需要予測値をN+M個積み重ねることによって、N+M日分の需要予測値を求めていると言えます。
つまり、合計の分散を求めている例です。
平均値の分散
昼間に50人でピッキング作業をしている物流センターがあります。
ピッキングエリアが広いため、10人ずつ5グループに分けて作業しています。
作業が同じ時間に終わるように、各グループの生産性(ピッキング個数/時)の平均値に応じて、毎日物量を割り当てています。
この時、生産性の平均だけでなく分散も考慮できると、作業終了時間がより正確に予測できます。
グループAの5人の作業生産性の分布は次の通りです。
スタッフ1:平均=100、分散=36
スタッフ2:平均=90、分散=36
スタッフ3:平均=80、分散=25
スタッフ4:平均=70、分散=25
スタッフ5:平均=60、分散=16
この時、グループAの作業生産性の平均と分散はどうなるでしょうか?
分散の加法性の詳細バージョンを適用すると次のように計算できます。
平均 = (100 + 90 + 80 + 70 + 60) / 5 = 400 / 5 = 80
分散 = (1/5)2*36 + (1/5)2*36 + (1/5)2*25 + (1/5)2*25 + (1/5)2*16 = (1/25)*138 = 6
各スタッフの分散に比べて、だいぶ分散が小さくなりました。
このように生産性を管理する時は、個々のスタッフで管理するより、グループの平均値で管理する方がばらつきが小さくなり精度が上がるようになります。
ちなみに、これは中心極限定理としても知られています。
消費の合計である需要は正規分布になることを中心極限定理で説明する