【具体例でわかりやすく解説!】F検定は何に使えるの?|商品分類の仕方で実演

2021年7月26日

ある消費財メーカーでは、需要のばらつきの大小によって、商品をいくつかのカテゴリーに分けようとしています。

例えば、下記の2つの商品は同じカテゴリーにすべきでしょうか?

それとも違うカテゴリーに分類すべきでしょうか?

 

F検定とは

F検定は2郡の分散(または標準偏差)が等しいかどうかを判定するのに用いられます。

2つの分散の比がF分布に従うことを利用しています。

一方の郡の分散をσ12、もう一方の郡の分散をσ22とすると、2つの分散の比はσ12/σ22となりますが、これがF分布に従うということです。

分散は不偏分散を使います。

F分布は次のようなグラフになります。

 

σ1222が1の時、つまり2つの分散が等しい時は、そうなる可能性がちょうど50%になります。

σ1222が2の時、つまり片方の分散がもう一方の2倍の時は、そうなる可能性7%まで減少します。

ちなみに、統計用語でそうなる可能性のことを右側確率と言います。

 

 

z検定やt検定などの他の検定でもそうですが、右側確率5%まで減少した場合に有意差あり、つまり2つの分散はもはや同じとは言えないと判断します。

 

分散を検定する

それではF検定を使って、商品Aと商品Bの分散が等しいといえるかどうかを検定してみましょう。

分散はエクセル関数VARで求められます。

 

商品Aの分散は59,708、商品Bのそれは146,004になりました。

よって、2つの分散の比σ22122.45になります。

先ほどのF分布のグラフで見ると、たいぶ右側にあり、そうなる確率はかなり低そうですね。

 

たぶん5%より低いと思いますが、念のため調べてみましょう。

これはエクセル関数で計算できます。

=F.DIST(F値、分子の自由度、分母の自由度、TRUE

=F.DIST(2.45,19,19,TRUE)

=0.97

Fというのは2つの分散の比のことです)

 

よって、右側確率(F値が2.45になる確率)は3%です。

つまり、5%より低いということになり、もはやこの2つの分散は同じとは言えないことになります。

 

変動係数で検定する

以前の記事で、ばらつきを比較する時は分散や標準偏差ではなく、変動係数で比較すべしというお話しをしました。

>> 変動係数の使い方【在庫管理から学ぶ】

 

今回も変動係数で検定してみましょう。

変動係数は標準偏差/平均で求められます。

これは言い換えれば、平均1にした時の標準偏差です。

ですから、これを二乗すれば平均1の時の分散になります。

2つの分散を比べる時に、両方とも平均1の分散に変換して比べれば問題ありませんので、F検定を使えます。

 

エクセルでFを計算すると次のようになります。

先ほどと同じようにして、このF値1.46に対応する右側確率を求めてみると、

=F.DIST(F値、分子の自由度、分母の自由度、TRUE)

=F.DIST(1.45,19,19,TRUE)

=0.79

となり、21%も起こり得る可能性があることが分かります。

5%よりも遥かに大きな確率ですので、2つの変動係数は同じと見なせます。

従って、この2つの商品は同じカテゴリーに分類すべきということになります。

 

まとめ

F検定は2つの郡の分散が等しいかどうかを調べるのに使われます。

でも、この目的で使う機会は余りありません。

2つの郡の平均が同じでないと、分散を比べても意味がないからです。

 

代わりに、変動係数を比べるのには意味があります。

変動係数は平均を1にした標準偏差ですので、二乗すれば分散になりF検定が使えます。

 

但し、ここで使う標準偏差は不偏標準偏差、分散は不偏分散です。

>> 【物流数学の基礎】標準偏差はnで割るの?n-1で割るの?