【z検定の使い方】カイゼン効果を正規分布と標準偏差の関係を使って定量化する

2023年10月29日

【ゆっくり解説】Youtubeはじめました!

カイゼン効果を検証するz検定

何かやり方を変えた時には、その効果を測定したいものです。

例えば、作業台の高さを作業し易いように変えたとしましょう。

変える前の処理数の平均は1時間当たり100個、標準偏差は35個でした。

変えた後、30時間分のデータを採ったら、1時間当たり110個に増えました。

これは効果があったと言えるでしょうか?

 

この疑問に統計的に答えてくれるのが「検定」です。

検定には色々ありますが、今回は一番基本的なz検定について解説します。

 

z検定の考え方

統計で言う検定には流儀があります。

それは、

  1. 差は誤差範囲であるという仮説を立てる
  2. 差の中に母集団データの何%が入るかを計算する
  3. 95%未満なら「差がない」、95%以上なら「差がある」

という考え方をすることです。

先の例で言うと、

  1. 110個と100個の差10個は誤差範囲である(=効果がなかった)という仮説を立てる
  2. 100個±10個の中に、母集団の何%のデータが入るか計算する
  3. 95%未満なら「差がない」(=効果がなかった)、95%以上なら「差がある」(=効果があった)

という風に考えます。

 

正規分布と標準偏差の関係を利用する

具体的に見ていきましょう。

1は仮説を立てるだけなので問題ないでしょう。

問題は2です。

ここで母集団とは、改善前のデータのことです

平均は100個、標準偏差は35個です。

以前の記事で、データが正規分布に従うなら、平均から標準偏差何個分離れているかが分かれば、そのデータと平均との間に全体の何%のデータが含まれているかが分かることを解説しました。

【標準偏差を使えば確率が分かる】標準正規分布表の使い方をわかりやすく解説

 

具体的には下記の式からzを求めて、標準正規分布表で検索すれば求まるのでした。

z = (x – μ) / σ

μ:母集団の平均

σ:母集団の標準偏差

 

検定でもこの原理を使います。

違うのは、標準偏差σを√nで割ることだけです。

冒頭の例だとn=30です。

 

なぜ√nで割るのかと言うと、サンプル平均の分布を考えているからです。

サンプルデータ自体の分散はσ2(標準偏差はσ)ですが、n個のサンプルデータの平均の分散なのでσ2/n(標準偏差はσ/√n)となるのです。

 

改めてzを計算してみると、次のようになります。

z = (x – μ) / (σ/√n) = (110 – 100) / (35/ √30) = 1.56

 

これは改善後のデータは改善前のデータから、標準偏差1.56個分離れていることを意味します。

zが分かったので、標準正規分布表を検索してみましょう。

クリックすると拡大します

 

これから、xとμの間には44%のデータが含まれることが分かります。

これは片側だけですので、両側を考えると、μからx離れた範囲に全体の88%のデータが含まれていることが分かります。

 

有意水準5%の意味

μは改善前の生産性の平均値ですので、この割合(88%)が小さいほど、改善後の生産性が改善前の生産性と近いことを意味します。

つまり、誤差範囲だとします。

では、どれくらいまでを誤差範囲と言うのでしょうか?

 

検定では通常95%までを誤差範囲ということにしています。

つまり、平均の周り95%データは正常のばらつきの範囲内、それ以外は「滅多に起こらないこと」、つまり違う母集団のデータと見なすのです。

これを有意水準5%とも言います。

 

従って、冒頭の例では、

作業改善によって、生産性が100個/時から110個/時に上がったが、残念ながら誤差範囲でした。生産性は上がったとは言えません

という結論になるのでした。

 

まとめ

少し意外な結果だったのではないでしょうか?

普通は、10%も変わっていれば効果があったと見なしてしまいそうです。

 

この例では2つのトリックがあります。

1つは母集団、つまり改善前の生産性の標準誤差が35個もある点です。

平均±標準偏差の中には全体の68%のデータが含まれますので、135個以上または65個未満のデータが32%含まれるほど、データがばらついています。

そのため、10個の差が誤差範囲と見なされてしまうのです。

 

2つめは、改善後のデータ数が30しかないことです。

このサンプルサイズは小さいほど不確かなデータということになりますので、10個という差が誤差範囲と見なされる確率が大きくなります。

現に、サンプルサイズが50なら改善したという結果になります。

しかし、統計学的には今回の条件では間違いなく誤差範囲、つまり改善効果があるとは言えないという結果になります。

 

【Udemyの関連講座】

はじめての統計(推定・検定編) ~記述統計から推測統計へ!しっかり9時間、97レクチャーでデータ時代の入場券を手に入れる

データサイエンス時代にまず押さえるべきデータの扱い方・見方を扱った統計講座。データをどう要約し、分かりやすく伝えるのか(記述統計)から、そのデータから母集団について何が言えるのか(推測統計)まで、丁寧に統計的発想を身に付けます

いちばん理解できる統計学ベーシック講座その1【確率分布・推定・検定】

統計学の基礎を効率的に学べるベーシック講座です。統計学の入り口となる「確率分布・推定・検定」について豊富な図を用いて説明していきます。統計学や確率思考という一生モノのスキルを一緒に身につけましょう!

 

物流でも統計が必要であることが、お分かりいただけると思います。

https://rikei-logistics.com/logistics-statistics