【区間推定の具体例】トラックに付いているタイヤの摩耗を区間推定する
区間推定とは?
サンプルデータから母集団の平均値を知ろうとすることを推定と言います。
推定には点推定と区間推定の2種類があります。
自社トラックに付いている1,000本のタイヤについて、1か月間のタイヤの擦り減り度合の平均を知りたいとします。
そのためには、ある特定の日に1,000本全部のタイヤの溝深さを測り、ちょうど1か月後にも再度同じすることをする必要があります。
しかし、毎日運航しているトラックでそれを行うのは困難です。
このような時に、例えば20本について測定し、1,000本の平均を推定したいと思いませんか?
思いますね。
この場合、1,000本が母集団、20本がサンプルになります。
そして、20本の平均をそのまま1,000本の平均と推定することを、点推定といいます。
でも、たった20本の平均が全体を代表すると考えるのは、少し乱暴です。
そこで、「○○の確率で平均値はXからYの間に入る」という風に推定してもらえると有り難いですね。
このような推定を区間推定と言います。
今回は、この区間推定のやり方を紹介します。
【具体例】20本のタイヤから1,000本の摩耗を区間推定する
20本のタイヤについて、7月31日と8月31日に溝深さを測定したところ、次のようになりました。
サンプル20本のタイヤの1か月の摩耗の平均値は1.08mmです。
母集団1,000本の摩耗の平均は1.08mm±○○mmになっていると考えられますので、この○○をこれから計算します。
また信頼区間は95%とします。
つまり、95%の確率で平均は1.08mm±○○mmになるという○○を求めるのです。
ばらつきをt分布で近似する
さて、今回はサンプルサイズが小さいので、サンプルの平均はt分布に従います。
もっと詳しく言うと、平均μ、分散s2/n(標準偏差s/√n)のt分布で近似されます。
ということは、サンプルの平均は下記のグラフにおいて、赤線の枠内にあるということになります。
有意確率(p値)からt値を求める
この図の中の○○は、t分布表から次のようにして求まります。
サンプルサイズは20ですので自由度は19です。
また95%の信頼区間ということは、両側5%を切る部分ですので、有意確率(p値)は0.05になります。
両者の交点を見ると2.09ですので、○○は2.09になります。
平均値からt値の±2.09倍ばらつくことを式にする
これを式で書くと次のようになります。
μ- 2.09 s / √n ≦ 1.08 ≦ μ+ 2.09 s / √n
s = 0.27、n = 20なので
μ- 2.09 x 0.27 / √20 ≦ 1.08 ≦ μ+ 2.09 x 0.27 / √20
μが真ん中にくるよう式変形する
μが真ん中に来るように変形すると、
1.08 – 2.09 x 0.27 / √20 ≦ μ ≦ 1.08 + 2.09 x 0.27 / √20
となります。
よって、母集団の平均μの95%信頼区間は次のようになります。
0.95 ≦ μ ≦ 1.21
これが1,000本のタイヤの摩耗度合いの推定値です。
区間推定はベイズ推定でやっても同じ結果が得られます。
分散既知の区間推定をベイズ推定でやって同じ結果になるか比較してみた
区間推定について更に学習したい人はこちらもどうぞ。
【区間推定の使い方】バイオディーゼルに変えた場合の燃費を区間推定する