【対数の使い方】パレートの法則が成り立つ時は対数でデータ分析がお薦め
「パレートの法則」が成り立つケースではグラフが見にくい
消費財メーカーA社は200品目を製造しています。
上位20%の品目で全体の80%の売上を占めるというパレートの法則が知られていますが、A社の場合は上位17.5%の品目で全体の80%を占めています。
ある月の品目別売上数をグラフにすると、次のようになります。
このように下位50%ほどの品目については、違いがほとんど分かりません。
もっと分かりやすいグラフを作ることはできないでしょうか?
また、上位品目の売上から下位品目の売上を予測するような回帰式を作ることはできないでしょうか?
対数にすると見やすいグラフになる
このような場合には売上数の対数を計算すると見やすくなります。
対数とは
103=1000
の式における3のことですが、これを求めるためにlogという関数を使います。
log101000=3
小さく書いてある10は底と呼ばれ、10の3乗における10のことです。
logはエクセル関数で簡単に計算することができます。
=LOG(数値、底)
この関数を使うと、次のように200品目すべての対数を計算することができます。
そして、このlog(売上数)をグラフにすると次のようになります。
最初のグラフと比較すると、下位品目でも売上の傾向がはっきりと見えるようになりましたね。
対数グラフだと見やすくなる理由
このようにパレートの法則が当てはまりすぎて、上位と下位の差が大きすぎる場合には、対数を取ると傾向が見やすくなります。
なぜそうなるのかは、次のy=log(x)のグラフを見ればわかります。
下の図で元の数の差はいずれも2ですが、対応する対数の差は3倍にもなります。
しかも、元の数が大きい方が、対数にすると差がより縮小されます。
元の数が小さいと、対数にしても差があまり縮小されません。
このことから対数を取ると、大きな値の差は小さく、小さな値の差は大きくなり、グラフで傾向がよりはっきり分かるようになるのです。
対数グラフの回帰式を求める
売上数の対数を取ったグラフは、一次関数(直線)で近似できそうです。
これを回帰式を求めると言います。
一次関数は傾きとy切片が分かれば、一意に決まりますね。
傾きとy切片は次式で求められます。
傾き=相関係数×(yの標準偏差/xの標準偏差)
y切片=yの平均-(xの平均×傾き)
相関係数を共分散と標準偏差から計算する式をわかりやすく解説|回帰との関係も
すべてエクセル関数にありますので、次のように求められます。
従って回帰式は
Y=-0.01264x+3.6113
となります。
グラフにすると下図のように、直線でほぼ正確に近似できました。
まとめ
パレートの法則はいろいろなシーンに当てはまりますが、わかりやすいのは世界の富の分布です。
世の中の多くの富は一握りの大金持ちが握っているため、世界80億人の一人ひとりの貯金額を降順に棒グラフにすると、半分から右側はほぼゼロで平坦なグラフになってしまうでしょう。
そのような場合には貯金額の対数でグラフを描けば、グラフ全体で傾きが見えるようになります。
また、そうすれば回帰分析もし易くなるのでデータ分析に便利です。