加重平均と偏差値を使って複合指標のランキングを作る方法を実演!

2023年10月14日

◆仕事や勉強の息抜きに。。。

人によって良い会社の基準は異なる

人によって就職する会社を選ぶ基準は異なります。

ある人は大手志向、ある人は給料、またある人は成長率の高い会社で自分を試したい等、様々です。

そこで、自分の価値観にあった会社を見つけるために、この際、自分だけのランキングを作ってしまいましょう。

今回、例として挙げるのは、先述した3つの指標

  1. 売上高
  2. 年収
  3. 売上高の成長率

をすべて考慮した複合ランキングです。

 

偏差値とは標準偏差のスケールを変えただけ

このような時に役に立つのが偏差値です。

学生の頃、よくお世話になりましたね。

 

なぜ役に立つのか?

 

それは、

  1. 同一評価軸での相対位置が分かる
  2. 異なる評価軸を同じ尺度で比較できる

からです。

 

1については、数学の試験を思い浮かべて下さい。

あなたが百点満点を取って1位になっても、平均点が80点で他にも百点満点を取った人が複数いる場合と、平均点が30点で2位の人が90点の場合とでは意味合いが全く違いますね。

偏差値だと、前者では55点、後者では80点のように、あなたの数学能力がどのくらい優れているかを的確に表すことができます。

 

2については、数学と国語の2科目の試験を思い浮かべて下さい。

あなたが数学で60点、国語で70点を取ったとしても、数学の平均点が30点で国語の平均点が70点だと、数学の方が良かったということになりますね。

偏差値だと、数学は70点、国語は50点というように、数学でよく頑張ったということが分かります。

 

偏差値の有用性が分かったところで、求め方を説明します。

偏差値は標準偏差と密接な関係があります。

というか、標準偏差を直観的に判断し易いように、スケールを変えただけとも言えます。

偏差値と標準偏差の関係は次の通りです。

 

偏差値=(データ-平均)÷標準偏差×10+50

 

まず、データと平均が標準偏差の何倍離れているかを計算します。

これは1とか1.8とか通常は2以下の小数になるので、分かりやすいように10を掛けます

そして、平均点を取った人の偏差値が50になるように、最後に50を足すだけです。

標準偏差はエクセル関数で計算できますので、簡単ですね。

 

対数で正規分布に変換してから偏差値を計算

ここで気を付けるポイントが一つあります。

それは、データの分布が正規分布でないと偏差値の意味がなくなってしまうことです。

テストの点数は正規分布になりますが、年収の分布や売上高の分布はそうなりません。

べき乗分布になります。

正規分布でなく、べき乗分布になる理由については、

【具体例でわかりやすく!】べき乗分布は何に使えるの?|会社ランキングへの応用を実演

を参照して下さい。

 

今回、複合ランキングを作ろうとしている3つの指標

  1. 売上高
  2. 年収
  3. 売上高の成長率

のうち、売上高と年収はべき乗分布に、成長率は正規分布になります。

べき乗分布はデータの対数を取れば、ほぼ正規分布になりますので、まずは対数を取ってから偏差値を計算することになります。

 

年収の偏差値ランキングを作る

年収についてエクセルで計算してみると次のようになります。

(単位:千円)

会社名 年収 log(年収) 偏差値
1 ヤマトホールディングス 9,211 3.96 72
2 住友倉庫 8,189 3.91 65
3 近鉄エクスプレス 8,145 3.91 65
4 三菱倉庫 8,075 3.91 65
5 日立物流 7,703 3.89 62
6 三井倉庫ホールディングス 7,701 3.89 62
7 SGホールディングス 7,539 3.88 61
8 伊勢湾海運 7,445 3.87 61
9 安田倉庫 7,433 3.87 60
10 日本トランスシティ 7,161 3.85 58
11 日新 6,698 3.83 55
12 澁澤倉庫 6,645 3.82 55
13 宇徳 6,602 3.82 54
14 名港海運 6,549 3.82 54
15 丸全昭和運輸 6,472 3.81 53
16 セイノーホールディングス 6,443 3.81 53
17 センコーグループホールディングス 6,282 3.80 52
18 山九 6,161 3.79 51
19 上組 6,003 3.78 49
20 横浜冷凍 5,941 3.77 49
21 キユーソー流通システム 5,901 3.77 48
22 SBSホールディングス 5,896 3.77 48
23 ケイヒン 5,802 3.76 48
24 アルプス物流 5,796 3.76 47
25 ニッコンホールディングス 5,761 3.76 47
26 東陽倉庫 5,742 3.76 47
27 内外トランスライン 5,457 3.74 44
28 C&Fロジホールディングス 5,443 3.74 44
29 日本通運 5,377 3.73 44
30 トランコム 5,188 3.72 42
31 中央倉庫 5,106 3.71 41
32 鴻池運輸 5,062 3.70 40
33 ゼロ 4,986 3.70 40
34 キムラユニティー 4,948 3.69 39
35 丸和運輸機関 4,796 3.68 38
36 日本ロジテム 4,794 3.68 38
37 福山通運 4,667 3.67 36
38 ハマキョウレックス 4,429 3.65 33
39 名鉄運輸 4,085 3.61 29

 

ちなみに、年収とlog(年収)がそれぞれどのような分布になっているかを、ヒストグラムで確認しておきましょう。

年収の分布

Log(年収)の分布

 

このように、対数を取る前はべき乗分布と正規分布の「あいのこ」みたいだったのが、対数を取った後はきれいな正規分布になっていることが分かります。

 

売上高と成長率の偏差値ランキングを作る

それでは同じように売上高と成長率の偏差値も計算してみましょう。

売上高と成長率は、

【2021年最新版】物流会社の売上高トップ63社をランキング!|7つの財務指標で徹底比較

のデータを使います。

結果は次のようになりました。

会社名 売上偏差値 年収偏差値 成長率偏差値
1 ヤマトホールディングス 71 72 53
2 SGホールディングス 69 61 62
3 近鉄エクスプレス 62 65 52
4 日立物流 63 62 42
5 住友倉庫 52 65 52
6 SBSホールディングス 54 48 88
7 三井倉庫ホールディングス 54 62 52
8 日本通運 73 44 49
9 三菱倉庫 53 65 46
10 センコーグループホールディングス 62 52 56
11 セイノーホールディングス 62 53 46
12 山九 61 51 47
13 日本トランスシティ 46 58 50
14 上組 55 49 48
15 丸全昭和運輸 48 53 52
16 安田倉庫 40 60 53
17 キユーソー流通システム 51 48 51
18 日新 50 55 29
19 ニッコンホールディングス 51 47 45
20 鴻池運輸 56 40 50
21 名港海運 43 54 49
22 澁澤倉庫 42 55 47
23 丸和運輸機関 47 38 77
24 伊勢湾海運 38 61 40
25 トランコム 50 42 51
26 福山通運 55 36 50
27 C&Fロジホールディングス 47 44 50
28 アルプス物流 46 47 44
29 宇徳 40 54 38
30 横浜冷凍 47 49 29
31 ケイヒン 40 48 50
32 ゼロ 45 40 54
33 ハマキョウレックス 48 33 55
34 日本ロジテム 41 38 57
35 東陽倉庫 35 47 48
36 キムラユニティー 40 39 50
37 内外トランスライン 33 44 48
38 名鉄運輸 47 29 46
39 中央倉庫 34 41 46

 

3つの指標の加重平均で複合偏差値ランキングを作る

次に、3つの指標を合算した複合ランキングを作ってみましょう。

一番簡単なのは、各社ごとに3つの偏差値の平均を計算するやり方です。

しかし、人によってどの指標を重視するかは異なりますので、各指標に重みを付けることとします。

例えば、会社の規模や年収よりも成長性を重視したいという人であれば、

売上:年収:成長率=25%:25%:50%

のように重みを付けます。

つまり加重平均を取るということです。

 

すると次のようになります。

重み: 25% 25% 50%
会社名 売上偏差値 年収偏差値 成長率偏差値 複合偏差値
1 SBSホールディングス 54 48 88 70
2 SGホールディングス 69 61 62 63
3 ヤマトホールディングス 71 72 53 62
4 丸和運輸機関 47 38 77 60
5 近鉄エクスプレス 62 65 52 58
6 センコーグループホールディングス 62 52 56 56
7 住友倉庫 52 65 52 55
8 三井倉庫ホールディングス 54 62 52 55
9 日本通運 73 44 49 54
10 日立物流 63 62 42 52
11 三菱倉庫 53 65 46 52
12 セイノーホールディングス 62 53 46 52
13 安田倉庫 40 60 53 51
14 丸全昭和運輸 48 53 52 51
15 山九 61 51 47 51
16 日本トランスシティ 46 58 50 51
17 キユーソー流通システム 51 48 51 50
18 上組 55 49 48 50
19 鴻池運輸 56 40 50 49
20 名港海運 43 54 49 48
21 ゼロ 45 40 54 48
22 トランコム 50 42 51 48
23 日本ロジテム 41 38 57 48
24 福山通運 55 36 50 48
25 ハマキョウレックス 48 33 55 48
26 C&Fロジホールディングス 47 44 50 48
27 澁澤倉庫 42 55 47 48
28 ニッコンホールディングス 51 47 45 47
29 ケイヒン 40 48 50 47
30 アルプス物流 46 47 44 45
31 キムラユニティー 40 39 50 45
32 伊勢湾海運 38 61 40 45
33 東陽倉庫 35 47 48 44
34 内外トランスライン 33 44 48 43
35 宇徳 40 54 38 43
36 名鉄運輸 47 29 46 42
37 中央倉庫 34 41 46 42
38 日新 50 55 29 41
39 横浜冷凍 47 49 29 39

 

以前の結果がリセットされないとべき乗分布になる

いかがでしたでしょうか?

偏差値を使うことで、いろいろな指標を合算した複合評価ができることを実感していただけたと思います。

 

注意する点は、データが正規分布に従っていることを確認することだけです。

世の中の現象は確率的にばらつきますが、年収や売上というのは、一度増えたらそこからまた増えますので、増え方が乗数的になります。

それに対してテストでは、前のテストで赤点を取っても次のテストは横一線で勝負できます。

このように毎回前の結果がリセットされる現象は正規分布になりますが、リセットされないとべき乗分布になるケースが多くなります。

その場合は対数を取れば正規分布に近くなります。

なぜなら、「増える割合」は毎回リセットされるからです。