【２通りの方法】最小二乗法を行列を使って解く方法をわかりやすく解説

2021年10月31日2025年3月9日

1. 高次式に最小二乗法を適用するには「行列」を使うのが便利
2. 最小二乗法を行列で解く２通りの方法
- 2.1. 二乗誤差を係数で偏微分する方法
- 2.2. 二乗誤差の変数で微分する方法
3. 補足

高次式に最小二乗法を適用するには「行列」を使うのが便利

下記のデータが得られた時に、xからyを予測する回帰式を求めたいとします。

【6つもあった！】Excelで単回帰分析の最小二乗法を解く方法をすべて実演

で回帰式をExcelで求める６通りの方法を紹介しましたが、この方法では直線の回帰式しか求められません。

つまり

y=ax+b

のようなxの１次式の回帰式しか求められません。

そこで今回は、２次式や３次式などの高次の回帰式を求める方法を紹介します。

行列演算を使うのですが、２通りの方法があります。

係数を微分する方法と、変数を微分する方法です。

今回の例題は２次式で十分に近似できますが、３次式や４次式などの複雑な回帰式であっても、この方法は使えます。

尚、このように高次式による回帰式は多項式回帰とも呼ばれます。

最小二乗法を行列で解く２通りの方法

二乗誤差を係数で偏微分する方法

xからyを推定する式を

f(x) = ax²+bx+c

と置きます。

すると、実測値yと推定値f(x)との誤差は

y-f(x)

なので、二乗誤差

e = {y-f(x)}²

が最小となるような係数a、ｂ、ｃを求めることになります。

しかし、１点だけについて誤差を小さくしても仕方ないので、１０点すべてについての合計誤差

E = Σ{y-f(x)}²

が最小となるような係数a、ｂ、ｃを求めます。

この二乗誤差Eを書き直すと

E = Σ{y-f(x)}²

= Σ(y- ax²-bx-c)²

となります。

このEは各係数で偏微分した式がすべてゼロとなる時に最小値を取ります。

すなわち、

∂E／∂a = 0

∂E／∂b = 0

∂E／∂c = 0

をすべて満たすようなa、b、cを求める問題に帰着します。

一見、難しそうに思えますが、例えばaで偏微分する時にはその他の変数はすべて定数と見なせるので簡単です。

∂E／∂a = -2Σx²(y- ax²-bx-c) = 0

この時、高校で習った合成関数の微分の技を使っています。

{g(f(x))}’=g’(f(x))f’(x)

詳しくは、下記サイトを参照して下さい。

>> 【基本】合成関数の微分 | なかけんの数学ノート

bやcでの偏微分も同じようにできます。

∂E／∂b = -2Σx(y- ax²-bx-c) = 0

∂E／∂c = -2Σ(y- ax²-bx-c) = 0

これらの３式は、次のように規則的な形に書き直せます。

∂E／∂a = -2Σx²(y- ax²-bx-c) = 0

⇔

aΣx⁴+bΣx³+cΣx²=Σx²y

∂E／∂b = -2Σx(y- ax²-bx-c) = 0

⇔

aΣx³+bΣx²+cΣx¹=Σx¹y

∂E／∂c = -2Σ(y- ax²-bx-c) = 0

⇔

aΣx²+bΣx¹+cΣx⁰=Σx⁰y

そして行列を使うと、更にきれいな形になります。

これを

と置くと

Ax = b

と書けます。

そして、行列Aとｂは観測した１０組のデータがあるので、次にように計算できて定数行列になります。

後は、x=A^-1bを解くだけです。

これもExcelで次のように計算できます。

これで誤差Eを最小化する係数a、b、cが求まりました。

yを推定する近似式（回帰式）は

f(x) = 1.8x²-5.7x+6.7

です。

二乗誤差の変数で微分する方法

もう一つの方法でもxからyを推定する式を

f(x) = ax²+bx+c

と置きます。

すると誤差は

f(x)-y

と表せます。

観察データは１０組ありますので、１０個の誤差が計算できます。

そして、これをまとめて次のように行列で表すことができます。

すると、二乗誤差である

||Ax – b||²

を最小にするようなa、b、cを求める問題に帰着します。

これは次のように式変形できます。

||Ax – b||²

= (Ax – b)^T (Ax – b)

= (x^TA^T – b^T)(Ax – b)

= x^TA^TAx – x^TA^Tb – b^TAx + b^Tb

= x^TA^TAx – 2x^TA^Tb + b^Tb

これを最小化するxは、xで微分してゼロと置いた式を解けば求まります。

行列の微分で一見難しそうですが、すべての項はスカラーですので簡単です。

第一項は対称行列であるA^TAの各成分にx行列の各成分の二乗を掛けているので、x²の微分が2xになるように2A^TAxになります。

また第二項は、A^Tbの各成分に2x^Tの各成分を掛けているので、2xの微分が2になるように2A^Tbになります。

第三項は定数で微分するとゼロなので、整理すると

A^TAx = A^Tb

となります。

これをxについて解くと、

x = (A^TA)^-1A^Tb

です。

後は数字を入れて計算するだけです。

Excelで次のように計算できます。

yを推定する近似式（回帰式）は

f(x) = 1.8x²-5.7x+6.7

になりました。

これは、一番目の方法で計算した結果と同じです。

補足

ここで紹介した２つの方法は勾配降下法などのような近似解を求める数値的解法ではなく、ズバリの解を求める解析的解法です。

４次や５次などの高次の回帰式でも同じやり方で解析的に求められるので、大変便利な方法だと思います。

行列pick,最小二乗法,行列

Posted by ロジギーク