ニューラルネットワークをExcelに実装して画像処理させてみた。

2021年9月26日2024年5月19日

1. ９画素のマークシートに書かれた〇✕をニューラルネットワークで読み取る
2. 教師データを用意する
3. ニューラルネットワークにモデル化する
- 3.1. 入力層は９つ、出力層には２つのノードを割り付ける
- 3.2. 活性化関数にはシグモイド関数
4. パラメータの初期値を入力する
- 4.1. 求めるパラメータは38個
- 4.2. パラメータの初期値は０～１の乱数
5. 誤差伝播法の計算式を入力する
6. 学習結果
- 6.1. 学習率０.５の場合
- 6.2. 学習率が大きいほど早く収束
7. 教師データ以外の画像で試してみる

９画素のマークシートに書かれた〇✕をニューラルネットワークで読み取る

入学試験や運転免許証の試験などで、誰でも一度はお世話になったマークシート。

大量の答案を機械で自動処理できることが魅力です。

このマークシート、昔はOMR（Optical Mark Reader）という専用の機械で処理していました。

ところが、そのためには専用の答案用紙や読み取り機が必要になりコストが嵩むため、最近では一般の用紙を使って汎用のコンピュータで処理できるスキャナー方式が普及してきています。

スキャナーとは、手書きなどのアナログデータをコンピュータで処理できるデジタルデータに変換する装置です。

コピー機やプリンターに付いていますね。

ところで、スキャナーの読み取り精度は画素数に依存します。

〇✕式のマークシートを読み取るには最低９画素は必要でしょう。

回答者には、○を書くにしても、×を書くにしても枠一杯に書いてもらうようにします。

すると○の場合、理想的には次のようになります。

９個の画素のうち、線を検出した画素には１、そうでない画素には0が入ります。

この１と０のパターンを見て、コンピュータは○か×かを判定します。

でも、こんなきれいな○を書く回答者はいないでしょう。

実際には、こんな感じになります。

これだって、ほぼ理想的なケースです。

人によっては筆圧が小さかったり、○を書きだす位置が異なっていたり、途中で芯が折れたりして、様々な欠損があるでしょう。

例えば、こんな感じです。

これも○と読み取らないといけません。

でも、×はもっと厄介です。

理想はこうです。

しかし、こんなにきれいに書ける人は稀でしょう。

実際にはこんな感じが多いのではないでしょうか。

このように○にも×にも、いろいろなパターンがあります。

９画素の１と０の組み合わせは、2⁹=512通りあります。

たった９画素でも512通りものパターンがあるのです。

実際には遥かに多くの画素数で読み取りますので、天文学的なパターン数になります。

ですので、すべてのパターンについてこれは○、これは×という風にコンピュータに設定しておくことは現実的ではありません。

そこで、これまでの回答者から集めた○×のパターンをコンピュータに学習させて、今後違うパターンが出てきたとしても適切に○×を自動判別させる仕組みが機械学習です。

そして、このような画像処理はニューラルネットワークが得意で、前回の記事で紹介した誤差伝播法を使ってプログラムすることができます。

>> 【実はとても簡単だった！】誤差伝播法をシンプルにわかりやすく解説します。

これをExcelに実装してみましょう。

Excelが学習していく様子は、まるで生き物みたいで結構感動的ですよ。

教師データを用意する

まずコンピュータに教え込むための教材を用意する必要があります。

この教材を教師データといいます。

今回は次のようなデータを用意しました。

○、×ともに２２パターンあります。

ニューラルネットワークにモデル化する

入力層は９つ、出力層には２つのノードを割り付ける

次に、この画像処理をニューラルネットワークにモデル化します。

ニューラルネットワークには入力層、隠れ層、出力層の３層がありましたね。

前回の記事では入力層に２つ、隠れ層に３つ、出力層に２つのノードがあるネットワークで説明しました。

>> 【実はとても簡単だった！】誤差伝播法をシンプルにわかりやすく解説します。

まずは、それぞれの層のノードに何を割り付け、合計でノードがいくつ必要になるのかを決める必要があります。

今回のケースでは何を入力層に割り付ければよいでしょうか？

９つの画素の二値データですね。

９つの画素はそれぞれ０か１の値を持ちますが、それぞれをx₁、x₂、、、x₉とします。

次に出力層には何を割り付ければよいでしょうか？

今回は○の確率と×の確率を出力したいので、それぞれ１つずつ出力を割り付けましょう。

O₁に○と判断する確率が入る変数、O₂には×と判断する確率が入る変数を割り付けましょう。

最後に隠れ層ですが、これは設計者が割り付けるのではなく、アルゴリズムが決めることなので分かりません。

とりあえず３つのノードにしておきます。

以上を図で表すと次のようになります。

活性化関数にはシグモイド関数

ここで一つ注意点があります。

前回の記事では活性化関数をf(u)=uという恒等関数にしていました。

そうすると、説明が簡単になるからです。

今回は出力として確率を求めますので、0～1の数字にするためにシグモイド関数を使います。

活性化関数でよく使われるシグモイド関数の歴史や定義について調べてみた。

この記事にあるように、シグモイド関数f(u)を微分すると

f’(u)=f(u){1-f(u)}

というように、わざわざ微分を計算しなくても元の関数で表すことができます。

これはプログラミングする上で大変便利です。

パラメータの初期値を入力する

求めるパラメータは38個

さて、これからいよいよ各パラメータ（重みとバイアス）を求めていきます。

求めるべきパラメータは、次のように38個あります。

ノードH₁の重みとバイアス

w^H₁₁, w^H₁₂, , , , w^H₁₉, θ^H₁

ノードH₂の重みとバイアス

w^H₂₁, w^H₂₂, , , , w^H₂₉, θ^H₂

ノードH₃の重みとバイアス

w^H₃₁, w^H₃₂, , , , w^H₃₉, θ^H₃

ノードO₁の重みとバイアス

w^O₁₁, w^O₁₂, w^O₁₃, θ^O₁

ノードO₂の重みとバイアス

w^O₂₁, w^O₂₂, w^O₂₃, θ^O₂

まずは、これらのパラメータと教師データをExcelシートに入力します。

教師データは入力x_i（i=1～9）とtj（j=1,2）の組み合わせが44組あります。

これらを順々に行を変えて学習させていって、44組全部終わったら、また1組目から学習させます。

これを延々と何巡も繰り返します。

パラメータの初期値は０～１の乱数

38個あるパラメータ（重みとバイアス）は、まずは初期値をテキトーに決めて、勾配降下法により少しずつ調整していきます。

上の図では、初期値は0から1の乱数としています。

初期値の次からのデータは空欄になっていますが、これから式を入れていきます。

誤差伝播法の計算式を入力する

次に誤差伝播法の計算式を入力していきます。

前回の記事より、各パラメータの勾配は次のような式で求められます。

まずは出力層の勾配、次にその値を使って隠れ層の勾配を求めます。

出力層の勾配を求める計算式

∂E/∂ w^O₁₁=∂E/∂ z^O₁ ･∂z^O₁/∂ u^O₁･∂u^O₁/∂ w^O₁₁

= (z^O₁-t₁) f’(u^O₁) z^H₁

ここで、f’(u^O₁)はシグモイド関数f(u^O₁)の微分です。

∂E/∂ w^O₁₂=∂E/∂ z^O₁ ･∂z^O₁/∂ u^O₁･∂u^O₁/∂ w^O₁₂

= (z^O₁-t₁) f’(u^O₁) z^H₂

∂E/∂ w^O₁₃=∂E/∂ z^O₁ ･∂z^O₁/∂ u^O₁･∂u^O₁/∂ w^O₁₃

= (z^O₁-t₁) f’(u^O₁) z^H₃

∂E/∂ w^O₂₁=∂E/∂ z^O₂ ･∂z^O₂/∂ u^O₂･∂u^O₂/∂ w^O₂₁

= (z^O₂-t₂) f’(u^O₂) z^H₁

∂E/∂ w^O₂₂=∂E/∂ z^O₂ ･∂z^O₂/∂ u^O₂･∂u^O₂/∂ w^O₂₂

= (z^O₂-t₂) f’(u^O₂) z^H₂

∂E/∂ w^O₂₃=∂E/∂ z^O₂ ･∂z^O₂/∂ u^O₂･∂u^O₂/∂ w^O₂₃

= (z^O₂-t₂) f’(u^O₂) z^H₃

隠れ層の勾配を求める計算式

∂E/∂ w^H₁₁=∂E/∂ z^H₁ ･∂z^H₁/∂ u^H₁･∂u^H₁/∂ w^H₁₁

=(∂E/∂ z^O₁ ･∂z^O₁/∂ z^H₁ +∂E/∂ z^O₂ ･∂z^O₂/∂ z^H₁)･∂z^H₁/∂ u^H₁･∂u^H₁/∂ w^H₁₁

={(z^O₁-t₁) w^O₁₁ + (z^O₂-t₂) w^O₂₁} f’(u^H₁) x₁

∂E/∂ w^H₁₂=∂E/∂ z^H₁ ･∂z^H₁/∂ u^H₁･∂u^H₁/∂ w^H₁₂

=(∂E/∂ z^O₁ ･∂z^O₁/∂ z^H₁ +∂E/∂ z^O₂ ･∂z^O₂/∂ z^H₁)･∂z^H₁/∂ u^H₁･∂u^H₁/∂ w^H₁₂

={(z^O₁-t₁) w^O₁₁ + (z^O₂-t₂) w^O₂₁} f’(u^H₁) x₂

∂E/∂ w^H₂₁=∂E/∂ z^H₂ ･∂z^H₂/∂ u^H₂･∂u^H₂/∂ w^H₂₁

=(∂E/∂ z^O₁ ･∂z^O₁/∂ z^H₂ +∂E/∂ z^O₂ ･∂z^O₂/∂ z^H₂)･∂z^H₂/∂ u^H₂･∂u^H₂/∂ w^H₂₁

={(z^O₁-t₁) w^O₁₂ + (z^O₂-t₂) w^O₂₂} f’(u^H₂) x₁

∂E/∂ w^H₂₂=∂E/∂ z^H₂ ･∂z^H₂/∂ u^H₂･∂u^H₂/∂ w^H₂₂

=(∂E/∂ z^O₁ ･∂z^O₁/∂ z^H₂ +∂E/∂ z^O₂ ･∂z^O₂/∂ z^H₂)･∂z^H₂/∂ u^H₂･∂u^H₂/∂ w^H₂₂

={(z^O₁-t₁) w^O₁₂ + (z^O₂-t₂) w^O₂₂} f’(u^H₂) x₂

∂E/∂ w^H₃₁=∂E/∂ z^H₃ ･∂z^H₃/∂ u^H₃･∂u^H₃/∂ w^H₃₁

=(∂E/∂ z^O₁ ･∂z^O₁/∂ z^H₃ +∂E/∂ z^O₂ ･∂z^O₂/∂ z^H₃)･∂z^H₃/∂ u^H₃･∂u^H₃/∂ w^H₃₁

={(z^O₁-t₁) w^O₁₃ + (z^O₂-t₂) w^O₂₃} f’(u^H₃) x₁

∂E/∂ w^H₃₂=∂E/∂ z^H₃ ･∂z^H₃/∂ u^H₃･∂u^H₃/∂ w^H₃₂

=(∂E/∂ z^O₁ ･∂z^O₁/∂ z^H₃ +∂E/∂ z^O₂ ･∂z^O₂/∂ z^H₃)･∂z^H₃/∂ u^H₃･∂u^H₃/∂ w^H₃₂

={(z^O₁-t₁) w^O₁₃ + (z^O₂-t₂) w^O₂₃} f’(u^H₃) x₂

よくわからないという人は、もう一度前回の記事を読み直してみて下さい。

>> 【実はとても簡単だった！】誤差伝播法をシンプルにわかりやすく解説します。

Excelシートに入力する

それでは、以上の式をExcelシートに入力していきます。

先ほどAC列まで入力しましたので、AD列から次のように入力します。

横に長いので、２つの画面に分けます。

（１枚目）

（２枚目）

最初にAC列までのスナップショットを載せましたが、A～D列までを隠していました。

このようになっています。

D列で損失関数Eを計算しています。

C列ではその時のパラメータで計算した結果、○か×のどちらの判定になったかを表示しています。

B列ではC列で判定した結果と教師データを比較して、合っていればOK、間違っていたらNGと表示させています。

そして44枚の教師データを何巡も読み込んで学習を繰り返しますが、1巡するごとに44枚のうち正解が何％だったかをA列に算出しています。

学習結果

学習率０.５の場合

学習率0.5で学習させた結果、９巡目で終了しました。

求めるパラメータ（重みとバイアス）は38個ありましたが、学習後の値は次のようになりました。

このパラメータであれば、少なくとも44枚の教師データはすべて間違いなく判定できるということです。

正解率の推移は次の通りです。

学習率が大きいほど早く収束

44枚の教師データをたったの9回読み込んだだけで、100%の正解を出せるようになりました。

学習率を変えたらどうなるのでしょうか？

学習率を0.2、0.5、1で学習させた場合の結果は、次のようになりました。

学習率が大きいほど早く学習が終了しました。

ηが1の場合は、たったの６回で終了しました。

教師データ以外の画像で試してみる

ところで、この正解率100%は44枚の画像に対してです。

512通りある組み合わせのうちの44通りについて、100%の正解を出せるようになったにすぎません。

他の画像はどう認識するのでしょうか？

これは教師データには入っていませんが、いかにもありそうなパターンですね。

先ほどの学習後の行に、この値を入力してみましょう。

すると、ちゃんと✕と認識しました。

詳しく見てみると、〇の確率は３７％、✕の確率は６３％と計算しています。

たった６回見ただけでで44枚をすべて認識できるようになった上に、他の画像もちゃんと認識できるようになるとは、、、管理人は絶対に負けますね。

Excelにもこのような頭脳を持たせることができる。

なかなか感動的ではありませんか？

AI by ExcelAI,ニューラルネットワーク基礎,微分,誤差逆伝播法

Posted by ロジギーク