Batch normalizationの逆伝播の算出式を計算グラフを辿って求める
誤差逆伝播法を行列演算でExcelに実装してXavierの初期値の有効性を実験してみた
【勾配消失しない重みの初期値】Excelでモンテカルロシミュレーションしてみた
ソフトプラス関数とソフトサイン関数を計算グラフで微分してみる。
【学習率を調整する】AdaGradとRMSPropをExcelに実装して比較してみた。
ブラックジャックの必勝法をExcelモンテカルロ法で強化学習したらこうなった。
ディーラーの公開カードも考慮したブラックジャックの必勝法を強化学習で求める 前回の記事では手持ちカードの合計が??までヒットするという単純戦略を採る場合、??は ...
Excelを使った強化学習でブラックジャックの単純戦略をシミュレーション!
ブラックジャックはカジノの中でも従属事象のゲームと呼ばれていて、うまくやるための必勝法らしきものが存在します。 本記事では独立事象のゲームとして簡略化しています ...