ブラックジャックの必勝法をExcelモンテカルロ法で強化学習したらこうなった。
ディーラーの公開カードも考慮したブラックジャックの必勝法を強化学習で求める 前回の記事では手持ちカードの合計が??までヒットするという単純戦略を採る場合、??は ...
Excelを使った強化学習でブラックジャックの単純戦略をシミュレーション!
ブラックジャックはカジノの中でも従属事象のゲームと呼ばれていて、うまくやるための必勝法らしきものが存在します。 本記事では独立事象のゲームとして簡略化しています ...
【強化学習】モンテカルロ法をExcelに実装して迷路問題を解いてみた。
モンテカルロ法とQ学習との違い 強化学習は、最終目的を達成するために、今とるべき最適な行動を学習する機械学習の一手法です。 テトリスで一列ずつ崩すのではなく、溜 ...
【強化学習】Q学習のアルゴリズムをExcelに実装して迷路問題を解いてみた。
Q学習はAlphaGoで有名な強化学習の基本 強化学習は機械学習の一分野で、管理人がサプライチェーンマネジメントに最も有用と考えている手法です。 なぜなら、それ ...




