AlphaZero Clone

これは、ニューラルネットワークと TensorFlow.js に関する理解を深めることを目的として作成した習作です。 TensorFlow.js を利用して実装された AlphaZero クローンになります。

※ まだちゃんと動きません。

  • TensorFlow.js とは、Google 主導で開発されている機械学習フレームワークである TensorFlow を JavaScript (TypeScript) で再実装した公式フレームワークです。WebGL を利用して GPU による計算を行えます。Web ブラウザ上で動作するため PC, スマホ, 携帯ゲーム機を含むさまざまな端末で動作し、端末上で深層学習を用いた評価・学習を実施できます。
  • AlphaZero とは、Google 傘下の DeepMind から発表された論文 Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm で発表された汎用的な手順最適化アルゴリズムです。深層学習 (Value/Policy Networks) とモンテカルロ木探索をベースにしたものになっています。