Skip to content

sk409/ReversiRL

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

リバーシAIを0から強化学習

ランダムAI相手に100%近い勝率を出すことを目標に約4日間学習を行いました。

ネットワークはResNetです。

reversi_main.pyを実行することで実際に学習を行い、学習過程のログを確認することができます。

play_reversi.pyを実行することでプレイヤーを2人選び、リバーシをプレイすることができます。

プレイヤーは以下の3人が用意されています。

  • Random(ランダムに手を打つAI)
  • DQN(今回学習させたモデル)
  • Human(人間が盤面を見て手を選ぶことができます。)

上記のプレイヤーから2人を選び、任意の組み合わせで対戦させることができます。


ランダムAIに対する勝率

最終的にはランダムAIに対しては100%近い勝率を達成することができました。


合法手の認識率

学習初期には合法手を全く認識することができませんでしたが約1日で合法手をほとんど完璧に認識できるようになりました。


学習させたモデル

訓練中のモデルは10エピソードごとにmodelsフォルダ直下に保存されます。

modelsフォルダにあるbest_modelフォルダには今までで一番性能の良かったモデルを格納してあります。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages