mutorereAI

----- Blouet Pierre - Le Gal Riwan -----

Version finale du jeu du Mutorere codé en python opposant deux agents :

un agent effectuant des déplacements aléatoires
un agent entrainé par un algorithme de renforcement (Q learning)

----- Principe du Q learning -----

Pour rendre notre agent intelligent nous nous sommes appuyé sur le système de Q learning. Cette technique permet de mesurer la qualité d'une action en fonction de l'état de l'environement dans lequel se trouve l'agent.

L'agent "intelligent" obtient une reward positive lorsqu'il porte un coup fatal à son adversaire et qu'il gagne la partie. Il reçoit une reward négative lorsqu'il effectue une action impossible ou alors lorsqu'il perd la partie.

Une version du code opposant deux joueurs effectuant tous les deux des actions aléatoires est également disponible dans le code : Pour y accéder il faut décommenter la ligne 307 ("# playGameRandomly") et commenter la ligne 308 ("playQLearningBlack(5000)")

----- Lancement du script -----

python mutorere.py

----- Avec 1 mois de plus -----

Optimisation des hyperparamètres.
Pouvoir prendre la place du joueur "aléatoire" pour pouvoir se mesurer à l'agent intelligent

----- Résultats -----

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
README.md		README.md
mutorere.py		mutorere.py
result.png		result.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

mutorereAI

About

Releases

Packages

Languages

PierreBlouet/mutorere_Qlearning

Folders and files

Latest commit

History

Repository files navigation

mutorereAI

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages