L'objectif de ce projet est d'analyser un dump de donnée Wikipedia, en langue française, suivant deux approches :
- text-mining : construction d'un espace vectoriel (mot,vecteur), word embedding
- graph-mining : exploitation des lien entre les pages
Afin d'installer ce projet, il est nécessaire d'avoir
Pour vérifier que l'installation de ces deux logiciels a réussi :
mvn --version
java -version
Assemblez le projet Maven :
mvn clean install
Equipe ArcToScience, M2 DM Université Lyon 2 :
This project is licensed under the MIT License - see the LICENSE.md file for details