Skip to content

Latest commit

 

History

History
60 lines (48 loc) · 2.07 KB

README.md

File metadata and controls

60 lines (48 loc) · 2.07 KB

Évaluation de la cohérence du discours en utilisant les techniques d'apprentissage profond

Dépendances

Les dépendances de ce code, écrit en Python, sont:

Dataset utilisé

Le corpus de GCDC proposé par (Lai et Tetreault, 2018) et disponible sur demande via (https://github.com/aylai/GCDC-corpus).

Évaluation des modèles

Les modèles sont évalués sur la tâche de classification à trois niveaux (low, medium, high coherence), et dont le traitement de la cohérence peut être réparti en deux catégories :

Niveau sémantique

  1. Au niveau des phrases (SENT_AVG)
  • Sans la validation croisée :
python main.py --model_name sentavg_model --train_corpus GCDC --model_type sent_avg --task class
  • Avec la validation croisée :
python main.py --model_name sentavg_model_cv --train_corpus GCDC --model_type sent_avg --task class --cross_val 1
  1. Au niveau des paragraphes (PAR_SEQ)
  • Sans la validation croisée :
python main.py --model_name parseq_model --train_corpus GCDC --model_type par_seq --task class
  • Avec la validation croisée :
python main.py --model_name parseq_model_cv --train_corpus GCDC --model_type par_seq --task class --cross_val 1
  1. Combinaison des deux niveaux (SEM_REL)
  • Sans la validation croisée :
python main.py --model_name semrel_model --train_corpus GCDC --model_type sem_rel --task class
  • Avec la validation croisée :
python main.py --model_name semrel_model_cv --train_corpus GCDC --model_type sem_rel --task class --cross_val 1

Niveau syntaxique (CNN_POS_TAG)

  • Sans la validation croisée :
python main.py --model_name cnn_postag_model --train_corpus GCDC --model_type cnn_pos_tag --task class --pos_tag 1
  • Avec la validation croisée :
python main.py --model_name cnn_postag_model_cv --train_corpus GCDC --model_type cnn_pos_tag --task class --pos_tag 1 --cross_val 1