Fichiers annexe de mon mémoire de M2 "Mesures de distances syntaxiques entre langues à partir de treebanks"

Scripts

Python

grew_extract.py : automatise l'extraction de motifs syntaxiques avec grew
grew_analysis.py : exploite les données précédemment extraites
plotting.py : visualisation des données sous formes de graphiques

R

grew_analysis.Rmd : autres types d'analyse des données en R

Graphiques

Ordre des unités (sujet, verbe, objet)

heatmaps de similarité cosinus entre :
- toutes les langues
- tous les treebanks
- les langues romanes
- les treebanks de langue romane
visualisation 2D après Analyse en Composantes Principales (ACP)
- toutes les langues
- les langues romanes
- un échantillon de langues
Barplot des préférences d'ordre de mot pour les langues romanes
Corrélation entre ordres de mots

Proportion des linéarisation dépendant-gouverneur pour les couples (objet/verbe, verbe/auxiliaire, adjectif/nom, nom/adposition)

heatmaps de similarité cosinus entre :
- toutes les langues
- tous les treebanks
- les langues romanes
- les treebanks de langue romane
Barplot des ratios de ces linéarisation pour les 4 motifs dans les langues romanes
Corrélation entre les ratios pour les 4 motifs
visualisation 2D après Analyse en Composantes Principales (ACP)
- toutes les langues

Distribution des trigrammes d'étiquettes morpho-syntaxiques

heatmaps de divergence de Jensen-Shannon entre :
- toutes les langues
- tous les treebanks
- les langues romanes

Données

comptage pour chaque paramètre étudié
- par langue
- par treebank
matrices de distances pour chaque paramètre étudié
- par langue
- par treebank

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
data		data
plots		plots
scripts		scripts
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Fichiers annexe de mon mémoire de M2 "Mesures de distances syntaxiques entre langues à partir de treebanks"

Scripts

Python

R

Graphiques

Ordre des unités (sujet, verbe, objet)

Proportion des linéarisation dépendant-gouverneur pour les couples (objet/verbe, verbe/auxiliaire, adjectif/nom, nom/adposition)

Distribution des trigrammes d'étiquettes morpho-syntaxiques

Données

About

Releases

Packages

Languages

marinecourtin/syntactic_distances

Folders and files

Latest commit

History

Repository files navigation

Fichiers annexe de mon mémoire de M2 "Mesures de distances syntaxiques entre langues à partir de treebanks"

Scripts

Python

R

Graphiques

Ordre des unités (sujet, verbe, objet)

Proportion des linéarisation dépendant-gouverneur pour les couples (objet/verbe, verbe/auxiliaire, adjectif/nom, nom/adposition)

Distribution des trigrammes d'étiquettes morpho-syntaxiques

Données

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages