Procède à une extraction terminologique en langue française sur un corpus de textes.
Le fichier .tar.gz
envoyé doit contenir des fichiers .json
dont chacun
contient un objet dont le champ value
contient un texte en français et le champ
id
un identifiant unique pouvant servir de nom de fichier.
ℹ️ Voir la commande Unix tar
.
Ce format de fichier,appelé corpus compressé, est celui renvoyé par les services
web data-wrapper
s (convertisseurs).
ℹ️ Voir les services web data-wrapper
.