Skip to content

Latest commit

 

History

History
12 lines (8 loc) · 693 Bytes

File metadata and controls

12 lines (8 loc) · 693 Bytes

Procède à une extraction terminologique en langue française sur un corpus de textes.

Le fichier .tar.gz envoyé doit contenir des fichiers .json dont chacun contient un objet dont le champ value contient un texte en français et le champ id un identifiant unique pouvant servir de nom de fichier.

ℹ️ Voir la commande Unix tar.

Ce format de fichier,appelé corpus compressé, est celui renvoyé par les services web data-wrappers (convertisseurs).

ℹ️ Voir les services web data-wrapper.