-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
SIFR Annotator Mgrep dictionnary enhancement #9
Comments
Oui mgrep accepte plusieurs entrées avec le même termid. Je rajoute un autre exemple avec le OU: |
Sur le document suivant, je met des heuristiques pour rajouter des concepts qui ont plus de chance de matcher: https://docs.google.com/document/d/1g83p3M64rtDZfsJcuHoq--mO_1ZSPBPyAG7CZQfyVRA/edit |
J'ai créé un jar qui implémente les heuristiques décrites dans le doc partagé (sauf la règle 4). |
UNe autre observée aujourd'hui sur l'AgroPortal Annotator: |
Cette tache consiste a traiter le dictionnaire Mgrep pour ajouter des termes qui ont plus de chance de matcher dans l'Annotator.
Pour une ligne comme celle-la:
5083756382759859076 ÉVéNEMENTS EMBOLIQUES ET THROMBOTIQUES (SMQ)
L'idéal, pour vraiment augmenter le recall de l'Annotator serait d'avoir comme résultats:
5083756382759859076 ÉVÉNEMENT EMBOLIQUE ET THROMBOTIQUE SMQ
5083756382759859076 ÉVÉNEMENT EMBOLIQUE
5083756382759859076 ÉVÉNEMENT THROMBOTIQUE
5083756382759859076 SMQ
Qu'en pensez vous ?
(j'ai oublié si MGREP accepte plusieurs entrée avec le même termid d'ailleurs ?)
Autre example:
INCISION ET DRAINAGE D'HéMATOME DU BASSIN
=>
INCISION ET DRAINAGE D HÉMATOME DU BASSIN
INCISION D HÉMATOME DU BASSIN
DRAINAGE D HÉMATOME DU BASSIN
The text was updated successfully, but these errors were encountered: