Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Génerer des alignements multilingues interportal pour les ontologies de SIFR et NCBO (non traduction l'une de l'autre) #2

Open
jonquet opened this issue Nov 17, 2016 · 5 comments
Assignees

Comments

@jonquet
Copy link
Member

jonquet commented Nov 17, 2016

Cela consiste a aligner des ontologies sources du SIFR BioPortal avec des ontologies cibles dans le NCBO BioPortal. Par exemple, MSHFRE et DOID.

Il s'agirait de stocker alors les mappings dans le SIFR BioPortal (comme ceux de ce projet décrits dans
http://www.lirmm.fr/~jonquet/publications/documents/Article_WIMS2016_Reconciliation_Annane.pdf )... sans le tag "translation"

Une fois que cela sera fait, nous pourrons le valoriser par le SIFR Annotator tel que décrit dans le cas 1 de:
ontoportal-lirmm/ncbo_annotator#3

Cette tache doit impliquer @twktheainur Konstantin, Zohra et Nacer et @AminaANNANE
Les ontologies a aligner dans le cadre du projet PratikPharma seront définies ici:
https://docs.google.com/spreadsheets/d/1JGSJlJGcDB9B_5_FWX67GUpNFYNf_v6ptlpT9Xr1Crs/edit

@jonquet
Copy link
Member Author

jonquet commented Nov 17, 2016

@twktheainur Est-ce que tu peux dans un premier temps recenser qu'elles ontologies d'UMLS sont utilisées dans le corpus Quaero quand aucun concept dans une ontologies FR n'etait disponible. Cela nous donnera nos premières cibles chez NCBO NioPortal.

@twktheainur
Copy link

@jonquet Il semble que beaucoup des mappings sur les CUI présents dans le bioportal, ne sont pas dans les ontologies téléchargables. En utilisant le endpoint 4 store il y a des CUI de partout en fin de compte

@twktheainur
Copy link

@jonquet les résultats sur EMEA montent à:
(P/R/F1) 0.0640 0.1526 0.0902

Par contre dans les cas où il y en a plusieurs ça compte faux si c'est pas exact

@AminaANNANE
Copy link
Contributor

Bonjour

Pour MSHFRE et DOID, à mon avis le mieux est d'aligner (MeSH et DOID) ensuite utiliser les mappings multilingues réconciliés dans notre premier travail pour déduire les liens avec l'ontologie française MSHFRE. En effet, généralement l'alignement de deux ontologies de même langue est plus facile que l'alignement de deux ontologies de langues différentes. Pareil pour toutes les ontologies que nous avons traitées.

Amina.

@jonquet
Copy link
Member Author

jonquet commented Jan 10, 2017

Pour la liste des ontologies avec lesquelles commencer, on va se baser sur le GDoc du projet PractikPharma:
https://docs.google.com/spreadsheets/d/1JGSJlJGcDB9B_5_FWX67GUpNFYNf_v6ptlpT9Xr1Crs/edit#gid=0

Comme sources (fr), je propose de prendre:

  • SNMIFRE, MSHFRE, MDRFRE, CIM-10, WHO-ARTFRE (ontologies qui ont un équivalent eng et donc pour lesquelles ce que propose @AminaANNANE est possible.
  • CCAM (a venir dans le portail) pour laquelle il n'existe pas d'ontologies équivalente en eng.

Comme cibles (eng), je propose de prendre;
SNOMED-CT, DOID, NCIt, OVAE, OGSF, OAE et AERO qui sont les ontologies recensées dans le listing que nous n'avons pas dans le SIFR BioPortal.

Je suggère de séparer cette tache en 2:

Ainsi, j'assigne à @AminaANNANE (on discutera tous ensemble de quand bosser la dessus en 2017)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Development

No branches or pull requests

3 participants