ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Masses de données hétérogènes
En savoir plus >>
Autres revues >>

Revue d'Intelligence Artificielle

0992-499X
Revue des Sciences et Technologies de l'Information
 

 ARTICLE VOL 28/6 - 2014  - pp.729-752  - doi:10.3166/ria.28.729-752
TITRE
Extraction possibiliste de concepts MeSH à partir de documents biomédicaux

TITLE
Possibilistic extraction of MeSH concepts from biomedical documents

RÉSUMÉ

Nous proposons dans cet article une nouvelle approche d’indexation de documents biomédicaux basée sur les réseaux possibilistes permettant de les apparier partiellement aux termes du thésaurus MeSH (Medical Subject Headings). La principale contribution de notre approche est le traitement de l’imprécision et de l’incertitude liée à la tâche d’indexation à travers l’utilisation de la théorie des possibilités. En effet, nous proposons d’améliorer l’estimation de la pertinence d’un document étant donné un concept en utilisant deux mesures : la possibilité et la nécessité. La possibilité estime le degré de rejet d’un document non pertinent étant donné un concept. La nécessité de la pertinence d’un document évalue dans quelle mesure un document est pertinent pour le concept. De plus, notre approche permet de réduire les limites de l’appariement partiel qui génère de l’information inutile, bien que ce type d’appariement permette de trouver dans le document d’autres variantes du vocabulaire contrôlé. Pour ce faire, nous proposons de filtrer l’index en utilisant les connaissances fournies par l’UMLS (Unified Medical Langage System). Filtrer l’index permet de ne garder que les concepts pertinents parmi ceux ayant un sous-ensemble de leurs mots dans le document. Les expérimentations réalisées sur les deux corpus OSHUMED et CISMeF ont montré des résultats encourageants.



ABSTRACT

We propose in this paper a new approach for indexing biomedical documents based on the possibilistic network, which carries out a partial matching between documents and the MeSH thesaurus (Medical Subject Headi ngs) terms. The main contribution of our approach is to deal with the imprecision and the un certainty of the indexing task by using the possibility theory. In fact, we propose to enhance the estimation of a document relevance given a concept by using the two measures of possibility and necessity instead of only one measure used by common approaches. The possibility measure estimates the degree of rejection of an irrelevant document given a concept. The necessity of the relevance of a document estimates what extent a document is relevant for a given concept. Our contribution also consists in reducing the limitation of the partial matching that generates irrelevant information although it allows finding in the document other variants of terms than those in the dictionaries. In fact, we propose to filter the index using the knowledge provided by the Unified Medical Language System (UMLS). The filtering allows keeping relevant concepts among those having a subset of their words terms in the document. The experiments carried out at the different steps of our approach and on different corpora showed very encouraging results.



AUTEUR(S)
Wiem CHEBIL, Lina SOUALMIA, Mohamed N. OMRI, Stéfan J. DARMONI

MOTS-CLÉS
Indexation de documents biomédicaux, réseaux possibilistes, appariement partiel, vocabulaires contrôlés

KEYWORDS
Biomedical documents indexing, possibilistic networks, partial matching, controlled vocabularies

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (305 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier