ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Masses de données hétérogènes
En savoir plus >>
Autres revues >>

Revue d'Intelligence Artificielle

0992-499X
Revue des Sciences et Technologies de l'Information
 

 ARTICLE VOL 17/1-3 - 2003  - pp.331-342
TITRE
Génération automatique d'une structure hiérarchique de concepts et de documents à partir de corpus

RÉSUMÉ
La disponibilité croissante de grandes collections de documents faiblement structurées a fait émerger en recherche d'information le besoin d'une structuration globale de ces collections et de l'établissement de liens sémantiques entre documents. En Recherche d'Information, les principaux éléments de structuration globale de corpus utilisés sont l'hyperlien entre documents et la structuration des documents en hiérarchies de concepts. Cette organisation des documents est réalisée manuellement. Nous proposons ici un algorithme pour construire et maintenir des hiérarchies de concepts et de documents de manière automatique. Nous présentons également des mesures de qualité pour l'évaluation des hiérarchies générées et des tests effectués sur des données issues du site Looksmart qui montrent la pertinence des méthodes proposées.


ABSTRACT
With the development and the availability of large textual corpora, appeared a need for structuring and organizing these corpora in a way that reflects some semantic relations between documents. For now, in Information Retrieval, these relations are indicated mainly via hyperlinks or by organizing documents into concept hierarchies, both being manually developed. We propose here an algorithm for automatically inferring concept and document hierarchies from a corpus. We also present numerical criteria for measuring the relevance of these automatically generated hierarchies and discuss some experiments performed on data from the Looksmart web site.


AUTEUR(S)
Hermine NJIKE FOTZO, Patrick GALLINARI, Nathalie LAGUNAS

MOTS-CLÉS
hiérarchie de concepts, hiérarchie de documents, segmentation de texte.

KEYWORDS
concept hierarchies, document hierarchies, text segmentation.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (69 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier