ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique

APPEL À
CONTRIBUTION
Masses de données hétérogènes
En savoir plus >>
Autres revues >>

Revue d'Intelligence Artificielle

0992-499X
Revue des Sciences et Technologies de l'Information
 

 ARTICLE VOL 17/1-3 - 2003  - pp.449-459
TITRE
AUSMS : un environnement pour l'extraction de sous-structures fréquentes dans une collection d'objets semi-structurés

RÉSUMÉ
La recherche de connaissances dans les données structurées a fait l'objet de nombreux travaux ces dernières années. Cependant, la plupart des approches proposées s'intéressent à des structures plates et, avec la popularité du Web, le nombre de documents semi-structurés disponibles augmente très rapidement. La structure de ces objets est irrégulière et il est judicieux de penser qu'une requête sur la structure des documents est aussi importante qu'une requête sur les données. De plus, les données manipulées ne sont pas statiques parce que de nouvelles mises à jour sont constamment réalisées. Le problème de maintenir de telles sous-structures devient aussi prioritaire que de les rechercher car, au fur et à mesure des mises à jour, les sous-structures trouvées peuvent devenir invalides. Dans cet article, nous proposons un système appelé AUSMS (Automatic Update Schema Mining System), permettant de collecter les données, de rechercher les sous-structures fréquentes et de maintenir les connaissances extraites suite aux évolutions des sources.


ABSTRACT
Mining knowledge from structured data has been extensively addressed in the few past years. However, most proposed approaches are interested in flat structures. With the growing popularity of the Web, the number of semi-structured documents available fastly increases. Structure of these objects is irregular and it is clever to think that a query on documents structure is almost as important as a query on data. Moreover, manipulated data is not static because new updates are constantly realised. Problem of maintaining such substructures is then prior on researching them because, every time data is updated, found substructures could become invalid. In this paper we propose a system, called A.U.S.M.S. (Automatic Update Schema Mining System), allowing data retrieval, researching frequent sub-structures and maintaining extracted knowledge after sources evolutions.


AUTEUR(S)
Pierre-Alain LAUR, Pascal PONCELET

MOTS-CLÉS
Découverte de sous- structures fréquentes, données semi-structurées, web mining.

KEYWORDS
Frequent sub-structures mining, semi-structured data, web-mining.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (192 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier